P. Erwartungswerte und enge Spiele

Dass Bill James eine der bedeutendsten Figuren in der Sportanalytik ist, sollte eifrigen Lesern dieses Blogs (sofern vorhanden) mittlerweile bekannt sein. Er gilt als Begründer der Sabermetrics, der wissenschaftlichen Suche nach neuem Baseballwissen. Viele seiner Ideen und Konzepten veränderten die Art und Weise, wie der Sport heute gespielt und beurteilt wird.

Heute möchte ich mit einer seiner Ideen befassen: Dem Pythagoräischen Erwartungswert"(Pythagoräisch" konnte ich nicht guten Gewissens in den Titel des Posts stecken)

James' simpler Ansatz war, dass Teams in Proportion zu ihrer Qualität gewinnen sollten und man Qualität messen kann als Verhältnis zwischen erzielten Runs und Runs, die der Gegner erzielt. Eine Abweichung von der erwarteten Siegesquote kann das als Näherung für Glück oder Zufall betrachtet werden.

Die erwartete Siegesquote errechnet sich als:

Das kann man jetzt natürlich ganz einfach aufs Eishockey übertragen, wo in Punkten statt in Siegen gerechnet wird:

Jetzt, wo wir so ein schickes neues Spielzeug haben, müssen wir es natürlich sofort mal anwenden. Zum Beispiel auf die aktuelle DEL-Tabelle:

Ok. Die deutlichste Abweichung bieten die Schwenninger. Was allerdings nicht verwunderlich ist. Denn ein 8-0 und ein 8-1 Sieg sorgen da durchaus für etwas überhöhte Zahlen. Allzu sehr möchte ich auf die Zahlenwerte allerdings noch nicht eingehen und die Frage nach der Eignung der pythagoräischen Erwartung für Prognosen auch erstmal zurückstellen. Heute soll es um den Hintergrund gehen, warum die Pythagoräische Erwartung Sinn macht (oder nicht).

Der Grund dafür, dass James die Abweichungen von der Pythagoräischen Erwartung als Zufall bezeichnet, ist, dass er davon überzeugt war, dass die Fähigkeit, enge Spiele überproportional häufig zu gewinnen, nicht existiert. Was erstmal wie eine mutige Behauptung in Anbetracht der gängigen Eishockeyberichterstattung scheint.

Stimmt das denn auch fürs Eishockey?

Enge Spiele

Für diese Studie gilt, dass ein enges Spiel ein Spiel ist, dass mit einem Tor Unterschied gewonnen wird.

Diese Definition hat natürlich ein paar Schönheitsfehler (eine mögliche Verbesserung der Daten wäre die Miteinbeziehung von Spielen, die mit 2 Toren Abstand gewonnen wurden, bei denen das "+2-Tor" in einer Empty Net Situation geschossen wurde), denn nicht jedes Ein-Tore-Spiel (grobe Übersetzung) ist wirklich eng und nicht jedes Nicht-Ein-Tore-Spiel ist nicht eng.

So manche Spiele, die mit mehr als einem Tor Abstand enden, waren durchaus eng umkämpft. Da wir aber mit 6 Saisons an Daten arbeiten, gehe ich davon aus, dass sich diese gegenläufigen Phänomene ausgleichen, beziehungsweise der Fehler, der dadurch entsteht für unsere qualitativen Aussagen nicht ausschlaggebend ist.

Einige weitere Definitionen:

P - Gesamtpunktzahl
Peng - Punktzahl aus engen Spielen
P% - Punktquote
P%eng - Punktquote in engen Spielen

Um herauszufinden, ob die Fähigkeit existiert, enge Spiele überproportional für sich zu entscheiden, müssen wir kontrollieren, ob der Anteil an in engen Spielen geholten Punkten (P%eng) ein reproduzierbares Talent ist.

Also suchen wir uns für jede Saison diese Zahl raus und berechnen die Korrelation mit dem Wert der nächsten Saison.

Diese Korrelation beträgt hier 0.2298. Man sieht, dass die Regressionsgerade sehr flach ist, was auf eine sehr starke Regression hindeutet. Schlussendlich sind nur 5.28% der Werte in Jahr 2 durch die Werte in Jahr 1 zu erklären. Oder mit anderen Worten, unsere beste Vermutung auf den Punkanteil in engen Spielen einer Mannschaft ist, den letztjährigen Wert 77.02% zurück zur Mitte zu schrumpfen. 

Die Tatsache, dass wir hier keine 0-Korrelation haben, sehe ich darin begründet, dass Teams, die wirklich gut sind, auf Dauer natürlich auch einen höheren Anteil der engen Spiele gewinnen. Nur eben nicht überproportional mehr. Also ein Team, das im Schnitt 60% aller Punkte holt, sollte auf Dauer eben auch 60% der Punkte in engen Spielen holen.

Ausserdem ist es ein schlechtes Zeichen, für die Leistung der nächsten Saison, wenn man in der Vorsaison einen hohen Anteil seiner Punkte in engen Spielen geholt hat:

Die Gerade hat hier sogar eine negative Steigung, was uns sagt, dass wenn eine Mannschaft in Jahr x-1 einen hohen Anteil ihrer Punkte in engen Spielen geholt hat, sie in  Jahr x eine etwas schlechtere Punktquote (in allen Spielen) erwarten sollte. 

So sollte es natürlich nicht verwunderlich sein, dass Erfolg in den "ultimativen engen Spielen", sprich der Verlängerung und dem Penaltyschiessen auch keine beobachtbaren Talentunterschiede existieren. Sicherlich gibt es Spieler, die besser oder schlechter im Penaltyschiessen sind. Und Mannschaften, die mehr Spieler haben, die gut darin sind. Aber in so kleinen Stichproben, wie hier vorhanden, dringen diese Talente nicht durch. Hier ist die vorhandene Korrelation sogar negativ, also wenn man vom Vorjahreswert auf den Wert des nächsten Jahres schliessen will, muss man auf die andere Seite des Durchschnittswertes. Aber im Grossen und Ganzen sind die Abweichungen hier vernachlässigbar. Wer also viele Extrapunkte in OT oder SO holt, darf sich ruhig freuen, sollte aber nicht erwarten, dass man in Zukunft genauso damit rechnen kann.

Im Gegensatz dazu stehen Punkte in Nicht-Engen Spielen, die

1. eher ein wahres Talent darstellen:

2. Deutlich wichtiger als Vorhersager für zukünftige Leistungen sind:

Deswegen wage ich zu behaupten, dass wir Bill James' Behauptung, dass Teams ihre Spiele in Proportion zu der Qualität ihrer Siege gewinnen, getrost aufs Eishockey übertragen können.

Ein Kartenhaus aus Siegen in engen Spielen fällt eben zusammen, auch wenn die Mannschaft dadurch gezeigt hat, dass sie *Eier in der Hose hat*.

Die Vulgarität sei bitte verziehen, die Phrase habe ich mittlerweile in dem Zusammenhang einfach schon so häufig gehört...

Das Clutch-Phänomen oder Deskriptiv ≠ Prädiktiv

Bei dieser Behauptung wird eben ein häufiger Fehler begangen. Man macht etwas Deskriptives zu etwas Prädiktivem.

"Clutch" ist ein toller deskriptiver Begriff. Clutch steht für eine gute Leistung in Momenten, in denen sie am meisten gebraucht wird. In Momenten, in denen es wirklich zählt. Das sind die Momente, die uns im Kopf bleiben. Von denen die lebendigsten Erinnerungen bleiben.

Aber nur weil etwas leicht aus dem Gedächtnis zu rufen ist, bedeutet es nicht, dass es repräsentativ ist.

Nur weil eine Mannschaft in einer Saison/einer Playoffsaison scheinbar immer genau dann Leistungen bringt, wenn es zählt, bedeutet es nicht, dass sie das wieder tun wird. 

Im Eishockey lässt sich das nächste Tor eben nicht immer erzwingen. Die guten Teams erzwingen eben eher 6 der nächsten 11.

Ziemlich viel Arbeit für "Hoch gewinnen ist besser als knapp gewinnen"...