Zufall und Varianz im Eishockey

Der folgende Post ist eine Art Leitbild für den Blog und soll eine kleine Einführung sein, warum es notwendig ist, gängige Meinungen zu hinterfragen und zu versuchen, unseren Wissensstand zu dieser faszinierenden Sportart stetig zu verbessern.

Im Sport zählt am Ende nur das Resultat. Ob am Ende die bessere Mannschaft gewonnen hat, ist dann sekundär. Die glücklichen Sieger dürfen sich dann zu mehr Einsatz, Willen, Cleverness gratulieren, egal ob das nun der Wahrheit entspricht oder nicht. Denn anders will man es sich nicht erklären. Man will sich ja möglichst viel damit erklären, dass Talent einen nur einen Teil der Strecke zum Erfolg trägt. Nur leider gehört im Eishockey, wie in vielen anderen Sportarten (von Schach vielleicht einmal abgesehen) auch, Glück dazu.

Zufall spielt eine grosse Rolle in unserem Leben und auch wenn wir uns wünschen, dass unsere Helden alles was sie machen, völlig absichtlich und geplant durchführen, ist das nicht der Fall. Die Tatsache, dass Zufall auch zum Profisport dazugehört, werden die wenigsten bestreiten. Die grossen Meinungsverschiedenheiten treten auf, wenn es darum geht, die Signifikanz vom Zufall 'richtig' einzuordnen.

Natürlich gilt immer noch, dass die bessere Mannschaft meistens auch gegen die schlechtere Mannschaft gewinnt. Nur eben nicht immer! Ich stelle es mir immer gerne anhand von Würfeln vor. Die bessere Mannschaft hat einen Würfel mit den Zahlen {4,5,6,7,8,9} die schlechtere einen mit {1,2,3,4,5,6}. Man kann also davon ausgehen, dass die Mannschaft mit dem besseren Würfel meistens gewinnen wird. Wenn aber beides zusammenpasst, also Mannschaft A einen schlechten Wurf landet und Mannschaft B einen verhältnismässig guten, dann wird Mannschaft B gewinnen. Natürlich ist es übertrieben, das Resultat des Aufeinandertreffens zweier Mannschaften ausschliesslich dem Zufall zuzuordnen. Im Eishockey gibt es jedoch so viele Ereignisse, die so geringfügig reproduzierbar sind, dass man sie getrost mit einem Zufallsexperiment vergleichen kann. 

Der Torschuss als Zufallsgrösse

Der Torschuss ist eines dieser Ereignisse. Natürlich hängt ein jeder Schuss von Position, Schützen, Torwart und wohl noch 37 anderen Faktoren ab. Es hat sich allerdings gezeigt, dass all diese Faktoren sich über den Verlauf einer Saison für Mannschaften ausgleichen, da am Ende einer Saison die 'schlechten' Schüsse (z.B. ein Handgelenkschuss von der blauen Linie) sich mit den 'guten' Schüssen (eine Direktabnahme bei einem 2-auf-1-Konter) ausgleichen. Natürlich wird es Unterschiede zwischen guten und schlechten Mannschaften geben, diese Unterschiede sind aber über die Dauer einer Saison vernachlässigbar klein und sind von statistischem Rauschen sehr schwer zu unterscheiden.

Im folgenden Diagramm stellt die dunkle Kurve die tatsächliche Verteilung der Schussquoten in der NHL in der Saison 2008/2009 dar. Die hellere Kurve stellt eine Verteilung dar, die sich einstellen würde, wenn man ein Zufallsexperiment durchführt, in dem jede Mannschaft mit der Ligadurchschnittsschussquote schiesst und man die Abweichungen vom Mittelwert nur durch zufällige Verteilung erhält.

 Wahrscheinlichkeitsdichtefunktion der Erwarteten Schussquote (hell) vs Beobachtete Schussquote (dunkelblau) ; Grafik von   Objective NHL

Wahrscheinlichkeitsdichtefunktion der Erwarteten Schussquote (hell) vs Beobachtete Schussquote (dunkelblau); Grafik von Objective NHL

Man sieht, dass die dunkle Kurve leicht breiter ist, was zeigt, dass wohl nicht alle Teams mit der gleichen (der durchschnittlichen) Schussquote schiessen. Die Abweichungen sind allerdings so geringfügig, dass man mit genügsamer Genauigkeit sagen kann, dass die Schussquote einer Mannschaft über den Verlauf einer Saison hauptsächlich ein Zufallsprodukt ist. 

Das ist eine sehr wichtige Einsicht!

Man kann also annehmen, dass sich die 'wahren' Schussquoten von Mannschaften

nicht merklich unterscheiden. (Zwischen Spielern kann natürlich ein grosser Unterschied zwischen den Schussquoten bestehen!) Also sollte man mit vernünftiger Genauigkeit annehmen können, dass die Mannschaften, die mehr schiessen, am Ende der Saison auch oben in der Tabelle stehen.

Doch die Schussstatistik alleine zu durchsuchen, ist immer noch fehleranfällig, denn Mannschaften lassen im allgemeinen bei einer Führung nach und zurückliegende Mannschaften 'machen mehr für das Spiel'. Das bedeutet im Umkehrschluss, dass gute Mannschaften zwangsläufig etwas weniger gut aussehen, da sie ja einen grossen Teil ihrer Saison in Führung verbringen und schlechte Mannschaften bekommen leicht verbesserte Schussstatistiken, da sie häufiger einen Rückstand aufholen müssen. Deswegen ist es wichtig, Schüsse auch nach Spielsituation zu unterscheiden. 

Wenn man also lediglich die Schüsse bei Gleichstand betrachtet, sollte man einen vernünftigen Überblick darüber bekommen, welche Mannschaften sich bei einer offenen Spielsituation häufiger in eine bessere Position bringen. Dazu wird von den meisten Analysten in der NHL Fenwick Tied benutzt.

Als Fenwickereignis gelten Schüsse und Schüsse, die das Tor verfehlen. Der Fenwickwert berechnet sich als Differenz zwischen den Fenwickereignissen für und gegen eine Mannschaft. Es ist also eine Art "Schussversuch - +/-", wird aber meistens für Mannschaften nicht als Absolutwert, sondern als Relativwert angegeben, also wie gross der prozentuale Anteil der gesamten Fenwickereignisse für eine Mannschaft ist. Fenwick Tied ist dieser prozentuale Wert berechnet aus den Ereignissen bei Gleichstand.

Da man im Allgemeinen davon ausgehen kann, dass eine Mannschaft, die mehr Schussversuche hat, auch zu grösseren Anteilen in Scheibenbesitz ist, werden Fenwick und Corsi auch als "Possession Metrics", also als Puckbesitzwerte bezeichnet.

Und die Probe zeigt auch, dass die besten Fenwick Tied-Teams auch am Ende der Saison die besten NHL-Teams sind.

Der Fenwickwert nach 20 - 30 Spielen ist ein sehr viel besseres Mittel zur Voraussage zukünftigen Erfolgs als die Tabelle nach 30 Spielen.

Der Grund dafür ist, dass eine Tabelle immer Resultate widerspiegelt und nur bedingt Leistungen. Natürlich nähern sich Resultate und Leistungen mit der Zeit an, das kann allerdings länger dauern, als dies häufig vermutet wird. 

Dass einzelne Spiele stark von Zufall beeinflusst werden, ist recht offensichtlich. Bemerkungen wie 'besser gespielt, Pech gehabt', 'glücklicher Sieg', 'unverdient' finden sich alltäglich in den Sportseiten.

Gleichzeitig gibt es aber auch den inneren Drang eine genauere Erklärung für alles zu finden. Und da man sich eine Niederlage des grossen Favoriten gegen den kleinen Underdog nicht durch 'Zufall' oder Varianz erklären will, sucht man sich andere Erklärungen.

Mannschaft A wollte es heute mehr, Spieler X ist momentan heiss, Mannschaft B hat heute den Gegner unterschätzt, etc. (Ich will hiermit nicht sagen, dass diese Erklärungen nicht gelegentlich durchaus richtig sein können, sondern lediglich, dass sie häufig die bevorzugte Erklärung für Varianz sind)

Das hat mehrere Gründe: 

Unser Gehirn ist sehr gut darin, Muster zu erkennen, hat dafür aber Defizite, wenn es darum geht, sich Varianz und Zufälligkeit zu erklären. Wenn eine Spitzenmannschaft 3,4 Spiele in Folge verliert, was im Eishockey jede Saison vorkommt, dann wird nach Erklärungen gesucht, obwohl es sich im Normalfall einfach nur um Varianz handelt. Sobald man über ein Spiel hinausgeht, lässt die Zulässigkeit von Zufall als Erklärung massiv nach. Diese innerlich begründete Suche nach Gründen nimmt mit grösser werdender Bedeutung des Ereignisses weiter zu. Dazu kommt dann noch die Tendenz des Gehirns, sich unterbewusst Informationen auszusuchen, die die eigene Meinung bekräftigen und Informationen, die das Gegenteil besagen, unterbewusst zu ignorieren und aus einer Vermutung wird schnell eine Überzeugung. Also wenn jemand davon überzeugt ist, dass eine Mannschaft heute lustlos wirkt, wird er sich eher an einen sich an der Bande ausruhenden Spieler erinnern als an den Stürmer, der es mit energischem Antritt erfolglos über den Flügel versucht hat.

So wird das Bedürfnis nach einer Erklärung für Zufall gestillt und Mannschaften, die einfach einen schlechten Tag erwischt haben, auf einen starken Torhüter treffen, etc. werden zu faulen, überheblichen, verweichlichten Mengen an Einzelspielern.1

Der Unterschied zwischen mangelnder Qualität und Varianz 

Nun stellt sich natürlich die Frage: Wie unterscheidet man zwischen wahrer Qualität und Glück/Pech?

Die Haupteigenschaft von stark zufallsabhängige Werten ist, dass diese nicht reproduzierbar sind, d.h. es lassen sich keine wirklichen Muster oder konstanten Unterschiede erkennen. Die Grösse, die Glück/Pech/Zufall im Eishockey am besten darstellt, ist PDO, die simple Addition von Schussquote und Fangquote einer Mannschaft.

Dieser Wert schwankt für die meisten Teams um 100, wobei Mannschaften mit konstant sehr starken Torhütern den Wert leicht erhöhen können. Der PDO-Wert hat natürlich einen sehr grossen Einfluss auf jedes einzelne Spiel. Die Korrelation (siehe Anm. 2) zwischen dem PDO-Wert einer Mannschaft in einem Spiel und den in diesem Spiel gewonnenen Punkten liegt ca. bei 0.776, was eine sehr hohe Korrelation darstellt. Die Korrelation zwischen dem Schussverhältnis und den gewonnenen Punkten liegt bei lediglich 0.04. Das heisst, ein einzelnes Spiel hängt stärker von dieser Zufallsgrösse ab, als von den reproduzierbaren Grössen. Im Verlaufe einer Saison läuft der PDO-Wert der Mannschaften aber immer mehr zum Mittelwert 100, während das Schussverhältnis einen konstanten eigenen Wert hat. Das zeigt, dass sich der Einfluss von Glück und Pech bei zunehmender Saisonlänge zusehends aufheben, während die Korrelation zwischen Schussverhältnis und gewonnenen Punkten immer weiter zunimmt. Nach 5 Spielen hängen Schussverhältnis und Punkte schon mit 0.39 zusammen, mit 50 Spielen steigt der Wert bereits auf 0.70, während der PDO-Wert einer Mannschaft hier bereits immer unwichtiger wird, da die Unterschiede zwischen einzelnen Mannschaften immer kleiner werden.

Das Schussverhältnis ist eine (die) echte Fähigkeit einer Mannschaft, während die Schussquote grösstenteils ein Zufallsprodukt ist. Die Schussquote beeinflusst kurzfristige Resultate, das Schussverhältnis langfristige - und ist damit wesentlich wichtiger, um den zukünftigen Erfolg einer Mannschaft vorauszusagen!

Also wenn eine Mannschaft das nächste Mal eine schwache Phase hat und die Gegner unterschätzt oder keinen Einsatz zeigt, einfach mal abwarten, solange sie genug schiessen, ist das wahrscheinlich nur Varianz!

Anm. 1: Mehr zum Unterschied zwischen Zufall und wahrem Können/Fähigkeiten in Michael Mauboussins Buch "The Success Equation: Untangling skill and luck in business, sports and investing", ISBN: 978-1422184233

2: Korrelationskoeffizienten kann man als Mass für den (linearen) Zusammenhang zweier Grössen verstehen, z.b. je mehr von A, desto mehr von B. Wenn mehr A immer zu mehr B führt, haben wir eine Korrelation von 1. Wenn mehr A immer zu weniger B führt, eine negative Korrelation, also -1 und wenn sich B völlig unabhängig zu A verhält, ist die Korrelation 0.