Quality of Competition

Ein Grund dafür, dass mir die Eishockeyberichterstattung in Deutschland aktuell nicht wirklich gefällt, ist, dass häufig lediglich auf Produktion geachtet wird. Selbst im nicht statistisch versierten Teil des NHL-Universums wird durchaus über Verwendung und Rollen gesprochen. Die wenigen Beispiele, die in Deutschland diesbezüglich auftreten,entstehen durch freiwillig präsentierte Informationen. Wie zum Beispiel Harold Kreis' Bezeichnung der Reihe um MacDonald, Kink und Glumac als "Wrecking Crew", also als Abrisstruppe. Deren Rolle beschrieb er damit, dass sie das Spiel der gegnerischen Topreihe zerstören sollen (z.B. sechster Absatz hier).

Bis zu einem gewissen Grad ist es natürlich auch verständlich, dass sich solche Gedanken nicht von alleine in die alltägliche Eishockeydiskussion einbringen. Fans fällt es sicherlich schwer, sich während dem Spiel noch klar zu machen gegen wen wer wie häufig spielt. Aber für genau solche Fälle sind ja Statistiken da.

Es sollte schliesslich intuitiv Sinn machen, dass man, um die Leistungen einzelner Spieler besser beurteilen zu können, sie in einen gewissen Kontext setzen muss. Ein gutes Beispiel findet man dazu von Eric T:
Nikolai Kulemin und Daniel Briere hatten letzte Saison in der NHL sehr ähnliche Punktzahlen. Wenn man nun aber bedenkt, dass Kulemin häufig gegen die besten Stürmer des Gegners, viel Unterzahl und sehr wenig Powerplay spielen musste, Briere hingegen eher die unteren Reihen der Gegner sah und sehr viel Powerplay-Eiszeit bekam, aber in Unterzahl so gut wie nie ran musste, gibt uns das ein klareres Bild die Leistungen welcher Stürmer man höher einschätzen sollte.

Die Qualität der Gegner (von hier an Quality of Competition, bzw. QoC) lässt sich auf mehrere Arten messen. Mein persönlicher Favorit ist die Eiszeitgewichtung. Also: 

Die Qualität der Gegner eines Spielers wird ausgedrückt als Durchschnitt der Eiszeit der Gegner, gegen die dieser Spieler spielt, gewichtet mit der Häufigkeit, mit der der Spieler gegen den jeweiligen Gegner spielt.

Eine andere beliebte Möglichkeit ist zum Beispiel die Berechnung über Corsi Rel (also statt Eiszeit, den durchschnittlichen Corsi Rel-Wert). Das ist auch der Wert, der auf Behindthenet.ca zu finden ist. Da die Qualität der Gegner meiner Meinung nach aber ein taktischer Umstand ist und die besten Spieler (wenn man von rational denkenden Trainern ausgeht) die meiste Eiszeit bekommen, scheint es mir sinnvoller auf die Eiszeit der Gegner zu schauen, da diese die Meinung der Trainer von ihren eigenen Spielern am besten widerspiegelt (Eiszeit ist schliesslich etwas, was ein Trainer sehr direkt beeinflussen kann).

Ausserdem erreichen wir ein deutlicheres Bild, wenn wir Verteidiger und Stürmer voneinander trennen.

Für diejenigen, die die Berechnung nicht interessiert und gleich zur interaktiven Grafik ganz unten springen wollen, hier vor der Verwendung noch ein paar Sicherheitshinweise (nicht, dass sich noch jemand weh tut):

  • Diese QoC-Daten sind Näherungen! 
  • Auch wenn ich davon überzeugt bin, dass die Näherung sehr sinnvoll ist, sollten die Schlüsse, die man aus diesen Diagrammen zieht, definitiv qualitativ und nicht quantitativ sein.
  • Das heisst, wenn Spieler A einen Wert von 19:30 hat und Spieler B einen von 20:30, beide aber jeweils den höchsten Wert ihrer Mannschaft haben, sollte man daraus inferieren, dass beide Spieler jeweils die schwersten Gegner gesehen haben und nicht Spieler A hat schwerere Gegner als Spieler B gesehen!
  • Es ist am besten dazu geeignet, die Spieler den Rollen innerhalb ihrer Mannschaft zuordnen zu können.
  • Es empfiehlt sich ebenfalls, jeweils Verteidiger und Stürmer eines Teams separat zu betrachten

Berechnung

Da die DEL uns aber keine Eiszeiten gibt, müssen wir uns dafür etwas anderes überlegen. Für ein ähnliches Projekt hat Scott Reynolds von Copper'n'Blue bereits eine Lösung geschaffen.

Er fand heraus, dass Eiszeit und Scoring Events (also Situationen, in denen der jeweilige Spieler auf dem Eis ist, während ein Tor fällt) sehr hoch korreliert sind. Wir können also, wenn wir wissen, wie häufig ein Spieler auf dem Eis war, wenn ein Tor fiel (egal ob für oder gegen) eine Schätzung abgeben, wie viel Eiszeit dieser Spieler hatte.

Wir nehmen an, dass ein Spieler, wenn er zu 1/3 der Tore der eigenen Mannschaft auf dem Eis war, also auch zu 1/3 der Zeit auf dem Eis war.

Glücklicherweise gibt uns die DEL diese Information. Denn aus den Spielberichten sieht man jeweils, wer bei welchem Tor auf dem Eis war (die DEL verwendet diese Informationen, um den Plus/Minus-Wert zu berechnen).

Nun müssen wir aber noch herausfinden, welcher Spieler wie häufig gleichzeitig mit welchem Spieler auf dem Eis war. In einer perfekten Welt könnten wir diese Informationen zu jedem einzelnen Zeitpunkt abrufen, wie das in der NHL möglich ist. Das geht in der DEL nicht. Auf dieses Problem ist auch Eric bei seinen Berechnungen gestossen. Deswegen hat er überprüft, ob eine Näherung möglich ist. Nämlich über die Tore. 

Denn hier wissen wir zu bestimmten Zeitpunkten, wer mit wem gleichzeitig auf dem Eis steht. Eric sah dann, dass diese Näherung qualitativ sehr ähnliche Daten liefert.

Also hab' ich mir sämtliche Daten zu den Toren der letzten Saison aus der DEL-Statistik gesucht (Was nicht ohne Hilfe, die lieber anonym bleibt, möglich gewesen wäre, 1000 Dank hierfür!) und damit sowohl Eiszeit als auch QoC berechnet. Wie bereits vermerkt ist die durchschnittliche Eiszeit der Gegner in Verteidiger und Stürmer aufgespalten, sodass sich folgende Diagramme ergeben (ganz unten interaktiv und eleganter).

Resultate

Aufgetragen sind auf der Y-Achse die durchschnittliche Eiszeit der gegnerischen Verteidiger, auf der X-Achse die der gegnerischen Stürmer

Man erkennt also zum Beispiel, dass Harold Kreis die Wahrheit gesagt hat, als er behauptete, die Reihe um MacDonald, Kink und Glumac setze er darauf an, die beste Reihe des Gegners stillzulegen. Das Trio hat mit die höchsten durchschnittliche Eiszeit der gegnerischen Stürmer vorzuweisen.

Ausserdem ist zu sehen, dass die Reihe um Ullmann und Magowan (und Mitchell, der allerdings während der Verletzungen der anderen beiden auch in anderen Reihen gespielt hat) sich konstant mit den besten Verteidigern des Gegners konfrontiert sah (was nach dem Riesen-Lauf, den die Reihe in den 11-12er Playoffs hatte, nicht extrem verwundert) und somit Yanick Lehoux die Freiheit gaben, gegen nicht so gute Spieler offensiv zu glänzen. Ein Vergleich mit dem Diagramm der Vorsaison könnte so auch teilweise den Punktabfall der Ullmann-Reihe erklären.

Das sind nur zwei kleine Beispiele, wie einem die Berücksichtigung dieser Daten einen besseren Überblick über die gezeigten Leistungen einzelner Spieler geben kann. Auf jedes einzelne Team möchte ich nun aber nicht eingehen, heute sollte es darum gehen, die Daten zu präsentieren und die Hintergründe der einzelnen Berechnungen vorzustellen. Damit kann ab heute jedermann sich die Daten seines Lieblingsteams angucken und mit seinen eigenen Eindrücken vergleichen.

Daten zur aktuellen Saison wird es rund um Spieltag 30-40 geben. Wie gesagt, diese Werte sind Näherungen, von daher möchte ich mindestens so lange warten, um etwas zu präsentieren.

In den folgenden Diagrammen sind die Spieler ebenfalls wie im obigen nach QoC D und F platziert. Die Grösse des Kreises, der jeden Spieler repräsentiert, ist ein Indikator der Eiszeit, die Farbe stellt die zur Eiszeit relative Punktzahl dar (also Punkte, die der Spieler in 60 Min Eiszeit erzielen würde).

Wenn man über einen einzelnen Spieler fährt, sollte eine Box erscheinen, die einem diese und weitere Zahlenwerte angibt.

Auf der rechten Seite gibt es die Möglichkeit nach Teams und Position zu filtern. Auch ist es möglich, Spieler mit einer geringen Spielezahl zu finden, hier würde ich aber warnen, da die kleiner werdende Stichprobe dann die Resultate durchaus verfälschen kann.

P.S.: Wenn jemand Interesse an anderen Ansichten/Darstellungen des unten zu findenden Diagramms hat, einfach hier in den Kommentaren, über Twitter (@5plusspieldauer) oder per Mail (5plusspieldauer at gmail.com) melden.