Nach der Beta-Phase in der letzten Saison geht die LigaInsider-Note nun in ihre zweite Spielzeit und wir im StatistikTeam möchten unser Projekt inhaltlich über das komplette nächste Jahr für Euch redaktionell begleiten. Dazu werden wir Fragen beantworten, Hintergründe erklären und unsere Modelle vorstellen.
Unsere interne LigaInsider-Liga wird uns dabei zusätzlich als Anschauungsbeispiel für die Bewertung einzelner Spieler dienen. Pro Wochenende sind darüber hinaus verschiedene Spieler und Spiele in unserem Fokus, die zur jeweiligen Thematik passen.
Spielerbewertungen mögen für viele Fans ja nur untergeordnete Relevanz haben – wenn man aber an einem Managerspiel teilnimmt und es um die Benotung der eigenen Spieler geht, wird das Thema noch einmal sehr viel interessanter.
Wir selbst sind alle als Manager aktiv und sind daher in besonderem Maße für das Thema Noten sensibilisiert. Daher setzen wir uns intensiv mit dem Feedback auseinander, welches wir von anderen Managern erhalten.
Nehmen wir den folgenden Satz eines kritisch eingestellten Kollegen: „Ein Spieler kann eine Passquote von 100% haben – aber wenn er die ganze Zeit nur Querpässe in der eigenen Hälfte spielt? Bekommt er dafür dann eine gute Note, selbst wenn er zum Spiel nichts beigetragen hat? Eine Statistik kann solche Sachen doch einfach nicht sehen.“
Doch. Kann sie. Denken wir uns jedenfalls im StatistikTeam mit allem Hintergrundwissen über die heutigen Möglichkeiten der Datenerhebung und wie man mit ihnen umgehen kann. Genau aus diesem Grunde möchten wir in dieser Serie unsere Ansätze auch mit Euch teilen.
Bleiben wir beim Beispiel mit der Passquote: Wie gehen wir mit dem Thema in unserer Note um? Es eignet sich hervorragend, um unser System ein wenig näher zu beleuchten. Denn natürlich zählen wir nicht nur stumpf die angekommenden Zuspiele beim Mitspieler. Wir klassifizieren alle erhobenen Rohdaten und setzen sie in einen fußballspezifischen Zusammenhang.
Schauen wir uns dies am Beispiel einiger Pässe von Thomas Delaney aus einem Spiel der letzten Saison an:
Die Pfeile, die mit den Nummern 1-4 gekennzeichnet sind, sind Bälle, die erfolgreich beim Mitspieler ankamen. Die mit A bis C bezeichneten Pfeile stellen Fehlpässe dar.
Für die Beurteilung eines Passes achten wir dabei vor allem auch darauf, in welcher Zone er gespielt wird und welches Ziel er hat. Wir unterscheiden dabei zwischen „Eigener Hälfte“ (Zone 1), „Gegnerischer Hälfte“ (Zone 2) und dem „Angriffsdrittel“ (Zone 3).
Zudem erhält jeder Pass von uns auch eine Zuordnung wie z.B. „Spielverlagerung“, „Rückpass“ oder „Vertikalpass“.
Schauen wir uns also die in der Grafik dargestellten Pässe einmal genauer an:
Erfolgreiche Pässe
- 1. Passart: Spielverlagerung | Ziel: Gegnerische Hälfte
- 2. Passart: Vertikalpass & Lang in den Fuß | Ziel: Angriffsdrittel
- 3. Passart: Querpass | Ziel: Gegnerische Hälfte
- 4. Passart: Rückpass | Ziel: Eigene Hälfte
Fehlpässe
- A. Passart: Querpass | Ziel: Eigene Hälfte
- B. Passart: Vertikalpass | Ziel: Angriffsdrittel
- C. Passart: Flanke | Ziel: Angriffsdrittel
Insgesamt haben wir bei den Pässen 30 vordefinierte Eigenschaften in unserer Passschablone, die jeden Pass exakt klassifizieren kann. So wird beispielsweise die Unterscheidung zwischen einem langen Ball mit bestimmtem Ziel auf den Kopf oder in den Fuß (Pass 2) vorgenommen.
Es kommt also immer darauf an, wie und wohin ein Pass gespielt wird und je nach Kombination der Werte ergibt sich für jeden Ball eine andere Wertigkeit. Pass 1 und 2 sind beispielweise in unserem System höherwertiger als Pass 3, der wiederum höher einzuordnen ist als Pass 4.
Fehlpass A ist schlechter bewertet als die nicht angekommenen Pässe B und C. Die Passquote alleine ist für uns also niemals ein Entscheidungskriterium. Wir ermöglichen es in der Bewertung z.B. Offensivspieler auch riskante Pässe spielen zu können, ohne genauso bewertet zu werden wie ein Spieler mit gleicher Passquote, der aber überwiegend Querpässe spielt.
Nur anhand von Makro-Daten wie Torschüssen, Zweikampfquote oder Passgenauigkeit lassen sich unserer Meinung nach keine sinnvollen Aussagen über Leistungen treffen. Wir haben uns daher aus den Rohdaten unsere eigene LigaInsider-Statistiken gebaut. Insgesamt verfügen wir über 1.000 Werte in unserem System: Von der fehlgeschlagenen Ballannahme eines Außenverteidigers in der eigenen Hälfte über ein verlorenes Dribbling eines offensiven Mittelfeldspielers, bei dem er einen Einwurf rausholt bis zum geblockten Torschuss eines Stürmers außerhalb des 16ers.
Soviel erst einmal zum Thema Qualifizierung von Daten und deren Zusammenhang. Morgen möchten wir Euch vorstellen, wie diese Zusammenhänge genauer aussehen, indem wir einen genaueren Blick auf die Hauptkriterien unseres Modells werfen.
Das ist doch wohl klar Zelandakh. Weil bei einem Torhüter 25 Punkte nach dieser Bewertungsskala reichen, um eine viel bessere Note zu erhalten, als das für einen Stürmer oder Abwehrspieler gilt. Er hat ja auch viel weniger Aktionen im Spiel, ergo kann er in Normallfall durchschnittlich weniger Punkte erreichen. Es wird also nach Positionen unterschieden: TW, Außenverteidiger, Innenverteidiger, DM, OM, Flügelspieler, Stürmer. Jede Position hat seine eigenen Bewertungsgrundlagen und Notenskalen, berechnet aus den Auswertungen der letzten 3 Jahre
Super Artikel. (Y)
Genau so etwas fehlt Comunio/Sportradar. Macht weiter so, top. :)
Immerhin hat sich Lasogga trotz Auslandswechsel für mich bezahlt gemacht. Er ist mit 0 Punkten einer meiner besten Spieler im Comunio-Kader. Und Geis ist auch nur nach Spanien abgehauen weil er keine Lust mehr auf Sportradar hat.
Lief echt bei dir. :D Wie gesagt, Diekmeier ist für 750k zu haben. :P :D
Daran sollte sich Sportrader ein Beispiel nehmen. Aktuell ist die Benotung teilweise absolut nicht nachzuvollziehen. Da wünsch ich mir sogar sportal/spox zurück.
Kann LigaInsider nicht mal mit Comunio sprechen und eine Kooperation eingehen? Mittlerweile hat sich diese Plattform doch bewiesen.
Das liegt auch am Finanziellen. Unter anderem um weitere Marktanteile zu gewinnen, wird jetzt ja diese Transparenz-Offensive gestartet - in der Zeit, in der sich fast alle Comunio-Manager über die dortigen Noten und mangelnde Transparenz beklagen. Dirk, Kristian und Co. machen das sehr clever. Ich hoffe, sie werden damit viel Erfolg haben und bald bei einem großen Manager einsteigen (auch wenn ich rein statistische Bewertungen noch sehr kritisch sehe)
very nice! Sportradar-Bingo braucht kein Mensch!!!
Ich habe den Eindruck, dass es Torhüter durch die neue Benotung generell schwerer bei Comunio haben.
War eigentlich als Antwort zu UdoBoenstrup gedacht. Die Benotung von Comunio und hier haben natürlich nichts miteinander zu tun.
Kann mir mal einer erklären, warum Schwolow letztes Wochenende bei Comunio ne 4,5 bekommen hat? Verstehe ich bis heute nicht. Ohne ihn wäre Freiburg gegen Leipzig ja fast zweistellig untergegangen. Er hat ja auch schließlich um die 300 Schüsse aufs Tor bekommen, klar, dass man da nicht alles halten kann.
Deswegen spiele ich Kickbase
[Kommentar gelöscht]
Endlich mal ein großes Lob von mir. Sehr transparent und auch nachvollziehbar, sofern die Datenbank das genauso erfasst, wie es hier erklärt wird.
Bin auf Teil 2 schon gespannt. Vielleicht zieht sportsradar ja mal nach und offenbart seine Bewertungsgrundlagen. Ich bezweifel das jedoch, weil die keine ordentliche Grundlage besitzen. Da wird sicher stehen, dass zB. ein Torwart bei 1 Gegentor keine 2,5 mehr erreichen kann....bei 2-3 Gegentoren keine 4 mehr usw............:)))))
Wenn ich mittlerweile Sportradar lese, wird mir schlecht.
Ih dachte der Schwerpunkt hier war alle Positionen vergleichbar zu machen. Es ist sehr leicht, alle Bewertungen zu normalisieren, so dass am Ende die Punktzahlen gleichwertig sind. Das scheint mir viel besser als eine magische Formel zu nutzen und war meinem Verstandnis wie es funktionieren soll.
gut beobachtet mit den punkten.. also erstmal ist es wie nitschos899 sagt, dass eh jede position ihre eigene skala hat. daher haben wir das am 1. spieltag voneinander gelöst, aber dann für den 2. spieltag auch die punkte vergleichbarer gemacht. wir dachten zuerst, das sei klar, aber wie du es sagst: wir wollen ja besonders die punkte vergleichbar machen, daher haben wir es angeglichen.
Das habe ich schon einmal auf der FCK Seite gescrieben, passt aber besser hier:
Könnte jemand vielleicht erklären warum in W1 Cordoba bekam für 57 eine Note 3 aber Klünter, Sörensen und T. Horn eine 2,5 für 53, 42 bzw. 25 Punkte. Alle haben volle 90 Minuten gespielt. Macht das Sinn?
Meine andere Frage ist, wie kalibriert ihr die Gewichtungen der einzelnen Aktionen? Spricht, wie viele Punkte es z.B. für einen erfolgreichen Steilpass im Vergleich zu einem erfolgreichen Querpass gibt, und wie sich die Minus-Punkte im Verhältnis zu den Pluspunkten verhalten.
So ist es! Ohne das jemand das Spiel sieht und bewertet ist das einfach nix! Siehe Hector bei Köln gegen Hamburg. Er bekommt ne 3,5 und hat ein rabenschwarzen Tag gehabt. Ich weiß nicht wie seine Passquote war, aber wer das Spiel gesehen hat, den sind seine 3 hartstreubenden Fehlpässe ohne Not in der Vorwärtsbewegung direkt in die Füße eines HSV Spielers aufgefallen die gefährliche Gegenstöße eingeleitet haben. Dazu noch unnötige Fouls in gefährlicher Situation und er bekommt ne 3,5? Cordoba im gleichen Spiel verspringt jeder zweite Ball er vergibt die wenigen guten Chancen kläglich und bekommt ne 2,0? Mehr als ein stets bemüht war es nicht. Sieht man im Vergleich dann noch Auba mit einer 3 im Spiel gegen Hertha, lache ich mich über die 2,0 von Cordoba gleich nochmal tot! Im ersten Spiel von Köln bekommt Klünter ne 2,5...Das war der Brüller. Ich meine den habe ich bei Kicker, aber der war so schlecht, alle Angriffe von Gladbach gingen über seine Seite grotten Stellungsspiel unterirdisches Spiel als AV und er bekommt ne 2,5? Bei kicker schaut man leider die Spiele und da bekam er zu recht ne 5. Also nur auf Statistik vertrauen ist wie bei den großen Banken. Da verwalten irgendwelche überzahlten Wasserköpfe in der Zentrale fernab vom Schuss ohne die geringste Ahnung zu haben was in den Filialen wirklich los ist, was die zukünftige Ausrichtung ist und wo Personal abgebaut werden kann weil es nicht benötigt wird. Die gut gewichtete Statistik macht nur in Zusammenhang mit einem der das Spiel gesehen hat Sinn. Sonst gibt es riesen Diskrepanzen. Wenn z.B. Sportradar nächstes Jahr wieder comunio Partner ist, höre ich auf zu spielen, weil das gar kein Spaß mehr macht.
@linch: zu genauen gewichtungenkönnen wir natürlich nichts sagen.
@rest: cordobas leistung wird nicht nur an offensiv-aktionen gemessen. ist aber kein problem, wenn ihr das anders seht. wir sehen es so. // "stellungsfehler" können nicht betrachtet werden. aber diesen punkt werden wir mal in zukunft explizit erklären, warum das auch gar nicht so sinnvoll ist (zumindest unserer meinung). wenn ihr es doch wollt, müsst ihr euch das woanders besorgen und auf die menschliche bewertung vertrauen.
"@linch: zu genauen gewichtungenkönnen wir natürlich nichts sagen"
Aber vielleicht ein paar Allgemeine Infos zur Kalibrierung ohne Gewichtungskoeffizienten oder ähnlichen geschützten Informationen?
ja genau. das wollen wir über die ges. saison an ausgewählten beispielen machen. wir müssen halt immer genau entscheiden zwischen info-mehrwert für user und schutz unseres systems. :)
Liebes StatikstikTeam,
ein Riesenlob von mir für die großartige Arbeit, die ihr leistet!
Darf ich fragen, in welcher Form die auszuwertende Rohdaten vorliegen und mit welcher Frequenz diese aktualisiert werden?
Wie entscheidet der Algorithmus, ob der Pass in den Fuß oder an den Kopf gedacht war?
Sind die Rohdaten Skalar- oder Vektorgrößen? Sind in den Rohdaten nur die Koordinaten jedes einzelnen Spielers inbegriffen? Oder auch die Orientierung, mit Gesicht in welche Richtung er gerade steht oder läuft? Auch seine Geschwindigkeit?
Und bei dem Ball, ist ebenfalls zu jedem Zeitpunkt die Position und die Geschwindigkeit bekannt?
- rohdaten von opta über schnittstelle in form einer xml. die wird jede minute aktualisiert.
- fuß und kopf wird ja genau beobachtet.
- momentan nur skalar. vektor wird erst relevant, wenn wir gps bekommen.. das ist aber finanziell leider momentan noch nicht realisierbar. der algorithmus ist dafür aber schon vorbereitet.
- ball: position immer in verknüpfung mit spieler, ohne geschwindikkeit. sonst ebenfalls noch nicht.
Hey Sveno,
vielen Dank!
"- rohdaten von opta über schnittstelle in form einer xml. die wird jede minute aktualisiert."
Bei der Frage wurde nicht die Aktualisierungsfrequenz der Opta-Schnittstelle, sondern wie die zeitliche Auflösung der Daten ist.
"fuß und kopf wird ja genau beobachtet."
Was heißt denn "wird genau beobachtet"? Steht in den Rohdaten bereits, ob ein Pass in den Fuß oder an den Kopf ging? Die restlichen Differenzierungen, wie Pass ins Angriffsdrittel, Querpass etc., werden ja vom LI-Algorithmus vorgenommen. "Fuß oder Kopf" kann aber ein Algorithmus nicht entscheiden, dafür ist ein zusätzlicher Input erforderlich.
"position immer in verknüpfung mit spieler"
Sprich, es werden 22 Koordinaten der Spieler weitergegeben, aber nicht noch zusätzlich die Koordinate des Balls?
- die antwort ist die gleiche.. sobald wir daten ziehen, werden sie auch sofort verarbeitet (bruchteil einer sekunde).
- das steht schon in den rohdaten.
- nein, es wird immer nur die koordinate des ballführenden spielers angegeben (und somit auch die des balles). findet zum bsp. gerade ein 2kampf statt in minute 33:11, dann weiß ich, maximal, wo sich gerade 2 spieler und der ball aufhalten. ich kann so die geschwindkeit und die richtung des balles ermitteln, aber wir hätten gerne zu jedem zeitpunkt alle spieler inkl. richtung und geschwindigkeit. wie gesagt, genau diese daten wollen wir für den nächsten schritt..
"die antwort ist die gleiche.. sobald wir daten ziehen, werden sie auch sofort verarbeitet"
Danke Sveno, aber ich glaube, die Frage ist immer noch nicht rüber gekommen. Es kann ja nicht sein, dass ihr der Rohdatenset in der zeitlichen Auflösung 1x pro Minute vorliegt. Wie oft ihr die Daten runter zieht und wie schnell diese verarbeitet werden ist bei der Frage irrelevant. Die Frage ist, wie viele Datensätze pro Minute vorliegen, sprich wie oft die Koordinaten aktualisiert werden. Gibt es eine feste Rate, wie z.B. 1x Rohdatensatz pro Sekunde, oder sind diese an bestimmte Ereignisse gekoppelt, wie z.B. diese werden nur dann aktualisiert, wenn etwas nennenswertes wie ein Zweikampf oder ein Pass passiert.
Beispiel:
Minute 3:05: Spieler A bekommt den Ball,
3:11: er geht in den Zweikampf
3:13 er gewinnt den Zweikampf
3:16 er spielt den Ball weiter
Sein Ballbesitz dauerte 11 Sekunden, in der Zeit gab es 4 Ereignisse. Hat man für diesen Abschnitt 11, 4 oder irgendeine andere Anzahl an Rohdatensets?
ahh, jetzt verstehen wir, was du meinst.. :)
ich kriege in diesem fall 3 ereignisse: in 3:05 bekommt er den ball --> dann verfolgen wir seinen weg (es passiert ja in deinem bsp. offenbar nichts), indem wir bei ereignis 2 seinen neuen standort kennen (hätten wir gps, könnten wir auch seinen laufweg bestimmen und von allen anderen, aber das geht halt noch nicht). 3:11 und 3:13 sind das gleiche, weil wir nur das ergebnis betrachten - wie lange ein 2kampf dauert, ist für uns irrelevant (ps. kein 2kampf dauert 2 sekunden ;)). und schließlich 3:16 pass.
Danke, so langsam wird es verständlich. Zumindest, in welcher Form die Daten zur Verfügung stehen.
Die reine Statistik kann vielleicht aufnehmen welcher Art ein Pass ist, aber die Umstände wie dieser zustande kommt kann sie einfach nicht abdecken.
Um das Beispiel mit dem Pass aufzunehmen.
So kann ein Spieler der Mannschaft X gute und präzise Vertikalpässe spielen und damit ordentlich Punkte in der Statistik sammeln, wird aber nicht den Umständen gerecht. Soll bedeuten er kann die Vertikalpässe spielen, das aber auch nur weil er den Platz und Raum hat.
Der Spieler der Mannschaft Y hingegen spielt nur halb so viele Querpässe, dafür technisch anspruchsvollere da er permanent in Manndeckung steht.
Solche Umstände kann man nur schwer aus der reinen Statistik ablesen, dazu braucht es schlussendlich der subjektiven Beobachtung.
Selbiges bei Torhütern.
Es gibt diese "unhaltbaren" Bälle, die manch einer wenn er einen guten Tag hat trotzdem irgendwie noch erreicht. In der Statistik ist das aber einfach nur ein gehaltener Torschuss. Gegenbeispiel, der 08/15 Torschuss der im Tor landet. Zwei Torschüsse beide werden gleich gewertet (beides Extrembeispiele).
Ich bin weiterhin extrem skeptisch was die reine Statistikauswertung betrifft.
Word! GENAU das ist das große Problem bei der Bewertung von Sportradar. Klasse Beispiel finde ich auch Brekalo: am ersten Spt eine 5,5 bekommn.. am zweiten Spt. eine 3. An seiner Spielweise hat er nichts groß verändert, nur im zweiten Spiel hatte er in HZ 1 eine 100% Passquote. Meint man ja fast er hätte sich selbst in Comunio. Da sonst seine Effizienz und seine Leistung nahezu identisch war in beiden Spielen darf hier niemals eine Differenz von 10 Bewertungspunkten entstehen.
was haben comunio manager davon? die noten hier sind ja nicht die grundlage für die bewertung in der comunio. ich bin aktuell sehr enttäuscht von sportradar... die noten dort weichen teilweise um 2 notenpunkte ab, wie soll man sich orientieren? wie gesagt, nice... aber für wen ???
Noch viel wichtiger als das sehr gut ausgeklügeltes Statistikmodell ist doch die Frage ob ihr auch das Spiel schaut und dementsprechend mit bewertet ?
Beispiel letzte Woche hector, klünter, cordoba und Auba. Das sieht mir nach reiner Maschinenbewertung aus.
Wie ist das? Ich kann gern zu den Spielern kurz was schreiben falls ihr wissen möchtet was ich meine.
ja, alles läuft automatisch und wird errechnet. da greift kein mensch mehr ein.
War der Spieler beim Pass vom Gegenspieler bedröngt, hat er den Ball mit dem Rücken zum Mitspieler weitergeleitet, wurde er selbst vor dem Pass ungenau angespielt? Keine Statistik der Welt erkennt einen Traumpass, ein echter Fussballfan schon!