LigaInsider | 1. Bundesliga

Hin­tergrundwis­sen zur Note | Teil 3

03.09.2017 - 19:00 Uhr Gemeldet von: StatistikTeam | Autor: StatistikTeam

Nachdem wir uns angesehen haben, welche Möglichkeiten es zur Klassifizierung der Rohdaten gibt und auf welchen Ebenen wir diese verknüpfen, möchten wir heute vorstellen, wie wir aus den vorgestellten Ansätzen eine Note bilden und welche Aussage ihr innewohnt.


Die beiden im letzten Artikel vorgestellten Ebenen (Aktion und Event / Einfluss eines Einzelspielers auf den Spielverlauf) führen wir in unserem sogenannten LImpact-Wert zusammen, der die Basis für unsere Note bildet.

Diesbezüglich möchten wir uns mit einer Aussage befassen, mit der wir zuletzt als Feedback konfrontiert waren: "Da kein Notensystem widergibt, was ein Trainer vorgegeben hat, spielt es keine Rolle, welches System falsch liegt... Ob Kick & Rush oder Tiki-Taka das bessere System ist, darauf gibt es ja auch keine Antwort."

Hier wird die Kernproblematik von Einzelbewertungen im Fußball angesprochen – es gibt keine "Wahrheit". Wir möchten uns daher auch von einem solchen Ansatz lösen. Spieler haben bestimmte Aufgaben, die man als Außenstehender lediglich erahnen kann.

Wir interpretieren nicht, wir raten nicht, wir bewerten lediglich den Output, den wir beobachten. Ein Spielverlauf ergibt sich auf natürliche Weise und es zeigt sich schnell, welche das dominante, spielbeherrschende Team ist und welche der Mannschaften eher Defensivarbeit verrichten muss. Bekommt ein Spieler zum Beispiel die Aufgabe, nach jedem Ballgewinn den Ball lang nach vorne zu schlagen (weil sein Trainer ihm das offensichtlich vor dem Spiel aufgetragen hat), und setzt er es dann genau so um, dann verrichtet er seinen Dienst zwar genau wie gefordert, aber von der Bewertung der Aufgaben-Erfüllung lösen wir uns explizit.

Wir fragen immer: War die Aktion erfolgreich oder nicht? Und wie schwierig und erfolgsversprechend war sie darüber hinaus? Ein Spieler, der nach einem erzwungenen Turnover, maßgeblich zum Spielaufbau in der Umschaltbewegung beitrug, hat für sein Team einen höheren Mehrwert geschaffen und dann einfach eine höhere Punktzahl verdient als sein Kontrahent mit den lang gespielten Bällen, die mit größerer Wahrscheinlichkeit direkt wieder einen Ballverlust bedeuten und so weniger zum eigenen Spiel beitragen können – Trainervorgabe hin oder her. Für den Limpact ist es daher unerheblich, was genau ein Trainer einem Spieler mit auf den Weg gegeben hat. Er misst den Beitrag, den jede Position auf dem Feld zum eigenen Spiel leistet.

Natürlich hat eine offensive Ausrichtung somit mehr positives Punktepotenzial für den Spieler als eine defensive, da hier die spielentscheidenden Events mit größerer Wahrscheinlichkeit eintreffen, aber eine solide Defensiv-Arbeit kann auch erfolgsversprechend sein und ein im Brennpunkt stehender defensiver Mittefeldspieler könnte eine bessere Einzelwertung bekommen als sein Pendant aus dem Mittelfeld des Gegners, der lediglich Mitläufer-Aufgaben erfüllt.

Ein für uns wichtiger Punkt, der unseren Ansatz von den bisher vorherrschenden unterscheidet, ist darüber hinaus der minimale Einfluss des Endergebnisses auf die Einzelleistung. Diese spielerübergreifende Bewertung werden wir zukünftig im Rahmen einer Trainernote veröffentlichen. Und jeder kann sich dann seine eigene Gewichtung aus taktischer Ausrichtung und Einzelbewertung kreieren. Auf diese Weise möchten wir die Wichtigkeit des Trainers hervorheben und positive wie negative Entwicklungen explizit nicht den Spielern zurechnen. Auch deshalb bezeichnen wir unsere Bewertung als fairste Note Deutschlands.

Exemplarisch für diesen Ansatz ziehen wir das Topspiel vom letzten Wochenende heran. Man hätte auf den ersten Blick eventuell bessere Noten beim BVB und/oder schlechtere bei Hertha erwartet, lag der Unterschied in der Spielanlage doch etwas weiter auseinander. Aber eine Kollektiv-Bewertung wollen wir so nicht vornehmen.

Niklas Stark konnte durch seine solide Defensivleistung eine Bewertung im 3er-Bereich erreichen, Gonzalo Castro allerdings ebenso (um eine Nuance besser) – zu einer „guten“ Leistung fehlten ihm hier die entscheidenden spielverändernden Szenen. Kritiker könnten dann aber immer noch sagen, dass sein solides Passspiel genau sein Aufgabengebiet gewesen sein muss/könnte. Das mag auch so sein, aber unsere Maxime ist, dass eine solche Aufgabe auch von einem anderen Spieler auf ähnliche Weise hätte verrichtet werden können (Austauschbarkeitsprinzip), da hier die Schwierigkeit der gestellten Aufgaben (bzw. der Aufgaben, die er sich selbst gestellt hat) im Spiel nicht so hoch war.

Dies sind (grob umrissen) unsere Ansätze für unseren Algorithmus, um die Leistung der Spieler innerhalb eines Spiels zu bewerten. Wir erheben keinen Anspruch auf Richtigkeit – die es einfach nicht geben kann und können auch nicht beantworten, wie „gut“ jemand wirklich ist (entsprechend einer Benotung in der Schule aufgrund einer Klausur). Wir bewerten den Einfluss der Spieler auf das eigene Spiel und setzen es ins Verhältnis zu allen Spielern dieser Position.

Wir werden, wie eingangs angekündigt, über die Saison hinweg auch immer mehr Informationen mit Euch teilen und spezielle bzw. kontroverse Noten erklären.


  • KOMMENTARE
  • 04.09.17

    Arturo gebe dir recht. Subjektiv finde ich meine persönlichen Noten "aus dem Bauch heraus" direkt nach dem Spiel einfach besser als all die wissenschaftlichen Noten über die hier diskutiert wird.

    Die fairste Note wäre im es Endeffekt wahrscheinlich die durchschnittsnote aus Kicker, Ligainsider, Sportal und trallalala "Bild" - Sportradar mal ganz bewusst herausgenommen, was die veranstalten geht gar nicht.

    • 04.09.17

      Wenn du die Durschschnittsnoten von mehreren Plattformen nimmst, hast du am Ende aber für alle Spieler eine Note von ~3.0, weil es eben immer subjektive Einflüsse gibt die unterschiedliche Plattformen unterschiedlich bewerten. Das fängt schon bei Details wie Foulspielen an: Manchmal schaut man mit Freunden ein Spiel und nach 10 Wiederholungen findet die Hälfte immer noch, dass es keins war, während sich die andere Hälfte klar für ein Foulspiel ausspricht. Es gibt also nicht "die Wahrheit". In der Folge vergibt der Kicker am Wochenende für Spieler XY die 3.0, weil er solide gespielt hat, Liga Insider vergibt jedoch Abzüge und die 4.0, weil er ein unnötiges Foul getätigt hat, welches zum Tor geführt hat. Ergo: (3.0 : 4.0 = 3.5) Würder unterm Strich also die 3.5 geben und damit ist dann meiner Meinung nach auch keinem geholfen, weil wir ja schon wollen, dass das Foulspiel berücksichtigt oder nicht berücksichtigt wird. Ein halbes Foul gibt es nun einmal nicht. Es ist daher schon wichtig, dass es einen einzigen Anbieter gibt, damit die volle Bandbreite der Notenskala genutzt werden kann, denn es nützt auch keinem etwas, wenn sich am Ende der Saison alle Spieler in einer Notenrange von 2.5 und 4.0 bewegen. Es sollen ja auch sehr gute Noten und sehr schlechte Leistungen berücksichtigt werden.

    • 04.09.17

      [Kommentar gelöscht]

    • 04.09.17

      Natürlich gibt es Unterschiede zwischen den Anbietern, was auch in Ordnung ist. Man kann nicht verlangen, dass alle die gleichen Maßstäbe ansetzen, Fußball ist nunmal auch subjektiv, egal wie gut das Notensystem ist. Worauf ich eigentlich nur hinaus wollte, dass man keine Durchschnittsnoten aus mehreren Anbietern bilden sollte, weil dies zwar auf den ersten Blick den den Eindruck erweckt, dass wenn man möglichst viele Meinungen einholt, man automatisch sehr nahe an " der richtigen Note" liegt, es aber im Gegenteil eher ein durchmischen von subjektiven Meinungen ist und man so immer das Problem der "Tendenz zur Mitte" hat. Es wird dann deutlich weniger sehr gut und sehr schlechte Leistungen geben.

    • 04.09.17

      [Kommentar gelöscht]

  • 03.09.17

    Liebes StatistikTeam,

    wieder einmal vielen Dank für das nächste Kapitel und die spannenden Hintergrundinfos.

    Allerdings fehlt mir noch was bei dem Thema. Und zwar schreibt ihr im Kapitel I:
    "Dazu werden wir Fragen beantworten, Hintergründe erklären und unsere Modelle vorstellen."

    Zu den ersten zwei Teilen habe ich mehrere Fragen gestellt, jedoch wurde leider keine einzige davon beantwortet. Nicht mal eine kurze Rückmeldung gab es dazu, was ist ehrlich gesagt sehr schade finde. Bevor ich weiterhin mit mir selbst rede und weitere Fragen ins Leere stelle, würde ich mich auf eine Rückmeldung von euch sehr freuen.

    • 04.09.17

      wir geben uns mühe, möglichst viele antworten zu geben. aber es ist nicht immer jeder sofort verfügbar. ihr könnt die fragen also gerne stellen, sofern es kein problem ist, auch mal etwas geduld mitzubringen.

  • 03.09.17

    Eure Bewertungsgrundlagen kann ich nachvollziehen, jedoch wird einem dadurch durchaus klar, dass es die absolut gerechte Bewertung kaum geben kann. LI versucht sicherlich dem Anspruch eines fairen Notengebers gerecht zu werden, nur ist "Gerechtigkeit" leider ein dehnbarer Begriff, wie man hier sieht. Dennoch vielen Dank für diese aufschlussreichen Informationen. Ihr seid absolut bestrebt zumindest seitens Euer für Klarheit zu sorgen, was man von sportsradar nicht behaupten kann. Meinetwegen seid Ihr zur neuen Saison der Notenpartner von Comunio. Bis dahin wird es aber mit sportsradar noch ein steiniger Weg für tausende User...........ich hoffe nicht, dass comunio sich da verzockt hat und tausende roter Karten zum Saisonende kassiert......

  • 04.09.17

    Wenn ich mir dieses ganze Statistik gedöns durchlese, sei es nun Ligainsider oder auch Sportradar muss ich sagen das die Noten alles sind nur nicht fair. Die Noten müssen zwingend mit einem subjektiven Eindruck des Spiels und des Spielers abgemischt werden. Ich behaupte sogar das im Laufe einer Saison fairere Noten zustande kommen würden wenn nur subjektiv durch Fachmänner bewertet werden würde. Der Ansatz Spieler anhand von Statistiken zu bewerten ist Ehrenwert, aber es fehlen gefühlt noch weitere 150 Parameter, doch soweit ist "Big Data" hier zumindest noch nicht.

    • 04.09.17

      Das ist Quatsch, weil es bisher überhaupt kein, "Statistik Gedöns" von Sportradar zu lesen gibt. Da lobe ich mir Liga Insider, einfach vorbildlich und transparent.

    • 04.09.17

      Kann den Gedanken von tam schon verstehen, auch wenn ich ihn nicht gänzlich teile und auch nicht so formulieren würde. Die perfekte Note wäre aus meiner Sicht, wenn die jeweiligen Trainer der Mannschaften ihre Spieler (auch in Bezug auf die taktischen Vorgaben) selbst bewerten. Da das aber natürlich utopisch ist, gibt es die perfekte Note nicht. Somit ist die Note, die Ligainsider hier erklärt, schon eine sehr gute Note. Wenn man sich die Artikel mal genau durchliest und sich betrachtet, welche Faktoren hier alles berücksichtigt werden und nicht nur Statistiken wie "Passquote" oder "Zweikampfquote" stumpf in einen Notenschlüssel gepresst werden, dann ist das schon top.

    • 04.09.17

      Ich möchte gar nicht diskutieren, ob redaktionelle Noten besser sind als statistische, aber wieso sollten subjektive Noten fairer sein, so wie du es schreibst? Ich tue mir schwer, fair und gut hier als synonym zu verwenden. Eine Note wie die von LI, die an Hand solcher Artikel nachvollziehbar wirkt und die auf jedes Spiel und jeden Spieler gleich angewendet wird ist doch fairer als eine Note eines Redakteurs, der persönliche Vorlieben beim Spielsystem, Spielern, Trainern, Vereinen, Mentalitäten etc hat. Das heißt freilich nicht, dass die Note deshalb besser ist, also die sportliche Leistung besser wiederspiegelt. Aber sie ist mmn fairer, denn sie ist nicht derart krass von subjektiver Wahrnehmung abhängig, nachvollziehbarer und direkt vergleichbar. Ich glaube deshalb wird die Note als "fairste" und nicht "beste" Note Deutschlands beworben.

      Welche Parameter fehlen dir denn bei LI? Soweit ich weiß sind es weiter über 200 Parameter die genutzt werden, ich wüsste aber gar nicht, um welche es sich jetzt genau handelt bzw. das man diese offen kommuniziert hat. Als Laie tue ich mir außerdem schwer 100 aufzuzählen, die ich für relevant halte, Ich frage mich deshalb, welche 150 zusätzliche Parameter du noch etabliert haben magst. Man muss natürlich auch bedenken, dass die in den Artikeln benannten Parameter bei weitem nicht die einzigen sind, die betrachtet werden.

    • 04.09.17

      Gut, wenn man es ganz zu Ende spinnen möchte, muss man natürlich auch erwähnen, dass Progammierer bzw. Journalisten das System "justieren". Sprich welche Parameter bekommen welche Bedeutung in der Endabrechnung von Noten/Performances. Das ist dann wieder subjektiv von den "Vorlieben" einer Person/Gruppe abhängig, bzw. deren Einschätzungen bzgl. einer fairen Leistungsbewertung. Sprich fair in dem Sinn ist Sportradar in der Theorie auch, weil sie einen Algorithmus nutzen, der für alle Spieler gleich ist. Jedoch ist dieser Algorithmus so schlecht progammiert, dass er falsche Akzente legt und die Leistung von Spielern wie sie überlicherweise als gut oder schlecht wahrgenommen wird, verzerrt darstellt.

    • 04.09.17

      Sehe ich ähnlich wie Arturo. Ligainsider lässt ja auch ein wenig Subjektivität einfließen. Pass a wird bspw. anders gewichtet als Pass b oder c. Aber wer sagt, dass Pass a pauschal immer der bessere ist, bzw. schwieriger ist? Ein neuer Anspielstationen schaffender Rückpass, ist oftmals besser als ein Steilpass, der einen Mitspieler in einen gestellten Raum gegen zwei, drei Gegenspieler schickt. Aber wie soll das eine Statistik beweten können? Wie soll das ein Notengeber bei Sportal bewerten können? Der einzige, der das wirklich zu 100% bewerten könnte, wäre der eigene Trainer, der weiß, welche taktische Vorgabe er gegeben hat und so beurteilen kann, ob sich sein Spieler für die richtige oder falsche Variante entschieden hat. Aber wie gesagt, das ist natürlich nicht ganz ernst gemeinte Utopie. Deshalb finde ich, macht das Ligainsider schon sehr gut. Zumindest im Rahmen der Möglichkeiten einer fairen, statistikbasierten Bewertung.

    • 04.09.17

      Ja, aber diese werden ja einmalig festgelegt und werden nicht geändert (pro betrachtetem Spiel; vgl. unterschiedliche Redakteure), das ist ja der Punkt weshalb ich sie für fair in diesem Sinne halte nicht aber für besser. Ich möchte auf keinen Fall von absoluter Objektivität sprechen, du hast das sehr gut auf den Punkt gebracht, weshalb das vermessen wäre. Die redaktionellen Noten sind - wie auch meine oder deine Einschätzungen - täglich anderen Umständen unterworfen und eignen sich meiner Meinung nach nicht für eine saisonübergreifende, faire und ausgeglichene Benotung, selbst spieltagsübergreifend kommen sie an ihre Grenzen und teilweise darüber hinaus.

    • 04.09.17

      "Eine Note wie die von LI, die an Hand solcher Artikel nachvollziehbar wirkt und die auf jedes Spiel und jeden Spieler gleich angewendet wird ist doch fairer"

      Einspruch:
      1) Die Note wirkt nachvollziehbar, ist sie aber im Grunde immer noch nicht, weil die Erklärungen nur das grobe Prizip preisgeben und Verständnisfragen nicht beantwortet werden.

      2) Sie wird nicht auf jeden Spieler gleich angewendet. Wie aus den Artikeln deutlich hervorgeht, werden die gleichen Aktionen bei Defensiv-, Mittelfeld- und Offensivspielern unterschiedlich gewichtet. Was zwar berechtigt und logisch ist, aber wie diese Gewichtung bringt ebenfalls Subjektivität mit rein. Ja, es werden zum Beispiel alle Innenverteidiger gleich bewertet und das ist durchaus objektiv. Aber es ist denkbar, dass durch die Gewichtung alle Innenverteidiger generell schlechter da stehen, alle z.B. die Offensivspieler.

      Edit: Ich meine genau das, was Arturo 11:23 auch schon sagte. Habe den Zwei nur noch nicht zum Ende gelesen gehabt.

    • 04.09.17

      Ich meinte das anders. Der Algorithmus für alle Spieler ist der gleiche, nur positionsabhängig findet die Gewichtung unterschiedlich statt. Ich weiß jetzt nicht, wie das Programm technisch aufgebaut ist und ob es unterschiedliche Programme sind, die miteinander kommunizieren, oder ob zu Beginn des Algorithmus einfach nur "Wenn Spieler X == Torwart dann..." abgefragt wird. In jedem Fall würde ich es eben so beschreiben, dass jeder Spieler das gleiche Bewertungssystem durchläuft, dabei jedoch seine Position berücksichtigt wird. Im Gegensatz dazu werden Spieler unterschiedlicher Partien bei redaktionellen Noten in der Regel von anderen Redakteuren bewertet, die zwangsläufig andere Bewertungsmaßstäbe ansetzen, egal wie sehr man sich intern auf Richtlinien geeinigt hat.

    • 04.09.17

      @linch: 1.) wie stellst es dir vor, das exakte prinzip zu veröffentlichen? wir versuchen über die saison so viel wie möglich zu erklären, aber alles geht nunmal nicht. wenn dir das nicht reicht, ok, dann müssen wir damit leben.. 2.) subjektiv, exakt. aber immer gleich. das ist für uns im vgl. zum rest ein vorteil. und nein, es kann nicht sein, dass bestimmte positionen vernachlässigt werden.

    • 04.09.17

      Hey Sveno,

      1) ich stelle es mir nicht vor, dass ihr alles veröffentlicht. Ich hätte mir bis vor drei Tagen sogar nicht vorstellen können, dass ihr überhaupt etwas veröffentlicht. Deswegen freue ich mich, überhaupt was dazu lesen zu dürfen.

      Was ich gemeint habe, wenn ihr euch schon dazu entscheidet, irgendwas zu veröffentlichen, dann wäre es nett, wenn zumindest das, war eurer Meinung nach veröffentlicht werden darf, nachvollziehbar und schlüssig geschieht. Dass das nicht einfach ist, kann ich mir vorstellen, aber dann kommen halt Fragen auf, die entweder beantwortet, oder mit einem Verweis auf die Geheimhaltung und Copyright zurückgewiesen werden. Das Problem war bloß, dass wenn ihr selbst im gewissen Maß Transparenz ankündigt, aber im gleichen Zuge einfache Verständnisfragen ignoriert, dann passt es eben irgendwie nicht zusammen. Aber nun habt ihr die Einladung zur Diskussion scheinbar angenommen, von daher ist alles gut.

      "wenn dir das nicht reicht, ok, dann müssen wir damit leben."
      Ich kann mir vorstellen, dass ihr sehr gut damit leben könnt ;) Die frage war eher, ob ihr diskutieren wollt und das, was eurer Meinung nach offen gelegt werden darf, auch ausreichend verständlich offengelegt wird, oder nicht.

      Ich bin halt auch beruflich in Modellierung anzusiedeln, auch wenn das, was ich mache, nichts mit Statistik oder Sport zu tun hat. Deswegen reicht es meiner Neugier nicht, nur mal gehört zu haben, dass irgendwelche Modelle dahinter stecken. Wenn mir schon einer von Modellen erzählt, dann möchte ich auch gerne verstehen, was man mir gerade erzählt, und nicht bloß lächeln und nicken. Und genauso, wenn ich jemandem etwas erklären möchte, dann freut es mich auch, wenn dieser jemand versteht, was ich ihm erklären möchte ;)

      zu 2) warum kann es nicht sein, dass bestimmte Positionen schlechter wegkommen? Wie kann man das ausschließen? Unterschiedliche Positionen werden doch unterschiedlich bewertet, oder?

    • 04.09.17

      1.) absolutes verständnis meinerseits.. ich hatte es so verstanden, dass du damit unzufrieden seist, aber freue mich, wenn es nicht so ist. wir wollen so viel wie möglich erklären, das ist uns ein großes anliegen, aber können eben gleichzeitig nicht alles verraten. deine fragen und dein interessensbereich liegt eher in dem gebiet, in dem es etwas schwerer ist, zu entscheiden, was wir sagen sollten und was nicht. aber wir versuchen auch dem möglichst gerecht zu werden. ich hoffe, du gibst uns da etwas zeit, um uns da zu orientieren.
      2.) jede position hat punktemäßig denselben horizont und die notenschnitte werden dann individuell für jede position gestaltet. dann liegt beim IV (wegen der geringeren streuung) das x-quantil dann punktemäßig woanders als sein pendant beim stürmer. alles wird aber entsprechend des leistungshorizonts in der eigenen gruppe gemessen. daher hat jeder spieler die gleiche möglichkeit auf eine gute note, unabh. von der position.

  • 03.09.17

    Bitte mal ein Meinungsbild: Sportradar Noten sind fair= like, Noten sind nicht fair= dislike