Verspätungsstatistik bei der Deutschen Bahn

  • Nochmal zusammenfassend das Feedback zu meinem Vorschlag:


    -Im Nahverkehr aus diversen Gründen nicht umsetzbar.

    -- Gebe ich zu.


    -Im Fernverkehr problematisch wegen Abos und Pausen

    -- Sehe ich anders. Ich schätze, dass vergleichsweise wenige Leute ein Abo haben. Die werden dann eben nicht erfasst. Pausen einlegen würde nicht zu einem ungültigen Pünktlichkeitswert führen, sondern nur dazu, dass die falsche Fahrt ausgewertet wird. Auch nicht weiter problematisch, die Pünktlichkeit ist ja trotzdem echt. Meiner Einschätzung nach ist auch das Pausen machen ein vernachlässigbares Randphänomen. Die Auswertung kann sowieso vollautomatisiert erfolgen, ist also kaum Mehrarbeit, sie erfolgt nur auf Stichproben und nicht für jeden Fahrgast, weswegen ein paar fehlende Abo-Kunden auch kein Problem darstellen.

  • -- Sehe ich anders. Ich schätze, dass vergleichsweise wenige Leute ein Abo haben.

    Es gibt Verbindungen, in denen praktisch jeder Fahrgast fernpendelt, und die meisten davon werden ein Abo haben. Diese Verbindungen würdest du systematisch unterrepräsentieren.


    Noch dazu sind das tendenziell genau die Verbindungen, die verspätungsanfällig sind (weil im Berufsverkehr im Ballungsraum) oder sogar verspätungsverursachend (weil im Berufsverkehr zusätzlich zum Taktverkehr im Ballungsraum).

  • Der RMV erfasst bei der S-Bahn die Pünktlichkeit an verschiedenen Stellen. Ist eine S6 in Bad Vilbel

    über +2:59 läuft das einmal ein, dann falls weiterhin über +2:59 in Gross Karben wieder, in Friedberg

    erneut (nur um mal ein paar Beispiele zu nennen). Reduziert die sich unterwegs unter 2:59 dann gilt

    natürlich an den Zwischenhalten die Bahn als pünktlich.

    In god (an invention by mankind) we trust - on earth we don't


    Sincerly yours, NSA
    powered by US government

  • Eigentlich ist es aus Nutzersicht doch trotzdem einfach:


    Von 100% geplanten Fahrten haben

    a % pünktlich stattgefunden

    b % verspätet stattgefunden (volle geplante Fahrtstrecke gefahren, Verspätung in Minuten)

    c % Verspätet und/oder verkürzt stattgefunden (Verspätung bis Abbruch in Minuten, Gefahrene Strecke in %, In % der Haltestellen)

    d % komplett ausgefallen (Geht als Verspätung um Abstand zur nächsten tatsächlich durchgeführten Fahrt in Verspätungen ein)


    a+b+c+d muss 100 ergeben.


    Aus Nutzersicht, ist es für den, der um 09:07 auf den Bahnsteig kommt, auch egal ob die Bahn, die um 09:11 ankommt die drei Minuten verspätete Bahn von 09:08 oder die von 08:48 ist - für den, der da schon seit 08:45 steht, dagegen schon. Entsprechend sollte für die Statistik des Verkehrsunternehmens der schlechtere Wert in die Statistik eingehen, da dieser in die Wahrnehmung der Servicequalität stärker eingeht.

  • Ich sehe in diesem Thread gerade eine Tendenz, die ich auch in meinem beruflichen Umfeld und sonst in der Gesellschaft in letzter Zeit - gefühlt - immer mehr wahrnehme:

    • Ein vorhandener Prozess wird fast einhellig als unzureichend, fehlerhaft, nicht sinnvoll empfunden, teilweise sogar als völlig nutzlos. Ich bezeichne den Ist-Zustand mal grobschlächtig als 50%-Prozess.
    • Alle Vorschläge, die daraufhin gemacht werden, werden umgehend in der Luft zerrissen und als "keine Lösung" dargestellt, wenn sie nicht sofort 100% oder sogar 110% Lösung des Problems bieten. Ein 80- oder 90-Prozenter kommt so nie zum Zug.

    Ich halte das für extrem zielentleert, wenn man z. B. jedwede Nutzung der durch zuggebundene Tickets mögliche Ermittlung der Reisendenverspätung als nicht sinnvoll hinstellt, weil dadurch BahnCard 100-Kunden (ich bin selbst einer) und Aboinhaber nicht betrachtet werden. Diese beiden Gruppen sind zugegebenermaßen in so ein System schwer einzubinden. Beim Flexpreisticket sieht das allerdings schon wieder ganz anders aus. Durch die Entwertung elektronischer Tickets kann die Reisekette nämlich trotz Pause nachvollzogen werden. Die benötigte Logik, um daraus mit den Ist-daten im Rückblick gewollte oder freiwillig in Kauf genommene Pausen von erzwungenen Pausen wegen Anschlussverlust zu unterscheiden, ist wirklich keine Raketenwissenschaft.


    Genau das Gleiche gilt in der anderen Richtung, also bei den diskutierten Varianten zur Verbesserung der Ermittlung von Zugverspätungen.

  • Auch wenn es hier oft nicht explizit dargestellt wurde: Der Hauptkritikpunkt Kreisels ist nicht, dass die offizielle Statistik falsch sei, sondern, dass sie als Steuergröße offensichtliche Mängel aufweist, da die Lenkungswirkungen konträr jeglicher unternehmerischer Interessen ist.


    Kennzahlen bieten in der Regel nur Anhaltspunkte zur Beurteilung der Performance und sind im Kontext betrieblicher Eigenheiten zu bewerten.


    Die Definition von Kennzahlen findet in der Regel innerhalb einer konkreten Entscheidungsdomäne statt:

    Verspätungen ab 6 Minuten im PV mit "Halt" als ungewichteter Bezugsgröße würde ich im Bereich Schieneninfrastruktur mit Berücksichtigung der Fahrgastinteressen als Nennenswerte End(!)Kundengruppe verordnen.


    Für den Bund als Hauptinteressenvertreter des ÖPV sollte jedoch eine verbesserte Metrik, die kongruent mit diversen Untermetriken der Leistungserbringer bzw. Umweltvariablen (bspw: Busverkehr -> Staubelastung/Verspätungsanfälligkeit) Zielvorstellungen sein.

    Meiner Meinung nach sollten die Nutzenfunktionen diverser Kundengruppen (Gelegenheitsfahrer, Wochenendpendler, "normale" Pendler) und sonstiger Marktteilnehmer hinreichend genau bekannt sein- ebenso die Umsteigezahlen derselben- um des gesamtwirtschaftlichen Nutzen, Potentiale und Risiken hinreichend genau abzubilden.


    Man könnte also die Leistungsparameter des ÖPV sinnvoll modellieren. Zur Sicherstellung der flächendeckenden Beurteilung der Aussagekraft müssen natürlich entsprechende statistische Parameter der Datenerhebung und -qualität vorgehalten und verrechnet werden.


    Das Ergebnis wären maximal belastbare Zahlen in den höheren Ebenen und beliebige Granulatität hinsichtlich regionaler und organisatorischer Grenzen.


    Falls sich eine Gruppe findet, ein entsprechendes Modell (für eine S Bahnlinie / das RMV Schienennetz / etc) zu Implementieren möchte ich hiermit mein Interesse zur Mitwirkung anmelden.

  • Es gibt Verbindungen, in denen praktisch jeder Fahrgast fernpendelt, und die meisten davon werden ein Abo haben. Diese Verbindungen würdest du systematisch unterrepräsentieren.


    Noch dazu sind das tendenziell genau die Verbindungen, die verspätungsanfällig sind

    Wenn ich mal frech bin, kann ich das auch andersherun drehen: würde man alle Vielfahrer mit reinrechnen, wären sie völlig überrepräsentiert und da sie tendenziell zur HVZ in den verspätungsanfälligsten Zügen sitzen ziehen sie die ganze Statistik nach unten wodurch sie für Gelegenheitsbahnfahrer nicht mehr aussagekräftig ist.


    dawson hat schon recht, natürlich ist mein in 2 Minuten ausgedachter Vorschlag nicht perfekt, aber vielleicht lässt er sich ja noch ausarbeiten, oder ist doch besser als der Status Quo, oder wenigstens bei zusätzlicher Erhebung eine Verbesserung.

    Einmal editiert, zuletzt von heinz ()

  • dawson, ich sehe da Versuche einer unnötigen komplzierten Konstruktion deren Ermittlung

    eine Ungenauigkeit mit sich führt die den Aufwand nicht gerechtfertigt.


    Eine einfache Lösung würde so aussehen:


    Für jeden einzelnen Halt seperat wird ermittelt:

    A% ausgefallene Züge

    B% verspätete Züge

    C% pünktliche Züge


    A+B+C = 100%


    Als Verfeinerung kann man das an Halten mit mehrerne Linien auf einzelne Linien aufdröseln, aber das wird

    dann problematisch wenn man zu viele wechselnde Ziele hat die zeitgleich von einer anderen Strecke aus

    im gleichen Masse angedient werden.


    PS: es gibt eine Möglichkeit jeden einzelnen Reiseweg ohne Aufwand nachzuverfolgen.....China hat markttaugliche

    Personenerkennungssoftware....die verbunden mit einer lückenlosen Videoüberwachung aller Halte liefert auf das

    genaueste wer welchen Umstieg erreicht hat, wer nicht umsteigt, etc. Die Software dazu liefert China sicherlich

    innerhalb weniger Wochen :)

    weitere Infos zu China-tech

    In god (an invention by mankind) we trust - on earth we don't


    Sincerly yours, NSA
    powered by US government

  • PS: es gibt eine Möglichkeit jeden einzelnen Reiseweg ohne Aufwand nachzuverfolgen.....China hat markttaugliche

    Personenerkennungssoftware....die verbunden mit einer lückenlosen Videoüberwachung aller Halte liefert

    Na die lückenlosen Videoüberwachung haben wir doch vorausschauend wie wir sind schon aufgebaut für den Fall, dass irgendwann eine faschistische Regierung die Macht ergreift und die gebrauchen könnte. Mir wird jedes Mal schlecht wenn ich den Luisenplatz betrete.

  • Für jeden einzelnen Halt seperat wird ermittelt: ...

    Und dann? Es geht doch um eine Deutschlandweite Kennzahl oder? Zählt dann die Verspätung von Frankfurt Hauptbahnhof genauso viel wie die von Poppenhausen Süd? Bei der Mittelung müsste man also noch mit der Anzahl der Züge an einem Halt gewichten, dann ist das tatsächlich eine gute Idee

  • Ein Deutschlanddurchschnitt zeigt nicht auf an welcher Stelle es die meisten Probleme gibt.

    Um dahingehend einen weiteren Schritt zugehen müsste man diese Daten farbig aufarbeiten und auf

    einer Streckenkarte jeden Halt als bunten Kreis darstellen. Dann sieht man welche Streckenabschnitte

    die meisten Probleme haben. Für genauere Lokalisierung wäre dann eine richtungsabhängige Filterung

    (ggf rein nach Nahverkehr) eine weitere Stufe.

    In god (an invention by mankind) we trust - on earth we don't


    Sincerly yours, NSA
    powered by US government

  • Die weitgehende Bewegungsüberwachung haben wir auch mit unseren Handys, Google, Facebook +Co. Sogar freiwillig. Von Google erhalte ich jeden Monat voller Stolz mein Bewegungsprofil. Auch ohne Google könnten Interessierte meine Bewegungen auch anhand meiner ÖV-Fotos nachvollziehen, zumindest außerhalb Frankfurts. :)


    Allerdings kann Google nicht nachvollziehen, ob ich um 8:17 Uhr mit dem ICE nach Göttingen gefahren bin, dort um 8:46 mit der RB 82 nach Bad Gandersheim gefahtrn bin, dort mit die Stadt ansah, und 2 Stunden später weiter nach Goslar fuhr. Da ist der europäische Datenschutz dagegen, und das ist gut so. Aus gleichen Gründen dürfte eine so lückenlose Verfolgung meines Bewegungsprofils durch die Deutsche Bahn nicht möglich sein, auch nicht für eine Verspätungsstatistik.


    Allerdings sollte es anhand vorliegender Daten - einige wurden ja unter anderem von mir - aufgeführt, mit vertretbarem Aufwand möglich sein, Verspätungs- und Ausfallstatistiken zu erstellen. Und diese auch noch nach Zeit und Ort aufzuführen.


    Es interssiert niemanden, ob Ost-West-Express oder ob Darkside auf ihrer Fahrt von A nach B soundsoviel später ankamen - außer den direkt Betroffenen:). Aber es interessiert allgemein, auf welchen Linien sich Verspätungen häufen, an welchen Bahnhöfen gehäuft Anschlüsse verpasst werden und zu welchen Zeiten. Ob es an einer Baustelle liegt, sich auf bestimmte Tage, Zeiten oder Züge konzentriert. Dann kann man gezielt nachbessern.


    Und wir sollten unsere Diskussion genau auf diese Fragen richten.

  • dawson, ich sehe da Versuche einer unnötigen komplzierten Konstruktion deren Ermittlung

    eine Ungenauigkeit mit sich führt die den Aufwand nicht gerechtfertigt.

    Ich wollte mit meinem Beitrag gar nicht solitär auf die eine Lösung hinaus, die zugegebenermaßen den größten Raum einnimmt. Ich schreibe ja bewusst unter dem langem Absatz, dass das gleiche wie für die Reisendenpünktlichkeit auch für Verbesserungsvorschläge zur Zugpünktlichkeit wie deinen Vorschlag gilt.


    Auch wenn ich zugegebenermaßen persönlich ein großer Fan der Reisendenpünktlichkeit als Maßstab bin (denn 5 Minuten Verspätung eines Zuges werden mal schnell ne Stunde Verspätung für den Reisenden auf seiner Gesamtstrecke oder eben auch gar keine!), war mein Ansinnen hier ganz allgemeiner Natur. Meine Aussage lässt sich vielleicht zusammenfassen als: Auf der Suche nach reiner Perfektion sollten wir nicht zunehmend die Verbesserung an sich aus den Augen verlieren.

  • würde man alle Vielfahrer mit reinrechnen, wären sie völlig überrepräsentiert und da sie tendenziell zur HVZ in den verspätungsanfälligsten Zügen sitzen ziehen sie die ganze Statistik nach unten wodurch sie für Gelegenheitsbahnfahrer nicht mehr aussagekräftig ist.

    Diese Abwägung ist ein guter Beweis dafür, dass eine Gewichtung mit Fahrgästen kein gutes Ergebnis bringen kann (der Singular ist bewusst gewählt).


    Generell bin ich ein Fan von Kennziffern, die leicht erklärt sind. „Anteil der pünktlichen Abfahrten an allen Abfahrten“ (also: Statistik der Bahn) passt da rein. „Anteil der pünktlichen Abfahrten an allen geplanten Abfahrten“ ebenso. Warum ich letzteres besser finde, habe ich oben diskutiert.


    „Durchschnittliche Verspätung der Fahrgäste, aber nur die mit Zugbindung oder wo wir vorher und nachher das Ticket gescannt haben“ ist da deutlich schwieriger, und „Durchschnittliche Verspätung pro Fahrgast, errechnet per Verkehrsstromanalyse XY, die auf den Annahmen <2-Seitige Erklärung> basiert“ erfüllt diese (meine) Bedingung überhaupt nicht mehr.


    Will man's genauer haben als eine Zahl? Gerne: meine vorgeschlagene Zahl kann man pro Haltepunkt/Bahnhof und aufgeschlüsselt nach Zuggattungen und/oder Linie und/oder Zugnummer erheben / veröffentlichen (die Original-Bahn-Zahl übrigens auch). Daran kann man sehen, wo was getan werden muss. Das führt aber über die reine Kennziffer hinaus.

    Einmal editiert, zuletzt von baeuchle ()

  • OWE, das ist ein Trugschluss....durch deine GPS Daten sieht man an welcher Stelle sich dein Mobilfon bewegt.

    Dieser Verlauf lässt sich mit den Daten von Maps mit der Bahsntrecke in Einklang bringen. Über die Livedaten

    die Google bei der DB snifft in Kombination mitder Uhrzeit lassen sich die Züge identifizieren.

    Und die gesammte Fahrt wird dann in die KI gefüttert die ständig lernt und beim Benutzen des Routenplaners

    in Maps Routen berechnet. Somit gibts du Google direkt Tips welche Routen empfehlenswert sind.

    (Man stimmt bei den Nutzungsbedingungen durch entprechendem Aufbau der Abfrage auch in der Regeln

    dem Datensammeln und Auswerten zu)

    Hier ein schönes Beispiel wie man sieht was Google so mit den Daten macht die Androidmobilfone nach Hause senden:

    https://www.pcwelt.de/news/Fal…t-99-Handys-10748664.html


    BTW: Von mir bekommt Google nicht sonderlich viele Daten -> Ortung dauerhaft deaktiviert, Datenverbindung

    (4G / WLAN) nur aktiv wenn ich konkret im Internet was suche

    In god (an invention by mankind) we trust - on earth we don't


    Sincerly yours, NSA
    powered by US government

  • Jetzt mal - außerhalb des eigentlichen Thread-Themas -Nachfrage an Darkside : Bluetooth an (wegen Corona App), Mobile Daten meist aus, weil ich möglichst freies WLAN nutze, um mein darüber hinausgehendes Datenvolumen zu begrenzen. Wenn ich auf freies WLAN treffe, nutzt das Handy das, also überwiegend zu Hause oder in der Bahn.


    Allerdings gibt es eine Einstellung bei Google "mein Gerät finden", die war "an" und habe ich gerade ausgestellt. In 99,9 % der Fälle hilft beim "Gerät finden", die Nummer zu wählen und darauf zu hören, wo es klingelt.

  • [freies] WLAN: Google fährt zwecks Kartierung immer wieder mal durch die Strasse und protokolliert von allen

    ortsfesten offnenen WLAN-Ports (= Router in Gebäuden die WLAN an haben und somit Kontakt zu anderen

    Geräten aufnehmen [können]) die MAC-Adresse. Kommt man mit seinem Mobilfon welches WLAN an hat

    da vorbei nimmt das automatisch Kontakt auf.

    Einstellung "mein Gerät finden": die ist dazu da gestohlene Geräte zu lokalisieren, nicht ob das Gerät

    zu Hause unters Bett gerutscht ist oder hintern Schrank gefallen. (dazu wird GPS und WLAN-MAC-Adressen

    benutzt)

    Bluetooth: keine Ortung möglich (Sendereichweite zu gering und von der Strasse aus sind ortsfeste Geräte in der

    Regel nicht lokalisierbar)


    PS: persönliche Meinung zu Corona-App - wenn man in den problematischen Bereichen (geschlossene

    Räume, Gedränge) durchweg eine richtig sitzende FFP2 auf hat braucht man das nicht. Bluetooth nämlich

    ist nicht ganz so sicher (Videos sind in englisch):

    https://media.ccc.de/v/35c3-94…ecting_broadcom_bluetooth

    https://media.ccc.de/v/36c3-10…e_equally_broken/playlist

    In god (an invention by mankind) we trust - on earth we don't


    Sincerly yours, NSA
    powered by US government

  • Was macht Ihr mit Langläufern?


    Beispiel: Fahrt vor längerer Zeit mit EC 113 von Darmstadt nach Bad Hofgastein.


    Damals fuhr der Zug ab Siegen. Es ergab sich:

    Siegen - Stuttgart pünktlich

    Stuttgart ab +20 Türstörung

    München an +10

    München ab fast pünktlich (damals hatte der Zug in München längeren Aufenthalt)

    Prien an pünktlich

    Prien ab + 10 Signalstörung

    Salzburg an/ab ungefähr +8

    Ankunft Bad Hofgastein (da die ÖBB ordentlich Tempo machte) praktisch pünktlich.


    Wir hatten also eine pünktliche Ankunft am Ziel. Gehen wir mal davon aus, dass der Zug auch noch pünktlich in Klagenfurt ankam. Dann hatten viele Fahrgäste eine pünktliche Zugfahrt, nur Fahrgäste mit einem Ziel nach Stuttgart bis München sowie mit einem Ziel nach Prien bis Salzburg nicht. Der Zug floß aber wohl als verspätet in die Statistik ein, da er nicht auf dem ganzen Laufweg pünktlich war. Viele Fahrgäste waren aber von der Verspätung unterwegs gar nicht betroffen.

  • Was macht Ihr mit Langläufern?

    Jedem Zug nicht nur einen Wert in der Statistik geben. (Und dennoch am Ende nur eine Zahl für alles zu haben.)


    Wie? In dem man, wie heute auch schon, nicht Züge, sondern Ankünfte zählt. (Ich habe oben von Abfahrten geredet, aber die sind ja im Prinzip egal, wenn man nicht zu spät ankommt. Das war unpräzise.)


    In dem Fall (für frei geratene Unterwegshalte) also Dillenburg, Wetzlar, Bad Nauheim, Frankfurt, Darmstadt, Bensheim, Weinheim, Heidelberg, Stuttgart pünktlich, Ulm, Augsburg, München nicht, Rosenheim, Bad Endorf, Prien pünktlich, Traunstein, Freilassing, Salzburg zu spät, alles in Österreich für die deutsche Pünktlichkeit egal.


    Also: 12 Punkte für pünktlich, 6 für unpünktlich.