Globales und lokales Unfallrisiko

  • Kennt sich kennt jemand von euch gut mit statistischer Mathematik aus und mir helfen folgendes Problem zu lösen ?

    Bekannt ist von zwei Gruppen von Verkehrsteilnehmern ( nennen wir sie M und R) jeweils das streckenbezogene Unfallrisiko ( Unfälle pro gefahrenem Kilometer) m(S) bzw r(S) für das gesamte Strassennetz der Länge S und es gilt m(S) > r(S). Kann man dann eine Wahrscheinlichkeit w angeben mit der für eine beliebige Teilstrecke der Länge s des Strassennetzes gilt, das das streckenbezogene Unfallrisiko der Gruppe M ebenfalls größer ist als das der Gruppe R also m(s) > r(s) ?

    Als Grenzfall bei m(S)=r(S) sollte dabei 0,5 herauskommen und für r(S)= 0 ergibt sich 1

  • Ohne Annahme zur Verteilung der Unfälle über das Streckennetz wird es schwierig.

    Zwei Extremfälle:

    Angenommen, die Unfälle sind über das Streckennetz komplett gleichverteilt. Dann ist die gesuchte Wahrscheinlichkeit 1.

    Angenommen, sämtliche Unfälle von m finden am gleichen Punkt statt, während die von r gleichverteilt sind. Dann hängt die gesuchte Wahrscheinlichkeit davon ab, ob der Punkt in s enthalten ist.

    Es geht also mMn nicht.

  • Angenommen, die Unfälle sind über das Streckennetz komplett gleichverteilt. Dann ist die gesuchte Wahrscheinlichkeit 1.

    Nein, da man die Varianz der Daten berücksichtigen muss. Beispiel: Ziehe zweimal 100 Elemente aus N(0,1). Eine der beiden Mengen hat einen (minimal) höheren Durchschnittswert, aber beide Gruppen wurden aus der gleichen Verteilung gezogen.

    Wenn die Daten pro Person in jeder Gruppe hat, kann man einen Test auf Normalverteilung machen, empirischen Mittelwert und Streuung berechnen und dann einen t-Test mit unterschiedlichen Varianzen durchführen. Wenn man keine Normalverteilung hat, muss man auf den Wilcoxon-Mann-Whitney-Test zurückgreifen.

  • Nein, da man die Varianz der Daten berücksichtigen muss.

    Es wurde nach dem "streckenbezogenen Unfallrisiko" gefragt. Daher bin ich davon ausgegangen, dass es um die allgemeine Wahrscheinlichkeit eines Unfalls auf der Strecke geht. Nicht um die Wahrscheinlichkeit eines Unfalls bei einer Zufallsstichprobe.

  • Als Nicht-Finanzmathematiker und "Nicht-Statistikfachmann" fände ich inzwischen einen Erklärbär ganz toll, der mir (und vermutlich einigen anderen hier) mal herleitet, worum die Diskussion sich mittlerweile eigentlich dreht. Ich bin nicht vom Fach, meine aber, durchaus verständig zu sein.

    ebayForumKopfverkl.jpg
    Peter Viehrig

    "Glaube ist die Überzeugung, dass etwas wahr ist, weil die Belege zeigen, dass es falsch ist."
    (Andreas Müller)

    Einmal editiert, zuletzt von Peter Viehrig (4. Mai 2018 um 14:47)

  • Es wurde nach dem "streckenbezogenen Unfallrisiko" gefragt

    Nein, es wurde danach gefragt, ob das Risiko für Gruppe M größer als das der Gruppe R ist:

    Kann man dann eine Wahrscheinlichkeit w angeben mit der für eine beliebige Teilstrecke der Länge s des Strassennetzes gilt, das das streckenbezogene Unfallrisiko der Gruppe M ebenfalls größer ist als das der Gruppe R

    Man hat also zwei zugrunde liegende Verteilungen: eine für M und eine für R und man möchte wissen, ob der Mittelwert für M größer als der für R ist. Da man aber nicht die Verteilungen sondern nur je eine Stichprobe aus der Verteilung hat, muss man einen Signifikanztest machen.

    Beispiel: Person E fährt 3km und hat einen Unfall. Z fährt drei Kilometer und hat zwei Unfälle. Ist das Unfallrisiko von Z jetzt höher als das von E? Man kann es nicht sicher sagen, da die Stichprobe zu klein ist.

    für r(S)= 0 ergibt sich 1

    ... ist natürlich nicht gegeben, wenn man auf Stichproben arbeitet. Wenn nicht, braucht man aber keine Statistik. Dann kann man wirklich die Werte ablesen und hat -- wie von Epaminaidos richtig bemerkt -- auch keine Wahrscheinlichkeiten, sondern nur die Fälle kleiner-gleich-größer.

  • Ich sollte das Problem etwas weniger mathematisch ausdrücken:

    Den jährlichen (Unfall/Mobiltäts-)Statistiken kann man einen Wert für Unfälle pro zurückgelegtem Fahrzeugkilometer ( streckenbezogenes Unfallrisiko) für M(otorradfahrer) und R(adfahrer) für das gesamte Straßennetz entnehmen, wobei das Risiko für M(otorradfahrer) größer ist als das für R(adfahrer).

    Damit kann man auch Annehmen das auf irgendeinem bestimmten Straßenabschnitt das Risiko für M(otorradfahrer) größer ist als das für R(adfahrer). Mit welcher Wahrscheinlichkeit trifft diese Annahme zu ?

    Überlegungen zu Grenzfällen ergeben:

    Bei gleichem Unfallrisiko für beide Gruppen sollte diese Annahme bereits zu 50% richtig sein,

    Wenn keine Radunfälle in der Statistik aufgetreten sind , ist diese Annahme zu 100% richtig

    Und je größer der Unterschied im Risiko ist desto näher liegt man bei 100%

  • Damit kann man auch Annehmen das auf irgendeinem bestimmten Straßenabschnitt das Risiko für M(otorradfahrer) größer ist als das für R(adfahrer). Mit welcher Wahrscheinlichkeit trifft diese Annahme zu ?

    Mir ist noch überhaupt nicht klar, was Du eigentlich willst.

    Du schreibst "kann man annehmen" und gleichzeitig "wie groß ist die Wahrscheinlichkeit, dass die Annahme zutrifft?".

    Das passt irgendwie nicht zusammen.

  • Die Antwort auf diese konkrete Frage wäre dann "zu 100%".

    Beweisskizze:

    Das Streckennetz S sei unterteilt in die Teilstrecken s_1, s_2, ..., s_n. M(s) sei die Unfallwahrscheinlichkeit eines Motorradfahrers auf einer beliebigen Strecke.

    Dann gelten:

    M(S) = 1- (1- M(s_1)) * (1-(M(s_2)) * ... * (1-M(s_n))

    R(S) = 1- (1- R(s_1)) * (1-(R(s_2)) * ... * (1-R(s_n))

    denn:

    1-M(s_i) ist die Wahrscheinlichkeit, einen bestimmten Streckenabschnitt unfallfrei zu durchqueren.

    Das Produkt über alle diese Ausdrücke ist als die Wahrscheinlichkeit, alle Teilstrecken unfallfrei zu durchqueren.

    M(S) ist genau das Gegenteil (also 1- dieses Produkt).

    Gemäß Annahme gilt:

    M(S) > R(S)

    Somit gilt:

    1- (1- M(s_1)) * (1-(M(s_2)) * ... * (1-M(s_n)) > 1- (1- R(s_1)) * (1-(R(s_2)) * ... * (1-R(s_n))

    Daraus folgt:

    (1- M(s_1)) * (1-(M(s_2)) * ... * (1-M(s_n)) < (1- R(s_1)) * (1-(R(s_2)) * ... * (1-R(s_n))

    Das kann nur gelten, wenn einer der Faktoren (1-M(s_i)) kleiner ist als sein Gegenpart (1-(R(s_i)).

    Also muss es mindestens einen Teilabschnitt geben, auf dem Motorradfahrer eine höhere Unfallwahrscheinlichkeit haben.