Simpson-Paradoxon

In der Statistik, das Paradox der Simpson weist auf eine Situation, in der eine Beziehung zwischen beiden Phänomenen erscheint geändert oder sogar umgekehrt werden, die verfügbaren Beweise aufgrund von anderen Phänomenen in der Analyse nicht berücksichtigt.

Es ist die Grundlage der häufigsten Fehler in der statistischen Analyse in den Sozialwissenschaften und der Medizin, aber nicht nur.

Geschichte

Es wurde von Udny Yule beschrieben in dem Artikel "Erläuterungen zur Theorie der Vereinigung der Attribute in Statistics", erschienen in Biometrika 1903 und von EH Simpson, mit dem Artikel "Die Interpretation der Wechselwirkung Kontingenztafeln", veröffentlicht in Blatt der Royal Statistical Society.

Formale Definition

Obwohl

es passiert, dass

wo

Beispiel

Nehmen Sie eine Situation, in der, im gleichen Alter, ist der Anteil der Arbeitslosen unter den Absolventen oder Absolventen die Hälfte der Bevölkerung von denen ohne Abschluss.

Aber bedenken Sie auch die Tatsache, dass aus historischen Gründen, zwischen den Absolventen Generation älter sind weit weniger, und aus Gründen, auf den Arbeitsmarkt, auch junge Menschen, ist die Arbeitslosenquote höher als bei älteren Menschen.

Ausgehend von den folgenden zwei hypothetischen Statistiken:

wo wir, dass in beiden Fällen ist die Arbeitslosigkeit etwa doppelt unter den nicht-Absolventen im Vergleich zu Absolventen, können Sie die Zahl der Arbeitslosen berechnen:

Diese Absolutwerte können Sie jetzt die Arbeitslosenquote für Nicht-Absolventen und Absolventen unabhängig von Alter zu berechnen. Sie erhalten:

Es stellt sich heraus, dass unter den Absolventen, die Arbeitslosenquote, anstatt die Hälfte ein Viertel, die größer ist unter den nicht-Absolventen ist, genau das Gegenteil von dem, was war spekuliert worden.

Ursachen

Das Paradoxe ist, aufgrund der Tatsache, dass die Arbeitslosenquote in der Gruppe, die einen höheren Anteil an Hochschulabsolventen hat deutlich höher; ignorieren die Existenz von zwei grundlegenden Beziehungen wird zu falschen Schlüssen kommen.

Während in diesem Fall auf Tisch zubereitet der Widerspruch ist offensichtlich in statistischen Analysen Echt kann nicht passieren, um die impliziten Beziehungen zwischen Variablen zu bemerken und sich auf die Analyse aggregierter Daten ohne über sie mit den grundlegenden Variablen zu begrenzen; der Widerspruch nicht so minimal wahrgenommen werden, und Schlussfolgerungen könnten mit potenziell sehr ernste vollständig gegenüber der wahren Verteilung gezogen werden.

In Situationen, in weniger extrem als die des Beispielsweise können die gleichen Ursachen von Simpsons Paradox führen zu überschätzen oder unterschätzen die Unterschiede zwischen den Gruppen, aber nicht die "Zeichen" des Berichts zu stürzen.

Die durch das Paradox der Simpson erzeugten Daten eindeutig sind nicht falsch an sich, sondern einfach anders, als sie es ein Leser oder Analyst Oberfläche gelesen werden:

  • bei Menschen mit Diplom gibt es mehr Arbeitslose unter den Menschen, ohne ein Diplom,

Während die Schlussfolgerung ist falsch Oberfläche, die die Konzepte von Ursache und Wirkung verwendet als

  • mit einer Diplom die Ursache der höheren Arbeitslosigkeit

Zu wollen, die Begriffe von Ursache und Wirkung zu verwenden, sondern den Zugriff auf alle Daten haben, kann gesagt werden,

  • Junge Menschen sind sechs Mal häufiger arbeitslos als ältere zu sein
  • aber sowohl bei jungen Menschen und unter den älteren Menschen haben ein Universitäts reduziert die "Arbeitslosigkeitsrisiko" in der Mitte
  0   0
Vorherige Artikel Admiral Millo
Nächster Artikel Carmageddon II

In Verbindung Stehende Artikel

Kommentare - 0

Keine Kommentare

Fügen Sie einen Kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Zeichen übrig: 3000
captcha