Internet Publikation für
Allgemeine und Integrative Psychotherapie
IP-GIPT DAS=08.09.2003
Internet-Erstausgabe, letzte Änderung 23.5.9
Impressum:
Diplom-PsychologInnen Irmgard Rathsmann-Sponsel und Dr. phil. Rudolf Sponsel
Stubenlohstr.
20 D-91052 Erlangen * Mail:
sekretariat@sgipt.org_Zitierung
& Copyright
Anfang _Beweise
in der Statistik_Überblick_Rel.
Aktuelles _Rel.
Beständiges _Titelblatt_
Konzept_
Archiv_
Region_Service_iec-verlag__Wichtiger
Hinweis zu Links und zu Empfehlungen
Willkommen in unserer Abteilung Abstrakte Grundbegriffe aus
den Wissenschaften (Analogien, Modelle und Metaphern für die allgemeine
und integrative Psychologie und Psychotherapie sowie Grundkategorien zur
Denk- und Entwicklungspsychologie), hier speziell zum Thema:
Beweis und beweisen in der Statistik
Blicke über den Zaun zum Auftakt für eine integrative
psychologisch-psychotherapeutische Beweislehre
aus allgemein integrativer psychologisch-psychotherapeutischer
und einheitswissenschaftlicher
Sicht
Einführung, Überblick,
Verteilerseite Beweis und beweisen
von Rudolf Sponsel, Erlangen
Hinweis: Wenn nicht ersichtlich werden (Externe
Links) in runden und [interne IP-GIPT
Links] in eckige Klammern gesetzt, direkte Links im Text auf
derselben Seite sind direkt gekennzeichnet.
In dieser Übersichtsarbeit wird das Thema im Überblick gesamtheitlich
aus einheitswissenschaftlicher Perspektive dargestellt. Im Laufe der Zeit
folgen weitere Ausarbeitungen.
Inhaltsübersicht
Einstieg
Beweis und beweisen in der Statistik
Trau keiner Statistik, die Du nicht selbst gefälscht
hast * Man kann mit Statistik alles beweisen
Diese beiden bösen geflügelten Worte aus Volk und Bildungswelt
sagen eigentlich schon alles über den Zustand dieser Wissenschaft,
ihrer Vermittelbarkeit und allgemeinen Anerkennung. Das ist sehr schade,
weil ich denke, daß Wahrscheinlichkeit und Statistik unverzichtbare
und bedeutende Errungenschaften für die Wissenschaft und Gesellschaft
sind. Ohne zuverlässige Statistiken, insbesondere langer Zeitreihen
über Jahrzehnte und Jahrhunderte kann es keine zuverlässige und
vernünftige Analyse, Planung, Erklärung und Prognose geben. Die
Amerikaner
wissen und können das, Deutschland und Europa kkönnen und wissen
es leider anscheinend nicht (> Repräsentativität,
Transparenz und Kontinuität statistischer Zeitreihen).
Beispiele für
praktisch-statistische Fragestellungen:
-
Wie viele Menschen umfaßt das deutsche Volk zum Zeitpunkt TT.MM.JJ?
-
Wie gut wirkt das Medikament M bei Kranken mit der Krankheit K?
-
Ist das Symptom S1 typisch für Störungen vom Typ T?
-
Wie gut und treffsicher ist der Test T für die Erkennung von Störungen
vom Typ X?
-
Wie wahrscheinlich ein Sechser im Lotto?
-
Wie hoch ist Bruttoinlandsprodukt?
-
Ist Elektrosmog schädlich?
-
Wer gewinnt die deutsche Fußballmeisterschaftf?
-
Warum sinkt die [Mordstatistik]
gegenüber Ausländern, obwohl mehr gealtpolitisch motiviert umgebracht
werden?
-
Wie entwickelt sich die Bevölkerungszahl?
-
Jemand hat fünf mal nacheinander eine zwei gewürfelt. Wie wahrscheinlich
ist es, daß auch der sechste Wurf eine zwei ergibt?
-
Wie hoch ist das Erkrankungsrisiko für tbc, wenn man schon röntgenpositiv
ist [Bayes]?
-
Wie sehr wachsen die Arbeitslosen?
-
Wie hoch ist das Risiko an AIDS zu erkranken? Wie hoch ist das Wachstum
von an AIDS-Erkankten?
-
Wie wahrscheinlich ist es, daß die Therapie T erfolgreich wird?
-
Wie wahrscheinlich ist es, daß Fritz seine Schuhe aufräumt,
wenn er nach Hause kommt, wenn seine bisherige Aufräumungszahl a und
seine Nichtaufräumungszahl u ist (alle=n=a+u)?
-
Wie oft verschlafen Menschen Prüfungstermine?
-
Wie sicher sind Atomkraftwerke?
-
Wie kann man verstehen, daß die Arbeitslosenstatistik fällt,
obowlh immer weniger Menschen Arbeit haben?
-
Wie wahrscheinlich ist es, daß man im Skat vier Buben auf eine Hand
bekommt?
-
Weshalb nimmt die [Arztdichte]
ständig zu?
-
Wie sicher sind die Renten?
Wie man sieht ist das statistische Feld weit und wir
tun gut daran, eine Grundordnung entlang am Thema Beweis und beweisen
in der Statistik zu entwickeln.
Praktisch
wichtige Grundfragen an die statistische Wissenschaft
-
Wichtige Grundbegriffe und Größen (Parameter) zur Charakterisierung
zufälliger oder vom Zufall beeinflußter Prozesse (z.B. relative
Häufigkeit, Verteilung).
-
Wahrscheinlichkeiten von Ereignissen: Wie wahrscheinlich ist ein
Ereignis, Merkmal oder Geschehen? Nach Pearson und Neyman wird Wahrscheinlichkeit
hier als Grenzwert relativer Häufigkeiten gedeutet.
-
Wahrscheinlichkeiten von Hypothesen ([Bayes;
Entscheidungstheorie,
Justiz]):
Wie wahrscheinlich sind die Hypothesen H0, H1, H2,
... ?
-
Welche Repräsentationsverfahren gibt es? Wie stellt man fest,
ob und wie das Repräsentationsverfahren (z.B. Zufallsauswahl) gültig
ist? Wie repräsentativ ist eine Stichprobe für die betreffende
Population?
-
Wahrscheinlichkeiten von Fehlern: Wie genau gilt eine statistische
Aussage? Im statistischen Grundmodell gibt es immer drei Fehler- von den
[vier
Grundmöglichkeiten]: richtig positiv, falsch positiv, richtig
negativ, falsch negativ.
-
Wahrscheinlichkeiten von Gültigkeiten: wie sicher gelten unter
welchen Bedingungen für wie lange statistische Aussagen? Welche
Bedingungen sind für die Gültigkeit einer statistischen Aussage
wichtig? [Grundannahme-Paradoxie:
Konstanz des Zufalls?]
-
[Entscheidungs- und Risikomodelle].
Man entscheidet immer, ob man will oder nicht, weil auch Nichtstun oder
warten als eine Entscheidung anzusehen ist. Auch das kann falsch und folgenreich
sein. Bei statistischen Entscheidungen sollten deshalb die wichtigsten
Sachverhalte und ihre jeweiligen Folgen berücksichtigt werden.
Genauere
Operationalisierungen (Auswahl):
Grundgesamtheiten
Die betrachtete statistische Grundgesamtheit (Mase, Kollektiv) nennt
man auch Population. Populationen können potentiell unendlich (alle
Menschen, Münzwürfe) oder endlich (alle Magenkrebskranken der
Uniklinik U im Zeitraum t) und mehr oder minder genauer bestimmt oder allgemein
sein. Es ist meist sehr wichtig, sich genau darüber klar zu werden,
über welche Population Aussagen getroffen werden sollen.
Häufigkeiten
Wie oft (h) ereignet sich E (z.B. Vulkanausbrüche, Stürme,
Hitze-/ Trockenperioden/ HIV, Magenkrebs, arbeitslos, Sterbealter usw.)
in einem Zeitraum t und in der sozikulturellen Umgebung u: h(E |
t,u)?
" | t,u" bedeute unter den Bedingungen t und u. Die Beweismethode ist
die Zählung. Nachdem das Zählen sehr aufwendig in Mühe,
Zeit und Kosten werden kann, ergibt sich sofort die nächste Beweisfrage:
Stichproben
Welche Stichprobe ist wie aussagekräftig für eine Schätzung
hs(E | t,u) für h(E | t,u) in der Population? Darin steckt
auch: Welche repräsentativen Stichprobenziehungen gibt es?
Verteilungen
Je nach der Anzahl und Ausprägung der in eine Verteilung eingehenden
Größen ergeben sich unterschiedliche Verteilungsdarstellungen
und daher unterschiedliche Modelle für Verteilungen. Modell d-t-a(m)
für t Meßzeitpunkte und a Ausprägungsgrade, z.B. 1=wenig,
2=mittel, 3=viel eines Merkmals m. Würde z.B. einmal in der Woche
gemessen, wie viel es geregnet (m) hat, so ergäben sich für ein
Jahr Vv=3^52 theoretische Verteilungsmöglichkeiten.
Charakteristische
Größen (Parameter)
Im obigen Beispiel wären charakteristische Parameter z.B. die
Anzahl der 1, 2 und 3 und der Perioden, wenn eine Periode z.B. aus einer
gleichen Anzahl besteht. Führte man einen solchen Versuch über
mehrere Jahre durch, könnte man feststellen, ob es - bezüglich
zu nennender Kriterien - Veränderungen gibt, vielleicht oder auch
nicht.
Fehlerschätzungen
Es gilt als fundamentaler Erfahrungssatz, dass alle empirischen Feststellungen
mit Fehlern behaftet sind, die sich aus vielerlei Quellen zusammensetzen,
ausgleichen, mindern oder verstärken (potenzieren) können. Zu
einer guten empirischen Theorie und Beobachtung, gehört daher auch
die Einbeziehung von Fehlern.
Zur Genauigkeit
der amtlichen Daten zum Wirtschaftswachstum
Pressemitteilung des Statistischen Bundesamtes Nr.
307 vom 3. August 2007
"WIESBADEN - Wie genau sind die Daten der deutschen amtlichen Statistik,
speziell die der Volkswirtschaftlichen Gesamtrechnungen (VGR) zum Wirtschaftswachstum?
Eine Frage, die immer wieder von Wirtschaftsforschern, Analysten und Journalisten
gestellt wird.
Berechnungen zeigen: Die laufenden Revisionen des
Bruttoinlandsprodukts (BIP) liegen in einem der hohen Aktualität angemessenen
und vertretbaren Rahmen. Im internationalen Vergleich gehören die
vierteljährlichen deutschen BIP-Berechnungen sogar zu den besten:
Nach einer Untersuchung der OECD sind die frühen Quartals-BIP-Schätzungen
der Statistikämter aus Deutschland, Frankreich und Großbritannien
die zuverlässigsten und genauesten, dicht gefolgt von denen für
die USA, Kanada und die Niederlande.
Dies ist umso bemerkenswerter, da Deutschland mit
seiner Schnellmeldung zum vierteljährlichen Bruttoinlandsprodukt (BIP)
nach nur 45 Tagen auch in punkto Aktualität zu den Spitzenreitern
in Europa zählt. Seit dem Jahr 2000 hat sich die erste Veröffentlichung
des BIP, unter anderem auf Drängen der Finanzwelt und des Bedarfs
der EZB nach aktuelleren Daten für die Eurozone, von 65 auf nur noch
45 Tage nach Abschluss des Berichtsquartals beschleunigt.
Mit der Veröffentlichung der von den Nutzern
geforderten hochaktuellen Konjunkturdaten befindet sich die amtliche Statistik
immer im Spannungsfeld zwischen Aktualität und Genauigkeit. Um möglichst
frühzeitig aktuelle Zahlen veröffentlichen zu können, werden
die
Ergebnisse auf unvollständiger Datengrundlage berechnet und zum
Teil geschätzt. Diese vorläufigen Ergebnisse werden kontinuierlich
aktualisiert, wenn neue statistische Ausgangsdaten verfügbar sind.
Darauf wird in einem eigenen Qualitätsbericht ausdrücklich hingewiesen."
Aussagen und Extrapolationen
Repräsentativität,
Transparenz und Kontinuität statistischer Zeitreihen.
Zeitreihen sind von großer Bedeutung für die Planung, Analyse,
Prognose und Beeinflussung von sozio-ökonomischen Prozessen, z.B.
die Erfassung der Verschuldung von Gebietskörperschaften. Voraussetzung
für die angemessene Verarbeitung, Bewertung (Evaluation) der Schuldenentwicklung
ist, dass die Definition der Schulden in der Zeitreihe gleich oder wenigstens
vergleichbar
bleibt. Falls unterschiedliche Schuldenwerte erfasst und mitgeteilt werden,
ist es zwingend erforderlich, dass die Repräsentativität, Transparenz
und Kontinuität der Daten gewährleistet wird. Dies ist in Deutschland
seit 1995 nicht mehr der Fall, wobei sich natürlich die Frage stellt,
warum die statistischen Ämter nicht für Repräsentativität,
Transparenz und Kontinuität sorgen können oder wollen? Nun, es
fällt auf, dass die zunehmende Intransparenz und fragliche Repräsentativität
der mitgeteilten Schuldendaten durch die statistischen Landesämter
einhergeht mit einer aus dem Ruder laufenden exponentiellen,
zunehmend bedrohlich erscheinenderen Schuldenentwicklung
auf allen Ebenen der Gebietskörperschaften, besonders auch der größeren
Gemeinden (Städte und Großstädte). In Bayern beispielsweise
führte das zu unklaren und unzulänglichen Veröffentlichungen
[71327-001r]. Dort verwendet man z.B. Spiegelstriche " - " sowohl für
"0" als auch für keine Angabe oder unbekannt ("Missing Data"); weder
Definition - auch nicht deren Rechtsgrundlage - noch Repräsentativität
und Kontinuität werden ausgewiesen, so dass man hier die Frage stellen
muss, ob dieses verwirrende Desinformation politisch gewollt ist? [L1;
L2].
Tradition
mehrdeutiger und daher unsinniger Auszeichnungen in der bayerischen Statistik
Anmerkung: Der Unsinn der Vieldeutigkeit von Zeichen könnte -
auf jeden Fall in der bayerischen - Statistik sogar Tradition haben. So
wird z.B. im Statistischen Jahrbuch der Stadt Nürnberg von 1930
unten beim Inhaltsverzeichnis ausgeführt:
Ein solches Vorgehen ist wissenschaftlich und praktisch vollkommen abzulehnen.
"Nicht vorhanden" ist etwas ganz anders als die Zahl 0 und gehört
infolgedessen auch mit einem eigenen Zeichen versehen, und zwar zwingend
eineindeutig und nicht "verodert" (wie z.B. in der Zeugenbefragung
geboten). Die Zahl 0 ist natürlich kein fehlendes Datum,
insbesondere nicht bei den Schulden, und gehört selbstverständlich
zwingend als 0 ausgewiesen, wenn der Schuldenstand eben Null ist (das war
in Bayern erfreulicherwiese im Jahre 2004 bei 76
Gemeinden der Fall). Folgende Fallunterscheidungen könnten hierbei
sinnvoll sein:
Missing Data
(MD) Unterscheidungen
-
MD1: Zahl liegt grundsätzlich vor, ist aber noch nicht eingetroffen;
mit ihr zu rechnen ist bis TT.MM.JJJJ.
-
MD2: Zahl liegt hier nicht vor, kann aber wahrscheinlich bei ... erkundet
werden.
-
MD3: Zahl liegt nicht vor und ist auch nicht beschaffbar.
-
MD3a: Schätzmethoden sind derzeit nicht bekannt....
-
MD3b: Als Schätzmethode eignet sich ...
Beispiel
MD3b: Schätzung des Gesamtschuldenstandes Nürnbergs am 31.3.1929
in Reichsmark
Im folgenden wird dargelegt, wie man den Gesamtschuldenstand
- aus Mark ("Papiermark") und Reichsmark - für 1928/29 schätzen
kann, wenn die einzubeziehenden Geldgrößen klar ausgewiesen
oder UMrechnungsfformeln angegeben würden. Zunächst der Sachverhalt,
wie ihn das Statistische Jahrbuch der Stadt Nürnberg 1930
ausweist:
Man sieht hier zwei Werte in der Rubrik "Schuldenstand
am Schlusse des Jahres", einmal in "M" ("Papiermark") und der andere
in "RM" (Reichsmark), ohne dass erklärt würde, wie nun der Gesamtschuldenstand
zu bilden ist. Das ist wenig verständlich, wenn man sich vergegenwärtigt,
dass es sich um das Jahrbuch von 1930 handelt, also 6 Jahre nach der Hyperinflation
und die tatsächlichen Verrechnungsdaten ja auf jeden Fall in der Kämmerei
vorliegen müssen.
Für das Haushaltsjahr 1928/29 wird im Verwaltungsbericht
der Stadt Nürnberg, bearbeitet im Statistischen Amt und herausgegeben
vom Stadtrat 1929, S. 434 ausgeführt:
Nach diesen Mitteilungen, sollten sich Schätzungen und Umrechnungen
durchführen lassen - wenn man wüsste, wie sich die einzelnen
Finanzgrößen (Rückkauf 339949 RM; Umtausch mit Auslosungsrechten
mit 16916156 RM und Umtausch ohne Auslösungsrechte mit 104375 RM)
zu einander verhalten. Das wird aber leider nicht mitgeteilt, so dass der
Gesamtschuldenstand natürlich davon abhängt, welche Größen
in die Umrechnung "Papiermark" und Reichsmark eingehen. Man kann also rätseln,
welcher drei hier möglich erscheinenden Gesamtschuldenstände
der richtige ist:
(1) Spielten die Umtauschgrößen keine
Rolle. ergäbe sich für die Gesamtschuld am 31.3.1929 folgender
Schätzungsansatz: 140092500 / 336949 = 415.7676681, also ein Verhältnis
von 1 Reichsmark zu gerundet 416 Mark ("Papiermark").
(2) Rechnet man die Umtauschgrößen mit
ein, ergibt sich folgende Umrechnung: 140092500 / (336949 + 16916156 +
104375) = 140092500 / (17357480) = 8.071016069, also ein Verhältnis
von 1 Reichsmark zu gerundet 8 Mark ("Papiermark").
(3) Es zählt nur die Gesamtschuld in Reichsmark,
weil die Ablösen schon in die Summe eingerechnet wurden.
Dies ergibt die möglichen Gesamtschuldenbeträge:
Rechnung (1), die 140 Mill. Papiermark sind 336949 RM wert, ergäbe
88,676999 Millionen RM Gesamtschuld.
Rechnung (2), die 140 Mill. Papiermark sind 17,357480 Mill. Reichsmark
wert, ergäbe 105,697530 Millionen RM Gesamtschuld.
Rechnung (3), es zählt nur der mitgeteilte Schuldenstand in Reichsmark,
es bliebe wie mitgeteilt, 88,340050 Millionen RM Gesamtschuld.
Veränderungen
der Erhebung statistischer Kenngrößen 1973 und 1978 am Beispiel
Verschuldung der Gemeinden
Den folgenden Ausführungen aus "Statistisches Jahrbuch Deutscher
Gemeinden", 66. Jahrgang, 1979, S. 438 kann man entnehmen, dass die Erfassungsmerkmale
der Schulden "eine Anknüpfung an die Berichterstattung bis einschließlich
1973 (61. Jahrgang) nicht mehr zu" lassen. "Im Unterschied zu 1977 sind
die Krankenhäuser nicht mehr in den Gesamtschuldenstandsbeträgen
enthalten. Sie werden wie die Eigenbetriebe nachrichtlich aufgeführt."
Was "beweist"
nun dieser wenig erfreuliche Sachverhalt ?
Nun, anscheinend ist die deutsche Statistik nicht in der Lage oder
motiviert, Sinn und Notwendigkeit vergleichbarer wichtiger sozioökonomischer
Daten, wie z.B. die Verschuldung einer Gemeinde, so zu begreifen, dass
sie die Kontinuität der Daten auch tatsächlich sicher stellen
würden. Das mag auch politisch gewollt sein, um Zusammenhänge
zu verschleiern und Transparenz und Kontinuität zu behindern.
Probleme
Grundannahme-Paradoxie:
Konstanz des Zufalls ?
Hier gibt es zwei Aspekte: 1) daß es so etwas wie Zufallsgesetze
überhaupt gibt; 2) inwiefern dies über die Zeit und Bedingungen
hinweg gelten.
In der schließenden und sog. Inferenzstatistik
möchten wir nicht nur Aussagen für den Augenblick treffen, sondern
auch über statistische Regelhaftighaften von Dauer etwas erfahren,
wobei unklar ist, ob oder inwieweit "Zufall", Dauer und Konstanz eineinder
nicht ausschließen. Wie wollen wir Regelhaftigkeiten von Dauer erkennen,
wenn schon das einzelne Ereignis sehr unsicher ist und eine große
statistische Ereignis-Bandbreite hat?
Mathematik und
Statistik
Das Wesen mathematischer Statistik besteht auf der Basis einen strengen
Theoriegebäudes vielfach darin, die Wahrscheinlichkeit für ein
Modell M1 gegenüber einem Vergleichs- oder Kriteriums-Modell M2 oder
für Annahmen A1 gegenüber anderen Annahmen A2 zu bestimmen. Das
ist einerseits sinnvoll und ergiebig, etwa bei der Frage, ob ein empirischer
Datensatz als normalverteilt angesehen werden darf oder nicht, andererseits
sehr merkwürdig, wenn die Empirie aus einem Vergleich herausfliegt
und nur noch zwei theoretische Modelle oder hypothetische Annahmen [verglichen]
werden: Beispiel: der unselige [Signifikanztest],
der ja, kurz und bündig formuliert, nur eine statistische Aussage
unter der Annahme zuläßt, daß die Nullhypothese
richtig ist. Wir testen mit dem Signifikanztest also ein virtuelles Ergebnis.
| Denn die gewöhnliche EmpirikerIn wird meist nicht
wissen wollen, was ist, wenn die Nullhypothese richtig wäre?,
sondern: ist sie anzunehmen oder nicht? Welche Hypothese ist
vorzuziehen, falls eine Entscheidung möglich ist ? |
Eine EmpirikerIn interesiert sich also meist nicht dafür, ob ein
Ergebnis angenommen oder verworfen werden darf, wenn die
Nullhypothese richtig ist, sondern ob sie sie annehmen oder
verwerfen soll. Die Gretchenfrage der empirischen Statistik lautet: Welche
Hypothese ist anzunehmen, die Null- oder die Alternativhypothese. Weiß
man nichts, können im Falle zweiwertiger Logik, beide Hypothesen richtig
oder falsch sein, so daß vier Fälle zu unterscheiden wären.
Das aber macht der Signifikanztest gerade nicht. Signifikanztesten scheint
also ein gigantisches Schautheater und numerologisches Zahlenspiel zu sein,
das nicht nur kaum einen Erkenntniswert hat, sondern vor allem Verwirrung
stiftet. Dafür ist die mathematische Statistik anscheinend bestens
gerüstet. Wissenschaft? Oder Wirrenschaft?
| Die großen Probleme in der Wahrscheinlichkeitsrechnung
und Statistik liegen weniger in der Theorie als in der Anwendung.
Es scheint so, als hätte die mathematische Statistik sich wenig um
die sozialwissenschaftlichen Gegebenheiten gekümmert. Die meisten
AnwenderInnen können die mathematische Statistik nicht richtig verstehen
und die meisten mathematischen StatistikerInnen sind nicht in der Lage,
ihre Theorien praktisch sinnvoll zu vermitteln. Theorie und Praxis driften
extrem auseinander. Über weite Strecken entsteht der Eindruck, als
ob nur theoretische Modell-1/ Annahme-1 gegen theoretisches Modell-2/ Annahme-2
getestet würde, wodurch wir aber nichts über die Wirklichkeit
erfahren und wie wir zwischen Hypothesen entscheiden sollten. |
Statistische
Paradoxien und Dilemmas nach Stegmüller
Im großen wissenschaftstheoretischen Werk Stegmüllers finden
sich mehrere Kapitel oder Abschnitte, die Wahrscheinlichkeit und Statistik
Stegmüller (1973, S. 279-303) nennt Elf Paradoxien und Dilemmas
-
(1) Die Paradoxie der Erklärung des Unwahrscheinlichen (S. 281-285),
z.B. 7 mal nacheinander eine 6 zu würfeln.
-
(2) Das Paradoxon der irrelevanten Gesetzesspezialisierung (S. 285-286),
z.B. das Problem von Scheinerklärungen zufälliger Koinzidenzen,
die falsch interpretiert werden (der Mond erscheint nach einer Finsternis
wieder aufgrund des großen Spektakels, das man veranstaltete).
-
(3) Das Informationsdilemma. (S. 286-287), fehlende oder widersprüchliche
Information mit unterschiedlichen Wahrscheinlichkeiten jenachdem, welche
Merlmalskombination zugrundegelegt wird [Partielle
Korrelation]
-
(4) Das Erklärungs-Bestätigungs-Dilemma (S. 287-289),
-
(5) Das Paradoxon der reinen ex post facto Kausalerklärung (S. 289-291),
Bestätigung und Erklärungen scheinen zirkulär und austauschbar
verwendet werden können.
-
(6) Das Verzahnungsparadoxon. (S. 291-295)
-
(7) Das Erklärungs-Begründungs-Dilemma. (S. 295-298)
-
(8) Das Dilemma der nomologischen Implikation (S. 298-299)
-
(9) Das Weltanschauungsdilemma (S. 299-301)
-
(10) Das Argumentationsdilemma (S. 301-303)
-
(11) Das Gesetzesparadoxon. (S. 303) [analog Goodman-Paradoxon]
Die
Paradoxie des statistischen Syllogismus (nach Stegmüller)
Simpsons Paradoxon
Simpson fand bei bedingten Wahrscheinlichkeiten in Vierfeldertafeln
einen Widerspruch dergestalt, dass bedingte Wahrscheinlichkeitsaussagen
je nachdem, ob eine Gesamtbetrachtung gegenüber einer - vollständigen
und disjunkten - Aufspaltung erfolgt, zu widerspruchsvollen Aussagen führen
können. Solche Phänomene darf man nicht einfach nur als "Paradoxon"
euphemistisch herunterspielen, sondern hier liegen tiefe und ernste Probleme
in der Mathematik der Verhältnisrelationen vor, die weite Teile der
angewandten Statistik-Interpretation grundsätzlich in Frage stellen,
weil je nach Auswahl nicht nur
unterschiedliche, sondern sogar widersprüchliche Aussagen resultieren
können. Das hat auch primär gar nichts mit (bedingter) Wahrscheinlichkeit
zu tun; der Sachverhalt wirkt sich in der bedingten Wahrscheinlichkeitsstatistik
"nur" verheerend aus. Das grundlegende Problem wurde von Hain
& Sponsel (1994) mit dem Begriff der Relationentreue
benannt, womit sich auch das Simpsons'sche Paradoxon gut charakterisieren
lässt, weil hier gerade eine Verletzung der Relationentreue vorliegt:
Die Verhältnisrelationen von Teilen eines Ganzen sind bezüglich
des Ganzen nicht relationstreu, sondern kehren sich gar um. Bei genauer
Betrachtung stellt sich allerdings die Frage, ob in der Darstellung der
sechs-Felder Tafel nicht schon im Ansatz der Fehler steckt, weil unterschiedliche
Teile und Ganze zu einander In Beziehung gesetzt werden, wehalb dann natürlich
eine Verletzung der Relationentreue auch nicht wirklich überraschen
kann.
Literatur und Links (Auswahl): Linksammlungen: 1,
2, 3,
-
Bishop, Y.M.M.; Fienberg, S.E. & Holland, P.W. (1975).
Discrete Multivariate Analysis. Cambridge, Mass.: MIT Press.
-
Blyth, Colin R. (1972). On Simpson's Paradox and the Sure-Thing
Principle. In: Journal of the American Statistical Association. 67, Nr.
338, 1972, p. 364–366.
-
Dawid, A.P. (1979). Conditional Independence in Statistical
Theory Journal of the Royal Statistical Society A41(1):1-31
-
Fleiss, Joseph L. (2003). Statistical methods for rates and
proportions. Hoboken, NJ: Wiley.
-
Grams, Timm (Denkfallen und Paradoxa): Simpsons
Paradoxon.
-
Pearl, Judea (1999). Simpsons's Paradox: An Anatomy.
University of California, 1999, p. 1–11. [PDF]
-
Pearson K, Lee A, Bramley-Moore L. (1899). Mathematical contributions
to the theory of evolution: VI – Genetic (reproductive) selection: Inheritance
of fertility in man, and of fecundity in thoroughbred racehorses. Philos
Trans R Soc Lond A. 1899;192: 257–330.
-
Simpson, E. H. (1951). The Interpretation of Interaction
in Contingency Tables. In: Journal of the Royal Statistical Society. Series
B (Methodological) 13 (1951), Nr. 2, p. 238–241.
-
Stanford Encyclopedia of Philosophy: Simpson's
Paraxon (2004).
-
Tu, Yu-Kang ; Gunnell, David & Gilthorpe,
Mark S (2008). Simpson's Paradox, Lord's Paradox, and Suppression Effects
are the same phenomenon – the reversal paradox. Emerg Themes Epidemiol.
2008; 5: 2. [Online]
-
Wagner, C. H. (1982). Simpson's Paradox in Real Life. In:
The American Statistician, 36 (1982), Nr. 1, p. 46–48.
-
Wikipedia: W.de,
W.en.
[Die Literaturangabe zu Pearson (1899) in W.de
und W.en 16.4.9 ist falsch und unzulänglich]
-
Yule, G.U. (1903). Notes on the theory of association of
attribution in statistics. Biometrika, 2, 121-134.
Die Korrelations-Paradoxien
Was bedeutet
ein korrelativer Zusammenhang?
Was eine Korrelation bedeutet, weiß man nicht genau ['Schein'korrelation],
es ist ein rein statistisch-artifizielles ('künstliches') Zusammenhangsmaß,
das von Erhebung zu Erhebung, und sogar innerhalb einer einzigen Erhebung
von Merkmalsraum zu Merkmalsraum sowohl ganz unterschiedliche Zahlenwerte
als auch Bedeutungen annehmen kann. Empirisch gilt meist der Satz: je nachdem
welche Variablen in die Berechnung einbezogen oder nicht eingebezogen werden,
ändern sich die Korrelationskoeffizienten, und zwar möglicherweise
sehr erheblich. Beweis: [Partielle
Korrelationen].
Grundlagen
der Interpretation statistischer Daten und Modelle
Fragen: durch die verschiedenen "Paradoxa" (Simpson,
Grundanahme:
Konstanz des Zufalls, Stegmüller,
Korrelation)
stellt sich die Frage der Bedeutung statistischer Daten verschärft.
Viele Paradoxien und Widersprüche verlören an Schärfe oder
lösten sich auf, wenn man folgendes Hauptprinzip anerkennt und streng
beachtet:
Hauptprinzip
statistischer Interpretation
| Werden bei einem statistischen Sachverhalt
neue Information hinzugenommen oder vorhandene vernachlässigt, können
sich die statistischen Sachverhalte verändern und ihre Relationentreue
verlieren.
Diese Grundidee wird auch benutzt für die Interpretation der statistischen
Un/Abhängigkeit: Spielt ein statistischer Sachverhalt B für einen
statistischen Sachverhalt A keine Rolle, verändert sich mit anderen
Worten die Wahrscheinlichkeit für ein Ereignis A nicht, wenn man B
mit hinzunimmt, so spricht man im Hinblick von A und B von unabhängien
Ereignissen.
Diese Überlegung kann man auch für die Definition statistischer
Relevanz heranzziehen. Eine Sachverhalt B ist für einen Sachverhalt
A relevant in dem Maße, wie er A beeinflusst, d.h. durch seine An-,
Abwesenheit oder so-oder-so-Beschaffenheit (Ausprägung) zu verändern
in der Lage ist.
Aus unterschiedlichen Voraussetzungen oder Basen, können sich unterschiedliche
Folgerungen oder Wirkungen ergeben. So erscheint z.B. die Erwartungen,
dass sich relative Häufigkeiten additiv wie die zugrundliegenden absoluten
Zahlen verhalten irrational, wenn die Bezugsgrößen nicht
gleich sind, was folgende Vierfeldertafel illustriert:
A a A+a Rel%
für a bezügl. Z Rel% A beügl. Z3 Rel% a bezügl.
A+a
Z1 10 4 14 4/10 = 0.40
10/30= 1/3 4/14 = 2/7 =
0.286
Z2 20 5 25 5/20 = 0.25
20/30= 2/3 5/25 = 1/5 =
0.200
Z3 30 9 39 9/30 = 0.33
30/30= 1.00 9/39 = 3/13 = 0.231
|
Glossar:
Wahrscheinlichkeit und Statistik: Messen, Schätzen, Testen, Schliessen.
(Stichwortsammlung)
__
Abweichung. ... von einem Bezugs-,
Norm- oder Referenzwert, z. B. die Standardabweichung als Abweichungsgröße
vom arithmetischen Mittelwert.
__
Alpha-Fehler
(Fehler erster Art). Die 0-Hypothese - z. B. A und B sind gleich -
wird verworfen, obwohl sie wahr ist.
__
Alternativhypothese(n):
__
Antinomie.
__
Ausgleichsrechnung.
__
Auswahl, Auswahlverfahren.
Vielfach können ganze Populationen nicht vermessen werden, so dass
Stichprobenauswahlen erfolgen müssen. Die meisten statistischen Verfahren
setzen eine Zufallsausfall voraus, wobei eine solche in den meisten Fällen
nicht durchgeführt wird.
__
Bayes Theorem.
__
Beta-Fehler
(Fehler zweiter Art). Die 0-Hypothese wird angenommen - z. B. A und B sind
gleich - obwohl sie falsch ist.
__
Bedingungen. Überhaupt, aber
besonder im statistischen Bereich elementarer Grundbegriff, der eine Erhebungssituation
charaktersiert.
__
Binominalverteilung. Wahrscheinlichkeitmodell
für die zwei Ergebnismöglichkeiten in n Versuchen: Ereignis tritt
für jeden Versuch mit der festen Wahrscheinlichkeit p ein ("Erfolg"),
Ereignis tritt für jeden Versuch mit der festen Wahrscheinlichkeit
q=1-p nicht ein ("Misserfolg"), wobei Vorgänger- und Nachfolger-
Wahrscheinlichkeit voneinander unabhängig sind. Typisches Beispiel:
Münzwurf mit dem Ereignis "Zahl" und "Wappen".
__
cut off Werte. "ACOMED statistik"
führt aus (071025):"Der
Cut-Off-Wert ist der Wert in einem quantitativen diagnostischen Test, der
zwischen zwei Testergebnissen (positiv, negativ) unterscheidet und damit
einen Patienten einem der zwei untersuchten Krankheitszustände (z.
B. krank vs. nicht krank oder Erkrankung 1 vs. Erkrankung 2) zuordnet.
Dabei gibt immer einen Überlappungsbereich, in dem je nach Lage des
Cut-Off-Punktes Patienten testpositiv oder testnegativ eingeordnet werden.
Deshalb ist die Auswahl des Cut-Off-Punktes sorgfältig vorzunehmen.
..."
__
Diagnostik
:= Liegt ein Merkmal in dieser oder jener Ausprägung vor? Hier gibt
es immer zwei Fehlerarten.
__
Diagnostische Fehlerarten:
1) Ein Merkmal wird zugeschrieben, obwohl es nicht zutrifft (falsch positiv).
2) Ein Merkmal wird nicht erkannt, obwohl es zutrifft (falsch negativ).
Man erkennt auf eine Diagnose, obwohl sie nicht vorliegt (falsch positiv)
oder man erkennt eine Diagnose nicht, obwohl sie vorliegt (falsch negativ).
Dieser Fehlertyp ist universell, so z. B. auch für die Rechtsprechung:
jemand wird für eine Tat verurteilt, obwohl er sie nicht begangen
hat (falsch positiv) oder er wird frei gesprochen, obwohl er die Tat begangen
hat (falsch negativ). Nachdem das Recht idealistisch orientiert ist und
vor allem Falsch-Positiv minimieren möchte, ergibt sich zwangsläufig,
dass Falsch-Negativ maximiert wird, d. h. immer mehr intelligente und skrupellose
TäterInnen kommen straffrei davon und durchsetzen die Gesellschaft.
__
Dichte, Dichtefunktion.
__
Differentialdiagnostik
:= was ist es hier genau, und was nicht?
__
Diskret. Mathematischer Grundbegriff unterbrochener
("diskontinuierlicher", "unstetiger") Meßpunkte. Wird z.B. am
__
Diskriminanzanalyse.
Mathematisch-statistische
Methode, ob und wie gut sich aufgrund gegebener Messwerte unterschiedliche
Gruppen von einander trennen bzw. zuordnen oder klassifizieren lassen.
__
Einzelfall. Recht, Kriminologie, Medizin,
Psychologie sind auch angewandte idiographische Wissenschaften,
d. h. sie machen Aussagen über ein Individuum. Hierbei ist ein großes
und bislang ungelöstes Problem, wie man Erkenntnisse, die für
Gruppen (Aggregate) gelten, auf den Einzelfall anwenden kann > Grundzüge
einer idiographischen Wissenschaftstheorie. Man bedenke, dass in unseren
Praxen, Büros, Kanzleien und Gerichten keine Stichproben und Populationen
Platz nehmen, sondern individuelle Menschen.> Praxeologie,
> evidenzbasierte Medizin.
__
Entscheidbarkeit. Wichtiger
mathematischer Begriff aus der Beweistheorie (Turing, Halteproblem > W).
__
Entscheidung. Grundlegender Begriff
für alle Systeme mit Wahlmöglichkeiten. Watzlawick postulierte
für den zwischenmenschlichen Bereich, dass man nicht nicht-kommunizieren
könne. Übertragen kann man sagen, dass man nicht nicht-entscheiden
kann, denn nichts tun, warten, nicht-entscheiden ist paradoxerweise
auch eine Entscheidung.
__
Entscheidungstheorie.
[1 (Bamberg), ]
__
Epidemiologie.
Inzidenz, Letalität, Morbidität, Mortalität, Prävalenz.
__
Ereignis. bestimmt durch Ort und Zeit
(Grundbegriff).
__
Ereignisalgebra (Mengenlehre):
__
Ergodisch, Ergodizität,
Ergodensätze.
__
Erhebungszeitraum. Zeitraum
(Anfang - Ende) in dem eine Erhebung erfolgte.
__
Erwartungswert. Theoretisch der
- immer unbekannte - wahre Mittelwert, praktisch oft der arithmetische
Mittelwert als beste empirische Näherung ("richtiger Wert") für
den gedachten wahren Wert.
__
Erwartungstreu(e Schätzung).
Eine Schätzfunktion heißt erwartungstreu, wenn sie im Durchschnitt
den richtigen Wert als besten Schätzer für den unbekannten "wahren"
Wert liefert.
__
Evaluation. Den Wert einer Methode
untersuchen und erweisen.
__
Evidenz. Offenkundig, offensichtlich,
klar, banal, trivial, selbstverständlich.
__
Evidenz-basierte Medizin.
Neuere Evaluations-Methode in der Heilkunde, die versucht, Entscheidungen
durch wissenschaftliche Forschungsergebnisse zu stützen, also eine
Verbindung zwischen der idiographischen (einzelfallorientierten, intra-individuellen)
und nomothetischen (inter-individuell gültige empirische Gesetze und
Regelhaftigkeiten) Betrachtungs- und Herangehensweise einzugehen.
__
Exzess := Maß für die Steilheit
einer Verteilung (4. Moment).
__
Faktorenanalyse.
__
f := Hier Zeichen für Fehler. In der psychologischen
Testtheorie meist mit "e" (error) bezeichnet.
__
Falsch negativ := ein Merkmalsträger
wird nicht erkannt.
__
Falsch positiv =: ein Nicht-Merkmalsträger
wird fälschlich als Merkmalsträger identifiziert..
__
Fehler. Alles menschliche Feststellen und
jede Messung ist mit einem Fehler behaftet, mag er auch noch so klein sein.
__
Fehlerarten: Fehler können durch
systematische oder zufällige Störquellen, durch die Messmethode,
das Messgerät, die Eichung, Anzeige, Ablesung, Irrtümer oder
bewusste Fälschung zustande kommen.
-
Fehler, absoluter. f = x - r.
[> Messfehler]
-
Fehler, relativer. f / Mittelwert
-
Fehler, systematischer. Fehlerhafte
Messmethode, fehlerhaftes Gerät, fehlerhaftes Ablesen; mangelnde Kontrolle
anderer Einflüsse oder Störvariablen, z. B. leichtfertiges ungeprüftes
oder ungesichertes Glauben von Angaben in sehr, sehr interessegeleiteten
Situationen (Prüfungen, Bewerbungen, Aufträge erringen, Aussagen
vor
Gericht oder der MPU).
Fehler, zufälliger. Schwieriger statistischer
Begriff, meist negativ definiert als nicht-systematisch; klein; durch viele
Faktoren bedingt und Abweichungen nach beiden Richtungen, so dass ein gewisser
Ausgleich bei der Mittelwertsbildung erfolgt. [> Zufall]
> Fehler (Genauigkeit, Reliabilität, Zuverlässigkeit):
__
Häufigkeit := Anzahl von Ereignissen
für einen bestimmten Zeitraum.
__
Heteroskedastizität:
ungleiche, veränderliche Varianz, Inkonstanz der Varianz.
__
Homoskedastizität: gleiche
Varianz, Varianz Konstanz
__
Hypothese. Wissenschaftlicher Grundbegriff.
__
Intra := innerhalb eines Systems (intra-individuell).
__
Inter := zwischen verschiedenen Systemen
(inter-individuell).
__
Inzidenz. Medizinstatistischer, epidemiologischer
Begriff. Nach 257Psychyrembel: Anzahl der Neuerkrankungsfälle
in einem bestimmten Zeitraum.
__
Inzidenzenrate. Medizinstatistischer,
epidemiologischer Begriff. Nach 257Psychyrembel: Anzahl der
Neuerkrankungsfälle in einem bestimmten Zeitraum im Verhältnis
zur Anzahl der exponierten Personen. Das Psychometrische Wörterbuch
(Rasch
et al. 1987) führt aus: "I, Zugangs- oder Neuerkrankungsrate heißt
die relative Häufigkeit bzw. Wahrscheinlichkeit des Neuauftretens
einer bestimmten Krankheit in einem bestimmten Zeitraum bezogen auf den
Umfang der Population, aus der die Erkrankungen hervorgingen. Die I. kann
man kumulativ, d.h. auf dem ganzen Untersuchungszeitraum bezogen, oder
in Form der Inzidenzdichte für einen (kurzen) bestimmten Teilzeitraum
betrachten. Die Inzidenzdichte dient zum Studium der Veränderung der
I. mit der Zeit, z. B. in Abhängigkeit vom Alter. Die I. wird in >
Längsschnittstudien
analysiert.
___
IQ. Normierungseinheit der Intelligenzschätzung.
___
Inferenz, Inferenzstatistik.
Schließende, schlußfolgernde Statistik (ergänzend zur
deskriptiven, beschreibenden). Zentrale Grundidee und ein Paradigma wahrscheinlichkeitstheoretischer
und statistischer Problemlösungen und Aufgaben. Beispiele: Man zieht
eine Stichprobe und möchte wissen, wie repräsentativ ist diese
Stichprobe für die Grundgesamtheit (Population). Man berechnet einen
Wert und möchte wissen, wie gut dieser Wert den unbekannten Parameter
schätzt, mit welchen Abweichungen unter diesen oder jenen Annahmen
zu rechnen ist? Im Grunde genommen, haben sich Wahrscheinlichkeitstheorie
und Statistik in einer eigenen unlösbaren Aufgabe (Aporie)
verfangen: Wie gewinnt man Sicherheit (Wissen), wo es keine(s) gibt? Damit
ist eine unendliche "Spielwiese" für die mathematische Statistik eröffnet,
indem unter "bestimmten" - in Wirklichkeit unbekannten - Anahmen gewisse
Annahmen gegenüber anderen Annahmen untersucht und getestet werden.
Man bewegt sich weitgehend in virtuellen, fiktiven Welten, obwohl man doch
etwas über die Wirklichkeit erfahren möchte. Einen hohen Wert
hat allerdings die Mathematik gegenüber allen anderen Wissenschaften:
sie zwingt zur Klärung der Voraussetzungen und Annahmen,
die ansonsten oft oft leichtfertig und wenig (problem-) bewusst einfach
unausgewiesen angenommen werden.
___
Kohärenzprinzip. Begriff
der subjektiven Wahrscheinlichkeitstheorie, wonach in einem Wettsystem
sichere Verluste ausgeschlossen werden. [1,2,3,]
___
Kohorte.
___
Kolmogoroff-Axiome.
Quelle Kolmogoroff, A. (1933; Nachdruck
1973, S. 2).
__
Kollinearität:
[Kollinearitätsanalyse
in Korrelationsmatrizen]
__
Konfundiert, Konfundierung.
untrennbar zusammenhängend; miterfasst. Sind zwei Merkmale M1 und
M2 untrennbar miteinander verbunden, z.B. Alter und Geschlecht, so kann
sich die Frage stellen, ob ein Effekt E durch das Alter, das Geschlecht,
durch beides oder durch keines von beidem bestimmt ist. Die Kontrolle von
miteinander konfundierten Variablen spielt in Experimenten eine wichtige
Rolle. Eine Möglichkeit konfundierte Effekte im wahrsten Sinne des
Wortes herauszurechnen besteht in der Nutzung partieller
Korrelationsanalyse.
__
Kontinuität.
__
Korrelation.
Zusammenhang. Es gibt viele Zusammenhangsmaße und damit unterschiedliche
Korrelationsbegriffe, so dass immer dazu gesagt werden sollte, um welche
Korrelation es sich handelt. [partielle
Korrelation]. > Regression.
__
Kovarianz. Ko = mit. Varianz = Streuung.
Mit- oder gemeinsame Streuung von zwei Datensätzen: Sxy
= 1/n [Summe(xi - mx) (yi - my),
wobei hier m der arithmetische Mittelwert sei. Beispiel: X=1,2,3. Y=2,3,4.
mx=2; my=3. n = 3:
|
xi
|
yi
|
xi - mx
|
yi - my
|
(xi - mx) (yi - my)
|
|
1
|
2
|
1-2 = -1
|
2-3= -1
|
(-1 * -1) = 1
|
|
2
|
3
|
2-2 = 0
|
3-3= 0
|
(0 * 0 ) = 0
|
|
3
|
4
|
3-2 = 1
|
4-3= 1
|
(1 * 1) = 1
|
|
Sum=1+2+3=6
|
Sum=2+3+4=9
|
|
|
Sum=1+0+1=2
|
|
mx=6/3 = 2
|
my=9/3=3
|
|
|
Sxy = 2/3 = 0.667
|
Besonderheiten und Zusammenhänge: Kovarianzen sind nicht standardisiert
(nicht normiert auf die Standardabweichung) sein. Wird mit standardisierten
Werten gerechnet, ist die Kovarianzmatrix mit der Korrelationsmatrix identisch.
In der schließenden (Inferenz-) Statistik wird wegegn der Erwartungstreue
nicht durch n, sondern durch 1/(n-1) dividiert. Die Kovarianz steht in
der Korrelationsformel nach Bravais-Pearson im Zähler.
__
Laborwertnormen.
__
Längsschnitt-Statistik
(Longitudinal). Erhebung von Werten über verschiedene Zeit- bzw. Messzeitpunkte
hinweg, z. B. alle zwei Monate Bestimmung der Leberwerte für die Dauer
eines Jahres. > Querschnitt.
__
Laplace-Experiment. "Ein stochastisches
Experiment heißt Laplace-Experiment, wenn die zugehörige Wahrscheinlichkeitsverteilung
gleichmäßig ist." Die Wahrscheinlichkeit bei einem Laplace-Experiment
ergibt sich dann mit p = günstige Fälle/ mögliche Fälle.
(Beispiele: Urne, Würfel, Münze)
Quelle: Barth,F. & Haller, R.
(1984a). Stochastik Leistungskurs. München: Ehrenwirt.
__
Letalität.
__
Likelihood.
__
Longitudinal > Längsschnitt.
__
Markovkette
__
Maximum-Likelihood-Methode.
Von R.A. Fisher 1921 entwickeltes Verfahren zur Schätzung von Wahrscheinlichkeiten.
Es wählt diejenige aus, die unter bestimmten Annahmen die größte
Wahrscheinlichkeit für ein vorliegendes Resultat hat.
__
Median. Der Wert, der eine Messwert-Reihe
in zwei Hälften teilt, z. B. 3 in: 1, 1, 2, 2, 3, 3,
3, 3, 4, 5, 5.
__
Mengenlehre. Nach der Mengenlehre
besteht die Messwert-Reihe "1, 1, 2, 2, 3, 3, 3, 3, 4,
5, 5" aus 5 Elementen.
__
Messen, Messung. Genau beschriebenes und
damit prinzipiell wiederholbares und überprüfbares Verfahren
zur Feststellung einer Ausprägung. Eine Messung ist lehr- und lernbar.
__
Messfehler. Als allgemeiner Erfahrungssatz
gilt: jede Messung ist mit einem Fehler behaftet, so das für den Messwert
x, den gedachten wahren Wert w und den Messfehler f gilt: x = w + f.
Da der wahre Wert eine gedachte Konstruktion und nie bekannt ist, muss
er in praxi geschätzt werden. Diesen Näherungswert nennt man
auch den "richtigen" Wert r und damit gilt dann: x = r + f. Man nimmt hierfür
oft den arithmetischen Mittelwert.
[> Fehlerarten.]
__
Messwert. Zahlenwert.
__
Minimum. Der kleinste Wert in einer Reihe,
z. B. 1 in: 1, 1, 2, 2, 3, 3, 3, 3, 4, 5, 5.
__
Mikrozensus. Stichprobenauswahlverfahren.
[W]
__
Mittelwert ohne nähere
Angabe. Meist ist der arithmetische gemeint und oft auch so erkennbar.
Sicher wäre es, genau zu anzugeben, von welchem man spricht. Most
(1955, S. 8, § 12: S. 57-65) führt folgende Mittelwerte an: "I.
Errechnete Mittelwerte: 1. und 2. Arithmetische Mittel. 3. und 4. Geometrische
Mittel. 5. Harmonisches Mittel. 6. Quadratisches Mittel. 7. Antiharmonisches
Mittel. II. Mittelwerte der Lage: 1. Zentralwert. 2. Häufigster Wert.
3. Schwerster Wert. 4. Scheidewert."
__
Mittelwert, arithmetischer.
Summe aller Werte dividiert durch die Anzahl. [W]
__
Mittelwert, geometrischer.
Besonders geeignet für Mittelwerte bei Verhältniszahlen (z.B.
von Geschwindigkeiten: v = s/t). [W]
__
Mittelwert, harmonischer.
[W]
__
Modalwert. Der häufigste Wert
in einer Reihe, z. B. 3 in: 1, 1, 2, 2, 3, 3, 3, 3, 4, 5,
5.
__
Moment. Sammelbezeichnung oder Klassenbegriff
für die verschiedenen statistischen Kennwerte oder Parameter einer
Verteilung: [W]
__
Morbidität. Unklarer medizinstatistischer,
epidemiologischer Begriff. 1) Gesundheitsbrockhaus 1990: Gibt die Häufigkeit
einer Erkrankung pro 1000 oder 10.000 für ein Jahr oder einen anderen
Zeitraum an. 2) Grundmann, E. (1994, Hrsg.; S.4-5): „Die M. ist die Zahl
einer bestimmten Erkrankung in einer bestimmten Bevölkerungsgruppe
in einem bestimmten Zeitraum (meist einem Jahr). Sie berechnet sich nach
der Formel: Mz = (Erkrankungszahl x 10 000) / Bevölkerungszahl“.
In dieser Formel fehlen die Einheiten der Zeit und die soziologische Spezifikation.
3) Nach Renner, D. (6.A. 1990, S. 24): „M. - Anzahl an einer bestimmten
Krankheit leidender Personen per Gesamtbevölkerung in einem bestimmten
Beobachtungszeitraum.“ Nach diesem Autor wird M. auch synonym mit Neuerkrankungsrate
(> Inzidenz) verwendet. Die Inzidenz wird von Schaefer
& Blohmke (1978, S.111) wiederum der > Prävalenz
gleichgesetzt.
__
Mortalität. Medizinstatistischer,
epidemiologischer Begriff, der die Sterblichkeit einer Krankheit bezogen
auf die Gesamtzahl der Lebenden eines Jahrganges pro 10.000 oder 100.000
angibt im Unterschied zur > Letalität, die
das Verhältnis der an einer Krankheit Gestorbenen in Beziehung zur
Anzahl der Erkrankten angibt.
___
Multikollinearität. In
einer Tabelle (Matrix) gibt es mindestens 2 Kollinearitäten (vergleichbarer
Datensätze, also aus der gleichen Stichprobe oder Population mit jeweils
gleicher Anzahl n).
__
Norm.
Bezugs- oder Vergleichgröße.
__
Normalverteilung. Gaußsche
Glockenkurve [1,
2,
W,
]. Wichtigste Verteilung der mathematischen Statistik. Häufung der
Werte in der Mitte und von aus fortlaufend abnehmend zu den Rändern
hin.
Zur Warnung (Grimm 1960,
S. 165).
"Die Erfahrung zeigt, daß eine ausgesprochen Normalverteilung
in der Natur nur selten vorkommt. Garry
(1947) schreibt sogar: 'Die Normalität ist ein Mythos, es lag nie
Normalverteilung vor, und sie wird nie vorliegen."
|
__
Normalwert. > Referenzwert.
__
Normwerte. Werte, die nach einem bestimmten,
nachvollzieh- und prüfbaren Verfahren, gewonnen und berechnet werden.
In Straube (1988, Hrsg.), S.9 heißt es: "Der Ausdruck „Normwert"
steht hier synonym für Normal-, Richt- oder Referenzwert, wobei sich
letztere Bezeichnung durchzusetzen scheint. Es wird nachdrücklich
darauf hingewiesen, daß alle Normwertangaben die intraindividuelle
Situation des Gesunden und des Kranken nicht berücksichtigen können.
Weiterhin muß der Arzt auf tages-, monats- und jahreszeitliche Schwankungen
Rücksicht nehmen."
Hier noch eine Tabelle aus Lienert (1969, 3. A.),
S. 337:
_
__
Nullhypothese [1,
] Es gibt keinen Unterschied.
__
Numerologie.
Nicht prüf- oder wiederholbare Methode, spezielle Bedeutungen von
Zahlen zu erkennen. Auch in der modernen Wissenschaft sehr verbreitet,
z. B. in der Faktorenanalyse
oder
Signifikanzstatistik.
__
Nutzen: mehr oder - meist - minder intersubjektive
Wertzuweisung
über den Gebrauchswert von Sachverhalten. Der Nutzen spielt eine große
Rolle für die meisten Menschen in fast allen Lebensbereichen, aber
auch in der Wissenschaft, besonders in der Ökonomie (Grenznutzentheorie)
und Psychologie: Nützlich erscheint, was Bedürfnisse, Wünsche
und Interessen befriedigt.
__
Objektivität := die Messung
soll nicht davon abhängen, wer mißt.
__
Objektivität, spezifische
:=
Begriff des Rasch-Modells, wonach die Messergebnisse (Relationen der Messobjekte)
nicht vom Messinstrument (Test, Skalierungsverfahren) abhängen darf
(>Relationentreue).
__
Odds-Ratio. Das Odds Ratio gibt, um
wieviel größer die Chance zu erkranken in der Gruppe mit Risikofaktor
ist (verglichen mit der Gruppe ohne Risikofaktor). Das Odds Ratio nimmt
Werte zwischen 0 und Unendlich an. Ein Wert von 1 bedeutet ein gleiches
Chancenverhältnis. [W]
__
Ökonomie (Nutzen, Utilität).
Kosten, Aufwand, Nutzen, Preis-Leistungs-Verhältnis.
__
Parameter: kennzeichnende Größe,
z.B. Mittelwert, Varianz, Minimum, Maximum, Spanne, Verteilung.
__
Parameter-Konstanz: kennzeichnende
Größe, die für bestimmte Bedingungen gleich bleibt, z.B.
Mittelwert, Varianz.
__
parametrische Verfahren. Sie gehen
von bestimmten Modellannahmen, z. B. Normalverteilung, aus.
__
Polung.
negative oder positive Wertzuweisung zu einem Bearbeitungssachverhalt.
Population: Gesamtheit, Ganzes.
__
Population. Grundgesamtheit, die betrachtet
wird.
__
Prävalenz. Epidemiologisch-statistischer
Begriff, der das Verhältnis aus Anzahl der Kranken zu einem Stichtag
gegenüber den Personen mit Merkmal an diesem Stichtag angibt. Anwendung:
an X Erkrankte : Medikamentenanwender. Beaglehole
et al (1997, S. 30): "Die Prävalenz einer Krankheit ist die Anzahl
der Krankheitsfälle in einer definierten Population zu einem bestimmten
Zeitpunkt."
___
Praxeologie. Ein Name für lehr-
und lernbares, begründetes praktisches Vorgehen nach Wissenschaft,
Erfahrungswissen und individuell situativen Gegebenheiten. In den stark
idiographisch geprägten Berufen der JuristInnen, Heilfachkundigen
und PsychologInnen müssen wissenschaftliche Ergebnisse auf einen
Einzelfall
angewendet werden. Das ist ein bislang von den Universitäten sehr
stark vernachlässigtes Gebiet, so gibt es m.W. auch keinen Lehrstuhl
für idiographische Wissenschaftstheorie und Praxeologie. Hier spielen
auch der berüchtigte sog. "gesunde Menschenverstand" und alltägliches
Regelwissen wie praktische Vernunft eine große Rolle. > evidenzbasierte
Medizin.
__
Produkt-Moment (kleines,
großes). Ausdruck aus der Matrixalgebra (z.B. Horst 1963, p. 166-171)
im Umfeld multivariater Datenanalyse (z.B. Revenstorf 1980, S.28, 53, 85
). Sei X eine Matrix, dann wird X'X das kleine (Minor) und XX' gelegentlich
das große (Major) Produktmoment genannt. Die Bravais-Pearson Korrelation
wird auch als Produkt-Moment-Korrelation bezeichnet. Die Encyclepedia of
Statistical Science, 1986, Vol.7, p. 292 führt aus:
__
Prozentrang.
Prozentsatz derjenigen, die einen so oder so großen Wert erreichen.
__
Quantile. Vielheiten, meist in gleiche
Klassen zusammengefasst. Quartile und Prozentränge sind Quantile.
__
Quartile. 1. Quartil := erstes Viertel
der Stichprobe. 2. Quartil: Zweites Viertel der Stichprobe. Median
:= halbiert die Stichprobe, 3. Quartil =: drittes Viertel der Stichprobe.
4. Quartil = letztes Viertel der Stichprobe. Seien 100 Messwerte von 1,2,3,
..., 100 gegeben, dann gehören 1-25 zum ersten Quartil, 26-50 zum
zweiten Quartil, 51-75 zum dritten und 76 bis 100 zum vierten Quartil.
__
Querschnitts-Statistik,
eine Statistik, die über verschiedene Objekte im gleichen Zeitraum
erhoben wird, z. B. der arithmetische Mittelwert für den durchschnittlichen
Alkoholkonsum junger Frauen zwischen 21 und 25 Jahren in Bayern. > Längsschnitt.
__
Referenzwert > wörtlich Bezugswert
bzw. Bezugswertbereich, Normwert, Normalbereichswert in der Medizin(im
Laborbereich gewöhnlich unzulänglich ausgewiesen).In der Psychologie
werden z. B. sog. "Normen" bei Intelligenztests meist für Geschlecht,
Alters- und Bildungsklassen bestimmt. In der Medizin sind naturgemäß
besonders wichtige Kriterien spezielle Erkrankungen und Risiko-, aber auch
ökologische Faktoren (wie z. B. Stadt, Land, Abgasbelastung, Sendemasten,
Strahlungsbelastung [Elektrosmog], Chemie- oder Atomkraftwerke in der Nähe,
oder Berufe, die mit bestimmten Risiken einhergehen, können sehr wichtig
sein. Beispielrechnung. Setzt man bei parametrischen statistischen Verfahren
eine Mindeststichprobengröße von N=30 an und geht man aus von
2 Geschlechtern, 5 Altersklassen, 3 Schulbildungsgraden, 6 ökologischen
Klassen, 27 Gesundheitsfaktoren (3 Bewegungsgrade, 3 Ernährungsgrade,
3 Körperindexgrade), 100 Krankheitsklassen und 10 Risikofaktoren ergibt
sich folgende Rechnung: STC [Stichprobencharakteristiken] = 30 * 2 * 5
* 3 * 6 * 27 * 100 * 10 = 48.600.000, d. h. 48,6 Millionen Laborbefunde.
Das wären die theoretischen Erfordernisse, wenn jede Stichprobenkombination
vertreten sein soll. Es kann natürlich durchaus vorkommen, dass nicht
jede Kombination mit 30 Fällen besetzt werden kann, weil sie zu selten
vorkommt.
__
Regression, Regressionsanalyse. Einfaches
lineares Modell nach y = a + b*x. Ein Wert y wird auf einen Wert x zurückgeführt,
z.B. das Gewicht auf die Körpergröße. Das geht auch umgekehrt,
indem man die Körpergröße auf das Gewicht zurückführt.
Als Maß für den Zusammenhang beider Regressionen dient der Korrelationskoeffzient,
der sich auch aus der Wurzel des Produktes beider Regressionskoeffzienten
(geometrisches Mittel) errechnen lässt. b ist die Steigung und heißt
auch beta-Gewicht. Inhaltlich interpretiert gibt b an, in welchem Verhältnis
y steigt (fällt), wenn x um eine Einheit steigt (fällt). Im Prinzip
gibt es beliebige Regressionsmodelle, letztlich so viele, wie Datenmodelle
und Funktionsverläufe, die sie charakterisieren. Das einfache lineare
Modell ist also nur eines, wenn auch das wohl meist angewendete. Regressionen
bei Wachstumsprozessen werden "linearisiert" durch logarithmieren (Bsp.).
__
Relation (Beziehung). Beispiele: größer,
kleiner, gleich, auf, unter, gleich alt wie, besser. Grundlegender, aber
wegen seiner Abstraktion schwieriger mathematischer Grundbegriff, der seit
der Durchsetzung der Mengenlehre auch über diese definiert wird: Eine
Relation ist eine Teilmenge der Kreuzmenge (kartesisches Produkt, Paarmenge).
Sei A = {Main, Passau, Frankfurt, Donau}, so ist die Kreuzmenge, AxA, numeriert:
1. (Main, Main), 2. (Main, Passau), 3. (Main, Frankfurt), 4. (Main, Donau),
5. (Passau, Main), 6. (Passau, Passau), 7. (Passau, Frankfurt), 8. (Passau,
Donau), 9. (Frankfurt, Main), 10. (Frankfurt, Passau), 11. (Frankfurt,
Frankfurt), 12. (Frankfurt, Donau), 13. (Donau, Main), 14. (Donau,
Passau), 15. (Donau, Frankfurt) und 16. (Donau, Donau). Relationen können
hier sein: I. Fluß und Stadt gehören zusammen: 3 und 8. II.
Fluß und Stadt gehören nicht zusammen: 2 und 7. III. identische
Flüsse: 1 und 16. IV. Identische Städte: 6 und 11. V. Flüsse:
1, 4, 13 und 16. VI. Städte: 1, 3, 5, 6, 7, 9, 10., 11. VII. Identische
Namen: 1, 6, 11, 16. VIII. schwebt über: wird von keinem der Paare
erfüllt.
__
Relationentreue.
__
Reliabilität. Messgenauigkeit.
In der Psychologie meist - und nicht unproblematisch - über die Korrelation
geschätzt.
__
Repräsentation. Grundlegender
Begriff für die Stichprobenstatistik, schließende Statistik
und für die allgemeine, auch alltägliche "Testtheorie". Erheben
wir Werte, so sollen diese repräsentativ für ... sein. Bei Laborwerten
kann es sehr darauf ankommen, wie die Randbedingungen der Erhebung sind
(z. B. Tageszeit, nüchtern). Ist ein Laborwert, z. B. Gamma-GT pathologisch
erhöht, so wird man das im allgemeinen beobachten und Messwiederholungen
ansetzen. Ein Gamma-GT-Wert ist sozusagen nur eine einzige Stichprobenziehung
aus den praktisch unendlich viel anmutenden Möglichkeiten. Eine besondere
Bedeutung hat der Begriff noch in der Messtheorie. Das Repräsentationstheorem
dort besagt, dass es eine homomorphe Abbildung von einem empirischen Relativ,
z. B. drei Hölzchen, in ein numerisches Relativ mit z. B. drei Zahlen
so gibt, dass die Beziehungen zwischen den Hölzchen durch die Zahlen
repräsentiert werden.
__
Risiko:
__
ROC. Diagramm bei dem auf der Ordinate die
Sensitivität
und auf der Abszisse 1-Spezifität eingetragen
wird. Daraus lässt sich das Verhältnis aller richtig positiven
und falsch positiven Zuweisungen ersehen. [W]
__
Rohwert := scorierter Bearbeitungswert,
dem Bearbeitungswert wird ein Zahlenwert zugeordnet. Wichtiger Grundbegriff
für sozialwissenschaftliche Fragestellungen.
__
Schiefe := Abweichungsmaß von der
Symmetrie einer Verteilung; rechtsschief, linksschief.
__
Score := Zahlenwert, Ausdruck in der
Testpsychologie. Bekommt eine ProbandIn auf die Frage, wie der Bundeskanzler
der BRD heißt, z. B. einen "Wertpunkt" für die richtige Antwort,
so ist dieser Wertpunkt der Rohwert-Score. > Summenscorefunktion.
__
Sensitivität. Ein Maß
für die Richtig-Positiv-Zuweisungen.
Sicherheit
__
Signifikanz.
Zufallskritische Beurteilung von Annahmen. Meist wird nicht die Wirklichkeit
geprüft, sondern unter bestimmten Annahmen wird eine Annahme einer
anderen Annahme gegenübergestellt, so dass nicht selten der Eindruck
einer virtuellen Scheinwissenschaft entsteht. Sog. "signifikante" Ergebnisse
werden auch selten in klaren - hierzulande deutschen - Sätzen interpretiert,
woran man schon erkennt, wie schwach und unbedeutend (nicht signifikant
;-) solche Erkenntnisse sind. Der "Signifikanz-Popanz" ist vermutlich eine
Folge der - oft genug sehr problematischen - Mathematisierung der Sozialwissenschaften.
Viele denken zu Unrecht, dass nur, wo Zahlen und Formeln verwendet werden,
schon Wissenschaft vorliegt; nicht selten ist es blosse moderne Numerologie
und das Gegenteil von Wissenschaft. Signifikanztest
__
Simpsons
Paradoxon
__
Skalierung. Messverfahren, Messmethode.
__
Spannweite = Maximum - Minimum. Ist
die zahlenmäßig kleinste Note in einem Zeugnis 1 und die größte
Note eine 4, dann beträgt die Spannweite 4 - 1 = 3. Mit Spannweite
kann auch ein Streuungsbereich gemeint sein, z. B. der 1 Sigma Bereich
bei der Standard-Normalverteilung umfasst die mittleren 68%, der 2 Sigma-Bereich
die mittleren 95,5% und der 3-Sigmabereich 99,7%, also fast die gesamte
Verteilung.
__
Spezifität.
Ein Maß für die Richtig-Negativ-Zuweisungen > Sensitivität.
__
Spiel.
__
Spieltheorie.
__
Stabil, Stabilität [numerische]
__
Standardabweichung
(Symbol: Sigma) . Wichtiges Streuungsmaß. Wurzel aus der Summe der
quadrierten Abweichungen der Rohwerte vom Mittelwert durch n-1 dividiert.
Ohne die Wurzel ergibt sich die Varianz = quadrierte Standardabweichung.
 |
Gegeben seien 5 ProbandInnen mit einem BAK von:
0, 0.5, 1, 1.5, 2.0. n = 5. Das arithmetische Mittel = 5/5 = 1.0. Die Standardabweichung
= Wurzel {Summe [(0-1)^2 + (0.5-1)^2 + (1-1)^2 + (1.5-1)^2 + (2-1)^2]/5-1}
=
Wurzel {[1 + 0.25 + 0 + 0.25 + 1] / 4 } = Wurzel {2.5/4}
= 0.79.
|
__
Standardnormalverteilung.
__
Standardwert. > z-Wert.
__
Stanine. Aus standard und nine
gebildete Verdichtung an den Rändern der 13 Centil-Normen auf 9 Werte:
[> Normwerte]
__
Statistik. Erfassen und Verarbeitung
von Zählungen von bestimmten Merkmalen an bestimmten Merkmalsträgern
an bestimmten Orten zu bestimmten Zeiten unter bestimmten
Bedingungen.
> Deskriptive S., > schließende S.. > Querschnitts-S., > Längsschnitts-S..
__
Statistik, deskriptive.
Sie beschränkt sich auf die Erfassung und Beschreibung statistischer
Kennwerte; nicht selten die ehrlichste und letztlich oft aussagestärkste
Form der Statistik.
__
Statistik, mathematische. Hochentwickelte,
komplizierte, umfangreiche und spezialisierte mathematische Fundierung
der Statistik. Für mathematische Laien teilweise sehr schwer bis gar
nicht verständlich, besonders was die Anwendung und auch den wirklichen
Nutzen bezüglich vieler Annahmen betrifft. Teilweise kann man den
Eindruck gewinnen, dass sich die Aussagen nur in virtuellen Welten jenseits
unserer Wirklichkeit bewegen. Viele ausgearbeitete Modelle beruhen auf
Voraussetzungen, die - besonders in der sozialwissenschaftlichen Forschungspraxis
- nicht erfüllt werden (Intervallniveau der Daten, Normalverteilung,
Zufallsauswahl, Parameterkonstanz). Eine wirklich konsequente Anwendung
der Mathematik würde wahrscheinlich mehr als 90% der Veröffentlichungen
gar nicht zulassen.
__
Statistikpakete/
Statistikprogramme.
__
Statistik, schließende.
Die schließende Statistik macht Aussagen - teilweise auch sehr fragwürdige
oder nichtssagende wie z. B. "signifikant" - über die Bedeutung der
deskriptiv erhaltenen Kennwerte mit Hilfe statistischer Modellannahmen.
__
Statistische Kennwerte
sind z. B. Median, Quartile, Minimum, Maximum, Spanne; Mittelwert (Typ),
Standardabweichung; relative Häufigkeiten, Quantile, Prozentränge,
Verteilung und Verteilungskennwerte (z. B. Schiefe, Exzess, Gipfel); Stichprobe,
Stichprobenumfang; Population; Erhebungszeitraum; Reliabilität und
Validität, Sensitivität und Spezifität; cut-off Werte mit
Erläuterungen und Begründungen. Hinzu kommen besonders bei psychologischen
Tests auch abgeleitete Normen wie z. B. z-Werte = (Rohwert - Mittelwert)
/ Standardabweichung, Stanine oder T-Werte.
__
Stichprobe. Teil eines Ganzen. Meist
ist angestrebt, dass der Teil das Ganze repräsentieren soll und der
Teil fürs Ganze stehen kann (pars pro toto). Hierbei entsteht gewöhnlich
ein Stichprobenfehler.
__
Stichprobenauswahlverfahren.
Der Sinn einer Stichprobe ist die Repräsentativität für
eine Gesamtheit.
__
Stichproben-Kennwerte.
Zu jeder wissenschaftlichen statistischen Normwert-Angabe gehören
ihre Bedeutung und die charakteristischen Kennwerte, sowie die Bezugsgruppe,
d. h. die Stichprobe, Zusammensetzung der Stichprobe, das Auswahlverfahren
und die Population, der Zeitraum der Erhebung, die Größe der
Stichprobe und der Population. Genau diese Angaben werden von der Labormedizin
so gut wie nie ausgewiesen (Stand 10/ 2007).
__
Stichprobenumfang. Anzahl der
Messobjekte in der Stichprobe.
__
subjektive
Wahrscheinlichkeitstheorie. Eine gewisse Nähe gibt es zur Nutzen-
und Entscheidungstheorie.
Vertreter (Auswahl): Bayes, de Finetti, Fishburn, Kleiter, Ramsey,
Savage, Wieckmann.
__
Summen-Score-Funktion.
Die blosse Anzahl im Sinne des positven Kriteriums bearbeiteter (meist
"gelöster") Aufgaben dient als (Ausgangs-) Maß für eine
Ausprägung.
__
Stationär, Stationarität:
Parameter-Konstanz.
__
Stetig. Grundlegender mathematischer Begriff
mit der alltagssprachlichen Bedeutung einen fortgesetzten Ununterbrochenen,
ohne Lücke. Gegensatz diskret.
__
Stichprobe: Auswahl eines Teiles von
einem Ganzen.
__
Stochastik.
__
Syllogismus, statistischer.
Wenn a aus A mit p1 m zeigt, dann sagt man, a habe mit der Wahrscheinlichkeit
p1 das Merkmal m.
Wenn a aus A mit p1 m zeigt und und a aus B mit p2
m zeigt und p1 ungleich p2 ist, dann gibt zwei unterschiedliche
Wahrscheinlichkeitsaussagen bzeüglich der Merkmalszuordnung m. Viele
WissenschaftstheortietikerInnen sehen hier einen Widerspruch. Ich kann
hier aber keinen sehen. Nicht, wenn A und B verschiedene Stichproben
oder schon gar nicht, wenn A und B aus verschiedenen Popualtionen stammen.
__
Test. Stichprobe zur - meist quantitativen
- Schätzung eines Sachverhaltes. Ein Fahrtest ist eine Stichprobe
aus dem Fahrverhalten einer Person. Aus der Fahrprobe schließt man
auf die technische Kraftfahreignung.
__
Test: Kontrolliertes und fundiertes Prüfverfahren
mittels einer Stichprobe und Kennwerten. Stichprobe zur - meist quantitativen
- Schätzung eines Sachverhaltes. Ein Fahrtest ist eine Stichprobe
aus dem Fahrverhalten einer Person. Aus der Fahrprobe schließt man
auf die technische Kraftfahreignung.
__
Testen: Kontrolliertes und fundiertes
Prüfen mittels einer Stichprobe und Kennwerten
__
Testgütekriterien. > Objektivität,
> Reliabilität, > Validität,
> Utilität, > Ökonomie.
__
Teststärke (Power). "Die Teststärke
gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer
spezifischen Alternativhypothese H1 (z. B. „Es gibt einen Unterschied“)
entscheidet, falls diese richtig ist. (Die abzulehnende Hypothese wird
H0, die Nullhypothese genannt.). Die Teststärke hat den Wert 1-?,
wobei ? die Wahrscheinlichkeit bezeichnet, einen Fehler 2. Art zu begehen."
[W071027]
__
Testtheorie: Theorie zur Konstruktion,
Auswertung und Beurteilung von Tests.
__
Transformation. Umwandlung von
Werten, z. B. y = ax + b. Hierbei kann es sehr wichtig sein, die Relationentreue
zu wahren. Achtung: In der Psychologie gibt es sehr merkwürdige Transformationen,
die, bei Lichte betrachtet, Datenfälschungen sind, wenn z. B. nicht
normalverteilte Rohwertdaten in Quantile gewandelt und dann so zurückgerechnet
werden, als ob sie normalverteilt wären (z. B. fragwürdiges
McGall-Verfahren). Das gilt auch für die meisten Faktorenanalysen,
weil die Kommunalitätsmatrizen
den ursprünglichen Korrelationsmatrizen
nicht mehr ähnlich sind.
__
Transparenz. Klarheit, Durchsichtigkeit,
Verständlichkeit, Nachvollziehbarkeit.
__
T-Werte. T = 50 + z.
Unsicherheit. Das Leben und die meisten
Entscheidungen, die es abverlangt, sind mit Unsicherheit verbunden. Diese
Unsicherheiten ab- und einschätzen können, ist ein vielfaches
und bedeutsames Anliegen von Wissenschaft und alltäglicher Praxeologie.
__
Unterscheiden. Grundlegende kognitive
Funktion. Eng verbunden mit vergleichen.
__
Utilität. Nutzen, Wert eines Tuns.
Aufwands-Ergebnis-Verhältnis. [> Ökonomie.]
__
Validität. Maß für die
Erreichung eines Ziels durch bestimmte Methoden.
__
Varianz. Streuungsmaß. Quadrat der
Standardabweichung.
__
Varianzanalyse. Untersuchungsverfahren,
das die Einflüsse von Bedingungen auf statistische Kennwerte durch
Analyse der Mittelwerte und Varianzen erforscht. [W]
__
Vergleichen := elementares geistiges
Handeln, Grundprinzip jeder Messung. Eng verbunden mit unterscheiden.
__
Verteilung. Häufigkeit oder Ausprägung
von Werten nach geordneten Kriterien. Meist wird die Häufigkeit an
der Ordinate und an der Abszisse meist die Zeit.
__
Verteilungsannahmen. Es gibt
beliebige Verteilungen. Die meisten parametrischen Tests setzen aber bestimmte
Verteilungsannahmen, z. B. normalverteilte Daten voraus. Dort, wo mit Verteilungsannahmen
gerechnet wird, müssen diese natürlich angegeben werden.
__
Verteilungskennwerte (z.
B. Schiefe,
Exzess, Gipfel).
__
Vertrauensintervall (Konfidenz).
[W]
__
Vieldeutigskeitssatz.
Vermutlich gilt allgemein: Ein Zusammenhang zwischen Variablen a und b,
bedeutet den Zusammenhang zwischen a und und b und der mit a und
b verbundenen Variablen, d.h. spaltet man die Einflußvariablen
auf - etwa durch auspartialisieren
- , ergeben sich womöglich ganz andere - und auch widerspruchsvolle
- Zusammenhänge. Damit stellt sich natürlich die Frage, was statistische
Zusammenhänge überhaupt bedeuten. Das Problem ist derzeit (2009)
nicht nur nicht geklärt, sondern bei nicht wenigen Statistiker- und
MethodologInnen noch gar nicht angekommen.
__
Voraussetzungen. Bestimmte Verfahren
erfordern bestimmte Voraussetzungen, die oftmals nicht ausdrücklich
genannt werden, z. B. Normalverteilung, Intervallskalenniveau, Zufallsauswahl,
Parameterkonstanz über die Zeit, Raum und Bedingungen hinweg. So sind
z. B. die Schulnoten auf Ordinalniveau und damit ist die arithmetische
Mittelwertsbildung unzulässig, weil hierfür mindestens Intervallskalenniveau
erforderlich ist.
__
w := Hier Zeichen für gedachten wahren
Wert bei einem Messvorgang. Der wahre Wert ist grundsätzlich unbekannt
und muss geschätzt werden, hier durch r := Näherungswert für
w.
__
Wahrscheinlich,
Wahrscheinlichkeit. Mehrdeutiger Grundbegriff der Wahrscheinlichkeitstheorie
(subjektiver und objektiver Wahrscheinlichkeitsbegriff). Ähnlich
wie der wahre Wert ist die Wahrscheinlichkeit eines Ereignisses letztlich
unbekannt. Als beste Näherungsschätzung wird in der Statistik
meist die relative Häufigkeit eines Ereignisses für den Wahrscheinlichkeitsparameter
genommen, wobei sich gewöhnlich für den Fall unendlich vieler
Realisationen - die in praxi natürlich nicht möglich sind - die
Identität von Näherungs- und wahrem Wahrscheinlichkeits-Wert
ergibt. Praktisch heisst das: je größer der Stichprobenumfang
oder je mehr Messungen vorliegen, desto mehr nähert sich der empirische
Wert dem wahren Wert an. In der Mathematik gilt dieser Grundbegriff seit
der Axiomatisierung 1933 durch Kolmogorov geklärt. Überblick
zu den verschiedenen Wahrscheinlichkeitsbegriffen: [1,
2, 3,].
__
Wahrscheinlichkeit, bedingte.
p(A|B), d.h. die Wahrscheinlichkeit für das Ereignis A unter der Bedingung
B. Wichtiger Grundbegriff. Genau betrachtet kann es gar keine "unbedingte"
Wahrscheinlichkeit geben. Wenn daher allgemein von "unbedingter" Wahrscheinlichkeit
gesprochen wird, so heißt das meist nur, dass nicht angegeben oder
gewusst wird, unter welchen Bedingungen eine Wahrscheinlichkeitsaussage
gilt.
__
Wahrscheinlichkeitsmodell.
Z. B. Urnenmodell mit oder ohne Zurücklegen.
__
Wahrscheinlichkeit,
objektive. [ > relative Häufigkeit]
Die "objektive" Wahrscheinlichkeitstheorie sucht unter bestimmten Annahmen
(Modellen), andere Annahmen auf ihre statistische Schlüssigkeit hin
zu überprüfen, was sich nicht selten in völlig nichtssagenden
Signifikanzaussagen erschöpft. Grundlage ist die Laplace Definition
der Wahrscheinlichkeit als Bruch aus der Anzahl der günstigen Fälle
durch alle möglichen Fälle. Eine Axiomatisierung gelang 1933
Kolmogoroff.
__
Wahrscheinlichkeit, subjektive.
[> Bayes]
__
Wahrscheinlichkeit, totale.
__
Welten.
__
Wert. 1) Zahlenwert im Rahmen einer Messung.
2) anderer Wert, den ein Sachverhalt relativ für einen Bewertenden
hat (z. B. Wind für einen Segler, Regen für einen Bauern, Musik
und Alkohol für einen Feiernden). [> werten]
__
Wert, richtiger. Beste bekannte empirische
Näherung an den gedachten wahren Messwert.
__
Wert, wahrer. Idee, dass ein Zustand
oder Merkmal zum Zeitpunkt der Messung einen wahren Messwert hat, den es
"bestmöglich" zu schätzen gilt. Fiktive Größe und
nicht immer hinreichend klare Vorstellung, repräsentier- oder schätzbar.
Beispiel: Zu messen sei das Volumen einer Streichholzschachtel. Hierbei
wird man mehrfache Messfehler begehen. Einmal weil die Ausdehnungen (Länge,
Breite, Höhe) nicht streng starr geradlinig sind. Zum andern weil
man in aller Regel bei jeder Messung auch Messfehler macht. Trotzdem ist
hier die Idee, dass die Streichholzschachtel zu einem bestimmten "Zeitpunkt"
- einen fiktive und genau betrachtet unklare Vorstellung - einen wohlbestimmten
Volumenwert hat, plausibel und intuitiv unmittelbar einsichtig.
__
Wertzuweisung. Bestimmten Sachverhalten
können Werte zugewiesen werden, z. B. "nützlich für ...",
"gesund", "krank", "Symptom für x". Die Wertzuweisung kann mehr oder
minder begründet und methodisch ausgewiesen sein oder willkürlich,
"per fiat" nach gutem Glauben oder Fachkompetenz erfolgen.
__
Wette.
__
Wissenschaftliches
Arbeiten.
__
Würfelspielparadoxon. Székely
(1990, S. 12)
__
x := Hier Zeichen für einen empirischen
Messwert.
__
Zahlen.
__
Zeit. Wichtiger, doch letztlich bezüglich
seiner Bedeutung oft sehr unklarer Grundbegriff in der Statistik. > Die
Zeit als Variable.
__
Zeitpunkt. Fiktive und - genau betrachtet
mitunter - problematische Vorstellung einer "Momemtaufnahme". Tatsächlich
dürfte in den meisten Fällen der "Moment" nur ein ungefähres
Zeit-Intervall bzw einen "Zeitraum" bedeuten. Beispiel: "Tages-Temperatur".
Ein "Tag" besteht aus 8-24 Stunden (Arbeitstag, astromischer Tag einschließlich
der Nacht), 1440 Minuten oder 86400 Sekunden. Die Temperatur dürfte
im Regelfall über die Zeiten schwanken; zudem hängt sie auch
vom Ort der Messungen ab.
__
Zeitreihenanalyse.
__
Zensus (Census). Bevölkerungsdaten.
__
Zentraler Grenzwertsatz.
__
Zufall. (Welt
der Möglichkeiten) Sehr schwieriger, mehrdeutiger und möglicherweise
widerspruchsvoller Begriff. Subjektive Bedeutungen: (1) Im einzelnen
nicht vorhersagbar (Münzwurfergebnis). (2) ein Ereignis geschieht
relativ zu einem Betroffenen nicht absichtsvoll (beim Wähnen, Eigenbezug
und im Wahn gestört: hier hat u. U. alles Absicht oder Bedeutung).
(3) Regellos, chaotisch, willkürlich.__
Zufallsgröße.
__
Zuverlässigkeit. > Reliabilität.
In der psychologischen Testtheorie meist Messgenauigkeit.
__
z-Werte = (Rohwert - Mittelwert) / Standardabweichung.
__
Literatur (Auswahl)
Siehe bitte auch Literaturliste Signifikanztest,
Bayes,
Diskriminanzanalyse,
Metaanalysen,
Statistikpakete,
Zeitreihen,
Numerisch
instabile Matrizen und Kollinearität in der Psychologie, Faktorenanalyse,
Kommunalität,
Irrtum,
Fehler, Betrug, Laborwertnormen,
..., ...
-
Bamberg,
Günter (1972). Statistische Entscheidungstheorie. Würzburg: Physica.
-
Garry,
R. C. (1947). Testing for normality. Biometrika 34, 209-242.
-
Grimm,
H (1960). Transformation von Zufallszahlen. Biometrische Zeitschrift, Bd.2,
164-182.
-
Horst,
Paul (1963). Matrix Algebra for Social Scientist. New York: Holt, Rinehart
and Winston.
-
Kolmogoroff,
A. (1933). Grundbegriffe der Wahrscheinlichkeitsrechnung. Berlin: Springer.
Nachdruck 1973.
-
Kotz,
S. & Johnson, N. (1982-1989, Ed.). Encyclopedia of Statistical Sciene.
Vol. 1-10. New York: Wiley.
-
Mises,
Richard von (196, 4.A. 1972). Wahrscheinlichkeit, Statistik und Wahrheit.
Wien: Springer.
-
Most,
Otto (1955). Allgemeine Statistik. Baden-Baden: Lutzeyer.
-
Müller,
P.H. (1970, Hrsg.). Lexikon Wahrscheinlichkeitsrechnung und mathematische
Statistik. Berlin: Akademie.
-
Revenstorf,
Dirk (1980). Faktorenanalyse. Stuttgart: Kohlhammer.
-
Sponsel,
R. (1994). Numerisch instabile Matrizen und Kollinearität in der Psychologie.
Ill Conditioned Matrices and Collinearity in Psychology. Zweisprachig.
Ins Englische übersetzt von Agnes Mehl. Mit einem Beitrag (Kap. 6)
von Dr. B. Hain: Bemerkungen über Korrelationsmatrizen. Erlangen:
IEC Verlag.
-
Sponsel,
R. (2005). Fast- Kollinearität
in Korrelationsmatrizen mit Eigenwert-Analysen erkennen Ergänzungsband
- Band II zu Numerisch instabile Matrizen und Kollinearität in der
Psychologie.
-
Stegmüller,
Wolfgang (1969). Statistische Erklärungen. Deduktiv-nomologische Erklärungen
in präzisen Modellsprachen. Offene Probleme. Studienausgabe Teil 5:
Probleme und Resultate der Wissenschaftstheorie und analytischen Philosophie
Bd. I. Wissenschaftliche Erklärung und Begründung.
-
Stegmüller,
Wolfgang (1973). Statistische Begründung. Statistische Analayse. Das
Repräsentationstheorem von de Finetti. Metrisierung qualitativer Wahrscheinlichkeitsfelder.
Studienausgabe Teil E: Probleme und Resultate der Wissenschaftstheorie
und analytischen Philosophie Bd. IV. Personelle und Statistische Wahrscheinlichkeit.
-
Székely, Gábor
J. (1990). Paradoxa. Klassische und neue Übersetzungen aus Wahrscheinlichkeitsrechnung
und mathematischer Statistik. Frankfurt aM.: Deutsch.
_
Links (Auswahl)
-
Fehlurteile und Missverständnisse: Gerd Gigerenzer und der richtige
Umgang mit Zahlen. Für die Interpretation eines Gutachtens ist
vor allem die Form, in der es dargestellt wird, von Bedeutung. Daher gilt
für Gerd Gigerenzer: Um Fehlschlüsse zu vermeiden, sollten statistische
Informationen besser und verständlicher kommuniziert werden. Falsche
Auslegung von Statistiken kann fatale Folgen haben: für die eigene
Gesundheit, die eigene Freiheit oder auch das Bankkonto. Experten wie Laien
sind häufig nicht in der Lage, statistische Informationen richtig
zu verstehen. http://www.zdf.de/ZDFde/inhalt/25/0,1872,2054489,00.html.
-
Engineering Statistics
Handbook.
-
Lügen
mit Statistik.
-
Statistiklabor
der Uni Berlin (Schlittgen)
-
Denkfallen
und Paradoxa.
IP-GIPT Links:
_
Glossar, Anmerkungen,
Endnoten:
GIPT= General and Integrative
Psychotherapy,
internationale Bezeichnung für Allgemeine und Integrative Psychotherapie.
___
einheitswissenschaftliche
Sicht. Ich vertrete die ursprüngliche einheitswissenschaftliche
Idee des Wiener
Kreises, auch wenn sein Projekt als vorläufig gescheitert angesehen
wird und ich mich selbst nicht als 'Jünger' betrachte. Ich meine dennoch
und diesbezüglich im Einklang mit dem Wiener
Kreis, daß es letztlich und im Grunde nur eine
Wissenschaftlichkeit gibt, gleichgültig, welcher spezifischen
Fachwissenschaft man angehört. Wissenschaftliches Arbeiten folgt einer
einheitlichen und für alle Wissenschaften typischen Struktur, angelehnt
an die allgemeine
formale Beweisstruktur.
| Wissenschaft
[IL] schafft Wissen
und dieses hat sie zu beweisen, damit es ein wissenschaftliches Wissen
ist, wozu ich aber auch den Alltag und alle Lebensvorgänge rechne.
Wissenschaft in diesem Sinne ist nichts Abgehobenes, Fernes, Unverständliches.
Wirkliches Wissen sollte einem Laien vermittelbar sein (PUK - "Putzfrauenkriterium").
Siehe
hierzu bitte das Hilbertsche
gemeinverständliche Rasiermesser 1900, zu dem auch gut die Einstein
zugeschriebene Sentenz passt: "Die meisten Grundideen der Wissenschaft
sind an sich einfach und lassen sich in der Regel in einer für jedermann
verständlichen Sprache wiedergegeben." |
___
Schaefer
& Blohmke (1978, S.111): "Die Mortalität ist das Ergebnis
zweier voneinander unabhängiger Determinanten: der Häufigkeit
einer Erkrankung und ihrer Gefährlichkeit. Das Maß der ersteren
nennt man die Morbidität, eine Maßzahl, welche als Morbiditätsziffer
auf 1000 Lebende der betrachteten Bevölkerungsgruppe (Altersgruppe,
Geschlecht, Stadt, Land etc.) bezogen wird. Sie ist jedoch eine wenig sinnvolle
Größe. Die moderne Démographie und Epidemiologie ersetzt
sie daher durch die Prävalenz oder Inzidenz einer Krankheit, die ebenfalls
unten definiert sind (Abschn. 4.4.5.). Der Ausdruck Morbidität wird
nur noch als allgemeines Kennzeichen für Daten benutzt, welche quantitative
Angaben über Krankheitshäufigkeiten machen. Je gefährlicher
die Krankheit ist, desto mehr Erkrankte sterben an ihr. Die krankheitsspezifische
Mortalitätsziffer ist also besonders hoch für häufig vorkommende
und zugleich gefährliche Krankheiten."
Wird gelegentlich vervollständigt, ergänzt überarbeitet
- Anregungen und Kritik erwünscht
Querverweise
Standort: Beweis und beweisen in der Statistik.
*
Überblick
Statistik in der IP-GIPT.
Wird gelegentlich vervollständigt, ergänzt überarbeitet
- Anregungen und Kritik erwünscht
Zitierung
Sponsel, Rudolf (DAS).
Beweis
und beweisen in der Statistik. Blicke über den Zaun zum Auftakt für
eine integrative psychologisch-psychotherapeutische Beweislehre. Abteilung
Abstrakte
Grundbegriffe aus den Wissenschaften:
Analogien, Modelle und Metaphern
für die allgemeine und integrative Psychologie und Psychotherapie
sowie Grundkategorien zur Denk- und Entwicklungspsychologie.
Internet
Publikation
- General and Integrative
Psychotherapy
IP-GIPT. Erlangen: http://www.sgipt.org/wisms/gb/beweis/b_stat.htm
Copyright & Nutzungsrechte
Diese Seite darf von jeder/m in nicht-kommerziellen
Verwertungen frei aber nur original bearbeitet und nicht inhaltlich
verändert und nur bei vollständiger Angabe der Zitierungs-Quelle
benutzt werden. Das Einbinden in fremde Seiten oder Rahmen, die die Urheberschaft
der IP-GIPT nicht jederzeit klar erkennen lassen, ist nicht gestattet.
Sofern die Rechte anderer berührt sind, sind diese dort zu erkunden.
Sollten wir die Rechte anderer unberechtigt genutzt haben, bitten wir um
Mitteilung. Soweit es um (längere) Zitate aus ... geht,
sind die Rechte bei/m ... zu erkunden oder eine Erlaubnis einzuholen.
Ende_Beweise
in der Statistik_Überblick_Rel.
Aktuelles _Rel.
Beständiges _Titelblatt_
Konzept_
Archiv_
Region_Service_iec-verlag
Mail: sekretariat@sgipt.org__Wichtiger
Hinweis zu Links und zu Empfehlungen
kontrolliert irs am tt.mm.jj
Änderungen
23.05.09 Ergänzungen
zum Mittelwert.
25.04.09 Würfelspielparadoxon
erfasst und Laplace-Experiment.
21.04.09 Grundlagen
der Interpretation statistischer Daten und Modelle.
17.04.09 Simpsons
Paradoxon mit fehlender Relationstreue identifiziert.
16.04.09 Ergänzung
zu Simpsons Paradoxon.
14.04.09 Simpsons
Paradoxon. * Vieldeutigkeitssatz.
15.12.07 Produkt-Moment
(kleines, großes). * Regression, Regressionsanalyse.
30.11.07 Aufnahme
wichtiger stat. Begriff: Erwartungstreu(e Schätzung), Inferenz-Statistik,
Kovarianz, Zeitpunkt; Erg. z. Wert, wahrer.
03.08.07 Zur
Genauigkeit der amtlichen Daten zum Wirtschaftswachstum.
21.04.07 Veränderungen
der Erhebung statistischer Kenngrößen 1973 und 1978 am Beispiel
Verschuldung der Gemeinden.
09.04.07 Korrektur
zum 30.03.07:
30.03.07 Beispiel
MD3b: Schätzung des Gesamtschuldenstandes Nürnbergs am 31.3.1928
in Reichsmark.
17.03.07 Tradition
mehrdeutiger und daher unsinniger Auszeichnungen in der bayerischen Statistik.
09.03.07 Repräsentativität,
Transparenz und Kontinuität statistischer Zeitreihen.
11.03.06 Linkhinweis:
Lügen
mit Statistik. Hinweis auf das "Statistiklabor" der Uni-Berlin (Schlittgen).
02.11.03 Einige Ergänzungen,
Kurzdefinitionen und Links im Glossar.