Beweis und beweisen in der Statistik
Blicke über den Zaun zum Auftakt für eine integrative
psychologisch-psychotherapeutische Beweislehre
aus allgemein integrativer psychologisch-psychotherapeutischer
und einheitswissenschaftlicher
Sicht
Einführung, Überblick, Verteilerseite Beweis und beweisen
von Rudolf Sponsel, Erlangen
Hinweis: Wenn nicht ersichtlich werden (Externe Links) in runden und [interne IP-GIPT Links] in eckige Klammern gesetzt, direkte Links im Text auf derselben Seite sind direkt gekennzeichnet. In dieser Übersichtsarbeit wird das Thema im Überblick gesamtheitlich aus einheitswissenschaftlicher Perspektive dargestellt. Im Laufe der Zeit folgen weitere Ausarbeitungen.
Einstieg
Beweis und beweisen in der Statistik
Trau keiner Statistik, die Du nicht selbst gefälscht
hast * Man kann mit Statistik alles beweisen
Diese beiden bösen geflügelten Worte aus Volk und Bildungswelt sagen eigentlich schon alles über den Zustand dieser Wissenschaft, ihrer Vermittelbarkeit und allgemeinen Anerkennung. Das ist sehr schade, weil ich denke, daß Wahrscheinlichkeit und Statistik unverzichtbare und bedeutende Errungenschaften für die Wissenschaft und Gesellschaft sind. Ohne zuverlässige Statistiken, insbesondere langer Zeitreihen über Jahrzehnte und Jahrhunderte kann es keine zuverlässige und vernünftige Analyse, Planung, Erklärung und Prognose geben. Die Amerikaner wissen und können das, Deutschland und Europa kkönnen und wissen es leider anscheinend nicht (> Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen).
Beispiele für praktisch-statistische Fragestellungen:
Wie man sieht ist das statistische Feld weit und wir
tun gut daran, eine Grundordnung entlang am Thema Beweis und beweisen
in der Statistik zu entwickeln.
Praktisch
wichtige Grundfragen an die statistische Wissenschaft
Genauere
Operationalisierungen (Auswahl):
Grundgesamtheiten
Die betrachtete statistische Grundgesamtheit (Mase, Kollektiv) nennt
man auch Population. Populationen können potentiell unendlich (alle
Menschen, Münzwürfe) oder endlich (alle Magenkrebskranken der
Uniklinik U im Zeitraum t) und mehr oder minder genauer bestimmt oder allgemein
sein. Es ist meist sehr wichtig, sich genau darüber klar zu werden,
über welche Population Aussagen getroffen werden sollen.
Häufigkeiten
Wie oft (h) ereignet sich E (z.B. Vulkanausbrüche, Stürme,
Hitze-/ Trockenperioden/ HIV, Magenkrebs, arbeitslos, Sterbealter usw.)
in einem Zeitraum t und in der sozikulturellen Umgebung u: h(E |
t,u)?
" | t,u" bedeute unter den Bedingungen t und u. Die Beweismethode ist
die Zählung. Nachdem das Zählen sehr aufwendig in Mühe,
Zeit und Kosten werden kann, ergibt sich sofort die nächste Beweisfrage:
Stichproben
Welche Stichprobe ist wie aussagekräftig für eine Schätzung
hs(E | t,u) für h(E | t,u) in der Population? Darin steckt
auch: Welche repräsentativen Stichprobenziehungen gibt es?
Verteilungen
Je nach der Anzahl und Ausprägung der in eine Verteilung eingehenden
Größen ergeben sich unterschiedliche Verteilungsdarstellungen
und daher unterschiedliche Modelle für Verteilungen. Modell d-t-a(m)
für t Meßzeitpunkte und a Ausprägungsgrade, z.B. 1=wenig,
2=mittel, 3=viel eines Merkmals m. Würde z.B. einmal in der Woche
gemessen, wie viel es geregnet (m) hat, so ergäben sich für ein
Jahr Vv=3^52 theoretische Verteilungsmöglichkeiten.
Charakteristische
Größen (Parameter)
Im obigen Beispiel wären charakteristische Parameter z.B. die
Anzahl der 1, 2 und 3 und der Perioden, wenn eine Periode z.B. aus einer
gleichen Anzahl besteht. Führte man einen solchen Versuch über
mehrere Jahre durch, könnte man feststellen, ob es - bezüglich
zu nennender Kriterien - Veränderungen gibt, vielleicht oder auch
nicht.
Fehlerschätzungen
Es gilt als fundamentaler Erfahrungssatz, dass alle empirischen Feststellungen
mit Fehlern behaftet sind, die sich aus vielerlei Quellen zusammensetzen,
ausgleichen, mindern oder verstärken (potenzieren) können. Zu
einer guten empirischen Theorie und Beobachtung, gehört daher auch
die Einbeziehung von Fehlern.
Zur Genauigkeit
der amtlichen Daten zum Wirtschaftswachstum
Pressemitteilung des Statistischen Bundesamtes Nr.
307 vom 3. August 2007
"WIESBADEN - Wie genau sind die Daten der deutschen amtlichen Statistik,
speziell die der Volkswirtschaftlichen Gesamtrechnungen (VGR) zum Wirtschaftswachstum?
Eine Frage, die immer wieder von Wirtschaftsforschern, Analysten und Journalisten
gestellt wird.
Berechnungen zeigen: Die laufenden Revisionen des
Bruttoinlandsprodukts (BIP) liegen in einem der hohen Aktualität angemessenen
und vertretbaren Rahmen. Im internationalen Vergleich gehören die
vierteljährlichen deutschen BIP-Berechnungen sogar zu den besten:
Nach einer Untersuchung der OECD sind die frühen Quartals-BIP-Schätzungen
der Statistikämter aus Deutschland, Frankreich und Großbritannien
die zuverlässigsten und genauesten, dicht gefolgt von denen für
die USA, Kanada und die Niederlande.
Dies ist umso bemerkenswerter, da Deutschland mit
seiner Schnellmeldung zum vierteljährlichen Bruttoinlandsprodukt (BIP)
nach nur 45 Tagen auch in punkto Aktualität zu den Spitzenreitern
in Europa zählt. Seit dem Jahr 2000 hat sich die erste Veröffentlichung
des BIP, unter anderem auf Drängen der Finanzwelt und des Bedarfs
der EZB nach aktuelleren Daten für die Eurozone, von 65 auf nur noch
45 Tage nach Abschluss des Berichtsquartals beschleunigt.
Mit der Veröffentlichung der von den Nutzern
geforderten hochaktuellen Konjunkturdaten befindet sich die amtliche Statistik
immer im Spannungsfeld zwischen Aktualität und Genauigkeit. Um möglichst
frühzeitig aktuelle Zahlen veröffentlichen zu können, werden
die
Ergebnisse auf unvollständiger Datengrundlage berechnet und zum
Teil geschätzt. Diese vorläufigen Ergebnisse werden kontinuierlich
aktualisiert, wenn neue statistische Ausgangsdaten verfügbar sind.
Darauf wird in einem eigenen Qualitätsbericht ausdrücklich hingewiesen."
Tradition
mehrdeutiger und daher unsinniger Auszeichnungen in der bayerischen Statistik
Anmerkung: Der Unsinn der Vieldeutigkeit von Zeichen könnte -
auf jeden Fall in der bayerischen - Statistik sogar Tradition haben. So
wird z.B. im Statistischen Jahrbuch der Stadt Nürnberg von 1930
unten beim Inhaltsverzeichnis ausgeführt:
Ein solches Vorgehen ist wissenschaftlich und praktisch vollkommen abzulehnen. "Nicht vorhanden" ist etwas ganz anders als die Zahl 0 und gehört infolgedessen auch mit einem eigenen Zeichen versehen, und zwar zwingend eineindeutig und nicht "verodert" (wie z.B. in der Zeugenbefragung geboten). Die Zahl 0 ist natürlich kein fehlendes Datum, insbesondere nicht bei den Schulden, und gehört selbstverständlich zwingend als 0 ausgewiesen, wenn der Schuldenstand eben Null ist (das war in Bayern erfreulicherwiese im Jahre 2004 bei 76 Gemeinden der Fall). Folgende Fallunterscheidungen könnten hierbei sinnvoll sein:
Beispiel
MD3b: Schätzung des Gesamtschuldenstandes Nürnbergs am 31.3.1929
in Reichsmark
Im folgenden wird dargelegt, wie man den Gesamtschuldenstand
- aus Mark ("Papiermark") und Reichsmark - für 1928/29 schätzen
kann, wenn die einzubeziehenden Geldgrößen klar ausgewiesen
oder UMrechnungsfformeln angegeben würden. Zunächst der Sachverhalt,
wie ihn das Statistische Jahrbuch der Stadt Nürnberg 1930
ausweist:
Man sieht hier zwei Werte in der Rubrik "Schuldenstand am Schlusse des Jahres", einmal in "M" ("Papiermark") und der andere in "RM" (Reichsmark), ohne dass erklärt würde, wie nun der Gesamtschuldenstand zu bilden ist. Das ist wenig verständlich, wenn man sich vergegenwärtigt, dass es sich um das Jahrbuch von 1930 handelt, also 6 Jahre nach der Hyperinflation und die tatsächlichen Verrechnungsdaten ja auf jeden Fall in der Kämmerei vorliegen müssen.
Für das Haushaltsjahr 1928/29 wird im Verwaltungsbericht der Stadt Nürnberg, bearbeitet im Statistischen Amt und herausgegeben vom Stadtrat 1929, S. 434 ausgeführt:
Nach diesen Mitteilungen, sollten sich Schätzungen und Umrechnungen
durchführen lassen - wenn man wüsste, wie sich die einzelnen
Finanzgrößen (Rückkauf 339949 RM; Umtausch mit Auslosungsrechten
mit 16916156 RM und Umtausch ohne Auslösungsrechte mit 104375 RM)
zu einander verhalten. Das wird aber leider nicht mitgeteilt, so dass der
Gesamtschuldenstand natürlich davon abhängt, welche Größen
in die Umrechnung "Papiermark" und Reichsmark eingehen. Man kann also rätseln,
welcher drei hier möglich erscheinenden Gesamtschuldenstände
der richtige ist:
(1) Spielten die Umtauschgrößen keine
Rolle. ergäbe sich für die Gesamtschuld am 31.3.1929 folgender
Schätzungsansatz: 140092500 / 336949 = 415.7676681, also ein Verhältnis
von 1 Reichsmark zu gerundet 416 Mark ("Papiermark").
(2) Rechnet man die Umtauschgrößen mit
ein, ergibt sich folgende Umrechnung: 140092500 / (336949 + 16916156 +
104375) = 140092500 / (17357480) = 8.071016069, also ein Verhältnis
von 1 Reichsmark zu gerundet 8 Mark ("Papiermark").
(3) Es zählt nur die Gesamtschuld in Reichsmark,
weil die Ablösen schon in die Summe eingerechnet wurden.
Dies ergibt die möglichen Gesamtschuldenbeträge:
Rechnung (1), die 140 Mill. Papiermark sind 336949 RM wert, ergäbe
88,676999 Millionen RM Gesamtschuld.
Rechnung (2), die 140 Mill. Papiermark sind 17,357480 Mill. Reichsmark
wert, ergäbe 105,697530 Millionen RM Gesamtschuld.
Rechnung (3), es zählt nur der mitgeteilte Schuldenstand in Reichsmark,
es bliebe wie mitgeteilt, 88,340050 Millionen RM Gesamtschuld.
Veränderungen
der Erhebung statistischer Kenngrößen 1973 und 1978 am Beispiel
Verschuldung der Gemeinden
Den folgenden Ausführungen aus "Statistisches Jahrbuch Deutscher
Gemeinden", 66. Jahrgang, 1979, S. 438 kann man entnehmen, dass die Erfassungsmerkmale
der Schulden "eine Anknüpfung an die Berichterstattung bis einschließlich
1973 (61. Jahrgang) nicht mehr zu" lassen. "Im Unterschied zu 1977 sind
die Krankenhäuser nicht mehr in den Gesamtschuldenstandsbeträgen
enthalten. Sie werden wie die Eigenbetriebe nachrichtlich aufgeführt."
Was "beweist"
nun dieser wenig erfreuliche Sachverhalt ?
Nun, anscheinend ist die deutsche Statistik nicht in der Lage oder
motiviert, Sinn und Notwendigkeit vergleichbarer wichtiger sozioökonomischer
Daten, wie z.B. die Verschuldung einer Gemeinde, so zu begreifen, dass
sie die Kontinuität der Daten auch tatsächlich sicher stellen
würden. Das mag auch politisch gewollt sein, um Zusammenhänge
zu verschleiern und Transparenz und Kontinuität zu behindern.
Grundannahme-Paradoxie:
Konstanz des Zufalls ?
Hier gibt es zwei Aspekte: 1) daß es so etwas wie Zufallsgesetze
überhaupt gibt; 2) inwiefern dies über die Zeit und Bedingungen
hinweg gelten.
In der schließenden und sog. Inferenzstatistik
möchten wir nicht nur Aussagen für den Augenblick treffen, sondern
auch über statistische Regelhaftighaften von Dauer etwas erfahren,
wobei unklar ist, ob oder inwieweit "Zufall", Dauer und Konstanz eineinder
nicht ausschließen. Wie wollen wir Regelhaftigkeiten von Dauer erkennen,
wenn schon das einzelne Ereignis sehr unsicher ist und eine große
statistische Ereignis-Bandbreite hat?
Mathematik und
Statistik
Das Wesen mathematischer Statistik besteht auf der Basis einen strengen
Theoriegebäudes vielfach darin, die Wahrscheinlichkeit für ein
Modell M1 gegenüber einem Vergleichs- oder Kriteriums-Modell M2 oder
für Annahmen A1 gegenüber anderen Annahmen A2 zu bestimmen. Das
ist einerseits sinnvoll und ergiebig, etwa bei der Frage, ob ein empirischer
Datensatz als normalverteilt angesehen werden darf oder nicht, andererseits
sehr merkwürdig, wenn die Empirie aus einem Vergleich herausfliegt
und nur noch zwei theoretische Modelle oder hypothetische Annahmen [verglichen]
werden: Beispiel: der unselige [Signifikanztest],
der ja, kurz und bündig formuliert, nur eine statistische Aussage
unter der Annahme zuläßt, daß die Nullhypothese
richtig ist. Wir testen mit dem Signifikanztest also ein virtuelles Ergebnis.
| Denn die gewöhnliche EmpirikerIn wird meist nicht wissen wollen, was ist, wenn die Nullhypothese richtig wäre?, sondern: ist sie anzunehmen oder nicht? Welche Hypothese ist vorzuziehen, falls eine Entscheidung möglich ist ? |
Eine EmpirikerIn interesiert sich also meist nicht dafür, ob ein
Ergebnis angenommen oder verworfen werden darf, wenn die
Nullhypothese richtig ist, sondern ob sie sie annehmen oder
verwerfen soll. Die Gretchenfrage der empirischen Statistik lautet: Welche
Hypothese ist anzunehmen, die Null- oder die Alternativhypothese. Weiß
man nichts, können im Falle zweiwertiger Logik, beide Hypothesen richtig
oder falsch sein, so daß vier Fälle zu unterscheiden wären.
Das aber macht der Signifikanztest gerade nicht. Signifikanztesten scheint
also ein gigantisches Schautheater und numerologisches Zahlenspiel zu sein,
das nicht nur kaum einen Erkenntniswert hat, sondern vor allem Verwirrung
stiftet. Dafür ist die mathematische Statistik anscheinend bestens
gerüstet. Wissenschaft? Oder Wirrenschaft?
| Die großen Probleme in der Wahrscheinlichkeitsrechnung und Statistik liegen weniger in der Theorie als in der Anwendung. Es scheint so, als hätte die mathematische Statistik sich wenig um die sozialwissenschaftlichen Gegebenheiten gekümmert. Die meisten AnwenderInnen können die mathematische Statistik nicht richtig verstehen und die meisten mathematischen StatistikerInnen sind nicht in der Lage, ihre Theorien praktisch sinnvoll zu vermitteln. Theorie und Praxis driften extrem auseinander. Über weite Strecken entsteht der Eindruck, als ob nur theoretische Modell-1/ Annahme-1 gegen theoretisches Modell-2/ Annahme-2 getestet würde, wodurch wir aber nichts über die Wirklichkeit erfahren und wie wir zwischen Hypothesen entscheiden sollten. |
Im großen wissenschaftstheoretischen Werk Stegmüllers finden sich mehrere Kapitel oder Abschnitte, die Wahrscheinlichkeit und Statistik
Stegmüller (1973, S. 279-303) nennt Elf Paradoxien und Dilemmas
Was bedeutet
ein korrelativer Zusammenhang?
Was eine Korrelation bedeutet, weiß man nicht genau ['Schein'korrelation],
es ist ein rein statistisch-artifizielles ('künstliches') Zusammenhangsmaß,
das von Erhebung zu Erhebung, und sogar innerhalb einer einzigen Erhebung
von Merkmalsraum zu Merkmalsraum sowohl ganz unterschiedliche Zahlenwerte
als auch Bedeutungen annehmen kann. Empirisch gilt meist der Satz: je nachdem
welche Variablen in die Berechnung einbezogen oder nicht eingebezogen werden,
ändern sich die Korrelationskoeffizienten, und zwar möglicherweise
sehr erheblich. Beweis: [Partielle
Korrelationen].
Quelle Kolmogoroff, A. (1933; Nachdruck
1973, S. 2).
__
Kollinearität:
[Kollinearitätsanalyse
in Korrelationsmatrizen]
__
Konfundiert, Konfundierung.
untrennbar zusammenhängend; miterfasst. Sind zwei Merkmale M1 und
M2 untrennbar miteinander verbunden, z.B. Alter und Geschlecht, so kann
sich die Frage stellen, ob ein Effekt E durch das Alter, das Geschlecht,
durch beides oder durch keines von beidem bestimmt ist. Die Kontrolle von
miteinander konfundierten Variablen spielt in Experimenten eine wichtige
Rolle. Eine Möglichkeit konfundierte Effekte im wahrsten Sinne des
Wortes herauszurechnen besteht in der Nutzung partieller
Korrelationsanalyse.
__
Kontinuität.
__
Korrelation.
Zusammenhang. Es gibt viele Zusammenhangsmaße und damit unterschiedliche
Korrelationsbegriffe, so dass immer dazu gesagt werden sollte, um welche
Korrelation es sich handelt. [partielle
Korrelation]. > Regression.
__
Kovarianz. Ko = mit. Varianz = Streuung.
Mit- oder gemeinsame Streuung von zwei Datensätzen: Sxy
= 1/n [Summe(xi - mx) (yi - my),
wobei hier m der arithmetische Mittelwert sei. Beispiel: X=1,2,3. Y=2,3,4.
mx=2; my=3. n = 3:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
Besonderheiten und Zusammenhänge: Kovarianzen sind nicht standardisiert
(nicht normiert auf die Standardabweichung) sein. Wird mit standardisierten
Werten gerechnet, ist die Kovarianzmatrix mit der Korrelationsmatrix identisch.
In der schließenden (Inferenz-) Statistik wird wegegn der Erwartungstreue
nicht durch n, sondern durch 1/(n-1) dividiert. Die Kovarianz steht in
der Korrelationsformel nach Bravais-Pearson im Zähler.
__
Laborwertnormen.
__
Längsschnitt-Statistik
(Longitudinal). Erhebung von Werten über verschiedene Zeit- bzw. Messzeitpunkte
hinweg, z. B. alle zwei Monate Bestimmung der Leberwerte für die Dauer
eines Jahres. > Querschnitt.
__
Letalität.
__
Likelihood.
__
Longitudinal > Längsschnitt.
__
Markovkette
__
Maximum-Likelihood-Methode.
Von R.A. Fisher 1921 entwickeltes Verfahren zur Schätzung von Wahrscheinlichkeiten.
Es wählt diejenige aus, die unter bestimmten Annahmen die größte
Wahrscheinlichkeit für ein vorliegendes Resultat hat.
__
Median. Der Wert, der eine Messwert-Reihe
in zwei Hälften teilt, z. B. 3 in: 1, 1, 2, 2, 3, 3,
3, 3, 4, 5, 5.
__
Mengenlehre. Nach der Mengenlehre
besteht die Messwert-Reihe "1, 1, 2, 2, 3, 3, 3, 3, 4,
5, 5" aus 5 Elementen.
__
Messen, Messung. Genau beschriebenes und
damit prinzipiell wiederholbares und überprüfbares Verfahren
zur Feststellung einer Ausprägung. Eine Messung ist lehr- und lernbar.
__
Messfehler. Als allgemeiner Erfahrungssatz
gilt: jede Messung ist mit einem Fehler behaftet, so das für den Messwert
x, den gedachten wahren Wert w und den Messfehler f gilt: x = w + f.
Da der wahre Wert eine gedachte Konstruktion und nie bekannt ist, muss
er in praxi geschätzt werden. Diesen Näherungswert nennt man
auch den "richtigen" Wert r und damit gilt dann: x = r + f. Man nimmt hierfür
oft den arithmetischen Mittelwert.
[> Fehlerarten.]
__
Messwert. Zahlenwert.
__
Minimum. Der kleinste Wert in einer Reihe,
z. B. 1 in: 1, 1, 2, 2, 3, 3, 3, 3, 4, 5, 5.
__
Mikrozensus. Stichprobenauswahlverfahren.
[W]
__
Mittelwert ohne nähere
Angabe. Meist ist der arithmetische gemeint und oft auch so erkennbar.
Sicher wäre es, genau zu anzugeben, von welchem man spricht.
__
Mittelwert, arithmetischer.
Summe aller Werte dividiert durch die Anzahl. [W]
__
Mittelwert, geometrischer.
Besonders geeignet für Mittelwerte bei Geschwindigkeiten. [W]
__
Mittelwert, harmonischer.
[W]
__
Modalwert. Der häufigste Wert
in einer Reihe, z. B. 3 in: 1, 1, 2, 2, 3, 3, 3, 3, 4, 5,
5.
__
Moment. Sammelbezeichnung oder Klassenbegriff
für die verschiedenen statistischen Kennwerte oder Parameter einer
Verteilung: [W]
__
Morbidität. Unklarer medizinstatistischer,
epidemiologischer Begriff. 1) Gesundheitsbrockhaus 1990: Gibt die Häufigkeit
einer Erkrankung pro 1000 oder 10.000 für ein Jahr oder einen anderen
Zeitraum an. 2) Grundmann, E. (1994, Hrsg.; S.4-5): „Die M. ist die Zahl
einer bestimmten Erkrankung in einer bestimmten Bevölkerungsgruppe
in einem bestimmten Zeitraum (meist einem Jahr). Sie berechnet sich nach
der Formel: Mz = (Erkrankungszahl x 10 000) / Bevölkerungszahl“.
In dieser Formel fehlen die Einheiten der Zeit und die soziologische Spezifikation.
3) Nach Renner, D. (6.A. 1990, S. 24): „M. - Anzahl an einer bestimmten
Krankheit leidender Personen per Gesamtbevölkerung in einem bestimmten
Beobachtungszeitraum.“ Nach diesem Autor wird M. auch synonym mit Neuerkrankungsrate
(> Inzidenz) verwendet. Die Inzidenz wird von Schaefer
& Blohmke (1978, S.111) wiederum der > Prävalenz
gleichgesetzt.
__
Mortalität. Medizinstatistischer,
epidemiologischer Begriff, der die Sterblichkeit einer Krankheit bezogen
auf die Gesamtzahl der Lebenden eines Jahrganges pro 10.000 oder 100.000
angibt im Unterschied zur > Letalität, die
das Verhältnis der an einer Krankheit Gestorbenen in Beziehung zur
Anzahl der Erkrankten angibt.
___
Multikollinearität. In
einer Tabelle (Matrix) gibt es mindestens 2 Kollinearitäten (vergleichbarer
Datensätze, also aus der gleichen Stichprobe oder Population mit jeweils
gleicher Anzahl n).
__
Norm.
Bezugs- oder Vergleichgröße.
__
Normalverteilung. Gaußsche
Glockenkurve [1,
2,
W,
]. Wichtigste Verteilung der mathematischen Statistik. Häufung der
Werte in der Mitte und von aus fortlaufend abnehmend zu den Rändern
hin.
|
"Die Erfahrung zeigt, daß eine ausgesprochen Normalverteilung in der Natur nur selten vorkommt. Garry (1947) schreibt sogar: 'Die Normalität ist ein Mythos, es lag nie Normalverteilung vor, und sie wird nie vorliegen." |
__
Prozentrang.
Prozentsatz derjenigen, die einen so oder so großen Wert erreichen.
__
Quantile. Vielheiten, meist in gleiche
Klassen zusammengefasst. Quartile und Prozentränge sind Quantile.
__
Quartile. 1. Quartil := erstes Viertel
der Stichprobe. 2. Quartil: Zweites Viertel der Stichprobe. Median
:= halbiert die Stichprobe, 3. Quartil =: drittes Viertel der Stichprobe.
4. Quartil = letztes Viertel der Stichprobe. Seien 100 Messwerte von 1,2,3,
..., 100 gegeben, dann gehören 1-25 zum ersten Quartil, 26-50 zum
zweiten Quartil, 51-75 zum dritten und 76 bis 100 zum vierten Quartil.
__
Querschnitts-Statistik,
eine Statistik, die über verschiedene Objekte im gleichen Zeitraum
erhoben wird, z. B. der arithmetische Mittelwert für den durchschnittlichen
Alkoholkonsum junger Frauen zwischen 21 und 25 Jahren in Bayern. > Längsschnitt.
__
Referenzwert > wörtlich Bezugswert
bzw. Bezugswertbereich, Normwert, Normalbereichswert in der Medizin(im
Laborbereich gewöhnlich unzulänglich ausgewiesen).In der Psychologie
werden z. B. sog. "Normen" bei Intelligenztests meist für Geschlecht,
Alters- und Bildungsklassen bestimmt. In der Medizin sind naturgemäß
besonders wichtige Kriterien spezielle Erkrankungen und Risiko-, aber auch
ökologische Faktoren (wie z. B. Stadt, Land, Abgasbelastung, Sendemasten,
Strahlungsbelastung [Elektrosmog], Chemie- oder Atomkraftwerke in der Nähe,
oder Berufe, die mit bestimmten Risiken einhergehen, können sehr wichtig
sein. Beispielrechnung. Setzt man bei parametrischen statistischen Verfahren
eine Mindeststichprobengröße von N=30 an und geht man aus von
2 Geschlechtern, 5 Altersklassen, 3 Schulbildungsgraden, 6 ökologischen
Klassen, 27 Gesundheitsfaktoren (3 Bewegungsgrade, 3 Ernährungsgrade,
3 Körperindexgrade), 100 Krankheitsklassen und 10 Risikofaktoren ergibt
sich folgende Rechnung: STC [Stichprobencharakteristiken] = 30 * 2 * 5
* 3 * 6 * 27 * 100 * 10 = 48.600.000, d. h. 48,6 Millionen Laborbefunde.
Das wären die theoretischen Erfordernisse, wenn jede Stichprobenkombination
vertreten sein soll. Es kann natürlich durchaus vorkommen, dass nicht
jede Kombination mit 30 Fällen besetzt werden kann, weil sie zu selten
vorkommt.
__
Regression, Regressionsanalyse. Einfaches
lineares Modell nach y = a + b*x. Ein Wert y wird auf einen Wert x zurückgeführt,
z.B. das Gewicht auf die Körpergröße. Das geht auch umgekehrt,
indem man die Körpergröße auf das Gewicht zurückführt.
Als Maß für den Zusammenhang beider Regressionen dient der Korrelationskoeffzient,
der sich auch aus der Wurzel des Produktes beider Regressionskoeffzienten
(geometrisches Mittel) errechnen lässt. b ist die Steigung und heißt
auch beta-Gewicht. Inhaltlich interpretiert gibt b an, in welchem Verhältnis
y steigt (fällt), wenn x um eine Einheit steigt (fällt). Im Prinzip
gibt es beliebige Regressionsmodelle, letztlich so viele, wie Datenmodelle
und Funktionsverläufe, die sie charakterisieren. Das einfache lineare
Modell ist also nur eines, wenn auch das wohl meist angewendete. Regressionen
bei Wachstumsprozessen werden "linearisiert" durch logarithmieren (Bsp.).
__
Relation (Beziehung). Beispiele: größer,
kleiner, gleich, auf, unter, gleich alt wie, besser. Grundlegender, aber
wegen seiner Abstraktion schwieriger mathematischer Grundbegriff, der seit
der Durchsetzung der Mengenlehre auch über diese definiert wird: Eine
Relation ist eine Teilmenge der Kreuzmenge (kartesisches Produkt, Paarmenge).
Sei A = {Main, Passau, Frankfurt, Donau}, so ist die Kreuzmenge, AxA, numeriert:
1. (Main, Main), 2. (Main, Passau), 3. (Main, Frankfurt), 4. (Main, Donau),
5. (Passau, Main), 6. (Passau, Passau), 7. (Passau, Frankfurt), 8. (Passau,
Donau), 9. (Frankfurt, Main), 10. (Frankfurt, Passau), 11. (Frankfurt,
Frankfurt), 12. (Frankfurt, Donau), 13. (Donau, Main), 14. (Donau,
Passau), 15. (Donau, Frankfurt) und 16. (Donau, Donau). Relationen können
hier sein: I. Fluß und Stadt gehören zusammen: 3 und 8. II.
Fluß und Stadt gehören nicht zusammen: 2 und 7. III. identische
Flüsse: 1 und 16. IV. Identische Städte: 6 und 11. V. Flüsse:
1, 4, 13 und 16. VI. Städte: 1, 3, 5, 6, 7, 9, 10., 11. VII. Identische
Namen: 1, 6, 11, 16. VIII. schwebt über: wird von keinem der Paare
erfüllt.
__
Relationentreue.
__
Reliabilität. Messgenauigkeit.
In der Psychologie meist - und nicht unproblematisch - über die Korrelation
geschätzt.
__
Repräsentation. Grundlegender
Begriff für die Stichprobenstatistik, schließende Statistik
und für die allgemeine, auch alltägliche "Testtheorie". Erheben
wir Werte, so sollen diese repräsentativ für ... sein. Bei Laborwerten
kann es sehr darauf ankommen, wie die Randbedingungen der Erhebung sind
(z. B. Tageszeit, nüchtern). Ist ein Laborwert, z. B. Gamma-GT pathologisch
erhöht, so wird man das im allgemeinen beobachten und Messwiederholungen
ansetzen. Ein Gamma-GT-Wert ist sozusagen nur eine einzige Stichprobenziehung
aus den praktisch unendlich viel anmutenden Möglichkeiten. Eine besondere
Bedeutung hat der Begriff noch in der Messtheorie. Das Repräsentationstheorem
dort besagt, dass es eine homomorphe Abbildung von einem empirischen Relativ,
z. B. drei Hölzchen, in ein numerisches Relativ mit z. B. drei Zahlen
so gibt, dass die Beziehungen zwischen den Hölzchen durch die Zahlen
repräsentiert werden.
__
Risiko:
__
ROC. Diagramm bei dem auf der Ordinate die
Sensitivität
und auf der Abszisse 1-Spezifität eingetragen
wird. Daraus lässt sich das Verhältnis aller richtig positiven
und falsch positiven Zuweisungen ersehen. [W]
__
Rohwert := scorierter Bearbeitungswert,
dem Bearbeitungswert wird ein Zahlenwert zugeordnet. Wichtiger Grundbegriff
für sozialwissenschaftliche Fragestellungen.
__
Schiefe := Abweichungsmaß von der
Symmetrie einer Verteilung; rechtsschief, linksschief.
__
Score := Zahlenwert, Ausdruck in der
Testpsychologie. Bekommt eine ProbandIn auf die Frage, wie der Bundeskanzler
der BRD heißt, z. B. einen "Wertpunkt" für die richtige Antwort,
so ist dieser Wertpunkt der Rohwert-Score. > Summenscorefunktion.
__
Sensitivität. Ein Maß
für die Richtig-Positiv-Zuweisungen.
Sicherheit
__
Signifikanz.
Zufallskritische Beurteilung von Annahmen. Meist wird nicht die Wirklichkeit
geprüft, sondern unter bestimmten Annahmen wird eine Annahme einer
anderen Annahme gegenübergestellt, so dass nicht selten der Eindruck
einer virtuellen Scheinwissenschaft entsteht. Sog. "signifikante" Ergebnisse
werden auch selten in klaren - hierzulande deutschen - Sätzen interpretiert,
woran man schon erkennt, wie schwach und unbedeutend (nicht signifikant
;-) solche Erkenntnisse sind. Der "Signifikanz-Popanz" ist vermutlich eine
Folge der - oft genug sehr problematischen - Mathematisierung der Sozialwissenschaften.
Viele denken zu Unrecht, dass nur, wo Zahlen und Formeln verwendet werden,
schon Wissenschaft vorliegt; nicht selten ist es blosse moderne Numerologie
und das Gegenteil von Wissenschaft. Signifikanztest
__
Skalierung. Messverfahren, Messmethode.
__
Spannweite = Maximum - Minimum. Ist
die zahlenmäßig kleinste Note in einem Zeugnis 1 und die größte
Note eine 4, dann beträgt die Spannweite 4 - 1 = 3. Mit Spannweite
kann auch ein Streuungsbereich gemeint sein, z. B. der 1 Sigma Bereich
bei der Standard-Normalverteilung umfasst die mittleren 68%, der 2 Sigma-Bereich
die mittleren 95,5% und der 3-Sigmabereich 99,7%, also fast die gesamte
Verteilung.
__
Spezifität.
Ein Maß für die Richtig-Negativ-Zuweisungen > Sensitivität.
__
Spiel.
__
Spieltheorie.
__
Stabil, Stabilität [numerische]
__
Standardabweichung
(Symbol: Sigma) . Wichtiges Streuungsmaß. Wurzel aus der Summe der
quadrierten Abweichungen der Rohwerte vom Mittelwert durch n-1 dividiert.
Ohne die Wurzel ergibt sich die Varianz = quadrierte Standardabweichung.
![]() |
Gegeben seien 5 ProbandInnen mit einem BAK von: 0, 0.5, 1, 1.5, 2.0. n = 5. Das arithmetische Mittel = 5/5 = 1.0. Die Standardabweichung = Wurzel {Summe [(0-1)^2 + (0.5-1)^2 + (1-1)^2 + (1.5-1)^2 + (2-1)^2]/5-1} = |
Unsicherheit. Das Leben und die meisten
Entscheidungen, die es abverlangt, sind mit Unsicherheit verbunden. Diese
Unsicherheiten ab- und einschätzen können, ist ein vielfaches
und bedeutsames Anliegen von Wissenschaft und alltäglicher Praxeologie.
__
Unterscheiden. Grundlegende kognitive
Funktion. Eng verbunden mit vergleichen.
__
Utilität. Nutzen, Wert eines Tuns.
Aufwands-Ergebnis-Verhältnis. [> Ökonomie.]
__
Validität. Maß für die
Erreichung eines Ziels durch bestimmte Methoden.
__
Varianz. Streuungsmaß. Quadrat der
Standardabweichung.
__
Varianzanalyse. Untersuchungsverfahren,
das die Einflüsse von Bedingungen auf statistische Kennwerte durch
Analyse der Mittelwerte und Varianzen erforscht. [W]
__
Vergleichen := elementares geistiges
Handeln, Grundprinzip jeder Messung. Eng verbunden mit unterscheiden.
__
Verteilung. Häufigkeit oder Ausprägung
von Werten nach geordneten Kriterien. Meist wird die Häufigkeit an
der Ordinate und an der Abszisse meist die Zeit.
__
Verteilungsannahmen. Es gibt
beliebige Verteilungen. Die meisten parametrischen Tests setzen aber bestimmte
Verteilungsannahmen, z. B. normalverteilte Daten voraus. Dort, wo mit Verteilungsannahmen
gerechnet wird, müssen diese natürlich angegeben werden.
__
Verteilungskennwerte (z.
B. Schiefe,
Exzess, Gipfel).
__
Vertrauensintervall (Konfidenz).
[W]
__
Voraussetzungen. Bestimmte Verfahren
erfordern bestimmte Voraussetzungen, die oftmals nicht ausdrücklich
genannt werden, z. B. Normalverteilung, Intervallskalenniveau, Zufallsauswahl,
Parameterkonstanz über die Zeit, Raum und Bedingungen hinweg. So sind
z. B. die Schulnoten auf Ordinalniveau und damit ist die arithmetische
Mittelwertsbildung unzulässig, weil hierfür mindestens Intervallskalenniveau
erforderlich ist.
__
w := Hier Zeichen für gedachten wahren
Wert bei einem Messvorgang. Der wahre Wert ist grundsätzlich unbekannt
und muss geschätzt werden, hier durch r := Näherungswert für
w.
__
Wahrscheinlich,
Wahrscheinlichkeit. Mehrdeutiger Grundbegriff der Wahrscheinlichkeitstheorie.
Ähnlich wie der wahre Wert ist die Wahrscheinlichkeit eines Ereignisses
letztlich unbekannt. Als beste Näherungsschätzung wird in der
Statistik meist die relative Häufigkeit eines Ereignisses für
den Wahrscheinlichkeitsparameter genommen, wobei sich gewöhnlich für
den Fall unendlich vieler Realisationen - die in praxi natürlich nicht
möglich sind - die Identität von Näherungs- und wahrem Wahrscheinlichkeits-Wert
ergibt. Praktisch heisst das: je größer der Stichprobenumfang
oder je mehr Messungen vorliegen, desto mehr nähert sich der empirische
Wert dem wahren Wert an. In der Mathematik gilt dieser Grundbegriff seit
der Axiomatisierung 1933 durch Kolmogorov geklärt.
__
Wahrscheinlichkeit, bedingte.
p(A|B), d.h. die Wahrscheinlichkeit für das Ereignis A unter der Bedingung
B. Wichtiger Grundbegriff. Genau betrachtet kann es gar keine "unbedingte"
Wahrscheinlichkeit geben. Wenn daher allgemein von "unbedingter" Wahrscheinlichkeit
gesprochen wird, so heißt das meist nur, dass nicht angegeben oder
gewusst wird, unter welchen Bedingungen eine Wahrscheinlichkeitsaussage
gilt.
__
Wahrscheinlichkeitsmodell.
Z. B. Urnenmodell mit oder ohne Zurücklegen.
__
Wahrscheinlichkeit,
objektive. [ > relative Häufigkeit]
__
Wahrscheinlichkeit, subjektive.
[> Bayes]
__
Wahrscheinlichkeit, totale.
__
Welten.
__
Wert. 1) Zahlenwert im Rahmen einer Messung.
2) anderer Wert, den ein Sachverhalt relativ für einen Bewertenden
hat (z. B. Wind für einen Segler, Regen für einen Bauern, Musik
und Alkohol für einen Feiernden). [> werten]
__
Wert, richtiger. Beste bekannte empirische
Näherung an den gedachten wahren Messwert.
__
Wert, wahrer. Idee, dass ein Zustand
oder Merkmal zum Zeitpunkt der Messung einen wahren Messwert hat, den es
"bestmöglich" zu schätzen gilt. Fiktive Größe und
nicht immer hinreichend klare Vorstellung, repräsentier- oder schätzbar.
Beispiel: Zu messen sei das Volumen einer Streichholzschachtel. Hierbei
wird man mehrfache Messfehler begehen. Einmal weil die Ausdehnungen (Länge,
Breite, Höhe) nicht streng starr geradlinig sind. Zum andern weil
man in aller Regel bei jeder Messung auch Messfehler macht. Trotzdem ist
hier die Idee, dass die Streichholzschachtel zu einem bestimmten "Zeitpunkt"
- einen fiktive und genau betrachtet unklare Vorstellung - einen wohlbestimmten
Volumenwert hat, plausibel und intuitiv unmittelbar einsichtig.
__
Wertzuweisung. Bestimmten Sachverhalten
können Werte zugewiesen werden, z. B. "nützlich für ...",
"gesund", "krank", "Symptom für x". Die Wertzuweisung kann mehr oder
minder begründet und methodisch ausgewiesen sein oder willkürlich,
"per fiat" nach gutem Glauben oder Fachkompetenz erfolgen.
__
Wissenschaftliches
Arbeiten.
__
x := Hier Zeichen für einen empirischen
Messwert.
__
Zahlen.
__
Zeit. Wichtiger, doch letztlich bezüglich
seiner Bedeutung oft sehr unklarer Grundbegriff in der Statistik. > Die
Zeit als Variable.
__
Zeitpunkt. Fiktive und - genau betrachtet
mitunter - problematische Vorstellung einer "Momemtaufnahme". Tatsächlich
dürfte in den meisten Fällen der "Moment" nur ein ungefähres
Zeit-Intervall bzw einen "Zeitraum" bedeuten. Beispiel: "Tages-Temperatur".
Ein "Tag" besteht aus 8-24 Stunden (Arbeitstag, astromischer Tag einschließlich
der Nacht), 1440 Minuten oder 86400 Sekunden. Die Temperatur dürfte
im Regelfall über die Zeiten schwanken; zudem hängt sie auch
vom Ort der Messungen ab.
__
Zeitreihenanalyse.
__
Zensus (Census). Bevölkerungsdaten.
__
Zentraler Grenzwertsatz.
__
Zufall. (Welt
der Möglichkeiten) Sehr schwieriger, mehrdeutiger und möglicherweise
widerspruchsvoller Begriff. Subjektive Bedeutungen: (1) Im einzelnen
nicht vorhersagbar (Münzwurfergebnis). (2) ein Ereignis geschieht
relativ zu einem Betroffenen nicht absichtsvoll (beim Wähnen, Eigenbezug
und im Wahn gestört: hier hat u. U. alles Absicht oder Bedeutung).
(3) Regellos, chaotisch, willkürlich.__
Zufallsgröße.
__
Zuverlässigkeit. > Reliabilität.
In der psychologischen Testtheorie meist Messgenauigkeit.
__
z-Werte = (Rohwert - Mittelwert) / Standardabweichung.
__
| Wissenschaft [IL] schafft Wissen und dieses hat sie zu beweisen, damit es ein wissenschaftliches Wissen ist, wozu ich aber auch den Alltag und alle Lebensvorgänge rechne. Wissenschaft in diesem Sinne ist nichts Abgehobenes, Fernes, Unverständliches. Wirkliches Wissen sollte einem Laien vermittelbar sein (PUK - "Putzfrauenkriterium"). Siehe hierzu bitte das Hilbertsche gemeinverständliche Rasiermesser 1900, zu dem auch gut die Einstein zugeschriebene Sentenz passt: "Die meisten Grundideen der Wissenschaft sind an sich einfach und lassen sich in der Regel in einer für jedermann verständlichen Sprache wiedergegeben." |
kontrolliert irs am tt.mm.jj