Internet Publikation für Allgemeine und Integrative Psychotherapie
    (ISSN 1430-6972)
    IP-GIPT DAS=08.09.2003 Internet-Erstausgabe, letzte Änderung 6.2.12
    Impressum: Diplom-Psychologe Dr. phil. Rudolf Sponsel  Stubenlohstr. 20   D-91052 Erlangen
    Mail: sekretariat@sgipt.org_Zitierung  &  Copyright

    Anfang _Beweise in der Statistik_Überblick_Rel. Aktuelles  _Rel. Beständiges  _Titelblatt_ Konzept_ Archiv_ Region_Service_iec-verlag__Wichtiger Hinweis zu Links und zu Empfehlungen

    Willkommen in unserer Abteilung Abstrakte Grundbegriffe aus den Wissenschaften (Analogien, Modelle und Metaphern für die allgemeine und integrative Psychologie und Psychotherapie sowie Grundkategorien zur Denk- und Entwicklungspsychologie), hier speziell zum Thema:

    Beweis und beweisen in der Statistik

    Blicke über den Zaun zum Auftakt für eine integrative psychologisch-psychotherapeutische Beweislehre
    aus allgemein integrativer psychologisch-psychotherapeutischer und einheitswissenschaftlicher Sicht

    Einführung, Überblick, Verteilerseite Beweis und beweisen

    von Rudolf Sponsel, Erlangen

    Hinweis: Wenn nicht ersichtlich werden (Externe Links) in runden und [interne IP-GIPT Links] in eckige Klammern gesetzt, direkte Links im Text auf derselben Seite sind direkt gekennzeichnet. In dieser Übersichtsarbeit wird das Thema im Überblick gesamtheitlich aus einheitswissenschaftlicher Perspektive dargestellt. Im Laufe der Zeit folgen weitere Ausarbeitungen.



    Inhaltsübersicht
    • Einstieg Beweis und beweisen in der Statistik.
      • Beispiele für praktisch-statistische Fragestellungen.
      • Praktisch wichtige Grundfragen an die statatistische Wissenschaft.
      • Genauere Operationaliserungen (Auswahl).
      • Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen.
        • Tradition mehrdeutiger und daher unsinniger Auszeichnungen in der bayerischen Statistik.
          • Missing Data (MD) Unterscheidungen.
          • Beispiel MD3b: Schätzung des Gesamtschuldenstandes Nürnbergs am 31.3.1929 in Reichsmark.
        • Veränderungen der Erhebung statistischer Kenngrößen 1973 und 1978 am Beispiel Verschuldung der Gemeinden.
          • Was "beweist" nun dieser wenig erfreuliche Sachverhalt?
    • Probleme.
      • Grundannahme-Paradoxie: Konstanz des Zufalls?.
      • Mathematik und Statistik.
      • [Der Signifikanztest in der Wissenschaft, Psychologie, klinischen und Psychotherapieforschung. Szientismus zwischen numerologischer Esoterik, Gaukeln und Betrug?]
      • Statistische Paradoxien und Dilemmas nach Stegmüller
      • Die Paradoxie des statistischen Syllogismus (nach Stegmüller).
      • Simpson's Paradox.
      • Die Korrelations-Paradoxien.
        • [Partielle Korrelationen]
      • Multivariate Fallstricke.
        • [Kollinearität und numerisch instabilde Matrizen in der Psychologie]
        • [Einführung und Überblick. Kritik der Handhabung der Faktorenanalyse]
    • Grundlagen der Interpretation statistischer Daten und Modelle.
    • Manipulation, tricksen, frisieren, täuschen, verdrehen, lügen, ausblenden, weglassen.
    • Glossar: Wahrscheinlichkeit und Statistik (Stichwortsammlung).
    • Literatur * Links * Allgemeine Querverweise.



    Einstieg Beweis und beweisen in der Statistik
    In memoriam: Trau keiner Statistik, die Du nicht selbst gefälscht hast * Man kann mit Statistik alles beweisen

    Diese beiden bösen geflügelten Worte aus Volk und Bildungswelt sagen eigentlich schon alles über den Zustand dieser Wissenschaft, ihrer Vermittelbarkeit und allgemeinen Anerkennung. Das ist sehr schade, weil ich denke, daß Wahrscheinlichkeit und Statistik unverzichtbare und bedeutende Errungenschaften für die Wissenschaft und Gesellschaft sind. Ohne zuverlässige Statistiken, insbesondere langer Zeitreihen über Jahrzehnte und Jahrhunderte kann es keine zuverlässige und vernünftige Analyse, Planung, Erklärung und Prognose geben. Die Amerikaner wissen und können das, Deutschland und Europa können und wissen es leider anscheinend nicht (> Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen).

    Beispiele für praktisch-statistische Fragestellungen:

    1. Wie viele Menschen umfaßt das deutsche Volk zum Zeitpunkt TT.MM.JJ?
    2. Wie gut wirkt das Medikament M bei Kranken mit der Krankheit K?
    3. Ist das Symptom S1 typisch für Störungen vom Typ T?
    4. Wie gut und treffsicher ist der Test T für die Erkennung von Störungen vom Typ X?
    5. Wie wahrscheinlich ein Sechser im Lotto?
    6. Wie hoch ist Bruttoinlandsprodukt?
    7. Ist Elektrosmog schädlich?
    8. Wer gewinnt die deutsche Fußballmeisterschaftf?
    9. Warum sinkt die [Mordstatistik] gegenüber Ausländern, obwohl mehr gealtpolitisch motiviert umgebracht werden?
    10. Wie entwickelt sich die Bevölkerungszahl?
    11. Jemand hat fünf mal nacheinander eine zwei gewürfelt. Wie wahrscheinlich ist es, daß auch der sechste Wurf eine zwei ergibt?
    12. Wie hoch ist das Erkrankungsrisiko für tbc, wenn man schon röntgenpositiv ist [Bayes]?
    13. Wie sehr wachsen die Arbeitslosen?
    14. Wie hoch ist das Risiko an AIDS zu erkranken? Wie hoch ist das Wachstum von an AIDS-Erkankten?
    15. Wie wahrscheinlich ist es, daß die Therapie T erfolgreich wird?
    16. Wie wahrscheinlich ist es, daß Fritz seine Schuhe aufräumt, wenn er nach Hause kommt, wenn seine bisherige Aufräumungszahl a und seine Nichtaufräumungszahl u ist (alle=n=a+u)?
    17. Wie oft verschlafen Menschen Prüfungstermine?
    18. Wie sicher sind Atomkraftwerke?
    19. Wie kann man verstehen, daß die Arbeitslosenstatistik fällt, obowlh immer weniger Menschen Arbeit haben?
    20. Wie wahrscheinlich ist es, daß man im Skat vier Buben auf eine Hand bekommt?
    21. Weshalb nimmt die [Arztdichte] ständig zu?
    22. Wie sicher sind die Renten?


    Wie man sieht ist das statistische Feld weit und wir tun gut daran, eine Grundordnung entlang am Thema Beweis und beweisen in der Statistik zu entwickeln.

    Praktisch wichtige Grundfragen an die statistische Wissenschaft
     

    1. Wichtige Grundbegriffe und Größen (Parameter) zur Charakterisierung zufälliger oder vom Zufall beeinflußter Prozesse (z.B. relative Häufigkeit, Verteilung).
    2. Wahrscheinlichkeiten von Ereignissen: Wie wahrscheinlich ist ein Ereignis, Merkmal oder Geschehen? Nach Pearson und Neyman wird Wahrscheinlichkeit hier als Grenzwert relativer Häufigkeiten gedeutet.
    3. Wahrscheinlichkeiten von Hypothesen ([Bayes; Entscheidungstheorie, Justiz]): Wie wahrscheinlich sind die Hypothesen H0, H1, H2, ... ?
    4. Welche Repräsentationsverfahren gibt es? Wie stellt man fest, ob und wie das Repräsentationsverfahren (z.B. Zufallsauswahl) gültig ist? Wie repräsentativ ist eine Stichprobe für die betreffende Population?
    5. Wahrscheinlichkeiten von Fehlern: Wie genau gilt eine statistische Aussage? Im statistischen Grundmodell gibt es immer drei Fehler- von den [vier Grundmöglichkeiten]: richtig positiv, falsch positiv, richtig negativ, falsch negativ.
    6. Wahrscheinlichkeiten von Gültigkeiten: wie sicher gelten unter welchen Bedingungen für wie lange statistische Aussagen? Welche Bedingungen und Voraussetzungen sind für die Gültigkeit einer statistischen Aussage wichtig? [Grundannahme-Paradoxie: Konstanz des Zufalls?]
    7. [Entscheidungs- und Risikomodelle]. Man entscheidet immer, ob man will oder nicht, weil auch Nichtstun oder warten als eine Entscheidung anzusehen ist. Auch das kann falsch und folgenreich sein. Bei statistischen Entscheidungen sollten deshalb die wichtigsten Sachverhalte und ihre jeweiligen Folgen berücksichtigt werden.
    8. Deskriptive Statistik und Einzelfallbewertung. Beispiel: Speckgürtel-Hypothesen-Untersuchung am Einzelfallbeispiel Mittelfranken 2009.
    9. Interpretation, empirische und praktische Bedeutung der statistischen Kennwerte. Methoden und Prüfverfahren. Dieses Feld ist das am meisten und sträflich vernachlässigte Feld.


    Genauere Operationalisierungen (Auswahl):

    Grundgesamtheiten
    Die betrachtete statistische Grundgesamtheit (Mase, Kollektiv) nennt man auch Population. Populationen können potentiell unendlich (alle Menschen, Münzwürfe) oder endlich (alle Magenkrebskranken der Uniklinik U im Zeitraum t) und mehr oder minder genauer bestimmt oder allgemein sein. Es ist meist sehr wichtig, sich genau darüber klar zu werden, über welche Population Aussagen getroffen werden sollen.

    Häufigkeiten
    Wie oft (h) ereignet sich E (z.B. Vulkanausbrüche, Stürme, Hitze-/ Trockenperioden/ HIV, Magenkrebs, arbeitslos, Sterbealter usw.) in einem Zeitraum t und in der sozikulturellen Umgebung u:  h(E | t,u)?
    " | t,u" bedeute unter den Bedingungen t und u. Die Beweismethode ist die Zählung. Nachdem das Zählen sehr aufwendig in Mühe, Zeit und Kosten werden kann, ergibt sich sofort die nächste Beweisfrage:

    Stichproben
    Welche Stichprobe ist wie aussagekräftig für eine Schätzung hs(E | t,u) für h(E | t,u) in der Population? Darin steckt auch: Welche repräsentativen Stichprobenziehungen gibt es?

    Verteilungen
    Je nach der Anzahl und Ausprägung der in eine Verteilung eingehenden Größen ergeben sich unterschiedliche Verteilungsdarstellungen und daher unterschiedliche Modelle für Verteilungen. Modell d-t-a(m) für t Meßzeitpunkte und a Ausprägungsgrade, z.B. 1=wenig, 2=mittel, 3=viel eines Merkmals m. Würde z.B. einmal in der Woche gemessen, wie viel es geregnet (m) hat, so ergäben sich für ein Jahr Vv=3^52 theoretische Verteilungsmöglichkeiten.

    Charakteristische Größen (Parameter)
    Im obigen Beispiel wären charakteristische Parameter z.B. die Anzahl der 1, 2 und 3 und der Perioden, wenn eine Periode z.B. aus einer gleichen Anzahl besteht. Führte man einen solchen Versuch über mehrere Jahre durch, könnte man feststellen, ob es - bezüglich zu nennender Kriterien - Veränderungen gibt, vielleicht oder auch nicht.

    Fehlerschätzungen
    Es gilt als fundamentaler Erfahrungssatz, dass alle empirischen Feststellungen mit Fehlern behaftet sind, die sich aus vielerlei Quellen zusammensetzen, ausgleichen, mindern oder verstärken (potenzieren) können. Zu einer guten empirischen Theorie und Beobachtung, gehört daher auch die Einbeziehung von Fehlern.

    Zur Genauigkeit der amtlichen Daten zum Wirtschaftswachstum
    Pressemitteilung des Statistischen Bundesamtes Nr. 307 vom 3. August 2007
    "WIESBADEN - Wie genau sind die Daten der deutschen amtlichen Statistik, speziell die der Volkswirtschaftlichen Gesamtrechnungen (VGR) zum Wirtschaftswachstum? Eine Frage, die immer wieder von Wirtschaftsforschern, Analysten und Journalisten gestellt wird.
        Berechnungen zeigen: Die laufenden Revisionen des Bruttoinlandsprodukts (BIP) liegen in einem der hohen Aktualität angemessenen und vertretbaren Rahmen. Im internationalen Vergleich gehören die vierteljährlichen deutschen BIP-Berechnungen sogar zu den besten: Nach einer Untersuchung der OECD sind die frühen Quartals-BIP-Schätzungen der Statistikämter aus Deutschland, Frankreich und Großbritannien die zuverlässigsten und genauesten, dicht gefolgt von denen für die USA, Kanada und die Niederlande.
        Dies ist umso bemerkenswerter, da Deutschland mit seiner Schnellmeldung zum vierteljährlichen Bruttoinlandsprodukt (BIP) nach nur 45 Tagen auch in punkto Aktualität zu den Spitzenreitern in Europa zählt. Seit dem Jahr 2000 hat sich die erste Veröffentlichung des BIP, unter anderem auf Drängen der Finanzwelt und des Bedarfs der EZB nach aktuelleren Daten für die Eurozone, von 65 auf nur noch 45 Tage nach Abschluss des Berichtsquartals beschleunigt.
        Mit der Veröffentlichung der von den Nutzern geforderten hochaktuellen Konjunkturdaten befindet sich die amtliche Statistik immer im Spannungsfeld zwischen Aktualität und Genauigkeit. Um möglichst frühzeitig aktuelle Zahlen veröffentlichen zu können, werden die
    Ergebnisse auf unvollständiger Datengrundlage berechnet und zum Teil geschätzt. Diese vorläufigen Ergebnisse werden kontinuierlich
    aktualisiert, wenn neue statistische Ausgangsdaten verfügbar sind. Darauf wird in einem eigenen Qualitätsbericht ausdrücklich hingewiesen."

    Aussagen und Extrapolationen



    Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen.
    Zeitreihen sind von großer Bedeutung für die Planung, Analyse, Prognose und Beeinflussung von sozio-ökonomischen Prozessen, z.B. die Erfassung der Verschuldung von Gebietskörperschaften. Voraussetzung für die angemessene Verarbeitung, Bewertung (Evaluation) der Schuldenentwicklung ist, dass die Definition der Schulden in der Zeitreihe gleich oder wenigstens vergleichbar bleibt. Falls unterschiedliche Schuldenwerte erfasst und mitgeteilt werden, ist es zwingend erforderlich, dass die Repräsentativität, Transparenz und Kontinuität der Daten gewährleistet wird. Dies ist in Deutschland seit 1995 nicht mehr der Fall, wobei sich natürlich die Frage stellt, warum die statistischen Ämter nicht für Repräsentativität, Transparenz und Kontinuität sorgen können oder wollen? Nun, es fällt auf, dass die zunehmende Intransparenz und fragliche Repräsentativität der mitgeteilten Schuldendaten durch die statistischen Landesämter einhergeht mit einer aus dem Ruder laufenden exponentiellen, zunehmend bedrohlich erscheinenderen Schuldenentwicklung auf allen Ebenen der Gebietskörperschaften, besonders auch der größeren Gemeinden (Städte und Großstädte). In Bayern beispielsweise führte das zu unklaren und unzulänglichen Veröffentlichungen [71327-001r]. Dort verwendet man z.B. Spiegelstriche " - " sowohl für "0" als auch für keine Angabe oder unbekannt ("Missing Data"); weder Definition - auch nicht deren Rechtsgrundlage - noch Repräsentativität und Kontinuität werden ausgewiesen, so dass man hier die Frage stellen muss, ob dieses verwirrende Desinformation politisch gewollt ist? [L1; L2].

    Tradition mehrdeutiger und daher unsinniger Auszeichnungen in der bayerischen Statistik
    Anmerkung: Der Unsinn der Vieldeutigkeit von Zeichen könnte - auf jeden Fall in der bayerischen - Statistik sogar Tradition haben. So wird z.B. im Statistischen Jahrbuch der Stadt Nürnberg von 1930 unten beim Inhaltsverzeichnis ausgeführt:

    Ein solches Vorgehen ist wissenschaftlich und praktisch vollkommen abzulehnen. "Nicht vorhanden"  ist etwas ganz anders als die Zahl 0 und gehört infolgedessen auch mit einem eigenen Zeichen versehen, und zwar zwingend eineindeutig und nicht "verodert" (wie z.B. in der Zeugenbefragung geboten). Die Zahl 0 ist natürlich kein fehlendes Datum, insbesondere nicht bei den Schulden, und gehört selbstverständlich zwingend als 0 ausgewiesen, wenn der Schuldenstand eben Null ist (das war in Bayern erfreulicherwiese im Jahre 2004 bei 76 Gemeinden der Fall). Folgende Fallunterscheidungen könnten hierbei sinnvoll sein:

    Missing Data (MD) Unterscheidungen
    • MD1: Zahl liegt grundsätzlich vor, ist aber noch nicht eingetroffen; mit ihr zu rechnen ist bis TT.MM.JJJJ.
    • MD2: Zahl liegt hier nicht vor, kann aber wahrscheinlich bei ... erkundet werden.
    • MD3: Zahl liegt nicht vor und ist auch nicht beschaffbar.
      • MD3a: Schätzmethoden sind derzeit nicht bekannt....
      • MD3b: Als Schätzmethode eignet sich ...


    Beispiel MD3b: Schätzung des Gesamtschuldenstandes Nürnbergs am 31.3.1929 in Reichsmark
    Im folgenden wird dargelegt, wie man den Gesamtschuldenstand - aus Mark ("Papiermark") und Reichsmark - für 1928/29 schätzen kann, wenn die einzubeziehenden Geldgrößen klar ausgewiesen oder UMrechnungsfformeln angegeben würden. Zunächst der Sachverhalt, wie ihn das Statistische Jahrbuch der Stadt Nürnberg 1930 ausweist:

    Man sieht hier zwei Werte in der Rubrik "Schuldenstand am Schlusse des Jahres", einmal in "M" ("Papiermark") und der andere in "RM" (Reichsmark), ohne dass erklärt würde, wie nun der Gesamtschuldenstand zu bilden ist. Das ist wenig verständlich, wenn man sich vergegenwärtigt, dass es sich um das Jahrbuch von 1930 handelt, also 6 Jahre nach der Hyperinflation und die tatsächlichen Verrechnungsdaten ja auf jeden Fall in der Kämmerei vorliegen müssen.

    Für das Haushaltsjahr 1928/29 wird im Verwaltungsbericht der Stadt Nürnberg, bearbeitet im Statistischen Amt und herausgegeben vom Stadtrat 1929, S. 434 ausgeführt:

    Nach diesen Mitteilungen, sollten sich Schätzungen und Umrechnungen durchführen lassen - wenn man wüsste, wie sich die einzelnen Finanzgrößen (Rückkauf 339949 RM; Umtausch mit Auslosungsrechten mit 16916156 RM und Umtausch ohne Auslösungsrechte mit 104375 RM) zu einander verhalten. Das wird aber leider nicht mitgeteilt, so dass der Gesamtschuldenstand natürlich davon abhängt, welche Größen in die Umrechnung "Papiermark" und Reichsmark eingehen. Man kann also rätseln, welcher drei hier möglich erscheinenden Gesamtschuldenstände der richtige ist:
        (1) Spielten die Umtauschgrößen keine Rolle. ergäbe sich für die Gesamtschuld am 31.3.1929 folgender Schätzungsansatz: 140092500 / 336949 = 415.7676681, also ein Verhältnis von 1 Reichsmark zu gerundet 416 Mark ("Papiermark").
        (2) Rechnet man die Umtauschgrößen mit ein, ergibt sich folgende Umrechnung: 140092500 / (336949 + 16916156 + 104375)  =  140092500 / (17357480) = 8.071016069, also ein Verhältnis von 1 Reichsmark zu gerundet 8 Mark ("Papiermark").
        (3) Es zählt nur die Gesamtschuld in Reichsmark, weil die Ablösen schon in die Summe eingerechnet wurden.
    Dies ergibt die möglichen Gesamtschuldenbeträge:
    Rechnung (1), die 140 Mill. Papiermark sind 336949 RM wert, ergäbe 88,676999 Millionen RM Gesamtschuld.
    Rechnung (2), die 140 Mill. Papiermark sind 17,357480 Mill. Reichsmark wert, ergäbe 105,697530 Millionen RM Gesamtschuld.
    Rechnung (3), es zählt nur der mitgeteilte Schuldenstand in Reichsmark, es bliebe wie mitgeteilt, 88,340050 Millionen RM Gesamtschuld.

    Veränderungen der Erhebung statistischer Kenngrößen 1973 und 1978 am Beispiel Verschuldung der Gemeinden
    Den folgenden Ausführungen aus "Statistisches Jahrbuch Deutscher Gemeinden", 66. Jahrgang, 1979, S. 438 kann man entnehmen, dass die Erfassungsmerkmale der Schulden "eine Anknüpfung an die Berichterstattung bis einschließlich 1973 (61. Jahrgang) nicht mehr zu" lassen. "Im Unterschied zu 1977 sind die Krankenhäuser nicht mehr in den Gesamtschuldenstandsbeträgen enthalten. Sie werden wie die Eigenbetriebe nachrichtlich aufgeführt."

    Was "beweist" nun dieser wenig erfreuliche Sachverhalt ?
    Nun, anscheinend ist die deutsche Statistik nicht in der Lage oder motiviert, Sinn und Notwendigkeit vergleichbarer wichtiger sozioökonomischer Daten, wie z.B. die Verschuldung einer Gemeinde, so zu begreifen, dass sie die Kontinuität der Daten auch tatsächlich sicher stellen würden. Das mag auch politisch gewollt sein, um Zusammenhänge zu verschleiern und Transparenz und Kontinuität zu behindern.



    Probleme

    Grundannahme-Paradoxie: Konstanz des Zufalls ?
    Hier gibt es zwei Aspekte: 1) daß es so etwas wie Zufallsgesetze überhaupt gibt; 2) inwiefern diese über die Zeit und Bedingungen hinweg gelten ("sollen").
        In der schließenden und sog. Inferenzstatistik möchten wir nicht nur Aussagen für den Augenblick treffen, sondern auch über statistische Regelhaftighaften von Dauer etwas erfahren, wobei unklar ist, ob oder inwieweit "Zufall", Dauer und Konstanz eineinder nicht ausschließen. Wie wollen wir Regelhaftigkeiten von Dauer erkennen, wenn schon das einzelne Ereignis sehr unsicher ist und eine große statistische Ereignis-Bandbreite hat?

    Mathematik und Statistik
    Das Wesen mathematischer Statistik besteht auf der Basis einen strengen Theoriegebäudes vielfach darin, die Wahrscheinlichkeit für ein Modell M1 gegenüber einem Vergleichs- oder Kriteriums-Modell M2 oder für Annahmen A1 gegenüber anderen Annahmen A2 zu bestimmen. Das ist einerseits sinnvoll und ergiebig, etwa bei der Frage, ob ein empirischer Datensatz als normalverteilt angesehen werden darf oder nicht, andererseits sehr merkwürdig, wenn die Empirie aus einem Vergleich herausfliegt und nur noch zwei theoretische Modelle oder hypothetische Annahmen [verglichen] werden: Beispiel: der unselige [Signifikanztest], der ja, kurz und bündig formuliert, nur eine statistische Aussage unter der Annahme zuläßt, daß die Nullhypothese richtig ist. Wir testen mit dem Signifikanztest also ein virtuelles Ergebnis.
     
    Denn die gewöhnliche EmpirikerIn wird meist nicht wissen wollen, was ist, wenn die Nullhypothese richtig wäre?, sondern: ist sie anzunehmen oder nicht? Welche Hypothese ist vorzuziehen, falls eine Entscheidung möglich ist ?

    Eine EmpirikerIn interesiert sich also meist nicht dafür, ob ein Ergebnis angenommen oder verworfen werden darf, wenn die Nullhypothese richtig ist, sondern ob sie sie annehmen oder verwerfen soll. Die Gretchenfrage der empirischen Statistik lautet: Welche Hypothese ist anzunehmen, die Null- oder die Alternativhypothese. Weiß man nichts, können im Falle zweiwertiger Logik, beide Hypothesen richtig oder falsch sein, so daß vier Fälle zu unterscheiden wären. Das aber macht der Signifikanztest gerade nicht. Signifikanztesten scheint also ein gigantisches Schautheater und numerologisches Zahlenspiel zu sein, das nicht nur kaum einen Erkenntniswert hat, sondern vor allem Verwirrung stiftet. Dafür ist die mathematische Statistik anscheinend bestens gerüstet. Wissenschaft? Oder Wirrenschaft?
     
    Die großen Probleme in der Wahrscheinlichkeitsrechnung und Statistik liegen weniger in der Theorie als in der Anwendung. Es scheint so, als hätte die mathematische Statistik sich wenig um die sozialwissenschaftlichen Gegebenheiten gekümmert. Die meisten AnwenderInnen können die mathematische Statistik nicht richtig verstehen und die meisten mathematischen StatistikerInnen sind nicht in der Lage, ihre Theorien praktisch sinnvoll zu vermitteln. Theorie und Praxis driften extrem auseinander. Über weite Strecken entsteht der Eindruck, als ob nur theoretische Modell-1/ Annahme-1 gegen theoretisches Modell-2/ Annahme-2 getestet würde, wodurch wir aber nichts über die Wirklichkeit erfahren und wie wir zwischen Hypothesen entscheiden sollten.



    Statistische Paradoxien und Dilemmas nach Stegmüller

    Im großen wissenschaftstheoretischen Werk Stegmüllers finden sich mehrere Kapitel oder Abschnitte, die Wahrscheinlichkeit und Statistik

    Stegmüller (1973, S. 279-303) nennt Elf Paradoxien und Dilemmas
     

    1. (1) Die Paradoxie der Erklärung des Unwahrscheinlichen (S. 281-285), z.B. 7 mal nacheinander eine 6 zu würfeln.
    2. (2) Das Paradoxon der irrelevanten Gesetzesspezialisierung (S. 285-286), z.B. das Problem von Scheinerklärungen zufälliger Koinzidenzen, die falsch interpretiert werden (der Mond erscheint nach einer Finsternis wieder aufgrund des großen Spektakels, das man veranstaltete).
    3. (3)  Das Informationsdilemma. (S. 286-287), fehlende oder widersprüchliche Information mit unterschiedlichen Wahrscheinlichkeiten jenachdem, welche Merlmalskombination zugrundegelegt wird [Partielle Korrelation]
    4. (4) Das Erklärungs-Bestätigungs-Dilemma  (S. 287-289),
    5. (5) Das Paradoxon der reinen ex post facto Kausalerklärung (S. 289-291), Bestätigung und Erklärungen scheinen zirkulär und austauschbar verwendet werden können.
    6. (6) Das Verzahnungsparadoxon. (S. 291-295)
    7. (7) Das Erklärungs-Begründungs-Dilemma. (S. 295-298)
    8. (8) Das Dilemma der nomologischen Implikation (S. 298-299)
    9. (9) Das Weltanschauungsdilemma (S. 299-301)
    10. (10) Das Argumentationsdilemma (S. 301-303)
    11. (11) Das Gesetzesparadoxon. (S. 303) [analog Goodman-Paradoxon]




    Die Paradoxie des statistischen Syllogismus (nach Stegmüller)



    Simpson's Paradox
    Simpson fand bei bedingten Wahrscheinlichkeiten in Vierfeldertafeln einen Widerspruch dergestalt, dass bedingte Wahrscheinlichkeitsaussagen je nachdem, ob eine Gesamtbetrachtung gegenüber einer - vollständigen und disjunkten - Aufspaltung erfolgt, zu widerspruchsvollen Aussagen führen können. Solche Phänomene darf man nicht einfach nur als "Paradoxon" euphemistisch herunterspielen, sondern hier liegen tiefe und ernste Probleme in der Mathematik der Verhältnisrelationen vor, die weite Teile der angewandten Statistik-Interpretation grundsätzlich in Frage stellen, weil je nach Auswahl nicht nur unterschiedliche, sondern sogar widersprüchliche Aussagen resultieren können, wobei meist verdeckte Abhängigkeiten eine Rolle spielen, wie Székely (1990, S. 63f) ausführte, die bei der Rechnung und Interpretation nicht angemessen berücksichtigt und dargestellt werden. Das grundlegende Problem wurde von Hain & Sponsel (1994) mit dem Begriff der Relationentreue benannt, womit sich auch das Simpsons'sche Paradoxon gut charakterisieren lässt, weil hier gerade eine Verletzung der Relationentreue vorliegt: Die Verhältnisrelationen von Teilen eines Ganzen sind bezüglich des Ganzen nicht relationstreu, sondern können sich sogar umkehren. Bei genauer Betrachtung stellt sich allerdings die Frage, ob in der Darstellung der sechs-Felder Tafel nicht schon im Ansatz der Fehler steckt, wenn unterschiedliche - nicht voneinander unabhängige - Teile und Ganze zu einander In Beziehung gesetzt werden, wehalb dann natürlich eine Verletzung der Relationentreue auch nicht wirklich überraschen kann. Die zahlreichen Widersprüche, Paradoxien, Absurditäten und Unverständlichkeiten in der Statistik (> Beck-Bornholdt, Székely) zeigen, dass eine gründliche Analyse, Umsicht und Skepsis gute Helfer sein können, um den zahlreichen Fallstricken und Tücken zu entgehen.

    Literatur und Links zu Simpson's Paradox (Auswahl): Linksammlungen: 1, 2, 3,

    • Beck-Bornholdt, Hans Peter & Dubben, Hans-Hermann (1997). Der Hund, der Eier legt. Erkennen von Fehlinformationen durch Querdenken. Reinbek: Rowohlt.
    • Beck-Bornholdt, Hans Peter (2005). Mit an Wahrscheinlichkeit grenzender Sicherheit : logisches Denken und Zufall. Reinbek: Rowohlt.
    • Bishop, Y.M.M.; Fienberg, S.E. & Holland, P.W. (1975). Discrete Multivariate Analysis. Cambridge, Mass.: MIT Press.
    • Blyth, Colin R. (1972). On Simpson's Paradox and the Sure-Thing Principle. In: Journal of the American Statistical Association. 67, Nr. 338, 1972, p. 364–366.
    • Dawid, A.P. (1979). Conditional Independence in Statistical Theory Journal of the Royal Statistical Society A41(1):1-31
    • Fleiss, Joseph L. (2003). Statistical methods for rates and proportions. Hoboken, NJ: Wiley.
    • Grams, Timm (Denkfallen und Paradoxa): Simpsons Paradoxon.
    • Pearl, Judea  (1999). Simpsons's Paradox: An Anatomy. University of California, 1999, p. 1–11. [PDF]
    • Pearson K, Lee A, Bramley-Moore L. (1899). Mathematical contributions to the theory of evolution: VI – Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses. Philos Trans R Soc Lond A. 1899;192: 257–330.
    • Simpson, E. H.  (1951). The Interpretation of Interaction in Contingency Tables. In: Journal of the Royal Statistical Society. Series B (Methodological) 13 (1951), Nr. 2, p. 238–241.
    • Stanford Encyclopedia of Philosophy:  Simpson's Paraxon (2004).
    • Stevens, S. S. (1946). On the Theory of Scales of Measurement. Svcience Vol. 103, No. 2684, 677-680.
    • Tu, Yu-Kang ; Gunnell, David  &  Gilthorpe, Mark S (2008). Simpson's Paradox, Lord's Paradox, and Suppression Effects are the same phenomenon – the reversal paradox. Emerg Themes Epidemiol. 2008; 5: 2. [Online]
    • Wagner, C. H. (1982). Simpson's Paradox in Real Life. In: The American Statistician, 36 (1982), Nr. 1, p. 46–48.
    • Wikipedia: W.de, W.en. [Die Literaturangabe zu Pearson (1899) in W.de und W.en 16.4.9 ist falsch und unzulänglich]
    • Yule, G.U. (1903). Notes on the theory of association of attribution in statistics. Biometrika, 2, 121-134.



    Die Korrelations-Paradoxien

    Was bedeutet ein korrelativer Zusammenhang?
    Was eine Korrelation bedeutet, weiß man nicht genau ['Schein'korrelation], es ist ein rein statistisch-artifizielles ('künstliches') Zusammenhangsmaß, das von Erhebung zu Erhebung, und sogar innerhalb einer einzigen Erhebung von Merkmalsraum zu Merkmalsraum sowohl ganz unterschiedliche Zahlenwerte als auch Bedeutungen annehmen kann. Empirisch gilt meist der Satz: je nachdem welche Variablen in die Berechnung einbezogen oder nicht eingebezogen werden, ändern sich die Korrelationskoeffizienten, und zwar möglicherweise sehr erheblich. Beweis: [Partielle Korrelationen].



    Grundlagen der Interpretation statistischer Daten und Modelle
    Fragen: durch die verschiedenen "Paradoxa" (Simpson, Grundanahme: Konstanz des Zufalls, Stegmüller, Korrelation) stellt sich die Frage der Bedeutung statistischer Daten verschärft. Viele Paradoxien und Widersprüche verlören an Schärfe oder lösten sich auf, wenn man folgendes Hauptprinzip anerkennt und streng beachtet:

    Hauptprinzip statistischer Interpretation
     
    Werden bei einem statistischen Sachverhalt neue Information hinzugenommen oder vorhandene vernachlässigt, können sich die statistischen Sachverhalte verändern und ihre Relationentreue verlieren. 

    Diese Grundidee wird auch benutzt für die Interpretation der statistischen Un/Abhängigkeit: Spielt ein statistischer Sachverhalt B für einen statistischen Sachverhalt A keine Rolle, verändert sich mit anderen Worten die Wahrscheinlichkeit für ein Ereignis A nicht, wenn man B mit hinzunimmt, so spricht man im Hinblick von A und B von unabhängien Ereignissen. 

    Diese Überlegung kann man auch für die Definition statistischer Relevanz heranzziehen. Eine Sachverhalt B ist für einen Sachverhalt A relevant in dem Maße, wie er A beeinflusst, d.h. durch seine An-, Abwesenheit oder so-oder-so-Beschaffenheit (Ausprägung) zu verändern in der Lage ist. 

    Aus unterschiedlichen Voraussetzungen oder Basen, können sich unterschiedliche Folgerungen oder Wirkungen ergeben. So erscheint z.B. die Erwartungen, dass sich relative Häufigkeiten additiv wie die zugrundliegenden absoluten Zahlen verhalten irrational, wenn die Bezugsgrößen nicht gleich sind, was folgende Vierfeldertafel illustriert:

          A   a  A+a  Rel% für a bezügl. Z  Rel% A beügl. Z3  Rel% a bezügl. A+a 
     Z1  10   4  14   4/10 = 0.40           10/30= 1/3        4/14 = 2/7  = 0.286 
     Z2  20   5  25   5/20 = 0.25           20/30= 2/3        5/25 = 1/5  = 0.200
     Z3  30   9  39   9/30 = 0.33           30/30= 1.00       9/39 = 3/13 = 0.231

     



    Manipulation, tricksen, frisieren, täuschen, verdrehen, lügen, ausblenden, weglassen.
    > Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen.

    Ursula von der Leyen, die Bundesagentur und die verdreht-falsche Kinder Hartz-IV Statistik [> Politiker]
    DER SPIEGEL berichtet in Nr.5, 2012, S. 14 [Online]: "15,1 Prozent aller Kinder unter 15 Jahren in Deutschland leben von Hartz IV. Das sind nur 1,5 Prozentpunkte weniger als noch vor fünf Jahren. Damals wie heute lebt etwa jedes sechste Kind am Rande des Existenzminimums. Vergangene Woche jedoch freute sich Bundes-arbeitsministerin Ursula von der Leyen (CDU) über Zahlen der Bundesagentur für Arbeit, nach denen im Jahr 2011 rund 257000 Kinder weniger von Sozialleistungen lebten als noch 2006 - ein Rückgang um 13,5 Prozent. Von der Leyen sprach triumphierend von „sinkender Kinderarmut" und der „Ernte dessen, was wir in den letzten Jahren an Kraftanstrengungen unternommen haben". Die Statistik trügt allerdings, denn seit 2006 ist auch die Gesamtzahl der unter 15-Jährigen um 750000 gesunken. Wenn es insgesamt weniger Kinder gibt, ist es kein Wunder, dass in absoluten Zahlen auch weniger Kinder auf Hartz IV angewiesen sind. Der Rückgang ist in großen Teilen ein demografischer Effekt."
        Die Bundesagentur ist offenbar daran interessiert, bewusst unzulänglich bis falsche Zahlen mitzuteilen, um einen Erfolg zu suggerieren, der sich bei genauer Analyse so gar nicht ergibt. Wie viel tückische Absicht dahintersteckt, mag man daran ermessen, wie einfach es doch gewesen wäre, die vier Zahlen - Anzahl Jugendliche unter 15 im Jahre 2006 und 2011, Anzahl Jugendliche, die Hartz IV 2006 und 2011 bekamen, mitzuteilen. Diese Datenmanipualationspraxis knüpft offenbar nahtlos an die - von Erwin Bixler aufgedeckte - Fälschungstradition der Bundesanstalt für Arbeit an. Euphemistisches Stroh dreschen durch tricksen, verdrehen und frisieren von Daten scheint inzwischen auch eine besondere Spezialität der Arbeitsminnisterin Ursula von der Leyen zu sein.

    Weitere Quellen:
    SZ: http://www.news4teachers.de/2012/01/kinderarmut-geht-zuruck-aber/
    Spiegel: http://www.spiegel.de/wirtschaft/soziales/0,1518,811455,00.html
    Reuters: http://de.reuters.com/article/worldNews/idDEBEE80P07W20120126
    destatis: Bevölkerung nach Altersgruppen seit 1950.(Klassen: unter 20, 20 - 40; 40 - 60; 60 - 80; 80 und mehr)
    bpb: http://www.bpb.de/wissen/X39RH6,0,0,Bev%F6lkerung_nach_Altersgruppen_und_Geschlecht.html
    bpb: http://www.bpb.de/wissen/RCQ36N,0,Familienhaushalte_nach_Zahl_der_Kinder.html

    Thatchers Arbeitslosenstratistik Tricks. Aus Claus Peter Ortlieb: Die Zahlen als Medium und Fetisch [PDF]
    "Als Anfang des Jahres 2005 die Anzahl der Arbeitslosen in Deutschland die Marke von fünf Millionen überschritt, war die Aufregung groß, und die Stimmung verdüsterte sich. Der Kanzler nannte diese Zahl „bedrückend“, obwohl er doch wie alle wusste, dass sie nur einer neuen Zählweise geschuldet war. Offenbar war es hier die Zahl selbst und nicht die dahinter liegende gesellschaftliche Realität, die die öffentliche Wahrnehmung auf sich zog und ihrerseits beeinflusste. Die Bundesregierung hätte vielleicht besser daran getan, sich ein Beispiel an der früheren britischen
    Regierung Thatcher zu nehmen, die in ihrer Regierungszeit die Arbeitslosigkeit dadurch bekämpfte, dass sie sie in dreizehn aufeinander folgenden gesetzlichen Vorschriften immer weiter herunter rechnete. Wenn nur die Zahlen sinken, ist alles in Ordnung. ..."

    Internationale Ausbeutung und Verletzung elementarer Menschenrechte (gestützt von Ursula von der Leyen) [> Politiker]
    Monitor beschäftuigte in der Sendung vom 2.2.12 mit dem Thema "Ihre Armut, unsere Hemden. Wie die Bundesregierung die Billigmode verteidigt."  Hierbei ging es um die Mindeststandards, die Unternehmen kontrollierbar abverlangt werden sollten, etwa hinsichtlich Kinderarbeit oder Löhnen unter jedem Existenzminimum ohne jede soziale Absicherung. Dass selbst eine Verdoppelung der Löhne nur einen geringfügigen Mehrpreis des Endproduktes nach sich zöge, wurde an einem Beispiel aus Bangladesh verdeutlicht: "'Bei der Verdopplung der Löhne in Bangladesch würde sich der Einkaufspreis eines T-Shirts ungefähr um 15 bis 20 Cent erhöhen.', so Prof. Herbert Loock, Akademie für Mode und Design, Düsseldorf . Um dem kritischen und solidarischen Verbraucher Möglichkeiten bei der Auswahl zu geben, beabsichtigt nun die EU-Kommission "Eine Rechtsvorschrift über die Transparenz der sozialen und ökologischen Informationen“ zu erlassen. "Im Klartext: Unternehmen müssen ihre Produktions- und Lieferketten offenlegen. Dazu beabsichtigt die Kommission: Zitat: "zu überprüfen, ob Unternehmen den von ihnen eingegangenen Verpflichtungen nachgekommen sind." Doch ausgerechnet die Bundesregierung lehnt die EU-Initiative rigoros ab. Richard Howitt ist Berichterstatter des EU-Parlamentes für die soziale Verantwortung von Unternehmen. Wie bewertet er die Ablehnung der Deutschen? Richard Howitt, EU-Parlament Berichterstatter für soziale Standards (Übersetzung MONITOR): "Ich bin sehr enttäuscht über die deutsche Haltung. Kaum war die neue Strategie veröffentlicht, kam die Ablehnung. Vor allem gegen unsere zentralen Vorschläge zur Modernisierung und Veränderung der Standards unternehmerischer Verantwortung." Zuständig für die soziale Verantwortung von Unternehmen ist Arbeitsministerin Ursula von der Leyen. Wir fragen nach. Reporterin: "Warum blockieren Sie und Ihr Ministerium denn hier die EU-Strategie, die eben nicht nur auf Freiwilligkeit basieren soll?"
        Ursula von der Leyen: "Ich finde, dass es ganz wichtig ist, die soziale Verantwortung von Unternehmen zu diskutieren. Insofern sind wir im Augenblick mit der EU-Kommission in Diskussionen darüber, für welche Bereiche es Berichtspflichten geben soll oder auch nicht. Die Diskussion ist noch offen."
        Offen? In einem Schreiben an die EU Kommission, das MONITOR vorliegt, spricht sich die Bundesregierung ausdrücklich Zitat: "Gegen neue gesetzliche Berichtspflichten aus."  Und weiter unten heißt es unmissverständlich Zitat: "Das Prinzip der Freiwilligkeit muss gewahrt bleiben."
        Reporterin: "Aber in Ihrem Positionspapier haben Sie sich doch ganz stark gegen eine gesetzliche Berichtspflichten ausgesprochen?"
    Ursula von der Leyen: "Wir sind mit der EU-Kommission genau darüber in Diskussion. Also ich sage Ihnen hier als Ministerin, dass ich offen bin für den Dialog."
        Die Recherche und Dokumentation von Monitor zeigt klar und unmissverständlich auf, dass Arbeitsministerin Ursula von der Leyen schriftliche und überprüfbare Tatsachen einfach wegleugnet. Das ist eine weitverbreitete und beliebte Methode in der Politik.



    Glossar: Wahrscheinlichkeit und Statistik: Messen, Schätzen, Testen, Schliessen.  (Stichwortsammlung)
    __
    Abweichung * Alpha-Fehler * Alternativhypothese(n) * Antinomie * Ausgleichsrechnung * Auswahl, Auswahlverfahren * Bayes Theorem * Bedingungen * Bedingte Wahrscheinlichkeit * Beta-Fehler * Binominalverteilung * cut off Werte * Diagnostik *  Diagnostische Fehlerarten * Dichte, Dichtefunktion * Differentialdiagnostik *  Diskret * Diskriminanzanalyse *  Einzelfall * Entscheidbarkeit *  Entscheidung  *  Entscheidungstheorie * Epidemiologie *  Ereignis *  Ereignisalgebra (Mengenlehre) * Ergodisch, Ergodizität, Ergodensätze  * Erhebungszeitraum *  Erwartungswert *  Erwartungstreu(e Schätzung) *  Evaluation * Evidenz * Evidenz-basierte-Medizin  *  Exzess *  Faktorenanalyse *  f *  Falsch negativ *  Falsch positiv *  Fehler * Fehlerarten *  Fiduzialkonzept * Größe * Häufigkeit *  Heteroskedastizität * Histogramm * Homoskedastizität  * Hypothese * Hypothesendiskussion * Hypothesenraum *  Inferenz, Inferenzstatistik * Integratives Testprinzip *  Intra * Inter * Inzidenz  * Inzidenzenrate *  IQ *  Kohärenzprinzip * Kohorte *  Kolmogoroff-Axiome * Kollinearität * Konfundiert, Konfundierung * Kontinuität * Korrelation * Kovarianz * Laborwertnormen *   Längsschnitt-Statistik (Longitudinal) * Laplace-Experiment * Letalität * Likelihood * Longitudinal > Längsschnitt. * Markovkette *   Maximum-Likelihood-Methode * Median * Mengenlehre * Merkmalsraum, relevanter * Messen, Messung * Messfehler * Messwert, Zahlenwert * Minimum. *  Mikrozensus * Mittelwert ohne nähere Angabe * Mittelwert, arithmetischer * Mittelwert, geometrischer * Mittelwert, harmonischer. *  Modalwert * Moment * Morbidität * Mortalität * Multikollinearität * Non-parametrische Statistik * Norm * Normalverteilung * Normalwert.* Normwerte *  Nullhypothese *  Numerologie * Nutzen  *  Objektivität *  Objektivität, spezifische *  Odds-Ratio * Ökonomie * Operationscharakteristik * Parameter * Parameter-Konstanz  *  parametrische Verfahren. *  Paranormale Fähigkeiten testen * Polung. *  Population. *  Prävalenz. *  Praxeologie * Produkt-Moment * Prozentrang * Prüfstatistik * Quantile * Quartile  *   Querschnitts-Statistik * Rang, Rangzahl, Rangtests * Referenzwert * Regression, Regressionsanalyse  *  Relation (Beziehung) * Relationentreue * Reliabilität  *  Repräsentation. *  Risiko: *   ROC *  Rohwert *  Scheidewert * Schiefe  *  Schließende Statistik * Score *  Sensitivität. *  Signifikanz. *  Simpsons Paradoxon * Skalierung. Messverfahren, Messmethode *  Spannweite * Spezifität * Spiel *  Spieltheorie * Stabil, Stabilität [numerische] *  Standardabweichung * Standardnormalverteilung * Standardwert * Stanine * Statistik * Statistik, deskripve * Statistik, mathematische * Statistikpakete/ Statistikprogramme * Statistik, schließende * Statistische Kennwerte *  Statistisches Paradigma * Statistische Schlussweisen * Stichprobe * Stichprobenauswahlverfahren * Stichproben-Kennwerte *  Stichprobenumfang * Stationär, Stationarität *   Stetig  *  Stichprobe *  Stochastik. *  subjektive Wahrscheinlichkeitstheorie *  Summen-Score-Funktion *  Syllogismus, statistischer. *  Telepathische Fähigkeiten * Test *  Testen  * Testgütekriterien. *  Teststärke (Power). *  Testtheorie: *  Transformation.  *  Transparenz. *  T-Werte * Unsicherheit. *  Unterscheiden. *  Utilität  *  Validität.* Varianz. * Varianzanalyse *  Vergleichen *  Verteilung. *  Verteilungsannahmen. * Verteilungsfunktionen * Verteilungskennwerte *  Vertrauensintervall * Vieldeutigskeitssatz. * Voraussetzungen. *  w *  Wahrscheinlich, Wahrscheinlichkeit. *  Wahrscheinlichkeit, bedingte * Wahrscheinlichkeitsmodell. *  Wahrscheinlichkeit, objektive. * Wahrscheinlichkeit, subjektive. * Wahrscheinlichkeit, totale * Welten * Wert * Wert, richtiger * Wert, wahrer *  Wertzuweisung *  Wette *  Wissenschaftliches Arbeiten *  Würfelspielparadoxon *  x *  Zahlen * Zeit * Zeitpunkt. *  Zeitreihenanalyse * Zensus (Census) * Zentraler Grenzwertsatz * Zufall * Zufallsgröße * Zuverlässigkeit *  z-Werte *
    ___
    Abweichung. ... von einem Bezugs-, Norm- oder Referenzwert, z. B. die Standardabweichung als Abweichungsgröße vom arithmetischen Mittelwert.
    __
    Alpha-Fehler (Fehler erster Art). Die 0-Hypothese - z. B. A und B sind gleich -  wird verworfen, obwohl sie wahr ist.
    __
    Alternativhypothese(n): H1, (H2, ...)  Im allgemeinen die von einer ForscherIn inhaltlich vertretene Hypthese, z.B. Lernmethode A ist für den Zweck Z "besser" als Lernmethode B. Die einseitige Nullhypothese (H0) würde dann so formuliert: A ist nicht besser, höchstens genau so gut wie B. Zweiseitig ungerichtet: A und B unterscheiden sich nicht.
        Bortz (1985, S. 143) führt aus: "Grundsätzlich sollte die statistische H1 so formuliert werden, daß sie die inhaltliche Hypothese so präzise wie möglich wiedergibt. In Abhängigkeit von der Art der statistischen Hypothese ist dann ein statistisches Verfahren auszuwählen, das eine möglichst „strenge" Überprüfung des hypothetisch behaupteten Sach Verhaltes gewährleistet. Wir werden diese Forderung im Zusammenhang mit den einzelnen in diesem Text behandelten statistischen Verfahren erneut aufgreifen. (Ausführlicher wird das Problem des Umsetzens wissenschaftlicher Hypothesen in statistische Hypothesen bei Hager u. Westermann, 1983 diskutiert.)"
    __
    Antinomie.
    __
    Ausgleichsrechnung.
    __
    Auswahl, Auswahlverfahren. Vielfach können ganze Populationen nicht vermessen werden, so dass Stichprobenauswahlen erfolgen müssen. Die meisten statistischen Verfahren setzen eine Zufallsausfall voraus, wobei eine solche in den meisten Fällen nicht durchgeführt wird.
    __
    Bayes Theorem.
    __
    Beta-Fehler (Fehler zweiter Art). Die 0-Hypothese wird angenommen - z. B. A und B sind gleich - obwohl sie falsch ist.
    __
    Bedingungen. Überhaupt, aber besonder im statistischen Bereich elementarer Grundbegriff, der eine Erhebungssituation charaktersiert.
    __
    Bedingte Wahrscheinlichkeit. Wahrscheinlichkeit für ein Ereignis E unter der Bedingung B: p(E|B).
    __
    Binominalverteilung. Wahrscheinlichkeitmodell für die zwei Ergebnismöglichkeiten in n Versuchen: Ereignis tritt für jeden Versuch mit der festen Wahrscheinlichkeit p ein ("Erfolg"), Ereignis tritt für jeden Versuch mit der festen Wahrscheinlichkeit q=1-p nicht ein ("Misserfolg"), wobei Vorgänger-  und Nachfolger- Wahrscheinlichkeit voneinander unabhängig sind. Typisches Beispiel: Münzwurf mit dem Ereignis "Zahl" und "Wappen".
    __
    cut off Werte.  "ACOMED statistik" führt aus (071025):"Der Cut-Off-Wert ist der Wert in einem quantitativen diagnostischen Test, der zwischen zwei Testergebnissen (positiv, negativ) unterscheidet und damit einen Patienten einem der zwei untersuchten Krankheitszustände (z. B. krank vs. nicht krank oder Erkrankung 1 vs. Erkrankung 2) zuordnet. Dabei gibt immer einen Überlappungsbereich, in dem je nach Lage des Cut-Off-Punktes Patienten testpositiv oder testnegativ eingeordnet werden. Deshalb ist die Auswahl des Cut-Off-Punktes sorgfältig vorzunehmen. ..."
    __
    Diagnostik := Liegt ein Merkmal in dieser oder jener Ausprägung vor? Hier gibt es immer zwei Fehlerarten.
    __
    Diagnostische Fehlerarten: 1) Ein Merkmal wird zugeschrieben, obwohl es nicht zutrifft (falsch positiv). 2) Ein Merkmal wird nicht erkannt, obwohl es zutrifft (falsch negativ). Man erkennt auf eine Diagnose, obwohl sie nicht vorliegt (falsch positiv) oder man erkennt eine Diagnose nicht, obwohl sie vorliegt (falsch negativ). Dieser Fehlertyp ist universell, so z. B. auch für die Rechtsprechung: jemand wird für eine Tat verurteilt, obwohl er sie nicht begangen hat (falsch positiv) oder er wird frei gesprochen, obwohl er die Tat begangen hat (falsch negativ). Nachdem das Recht idealistisch orientiert ist und vor allem Falsch-Positiv minimieren möchte, ergibt sich zwangsläufig,  dass Falsch-Negativ maximiert wird, d. h. immer mehr intelligente und skrupellose TäterInnen kommen straffrei davon und durchsetzen die Gesellschaft.
    __
    Dichte, Dichtefunktion. Die Dichtefunktion bezieht sich auf stetige oder kontinuierliche Zufallsvariable. Sie ordnet dem Intervall, in dem sich der Wert der Zufallsvariable befindet, eine Wahrscheinlichkeit zu. Die Dichtefunktion entspricht bei diskreten Zufallsvariablen die Wahrscheinlichkeitsfunktion, die jedem der diskreten Werte, eine Wahrscheinlichkeit zuordnet. [B]
    __
    Differentialdiagnostik := was ist es hier genau, und was nicht?
    __
    Diskret. Mathematischer Grundbegriff unterbrochener ("diskontinuierlicher", "unstetiger") Meßpunkte.
    __
    Diskriminanzanalyse. Mathematisch-statistische Methode, ob und wie gut sich aufgrund gegebener Messwerte unterschiedliche Gruppen von einander trennen bzw. zuordnen oder klassifizieren lassen.
    __
    Einzelfall. Recht, Kriminologie, Medizin, Psychologie sind auch angewandte idiographische Wissenschaften, d. h. sie machen Aussagen über ein Individuum. Hierbei ist ein großes und bislang ungelöstes Problem, wie man Erkenntnisse, die für Gruppen (Aggregate) gelten, auf den Einzelfall anwenden kann > Grundzüge einer idiographischen Wissenschaftstheorie. Man bedenke, dass in unseren Praxen, Büros, Kanzleien und Gerichten keine Stichproben und Populationen Platz nehmen, sondern individuelle Menschen.> Praxeologie, > evidenzbasierte Medizin.
    Querverweise:
    • Hake: Statistische Falschschlüsse Gruppe/Einzelfall.
    • Nedopil: Prognosen in der Forensischen Psychiatrie.
    __
    Entscheidbarkeit. Wichtiger mathematischer Begriff aus der Beweistheorie (Turing, Halteproblem > W).
    __
    Entscheidung. Grundlegender Begriff für alle Systeme mit Wahlmöglichkeiten. Watzlawick postulierte für den zwischenmenschlichen Bereich, dass man nicht nicht-kommunizieren könne. Übertragen kann man sagen, dass man nicht nicht-entscheiden kann, denn nichts tun, warten, nicht-entscheiden ist paradoxerweise auch eine Entscheidung.
    __
    Entscheidungstheorie.  [1 (Bamberg), ]
    __
    Epidemiologie. Inzidenz, Letalität, Morbidität, Mortalität, Prävalenz. > Grundbegriffe.
    __
    Ereignis. bestimmt durch Ort und Zeit (Grundbegriff).
    __
    Ereignisalgebra (Mengenlehre):
    __
    Ergodisch, Ergodizität, Ergodensätze.
    __
    Erhebungszeitraum. Zeitraum (Anfang - Ende) in dem eine Erhebung erfolgte.
    __
    Erwartungswert. Theoretisch der - immer unbekannte - wahre Mittelwert, praktisch oft der arithmetische Mittelwert als beste empirische Näherung ("richtiger Wert") für den gedachten wahren Wert.
    __
    Erwartungstreu(e Schätzung). Eine Schätzfunktion heißt erwartungstreu, wenn sie im Durchschnitt den richtigen Wert als besten Schätzer für den unbekannten "wahren" Wert liefert.
    __
    Evaluation. Den Wert einer Methode untersuchen und erweisen.
    __
    Evidenz. Offenkundig, offensichtlich, klar, banal, trivial, selbstverständlich.
    __
    Evidenz-basierte Medizin. Neuere Evaluations-Methode in der Heilkunde, die versucht, Entscheidungen durch wissenschaftliche Forschungsergebnisse zu stützen, also eine Verbindung zwischen der idiographischen (einzelfallorientierten, intra-individuellen) und nomothetischen (inter-individuell gültige empirische Gesetze und Regelhaftigkeiten) Betrachtungs- und Herangehensweise einzugehen. Anmerkung: Evidenz ist hier in der angloameriknaischen Bedeutung  (Beweism belegt) gemeint. Die deutsche Übersetzung suggeriert eine falsche Bedeutung.
    __
    Exzess := Maß für die Steilheit einer Verteilung (4. Moment).
    __
    Faktorenanalyse.
    __
    f := Hier Zeichen für Fehler. In der psychologischen Testtheorie meist mit "e" (error) bezeichnet.
    __
    Falsch negativ := ein Merkmalsträger wird nicht erkannt.
    __
    Falsch positiv =: ein Nicht-Merkmalsträger wird fälschlich als Merkmalsträger identifiziert..
    __
    Fehler. Alles menschliche Feststellen und jede Messung ist mit einem Fehler behaftet, mag er auch noch so klein sein. Allgemein bedeutet Fehler eine Abweichung vom Zutreffenden oder für richtig Erachteten, wodurch eine subjektive Komponente entsteht, weil, z.B. in der Welt der Werte es keine Objektivität oder Intersubjektivität gibt.
       
      Der allgemeine Fehlerfall
      Sachverhalt = wahr, richtig Sachverhalt = falsch, unrichtig
      Entscheidung für wahr, richtig Entscheidung = wahr, richtig Entscheidung = falsch, unrichtig
      Entscheidung für falsch, unrichtig Entscheidung = falsch, unrichtig Entscheidung = wahr, richtig

      In der Statsitik werden unter bestimmten - meist problematischen, unbekannten oder nicht erfüllten - Annahmen, die Annahmen richtig oder falsch geschätzt. Über die Wirklichkeit selbst erfährt dabei gewöhnlich. Aber man bewegt sich in scheinbar exakten, wenn auch virutellen Räumen

    __
    Fehlerarten: Fehler können durch systematische oder zufällige Störquellen, durch die Messmethode, das Messgerät, die Eichung, Anzeige, Ablesung, Irrtümer oder bewusste Fälschung zustande kommen.
    • Fehler, absoluter. f = x - r.   [> Messfehler]
    • Fehler, relativer. f / Mittelwert
    • Fehler, systematischer. Fehlerhafte Messmethode, fehlerhaftes Gerät, fehlerhaftes Ablesen; mangelnde Kontrolle anderer Einflüsse oder Störvariablen, z. B. leichtfertiges ungeprüftes oder ungesichertes Glauben von Angaben in sehr, sehr interessegeleiteten Situationen (Prüfungen, Bewerbungen, Aufträge erringen, Aussagen vor Gericht oder der MPU).

    • Fehler, zufälliger. Schwieriger statistischer Begriff, meist negativ definiert als nicht-systematisch; klein; durch viele Faktoren bedingt und Abweichungen nach beiden Richtungen, so dass ein gewisser Ausgleich bei der Mittelwertsbildung erfolgt. [> Zufall]
        > Fehler (Genauigkeit, Reliabilität, Zuverlässigkeit)
    __
    Fehler, statistische.    > W;  Interaktive Bestimmung Fehler 1. und 2. Art Uni-Konstanz.
    __
    Fiduzialkonzept. Konzept von Fisher, wonach aus den Realisationen der Zufallsvariablen Schlüsse auf die theoretische Verteilung und Ihre Parameter ohne a-priori Kenntnisse gezogen werden. Vorasetzungen: kontinuierliche Zufallsvariable, suffiziente Schätzung. Nach Dieter Rasch (1978, S. 202) hätten James (1954) und Stewart (1959) gezeigt, dass die Fiduzialfunktion nicht immer auf 1 normiert sei und daher nicht immer eine Dichtefunktion der Wahrscheinlichkeitsrechnung entspreche.
    __
    Größe. Grundlegender wissenschaftlicher Begriff, der im allgemeinen eine quantitative (messbare) Qualität beschreibt und mit anderen Größen in Zusammenhängen steht, deren Erforschung Aufgabe der Wissenschaft ist. Im Umfeld der Statistik und Wahrscheinlichkeits werden Größen vorschnell und leichfertig als ausschließliche Zufallsgrößen (Zufallsvariablen) aufgefasst, was sie natürlioch nicht sind. Der Zufall ist nur ein Aspekt. Für Größen gilt daher G = f(F1, F2, ..., Fi, ...  Fn), f(Z1, Z2, ..., Zi, ...  Zn), wobei F hier kausale, korrelative und Z "zufällige" Einflüsse bedeuten sollen.
    __
    Häufigkeit := Anzahl von Ereignissen für einen bestimmten Zeitraum.
    __
    Heteroskedastizität: ungleiche, veränderliche Varianz, Inkonstanz der Varianz.
    __
    Histogramm. Grafische Darstellung von Häufigkeiten. [W]
    __
    Homoskedastizität: gleiche Varianz, Varianz Konstanz
    __
    Hypothese. Wissenschaftlicher Grundbegriff. Verwerfungsregel: Eine Hypothese für ein Ergebnis wird verworfen, wenn bezüglich der Voraussetzungen und Annahmen die Wahrscheinlichkeit für das Ergebnis kleiner-gleich einer gewählten Schranke (Irrtumswahrscheinlichkeit, Signifikanzniveau) ist. Das Ergebnis gilt bezüglich der gewählten Schranke als unwahrscheinlich. Die meisten Hypothesenprüfungen in der angewandten Statistik prüfen nur virtuelle Möglichkeiten mit virtuellen Anahmen gegen andere virtuelle Annahmen. Das Zusammenwirkungen kausaler Faktoren, korrelativer Faktoren und "des Zufalls" ist weitgehend ungeklärt und wird gewöhnlich nicht erörtert. Die Lehrbücher sind leer davon.
    ___
    Hypothesendiskussion. Zu ihr gehören die Eröterung der Hypothesen, ihre Entwicklung und Begründung, die Prüfmethoden, Voraussetzungen und Annahmen, Formulierung der Ergebnisse in deutschen Worten, Erörterung der Fehlerarten und die Möglichkeiten ihrer Abschätzung. Sehr oft kommen inhatliche Erörterungen viel zu kurz.
    ___
    Hypothesenraum. > Integratives Testprinzip, relevanter Merkmalsraum. Gesamheit der potentiell relevanten Hypothesen. Eine vernünftige und realitätsorientierte Statistik muss den gesamten relevanten Hypothesenraum erfassen und die Hypothesendiskussion realitätsbezogen darin führen.
    __
    Inferenz, Inferenzstatistik.  > statistische Schlussweisen, > schließende Statistik. Schließende, schlußfolgernde Statistik (ergänzend zur deskriptiven, beschreibenden). Zentrale Grundidee und ein Paradigma wahrscheinlichkeitstheoretischer und statistischer Problemlösungen und Aufgaben. Beispiele: Man zieht eine Stichprobe und möchte wissen, wie repräsentativ ist diese Stichprobe für die Grundgesamtheit (Population). Man berechnet einen Wert und möchte wissen, wie gut dieser Wert den unbekannten Parameter schätzt, mit welchen Abweichungen unter diesen oder jenen Annahmen zu rechnen ist? Im Grunde genommen, haben sich Wahrscheinlichkeitstheorie und Statistik in einer eigenen unlösbaren Aufgabe (Aporie) verfangen: Wie gewinnt man Sicherheit (Wissen), wo es keine(s) gibt? Damit ist eine unendliche "Spielwiese" für die mathematische Statistik eröffnet, indem unter "bestimmten" - in Wirklichkeit unbekannten - Anahmen gewisse Annahmen gegenüber anderen Annahmen untersucht und getestet werden. Man bewegt sich weitgehend in virtuellen, fiktiven Welten, obwohl man doch etwas über die Wirklichkeit erfahren möchte. Einen hohen Wert hat allerdings die Mathematik gegenüber allen anderen Wissenschaften: sie zwingt zur Klärung der Voraussetzungen und Annahmen, die ansonsten oft oft leichtfertig und wenig (problem-) bewusst einfach unausgewiesen angenommen werden.
    __
    Integratives Testprinzip. > Hypothesenraum. Es geht von der Anahme aus, das ein empirisch erhaltener Datensatz mehr oder minder repräsentativ für die Population ist. Für eine Gesamtbeurteilung sind mehrere hypotheteische Betrachtungen sinnvoll und notwendig. Das bloße Testen gegen eine Hypothese, gewöhnlich Nullhypothese genannt, Stichprobenwert = Populationswert, erscheint viel zu einseitig, virtuell und viel zu wenig informativ.
    __
    Inter := zwischen verschiedenen Systemen (inter-individuell).
    __
    Intra := innerhalb eines Systems (intra-individuell).
    __
    Inzidenz. Medizinstatistischer, epidemiologischer Begriff. Nach 257Psychyrembel: Anzahl der Neuerkrankungsfälle in einem bestimmten Zeitraum.
    __
    Inzidenzenrate. Medizinstatistischer, epidemiologischer Begriff. Nach 257Psychyrembel: Anzahl der Neuerkrankungsfälle in einem bestimmten Zeitraum im Verhältnis zur Anzahl der exponierten Personen. Das Psychometrische Wörterbuch (Rasch et al. 1987) führt aus: "I, Zugangs- oder Neuerkrankungsrate heißt die relative Häufigkeit bzw. Wahrscheinlichkeit des Neuauftretens einer bestimmten Krankheit in einem bestimmten Zeitraum bezogen auf den Umfang der Population, aus der die Erkrankungen hervorgingen. Die I. kann man kumulativ, d.h. auf dem ganzen Untersuchungszeitraum bezogen, oder in Form der Inzidenzdichte für einen (kurzen) bestimmten Teilzeitraum betrachten. Die Inzidenzdichte dient zum Studium der Veränderung der I. mit der Zeit, z. B. in Abhängigkeit vom Alter. Die I. wird in > Längsschnittstudien analysiert.
    __
    IQ. Normierungseinheit der Intelligenzschätzung.
    __
    Kohärenzprinzip. Begriff der subjektiven Wahrscheinlichkeitstheorie, wonach in einem Wettsystem sichere Verluste ausgeschlossen werden. [1,2,3,]
    ___
    Kohorte.
    ___
    Kolmogoroff-Axiome.

    Quelle Kolmogoroff, A. (1933; Nachdruck 1973, S. 2).
    __
    Kollinearität: [Kollinearitätsanalyse in Korrelationsmatrizen]
    __
    Konfundiert, Konfundierung. untrennbar zusammenhängend; miterfasst. Sind zwei Merkmale M1 und M2 untrennbar miteinander verbunden, z.B. Alter und Geschlecht, so kann sich die Frage stellen, ob ein Effekt E durch das Alter, das Geschlecht, durch beides oder durch keines von beidem bestimmt ist. Die Kontrolle von miteinander konfundierten Variablen spielt in Experimenten eine wichtige Rolle. Eine Möglichkeit konfundierte Effekte im wahrsten Sinne des Wortes herauszurechnen besteht in der Nutzung partieller Korrelationsanalyse.
    __
    Kontinuität.
    __
    Korrelation. Zusammenhang. Es gibt viele Zusammenhangsmaße und damit unterschiedliche Korrelationsbegriffe, so dass immer dazu gesagt werden sollte, um welche Korrelation es sich handelt. [partielle Korrelation]. > Regression.
    __
    Kovarianz. Ko = mit. Varianz = Streuung. Mit- oder gemeinsame Streuung von zwei Datensätzen: Sxy = 1/n [Summe(xi - mx) (yi - my), wobei hier m der arithmetische Mittelwert sei. Beispiel: X=1,2,3. Y=2,3,4. mx=2;   my=3. n = 3:
    xi
    yi
    xi - mx
    yi - my
    (xi - mx) (yi - my)
    1
    2
    1-2 = -1
    2-3= -1
    (-1 * -1) = 1
    2
    3
    2-2 = 0
    3-3= 0
    (0 * 0 ) = 0
    3
    4
    3-2 = 1
    4-3= 1
    (1 * 1) = 1
    Sum=1+2+3=6
    Sum=2+3+4=9
       
    Sum=1+0+1=2
    mx=6/3 = 2
    my=9/3=3
       
    Sxy = 2/3 = 0.667

    Besonderheiten und Zusammenhänge: Kovarianzen sind nicht standardisiert (nicht normiert auf die Standardabweichung) sein. Wird mit standardisierten Werten gerechnet, ist die Kovarianzmatrix mit der Korrelationsmatrix identisch. In der schließenden (Inferenz-) Statistik wird wegegn der Erwartungstreue nicht durch n, sondern durch 1/(n-1) dividiert. Die Kovarianz steht in der Korrelationsformel nach Bravais-Pearson im Zähler.
    __
    Laborwertnormen.
    __
    Längsschnitt-Statistik (Longitudinal). Erhebung von Werten über verschiedene Zeit- bzw. Messzeitpunkte hinweg, z. B. alle zwei Monate Bestimmung der Leberwerte für die Dauer eines Jahres. > Querschnitt.
    __
    Laplace-Experiment. "Ein stochastisches Experiment heißt Laplace-Experiment, wenn die zugehörige Wahrscheinlichkeitsverteilung gleichmäßig ist."  Die Wahrscheinlichkeit bei einem Laplace-Experiment ergibt sich dann mit p = günstige Fälle/ mögliche Fälle. (Beispiele: Urne, Würfel, Münze)
        Quelle: Barth,F. & Haller, R.  (1984a). Stochastik Leistungskurs. München: Ehrenwirt.
    __
    Letalität.
    __
    Likelihood. Engl.: Wahrscheinlichkeit.
    __
    Likelihood-Quotienten-Test. Vergleicht die Wahrscheinlichkeiten für die Null- und Alternativhypothese unter den Annahmen, dass sie richtig sind. Diese Idee erscheint gegenüber dem Signifikanztest, der mit Anahme A1 eine Anahme A2 mit einer anderen Annahme A3 vergleicht, und keinerlei Aussage über die Wirklichkeit erlaubt, etwas informativer. Nachteil: parametrische Voraussetzungen.
    __
    Longitudinal > Längsschnitt.
    __
    Markovkette
    __
    Maximum-Likelihood-Methode. Von R.A. Fisher 1921 entwickeltes Verfahren zur Schätzung von Wahrscheinlichkeiten. Es wählt diejenige aus, die unter bestimmten Annahmen die größte Wahrscheinlichkeit für ein vorliegendes Resultat hat.
    __
    Median. Der Wert, der eine Messwert-Reihe in zwei Hälften teilt, z. B. 3 in:  1, 1, 2, 2, 3,  3,  3, 3, 4, 5, 5.
    __
    Mengenlehre. Nach der Mengenlehre besteht die Messwert-Reihe  "1, 1, 2, 2, 3,  3,  3, 3, 4, 5, 5"  aus 5 Elementen.
    __
    Merkmalsraum, relevanter. [1,]
    __
    Messen, Messung. Genau beschriebenes und damit prinzipiell wiederholbares und überprüfbares Verfahren zur Feststellung einer Ausprägung. Eine Messung ist lehr- und lernbar. Es ist sehr zweifelhaft, ob in der Erlebnis-Psychologie echte Messungen möglich sind.
    __
    Messfehler. Als allgemeiner Erfahrungssatz gilt: jede Messung ist mit einem Fehler behaftet, so das für den Messwert x, den gedachten wahren Wert w und den Messfehler f gilt: x = w + f.  Da der wahre Wert eine gedachte Konstruktion und nie bekannt ist, muss er in praxi geschätzt werden. Diesen Näherungswert nennt man auch den "richtigen" Wert r und damit gilt dann: x = r + f. Man nimmt hierfür oft den arithmetischen Mittelwert.  [> Fehlerarten.]
    __
    Messwert. Zahlenwert.
    __
    Minimum. Der kleinste Wert in einer Reihe, z. B. 1 in: 1, 1, 2, 2, 3,  3,  3, 3, 4, 5, 5.
    __
    Mikrozensus. Stichprobenauswahlverfahren.  [W]
    __
    Mittelwert ohne nähere Angabe. Meist ist der arithmetische gemeint und oft auch so erkennbar. Sicher wäre es, genau zu anzugeben, von welchem man spricht. Most (1955, S. 8, § 12: S. 57-65) führt folgende Mittelwerte an: "I. Errechnete Mittelwerte: 1. und 2. Arithmetische Mittel. 3. und 4. Geometrische Mittel. 5. Harmonisches Mittel. 6. Quadratisches Mittel. 7. Antiharmonisches Mittel. II. Mittelwerte der Lage: 1. Zentralwert. 2. Häufigster Wert. 3. Schwerster Wert. 4. Scheidewert." Lit: > Jecklin; [W]
    __
    Mittelwert, arithmetischer. Summe aller Werte dividiert durch die Anzahl. [W]
    __
    Mittelwert, geometrischer. Besonders geeignet für Mittelwerte bei Verhältniszahlen (z.B. von Geschwindigkeiten: v = s/t). [W]
    __
    Mittelwert, harmonischer. [W]
    __
    Modalwert. Der häufigste Wert in einer Reihe, z. B. 3 in:  1, 1, 2, 2, 3, 3, 3, 3, 4, 5, 5.
    __
    Moment. Sammelbezeichnung oder Klassenbegriff für die verschiedenen statistischen Kennwerte oder Parameter einer Verteilung:  [W]
    __
    Morbidität. Unklarer medizinstatistischer, epidemiologischer Begriff. 1) Gesundheitsbrockhaus 1990: Gibt die Häufigkeit einer Erkrankung pro 1000 oder 10.000 für ein Jahr oder einen anderen Zeitraum an. 2) Grundmann, E. (1994, Hrsg.; S.4-5): „Die M. ist die Zahl einer bestimmten Erkrankung in einer bestimmten Bevölkerungsgruppe in einem bestimmten Zeitraum (meist einem Jahr). Sie berechnet sich nach der Formel: Mz = (Erkrankungszahl x 10 000) / Bevölkerungszahl“. In dieser Formel fehlen die Einheiten der Zeit und die soziologische Spezifikation. 3) Nach Renner, D. (6.A. 1990, S. 24): „M. - Anzahl an einer bestimmten Krankheit leidender Personen per Gesamtbevölkerung in einem bestimmten Beobachtungszeitraum.“ Nach diesem Autor wird M. auch synonym mit Neuerkrankungsrate (> Inzidenz) verwendet. Die Inzidenz wird von Schaefer & Blohmke (1978, S.111) wiederum der > Prävalenz gleichgesetzt.
    __
    Mortalität. Medizinstatistischer, epidemiologischer Begriff, der die Sterblichkeit einer Krankheit bezogen auf die Gesamtzahl der Lebenden eines Jahrganges pro 10.000 oder 100.000 angibt im Unterschied zur > Letalität, die das Verhältnis der an einer Krankheit Gestorbenen in Beziehung zur Anzahl der Erkrankten angibt.
    ___
    Multikollinearität. In einer Tabelle (Matrix) gibt es mindestens 2 Kollinearitäten (vergleichbarer Datensätze, also aus der gleichen Stichprobe oder Population mit jeweils gleicher Anzahl n).
    __
    Non-parametrische Statistik. Nicht-parametrische ist im Gegensatz zur parametrischen Statistik voraussetzumgarm und mehr datenangemessen.  Altmeister Siegel schreibt (dt. 1976, S.2f): "Im Lauf der Entwicklung der modernen statistischen Methoden konstruierte man zunächst Verfahren des statistischen Schließens, die sehr viele Annahmen über die Art der Population machten, aus der die Stichprobe gezogen wurde. Da die Populationswerte "Parameter" sind, nennt man diese statistischen Verfahren parametrisch. Eine Technik des Schließens kann z.B. auf der Annahme beruhen, daß die Daten aus einer normalverteilten Population stammen. Oder sie kann auf der Annahme beruhen, daß zwei Datenbündel aus Populationen erhoben wurden, die dieselbe Varianz (a2) oder Streuung der Daten aufweisen. Diese Verfahren führen zu eingeschränkten Schlußfolgerungen, z.B. 'Wenn die Annahmen über die Art der Verteilung der Population(en) gültig sind, läßt sich daraus schließen, daß... '.
        Inzwischen sind eine große Anzahl von Verfahren des statistischen Schließens entwickelt worden, die ohne die zahlreichen oder strengen Annahmen über Parameter auskommen. Diese neueren "verteilungsfreien1' oder nicht-parametrischen Verfahren führen zu Schlüssen, die mit weniger Einschränkungen verbunden sind. Wenn wir eines davon anwenden, so können wir etwa sagen: "Ungeachtet der verteiiungsform der Population(en) können wir folgern, daß...". In diesem Buch werden wir uns mit diesen neueren Verfahren beschäftigen.
        Einige nicht-parametrische Verfahren werden oft "Rang-Tests" oder "Ordinal-Tests" genannt, und diese Bezeichnungen lassen noch andere Unterschiede zu parametrischen Tests erkennen. Bei der Berechnung parametrischer Tests addieren, multiplizieren, und dividieren wir die Werte aus den einzelnen Stichproben, Führt man diese Rechenarten auch mit Daten durch, die eigentlich nicht numerisch sind, so werden diese verzerrt, und die aus dem Test gezogenen Schlußfolgerungen sind nicht mehr zulässig. Man ist also in der Anwendung parametrischer Verfahren auf Daten beschränkt, die in numerischer Form vorliegen. Dagegen gehen viele nicht-parametrische Tests von der Rangordnung der Daten und nicht von deren 'numerischem' Wert aus, und einige Tests lassen sich sogar auf Daten anwenden, die nicht einmal eine Rangordnung zulassen, d.h. die lediglich klassifiziert sind. Während der parametrische Test etwa die Differenz der arithmetischen Mittel zweier Datenreihen untersucht, geht es im äquivalenten nicht-parametrischen Test um den Unterschied zwischen den Medianwerten. Die Berechnung des arithmetischen Mittelwertes erfolgt über arithmetische Operationen (Addition und anschließend Division), die Bestimmung des Medians geschieht durch Zählen. Die Vorteile von Rangstatistiken für Daten aus den Verhaltenswissenschaften (deren Daten nur scheinbar 'numerisch' im strengen Sinne sind) liegen auf der Hand. Wir werden diesen Punkt in Kap. 3 ausführlicher behandeln, wo parametrische und nicht-parametrische Tests miteinander verglichen werden."
    __
    Norm. Bezugs- oder Vergleichgröße.
    __
    Normalverteilung. Gaußsche Glockenkurve [1, 2, W, ]. Wichtigste Verteilung der mathematischen Statistik. Häufung der Werte in der Mitte und von aus fortlaufend abnehmend zu den Rändern hin.
     

    Zur Warnung (Grimm 1960, S. 165).
    "Die Erfahrung zeigt, daß eine ausgesprochene Normalverteilung in der Natur nur selten vorkommt. Garry (1947) schreibt sogar: 'Die Normalität ist ein Mythos, es lag nie Normalverteilung vor, und sie wird nie vorliegen." 
    __
    Normalwert. > Referenzwert.
    __
    Normwerte. Werte, die nach einem bestimmten, nachvollzieh- und prüfbaren Verfahren, gewonnen und berechnet werden.  In Straube (1988, Hrsg.), S.9 heißt es: "Der Ausdruck „Normwert" steht hier synonym für Normal-, Richt- oder Referenzwert, wobei sich letztere Bezeichnung durchzusetzen scheint. Es wird nachdrücklich darauf hingewiesen, daß alle Normwertangaben die intraindividuelle Situation des Gesunden und des Kranken nicht berücksichtigen können. Weiterhin muß der Arzt auf tages-, monats- und jahreszeitliche Schwankungen Rücksicht nehmen."
        Hier noch eine Tabelle aus Lienert (1969, 3. A.), S. 337:
    _

    __
    Nullhypothese [1, ] Streng formal besagt die Nullhypothese Kennwert-1  = Kennwert-2 oder x = y, wenn die Irrtumswahrscheinlichkeit einen Wert < Signifikanzniveau alpha hat unter der Voraussetzung, dass x = y gilt. Die häufigste und übliche, aber keineswegs zwingende Deutung ist: Es gibt keinen Unterschied zwischen den Kennwerten. Tatsächlich kann jede spezifierte Hypothese zur Nullhypothese gemacht werden. Die Alternativhypothesem sofern sie spezifiziert ist, lässt sich natürlich auch berechnen. Vom praktischen Standpunkt wählt man die Hypothese zur Nullhypothese, deren Verwerfung besonders interessiert. Grundsätzlich ist zu fordern, dass alle relevanten Annahmen und Voraussetzungen, die in die Prüfung eingehen mitgeteilt und in einer Hypothesendiskussion kritisch erörtert werden.
        Bortz (1985, S. 144) führt aus: "Die statistische Nullhypothese (H0) folgt ebenfalls zwingend aus der statistischen Alternativhypothese (H1). Bezogen auf den Vergleich zweier Mittelwerte sind die folgenden drei Hypothesenpaare denkbar:
    H1:  µ0 > µ1  H0:  µ0 <= µ1
     H1:  µ0 < µ1  H0:  µ0 >= µ1
    H1:  µ0 =|= µ1 H0: µ0 = µ1

    In ähnlicher Weise formuliert man statistische Nullhypothesen zu statistischen Alternativhypothesen, die sich auf Zusammenhänge beziehen (z.B. H1: rho > 0, H0:  rho <= 0).
        Die Nullhypothese stellt in der klassischen Prüfstatistik die Basis dar, von der aus entschieden wird, ob die Alternativhypothese akzeptiert werden kann oder nicht. Nur wenn die Realität „praktisch" nicht mit der Nullhypothese zu erklären ist, darf sie zugunsten der neuen Alternativhypothese verworfen werden."
    __
    Numerologie. Nicht prüf- oder wiederholbare Methode, spezielle Bedeutungen von Zahlen zu erkennen. Auch in der modernen Wissenschaft sehr verbreitet, z. B. in der Faktorenanalyse oder Signifikanzstatistik.
    __
    Nutzen: mehr oder - meist - minder intersubjektive Wertzuweisung über den Gebrauchswert von Sachverhalten. Der Nutzen spielt eine große Rolle für die meisten Menschen in fast allen Lebensbereichen, aber auch in der Wissenschaft, besonders in der Ökonomie (Grenznutzentheorie) und Psychologie: Nützlich erscheint, was Bedürfnisse, Wünsche und Interessen befriedigt.
    __
    Objektivität := die Messung soll nicht davon abhängen, wer mißt. Allgemeiner: ein Feststellung über einen Sachverhalt heißt objektiv, wenn sie unabhängig vom Feststeller ist.
    __
    Objektivität, spezifische := Begriff des Rasch-Modells, wonach die Messergebnisse (Relationen der Messobjekte) nicht vom Messinstrument (Test, Skalierungsverfahren) abhängen darf (>Relationentreue).
    __
    Odds-Ratio. Das Odds Ratio gibt, um wieviel größer die Chance zu erkranken in der Gruppe mit Risikofaktor ist (verglichen mit der Gruppe ohne Risikofaktor). Das Odds Ratio nimmt Werte zwischen 0 und Unendlich an. Ein Wert von 1 bedeutet ein gleiches Chancenverhältnis. [W]
    __
    Ökonomie (Nutzen, Utilität). Kosten, Aufwand, Nutzen, Preis-Leistungs-Verhältnis.
    __
    Operationscharakteristik (OCR). [W]
    __
    Paradigma. Charakteristische, typische und grundlegende Situation. Zweiwertiges Aussageparadima: eine Aussage ist wahr oder falsch. Dreiwertiges Aussagaparadigma: Eine Aussage ist wahr, falsch oder nicht bestimmbar. > Statistisches Paradigma.
    __
    Parameter: kennzeichnende, charakteristische Größe, z.B. Mittelwert, Varianz, Minimum, Maximum, Spanne, Verteilung.
    __
    Parameter-Konstanz: kennzeichnende Größe, die für bestimmte Bedingungen gleich bleibt, z.B. Mittelwert, Varianz.
    __
    parametrische Verfahren. Sie gehen von bestimmten Modellannahmen, z. B. Normalverteilung, aus.
    __
    Paranormale Fähigkeiten testen. [PDF, S. 376] [GWUP] [Randi]
    __
    Polung. negative oder positive Wertzuweisung zu einem Bearbeitungssachverhalt.
    Population: Gesamtheit, Ganzes.
    __
    Population. Grundgesamtheit, die betrachtet wird.
    __
    Power. Auch Macht, Teststärke oder Gütefunktion genannt: Wahrscheinlichkeit dafür, dass die Nullhypothese abgelehnt wird, wenn die Alternativhypothese richtig ist. Power = 1 - b mit b als Fehler 2. Art. [W]. Programm der Uni-Düsseldorf zur Berechnung der Power. Lit: Cohen (1969).
    __
    Prävalenz. Epidemiologisch-statistischer Begriff, der das Verhältnis aus Anzahl der Kranken zu einem Stichtag gegenüber den Personen mit Merkmal an diesem Stichtag angibt. Anwendung: an X Erkrankte : Medikamentenanwender.  Beaglehole et al (1997, S. 30): "Die Prävalenz einer Krankheit ist die Anzahl der Krankheitsfälle in einer definierten Population zu einem bestimmten Zeitpunkt."
    ___
    Praxeologie. Ein Name für lehr- und lernbares, begründetes praktisches Vorgehen nach Wissenschaft, Erfahrungswissen und individuell situativen Gegebenheiten. In den stark idiographisch geprägten Berufen der JuristInnen, Heilfachkundigen und PsychologInnen  müssen wissenschaftliche Ergebnisse auf einen Einzelfall angewendet werden. Das ist ein bislang von den Universitäten sehr stark vernachlässigtes Gebiet, so gibt es m.W. auch keinen Lehrstuhl für idiographische Wissenschaftstheorie und Praxeologie. Hier spielen auch der berüchtigte sog. "gesunde Menschenverstand" und alltägliches Regelwissen wie praktische Vernunft eine große Rolle. > evidenzbasierte Medizin.
    Querverweise:

    • Hake: Statistische Falschschlüsse Gruppe/Einzelfall.
    • Nedopil: Prognosen in der Forensischen Psychiatrie.
    __
    Produkt-Moment (kleines, großes). Ausdruck aus der Matrixalgebra (z.B. Horst 1963, p. 166-171) im Umfeld multivariater Datenanalyse (z.B. Revenstorf 1980, S.28, 53, 85 ). Sei X eine Matrix, dann wird X'X das kleine (Minor) und XX' gelegentlich das große (Major) Produktmoment genannt. Die Bravais-Pearson Korrelation wird auch als Produkt-Moment-Korrelation bezeichnet. Die Encyclepedia of Statistical Science, 1986, Vol.7, p. 292 führt aus:


    __
    Prognose.
    __
    Prozentrang. Prozentsatz derjenigen, die einen so oder so großen Wert erreichen.
    __
    Prüfstatistik. > Signifikanztest. Clauss & Ebner (1970, S. 170) schreiben: "Der gesamten Prüfstatistik liegt demnach folgender Gedanke zugrunde: Dann und nur dann, wenn die Stichproben Ergebnisse liefern, die bei Gültigkeit der Ausgangshypothese unwahrscheinlich sind, verwerfen wir die Hypothese."
    __
    Quantile. Vielheiten, meist in gleiche Klassen zusammengefasst. Quartile und Prozentränge sind Quantile.
    __
    Quartile. 1. Quartil := erstes Viertel der Stichprobe. 2. Quartil:  Zweites Viertel der Stichprobe. Median := halbiert die Stichprobe, 3. Quartil =: drittes Viertel der Stichprobe.  4. Quartil = letztes Viertel der Stichprobe. Seien 100 Messwerte von 1,2,3, ..., 100 gegeben, dann gehören 1-25 zum ersten Quartil, 26-50 zum zweiten Quartil, 51-75 zum dritten und 76 bis 100 zum vierten Quartil.
    __
    Querschnitts-Statistik, eine Statistik, die über verschiedene Objekte im gleichen Zeitraum erhoben wird, z. B. der arithmetische Mittelwert für den durchschnittlichen Alkoholkonsum junger Frauen zwischen 21 und 25 Jahren in Bayern. > Längsschnitt.
    __
    Rang, Rangzahlen, Rangtests. Ränge haben nach traditioneller Aufassung nur sog. Ordinalniveau. Mit solchen Größen sind numerisch-numerische Rechnungen bis auf montonone Transformationen nicht zulässig.  Das wird aber von vielen sog. Rangtests missachtet. Die mathematische Statistik ist hier falsch und unsauber, wenn sie unzulässig addiert, subtrahiert, dividiert, multipliziert, ohne im Einzelfall gezeigt zu haben, dass die metrisch-numerische Handhabung zu den zulässigen ordinalen Operationen äquivalente Ergebnisse liefert.
    __
    Referenzwert > wörtlich Bezugswert bzw. Bezugswertbereich,  Normwert, Normalbereichswert in der Medizin(im Laborbereich gewöhnlich unzulänglich ausgewiesen).In der Psychologie werden z. B. sog. "Normen" bei Intelligenztests meist für Geschlecht, Alters- und Bildungsklassen bestimmt. In der Medizin sind naturgemäß besonders wichtige Kriterien spezielle Erkrankungen und Risiko-, aber auch ökologische Faktoren (wie z. B. Stadt, Land, Abgasbelastung, Sendemasten, Strahlungsbelastung [Elektrosmog], Chemie- oder Atomkraftwerke in der Nähe, oder Berufe, die mit bestimmten Risiken einhergehen, können sehr wichtig sein. Beispielrechnung. Setzt man bei parametrischen statistischen Verfahren eine Mindeststichprobengröße von N=30 an und geht man aus von 2 Geschlechtern, 5 Altersklassen, 3 Schulbildungsgraden, 6 ökologischen Klassen, 27 Gesundheitsfaktoren (3 Bewegungsgrade, 3 Ernährungsgrade, 3 Körperindexgrade), 100 Krankheitsklassen und 10 Risikofaktoren ergibt sich folgende Rechnung: STC [Stichprobencharakteristiken] = 30 * 2 * 5 * 3 * 6 * 27 * 100 * 10 = 48.600.000, d. h. 48,6 Millionen Laborbefunde. Das wären die theoretischen Erfordernisse, wenn jede Stichprobenkombination vertreten sein soll. Es kann natürlich durchaus vorkommen, dass nicht jede Kombination mit 30 Fällen besetzt werden kann, weil sie zu selten vorkommt.
    __
    Regression, Regressionsanalyse. Einfaches lineares Modell nach y = a + b*x. Ein Wert y wird auf einen Wert x zurückgeführt, z.B. das Gewicht auf die Körpergröße. Das geht auch umgekehrt, indem man die Körpergröße auf das Gewicht zurückführt. Als Maß für den Zusammenhang beider Regressionen dient der Korrelationskoeffzient, der sich auch aus der Wurzel des Produktes beider Regressionskoeffzienten (geometrisches Mittel) errechnen lässt. b ist die Steigung und heißt auch beta-Gewicht. Inhaltlich interpretiert gibt b an, in welchem Verhältnis y steigt (fällt), wenn x um eine Einheit steigt (fällt). Im Prinzip gibt es beliebige Regressionsmodelle, letztlich so viele, wie Datenmodelle und Funktionsverläufe, die sie charakterisieren. Das einfache lineare Modell ist also nur eines, wenn auch das wohl meist angewendete. Regressionen bei Wachstumsprozessen werden "linearisiert" durch logarithmieren (Bsp.).
    __
    Relation (Beziehung). Beispiele: größer, kleiner, gleich, auf, unter, gleich alt wie, besser. Grundlegender, aber wegen seiner Abstraktion schwieriger mathematischer Grundbegriff, der seit der Durchsetzung der Mengenlehre auch über diese definiert wird: Eine Relation ist eine Teilmenge der Kreuzmenge (kartesisches Produkt, Paarmenge). Sei A = {Main, Passau, Frankfurt, Donau}, so ist die Kreuzmenge, AxA, numeriert: 1. (Main, Main), 2. (Main, Passau), 3. (Main, Frankfurt), 4. (Main, Donau), 5. (Passau, Main), 6. (Passau, Passau), 7. (Passau, Frankfurt), 8. (Passau, Donau), 9. (Frankfurt, Main), 10. (Frankfurt, Passau), 11. (Frankfurt, Frankfurt), 12. (Frankfurt, Donau), 13. (Donau, Main),  14. (Donau, Passau), 15. (Donau, Frankfurt) und 16. (Donau, Donau). Relationen können hier sein: I. Fluß und Stadt gehören zusammen: 3 und 8. II. Fluß und Stadt gehören nicht zusammen: 2 und 7. III. identische Flüsse: 1 und 16. IV. Identische Städte: 6 und 11. V. Flüsse: 1, 4, 13 und 16. VI. Städte: 1, 3, 5, 6, 7, 9, 10., 11. VII. Identische Namen: 1, 6, 11, 16. VIII. schwebt über: wird von keinem der Paare erfüllt.
    __
    Relationentreue.
    __
    Reliabilität. Messgenauigkeit. In der Psychologie meist - und nicht unproblematisch - über die Korrelation geschätzt.
    __
    Repräsentation. Grundlegender Begriff für die Stichprobenstatistik, schließende Statistik und für die allgemeine, auch alltägliche "Testtheorie". Erheben wir Werte, so sollen diese repräsentativ für ... sein. Bei Laborwerten kann es sehr darauf ankommen, wie die Randbedingungen der Erhebung sind (z. B. Tageszeit, nüchtern). Ist ein Laborwert, z. B. Gamma-GT pathologisch erhöht, so wird man das im allgemeinen beobachten und Messwiederholungen ansetzen. Ein Gamma-GT-Wert ist sozusagen nur eine einzige Stichprobenziehung aus den praktisch unendlich viel anmutenden Möglichkeiten. Eine besondere Bedeutung hat der Begriff noch in der Messtheorie. Das Repräsentationstheorem dort besagt, dass es eine homomorphe Abbildung von einem empirischen Relativ, z. B. drei Hölzchen, in ein numerisches Relativ mit z. B. drei Zahlen so gibt, dass die Beziehungen zwischen den Hölzchen durch die Zahlen repräsentiert werden.
    __
    Risiko:
    __
    ROC. Diagramm bei dem auf der Ordinate die Sensitivität und auf der Abszisse 1-Spezifität eingetragen wird. Daraus lässt sich das Verhältnis aller richtig positiven und falsch positiven Zuweisungen ersehen. [W]
    __
    Rohwert := scorierter Bearbeitungswert, dem Bearbeitungswert wird ein Zahlenwert zugeordnet. Wichtiger Grundbegriff für sozialwissenschaftliche Fragestellungen.
    __
    Scheidewert. Der Median der Momentverteilung heißt Scheidewert (oder auch Medial) [PDF]
    __
    Schiefe := Abweichungsmaß von der Symmetrie einer Verteilung; rechtsschief, linksschief.
    __
    Schließende Statistik (Inferenz-Statistik).
    __
    Schwerster Wert. Ausdruck der älteren deutschen Statistik: mit der Häufigkeit gewichteter Modalwert. Nach Most ein Mittelwert der Lage.
    __
    Score :=  Zahlenwert, Ausdruck in der Testpsychologie. Bekommt eine ProbandIn auf die Frage, wie der Bundeskanzler der BRD heißt, z. B. einen "Wertpunkt" für die richtige Antwort, so ist dieser Wertpunkt der Rohwert-Score. > Summenscorefunktion.
    __
    Sensitivität. Ein Maß für die Richtig-Positiv-Zuweisungen.
    Sicherheit
    __
    Signifikanz. > Prüfstatistik. Zufallskritische Beurteilung von Annahmen. Der Signifikanztest errechnet, ob unter der Voraussetzung der Richtigkeit der 0-Hypothese (H0: es besteht kein statistischer Unterschied) zwischen beobachteten Werten, die 0-Hypothese bei Zugrundelegeung dieser oder jener Irrtumswahrscheinlichkeit (Signifikanzniveau, oft 5%) beibehalten oder zu Gunsten der Alternativhypothese (H1) verworfen werden muss. Es wird also nicht die Wirklichkeit geprüft, sondern unter bestimmten Annahmen wird eine Annahme einer anderen Annahme gegenübergestellt, so dass nicht selten der Eindruck einer virtuellen Scheinwissenschaft entsteht. Sog. "signifikante" Ergebnisse werden auch selten in klaren - hierzulande deutschen - Sätzen interpretiert, woran man schon erkennt, wie schwach und unbedeutend (nicht signifikant ;-) solche Erkenntnisse sind. Der "Signifikanz-Popanz" ist vermutlich eine Folge der - oft genug sehr problematischen - Mathematisierung der Sozialwissenschaften. Viele denken zu Unrecht, dass nur, wo Zahlen und Formeln verwendet werden, schon Wissenschaft vorliegt; nicht selten ist es blosse moderne Numerologie und das Gegenteil von Wissenschaft. Signifikanztest.
    __
    Simpsons Paradoxon
    __
    Skalierung. Messverfahren, Messmethode.
    __
    Spannweite = Maximum - Minimum. Ist die zahlenmäßig kleinste Note in einem Zeugnis 1 und die größte Note eine 4, dann beträgt die Spannweite 4 - 1 = 3. Mit Spannweite kann auch ein Streuungsbereich gemeint sein, z. B. der 1 Sigma Bereich bei der Standard-Normalverteilung umfasst die mittleren 68%, der 2 Sigma-Bereich die mittleren 95,5% und der 3-Sigmabereich 99,7%, also fast die gesamte Verteilung.
    __
    Spezifität. Ein Maß für die Richtig-Negativ-Zuweisungen > Sensitivität.
    __
    Spiel.
    __
    Spieltheorie.
    __
    Stabil, Stabilität [numerische]
    __
    Standardabweichung (Symbol: Sigma) . Wichtiges Streuungsmaß. Wurzel aus der Summe der quadrierten Abweichungen der Rohwerte vom Mittelwert durch n-1 dividiert. Ohne die Wurzel ergibt sich die Varianz = quadrierte Standardabweichung.
    Gegeben seien 5 ProbandInnen mit einem BAK von: 0, 0.5, 1, 1.5, 2.0. n = 5. Das arithmetische Mittel = 5/5 = 1.0. Die Standardabweichung = Wurzel {Summe [(0-1)^2 + (0.5-1)^2 + (1-1)^2 + (1.5-1)^2 + (2-1)^2]/5-1} = 
    Wurzel {[1 + 0.25 + 0 + 0.25 + 1] / 4 } = Wurzel {2.5/4} =  0.79.
    __
    Standardnormalverteilung.
    __
    Standardwert. > z-Wert.
    __
    Stanine. Aus standard und nine gebildete Verdichtung an den Rändern der 13 Centil-Normen auf 9 Werte: [> Normwerte]

    __
    Statistik. Erfassen und Verarbeitung von Zählungen von bestimmten Merkmalen an bestimmten Merkmalsträgern an bestimmten Orten zu bestimmten Zeiten unter bestimmten Bedingungen. > Deskriptive S., > schließende S.. > Querschnitts-S., > Längsschnitts-S..
    __
    Statistik, deskriptive. Sie beschränkt sich auf die Erfassung und Beschreibung statistischer Kennwerte; nicht selten die ehrlichste und letztlich oft aussagestärkste Form der Statistik.
    __
    Statistik, mathematische. Hochentwickelte, komplizierte, umfangreiche und spezialisierte mathematische Fundierung der Statistik. Für mathematische Laien teilweise sehr schwer bis gar nicht verständlich, besonders was die Anwendung und auch den wirklichen Nutzen bezüglich vieler Annahmen betrifft. Teilweise kann man den Eindruck gewinnen, dass sich die Aussagen nur in virtuellen Welten jenseits unserer Wirklichkeit bewegen. Viele ausgearbeitete Modelle beruhen auf Voraussetzungen, die - besonders in der sozialwissenschaftlichen Forschungspraxis - nicht erfüllt werden (Intervallniveau der Daten, Normalverteilung, Zufallsauswahl, Parameterkonstanz). Eine wirklich konsequente Anwendung der Mathematik würde wahrscheinlich mehr als 90% der Veröffentlichungen gar nicht zulassen.
    __
    Statistikpakete/ Statistikprogramme.
    __
    Statistik, schließende. > Inferenzstatistik. Die schließende Statistik macht Aussagen - teilweise auch sehr fragwürdige oder nichtssagende wie z. B. "signifikant" - über die Bedeutung der deskriptiv erhaltenen Kennwerte mit Hilfe statistischer Modellannahmen.
    __
    Statistische Kennwerte sind z. B. Median, Quartile, Minimum, Maximum, Spanne; Mittelwert (Typ), Standardabweichung; relative Häufigkeiten, Quantile, Prozentränge, Verteilung und Verteilungskennwerte (z. B. Schiefe, Exzess, Gipfel); Stichprobe, Stichprobenumfang; Population; Erhebungszeitraum; Reliabilität und Validität, Sensitivität und Spezifität; cut-off Werte mit  Erläuterungen und Begründungen. Hinzu kommen besonders bei psychologischen Tests auch abgeleitete Normen wie z. B. z-Werte = (Rohwert - Mittelwert) / Standardabweichung, Stanine oder T-Werte.
    __
    Statistisches Paradigma. In der üblichen, an mathematischer Wahrscheinlichkeitstheorie und Statistik orientierter Einstellung geht man oft  - Ausnahme z.B. voraussetzungsreiche Varianzanalyse - von einem Wahrscheinlichkeitsraum- und Modell aus, in dem die Parameter zufällige Prozesse festgelegt werden. In den empirischen Wissenschaften geht es aber gewöhnlich um systematische Einflüsse, bei denen der Zufalls zwar auch eine Rolle spielt, aber eben nur eine Rolle. Ein empirisch orientiertes statistisches Paradigma muss also von einem grundlegende anderen Ansatz ausgehen, nämlich von der paradimatischen Grundgleichung E = f( S, Z). Ergebnisse (E) von Beobachtungen oder Experimenten führen zu Hypothesen, wie diese Ergebnisse erklärt werden können. Das grundlegende statistische Paradigma sieht vor, dass es systematische (S) und zufällige (Z) Einflüsse gibt. Es stellt sich für den Statistiker daher immer das Problem, zu entscheiden, welcher Anteil der Ergebnisse auf systematische Einflussgrößen (S) und welcher Anteil auf zufällige Einflüsse (Z) in welchem Wirkungszusammenhang (f)  zurückgehen, also erklärt werden können.
    ___
    Statistische Schlussweisen.
    Dieter Rasch (1978, S. 193-243) beschreibt im 7. Kapitel  "Statistische Schlußweisen" seines Buch folgende:

      7.1  Grundgesamtheit und Stichprobe  (S. 193).
      7.2. Formen des induktiven Schüeßens (S. 198).
      7.2.1.  Bayessches Vorgehen  (S. 199)
      7.2.2.  Empirisches Bayessches Vorgehen  (S. 201)
      7.2.3.  Fiduzialkonzept (S. 202)
      7.2.4.  Klassisches Vorgehen (Häufigkeitsvorgehen) (S. 203)
      7.3.   Parameterschätzung  (S. 206)
      7.3.1.   Wünschenswerte Eigenschaften von Schätzfunktionen (S. 206)
      7.3.2.   Maxiinum-Likelihood-Methode  (S. 217)
      7.3.3.   Methode der kleinsten Quadrate   (S. 219)
      7.3.4.   Minimums-Méthode  (S. 222)
      7.4.  Konfidenzbereiche  (S. 224)
      7.5.  Statistische Tests  (S.228 )
      7.6.  Beziehungen der Statistik zur Spiel- und Entscheidungstheorie  (S. 238)
      7.6.1.   Spieltheorie  (S. 239)
      7.6.2.   Statistische Entscheidungstheorie (S. 241)
    __
    Stichprobe. Teil eines Ganzen. Meist ist angestrebt, dass der Teil das Ganze repräsentieren soll und der Teil fürs Ganze stehen kann (pars pro toto). Hierbei entsteht gewöhnlich ein Stichprobenfehler.
    __
    Stichprobenauswahlverfahren. Der Sinn einer Stichprobe ist die Repräsentativität für eine Gesamtheit.
    __
    Stichproben-Kennwerte. Auch Stichprobencharakteristik. Zu jeder wissenschaftlichen statistischen Normwert-Angabe gehören ihre Bedeutung und die charakteristischen Kennwerte, sowie die Bezugsgruppe, d. h. die Stichprobe, Zusammensetzung der Stichprobe, das Auswahlverfahren und die Population, der Zeitraum der Erhebung, die Größe der Stichprobe und der Population. Genau diese Angaben werden von der Labormedizin so gut wie nie ausgewiesen (Stand 10/ 2007).
    __
    Stichprobenumfang. Anzahl der Messobjekte in der Stichprobe.
    __
    subjektive Wahrscheinlichkeitstheorie. Eine gewisse Nähe gibt es zur Nutzen- und Entscheidungstheorie.
    Vertreter (Auswahl): Bayes, de Finetti, Fishburn, Kleiter, Ramsey, Savage, Wieckmann.
    __
    Stationär, Stationarität: Parameter-Konstanz. Meist selbstverständlich vorausgesetzte, tatsächlich aber nicht unproblematische Annahme.
    __
    Stetig. Grundlegender mathematischer Begriff mit der alltagssprachlichen Bedeutung einen fortgesetzten Ununterbrochenen, ohne Lücke. Gegensatz diskret.
    __
    Stichprobe: Auswahl eines Teiles von einem Ganzen.
    __
    Stochastik.
    __
    Summen-Score-Funktion. Die blosse Anzahl im Sinne des positven Kriteriums bearbeiteter (meist "gelöster") Aufgaben dient als (Ausgangs-) Maß für eine Ausprägung.
    __
    Syllogismus, statistischer. Wenn a aus A mit p1 m zeigt, dann sagt man, a habe mit der Wahrscheinlichkeit p1 das Merkmal m.
    Wenn a aus A mit p1 m zeigt und und a aus B mit p2 m zeigt und p1 ungleich p2 ist, dann gibt zwei unterschiedliche Wahrscheinlichkeitsaussagen bzeüglich der Merkmalszuordnung m. Viele WissenschaftstheortietikerInnen sehen hier einen Widerspruch. Ich kann hier aber keinen sehen. Nicht, wenn  A und B verschiedene Stichproben oder schon gar nicht, wenn A und B aus verschiedenen Popualtionen stammen.
    ___
    Test: Kontrolliertes und fundiertes Prüfverfahren mittels einer Stichprobe und Kennwerten. Stichprobe zur - meist quantitativen - Schätzung eines Sachverhaltes. Ein Fahrtest ist eine Stichprobe aus dem Fahrverhalten einer Person. Aus der Fahrprobe schließt man auf die technische Kraftfahreignung.
    __
    Testen: Kontrolliertes und fundiertes Prüfen mittels einer Stichprobe und Kennwerten
    __
    Testgütekriterien. > Objektivität, > Reliabilität, > Validität, > Utilität, > Ökonomie.
    __
    Teststärke (Power). "Die Teststärke gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer spezifischen Alternativhypothese H1 (z. B. „Es gibt einen Unterschied“) entscheidet, falls diese richtig ist. (Die abzulehnende Hypothese wird H0, die Nullhypothese genannt.). Die Teststärke hat den Wert 1-?, wobei ? die Wahrscheinlichkeit bezeichnet, einen Fehler 2. Art zu begehen." [W071027]
    __
    Testtheorie: Theorie zur Konstruktion, Auswertung und Beurteilung von Tests.
    __
    Transformation. Umwandlung von Werten, z. B. y = ax + b. Hierbei kann es sehr wichtig sein, die Relationentreue zu wahren. Achtung: In der Psychologie gibt es sehr merkwürdige Transformationen, die, bei Lichte betrachtet, Datenfälschungen sind, wenn z. B. nicht normalverteilte Rohwertdaten in Quantile gewandelt und dann so zurückgerechnet werden, als ob sie normalverteilt wären (z. B. fragwürdiges McGall-Verfahren). Das gilt auch für die meisten Faktorenanalysen, weil die Kommunalitätsmatrizen den ursprünglichen Korrelationsmatrizen nicht mehr ähnlich sind.
    __
    Transparenz. Klarheit, Durchsichtigkeit, Verständlichkeit, Nachvollziehbarkeit.
    __
    T-Werte. T = 50 + z.

    Unsicherheit. Das Leben und die meisten Entscheidungen, die es abverlangt, sind mit Unsicherheit verbunden. Diese  Unsicherheiten ab- und einschätzen können, ist ein vielfaches und bedeutsames Anliegen von Wissenschaft und alltäglicher Praxeologie.
    __
    Unterscheiden. Grundlegende kognitive Funktion. Eng verbunden mit vergleichen.
    __
    Utilität. Nutzen, Wert eines Tuns. Aufwands-Ergebnis-Verhältnis. [> Ökonomie.]
    __
    Validität. Maß für die Erreichung eines Ziels durch bestimmte Methoden.
    __
    Varianz. Streuungsmaß. Quadrat der Standardabweichung.
    __
    Varianzanalyse. Untersuchungsverfahren, das die Einflüsse von Bedingungen auf statistische Kennwerte durch Analyse der Mittelwerte und Varianzen erforscht. [W]
    __
    Variation. Variante, andere Realisation. Wertneutraler Begriff im Unterschied zur Abweichung. Statistisch meist mit der Varianz, Standardabweichung oder einem anderen Streuungsmaß erfasst. > sexuelle Variationen.
    __
    Vergleichen := elementares geistiges Handeln, Grundprinzip jeder Messung. Eng verbunden mit unterscheiden.
    __
    Verteilung. Häufigkeit oder Ausprägung von Werten nach geordneten Kriterien. Meist wird die Häufigkeit an der Ordinate und an der Abszisse meist die Zeit.
    __
    Verteilungsfunktionen. [W, Liste] Sie geben die Summe von Wahrscheinlichkeiten bis zu einer Grenze k an. Bei diskreten Verteilungen z.B. der ProzentRANG, bei stetigen oder kontinuierlichen Verteilungen wie z.B. der Normalverteilung ist es die Ogive.

    • Merz: Zusammenstellung wichtiger Dichte- und Verteilungsfunktionen: * Binomialverteilung * Exponentialverteilung * Erlangverteilung  * Normalverteilung  *  Hjorthverteilung * Weibullverteilung *
    __
    Verteilungsannahmen. Es gibt beliebige Verteilungen. Die meisten parametrischen Tests setzen aber bestimmte Verteilungsannahmen, z. B. normalverteilte Daten voraus. Dort, wo mit Verteilungsannahmen gerechnet wird, müssen diese natürlich angegeben werden. Ebenso wichtig ist, die Verteilungsannahmen zu begründen und zu prüfen.
    __
    Verteilungskennwerte (z. B. Median, Mittel, Streuung, Schiefe, Exzess, Gipfel, Verlauf).
    __
    Vertrauensintervall (Konfidenz). [W]
    __
    Vieldeutigskeitssatz.
    • Für Korrelationskoeffizienten (Sponsel 1984, S. 213)
    • Das Simpsonsche "Paradoxon" zeigt auch die Gültigkeit für bedingte Wahrscheinlichkeiten.
    Vermutlich gilt allgemein: Ein Zusammenhang zwischen Variablen a und b, bedeutet den Zusammenhang zwischen a und und b und der mit a und b verbundenen Variablen, d.h. spaltet man die Einflußvariablen auf - etwa durch auspartialisieren - , ergeben sich womöglich ganz andere - und auch widerspruchsvolle - Zusammenhänge. Damit stellt sich natürlich die Frage, was statistische Zusammenhänge überhaupt bedeuten. Das Problem ist derzeit (2009) nicht nur nicht geklärt, sondern bei nicht wenigen Statistiker- und MethodologInnen noch gar nicht angekommen.
    __
    Voraussetzungen. Bestimmte Verfahren erfordern bestimmte Voraussetzungen, die oftmals nicht ausdrücklich genannt werden, z. B. Normalverteilung, Intervallskalenniveau, Zufallsauswahl, Parameterkonstanz über die Zeit, Raum und Bedingungen hinweg. So sind z. B. die Schulnoten auf Ordinalniveau und damit ist die arithmetische Mittelwertsbildung unzulässig, weil hierfür mindestens Intervallskalenniveau erforderlich ist.
    __
    w := Hier Zeichen für gedachten wahren Wert bei einem Messvorgang. Der wahre Wert ist grundsätzlich unbekannt und muss geschätzt werden, hier durch r := Näherungswert für w.
    __
    Wahrscheinlich, Wahrscheinlichkeit. Mehrdeutiger Grundbegriff der Wahrscheinlichkeitstheorie (subjektiver und  objektiver Wahrscheinlichkeitsbegriff). Ähnlich wie der wahre Wert ist die Wahrscheinlichkeit eines Ereignisses letztlich unbekannt. Als beste Näherungsschätzung wird in der Statistik meist die relative Häufigkeit eines Ereignisses für den Wahrscheinlichkeitsparameter genommen, wobei sich gewöhnlich für den Fall unendlich vieler Realisationen - die in praxi natürlich nicht möglich sind - die Identität von Näherungs- und wahrem Wahrscheinlichkeits-Wert ergibt. Praktisch heisst das: je größer der Stichprobenumfang oder je mehr Messungen vorliegen, desto mehr nähert sich der empirische Wert dem wahren Wert an. In der Mathematik gilt dieser Grundbegriff seit der Axiomatisierung 1933 durch Kolmogorov geklärt. Überblick zu den verschiedenen Wahrscheinlichkeitsbegriffen: [1, 2, 3,].
    __
    Wahrscheinlichkeit, bedingte. p(A|B), d.h. die Wahrscheinlichkeit für das Ereignis A unter der Bedingung B. Wichtiger Grundbegriff. Genau betrachtet kann es gar keine "unbedingte" Wahrscheinlichkeit geben. Wenn daher allgemein von "unbedingter" Wahrscheinlichkeit gesprochen wird, so heißt das meist nur, dass nicht angegeben oder gewusst wird, unter welchen Bedingungen eine Wahrscheinlichkeitsaussage gilt.
    __
    Wahrscheinlichkeitsfunktion. Ordnet dem Wert eine diskreten Zufallsvariable eine Wahrscheinlichkeit zu. Bei stetigen oder kontinuierlichen Werten von Zufallsvariablen spricht man von Dichtefunktion, die einem Intervall eine Wahrscheinlichkeit zuordnet..
    __
    Wahrscheinlichkeitsmodell. Z. B. Urnenmodell mit oder ohne Zurücklegen.
    __
    Wahrscheinlichkeit, objektive. [ > relative Häufigkeit]
    Die "objektive" Wahrscheinlichkeitstheorie sucht unter bestimmten Annahmen (Modellen), andere Annahmen auf ihre statistische Schlüssigkeit hin zu überprüfen, was sich nicht selten in völlig nichtssagenden Signifikanzaussagen erschöpft. Grundlage ist die Laplace Definition der Wahrscheinlichkeit als Bruch aus der Anzahl der günstigen Fälle durch alle möglichen Fälle. Eine Axiomatisierung gelang 1933 Kolmogoroff.
    __
    Wahrscheinlichkeit, subjektive. [> Bayes]
    __
    Wahrscheinlichkeit, totale.
    __
    Welten.
    __
    Wert. > Größe, Zufallsgröße. 1) Zahlenwert im Rahmen einer Messung. W = f(F1, F2, ..., Fi, ...  Fn), f(Z1, Z2, ..., Zi, ...  Zn), wobei F hier kausale, korrelative und Z "zufällige" Einflüsse bedeuten sollen. 2) anderer Wert, den ein Sachverhalt relativ für einen Bewertenden hat (z. B. Wind für einen Segler, Regen für einen Bauern, Musik und Alkohol für einen Feiernden). [> werten]
    __
    Wert, richtiger. Beste bekannte empirische Näherung an den gedachten wahren Messwert.
    __
    Wert, wahrer. Idee, dass ein Zustand oder Merkmal zum Zeitpunkt der Messung einen wahren Messwert hat, den es "bestmöglich" zu schätzen gilt. Fiktive Größe und nicht immer hinreichend klare Vorstellung, repräsentier- oder schätzbar. Beispiel: Zu messen sei das Volumen einer Streichholzschachtel. Hierbei wird man mehrfache Messfehler begehen. Einmal weil die Ausdehnungen (Länge, Breite, Höhe) nicht streng starr geradlinig sind. Zum andern weil man in aller Regel bei jeder Messung auch Messfehler macht. Trotzdem ist hier die Idee, dass die Streichholzschachtel zu einem bestimmten "Zeitpunkt" - einen fiktive und genau betrachtet unklare Vorstellung - einen wohlbestimmten Volumenwert hat, plausibel und intuitiv unmittelbar einsichtig.
    __
    Wertzuweisung. Bestimmten Sachverhalten können Werte zugewiesen werden, z. B. "nützlich für ...", "gesund", "krank", "Symptom für x". Die Wertzuweisung kann mehr oder minder begründet und methodisch ausgewiesen sein oder willkürlich, "per fiat" nach gutem Glauben oder Fachkompetenz erfolgen.
    __
    Wette.
    __
    Wissenschaftliches Arbeiten.
    __
    Würfelspielparadoxon. Székely (1990, S. 12)
    __
    x := Hier Zeichen für einen empirischen Messwert.
    __
    Zahlen.
    __
    Zeit. Wichtiger, doch letztlich bezüglich seiner Bedeutung oft sehr unklarer Grundbegriff in der Statistik. > Die Zeit als Variable.
    __
    Zeitpunkt. Fiktive und - genau betrachtet mitunter - problematische Vorstellung einer "Momemtaufnahme". Tatsächlich dürfte in den meisten Fällen der "Moment" nur ein ungefähres Zeit-Intervall bzw einen "Zeitraum" bedeuten. Beispiel: "Tages-Temperatur". Ein "Tag" besteht aus 8-24 Stunden (Arbeitstag, astromischer Tag einschließlich der Nacht), 1440 Minuten oder 86400 Sekunden. Die Temperatur dürfte im Regelfall über die Zeiten schwanken; zudem hängt sie auch vom Ort der Messungen ab.
    __
    Zeitreihenanalyse.
    __
    Zensus (Census). Bevölkerungsdaten.
    __
    Zentraler Grenzwertsatz. (ZGWS) Günter Menges (1972, S. 249) teilt hierzu mit: "1. Das Modell
      Wie erklärt es sich, daß immerhin doch viele vom Zufall beeinflußte Phänomene der unbelebten Natur der Normalverteilung gehorchen? Die Antwort auf diese Frage, die überhaupt erst die Normalverteilung aus dem Kreis ihrer Schwestern (§ 51) heraushebt, wurde erst im Jahre 1901 gefunden, obwohl sie Laplace schon vermutet hatte. Die Antwort ist der zentrale Grenzwertsatz; er wurde von Ljapunoff gefunden und bewiesen, seitdem von zahlreichen Autoren verallgemeinert und modifiziert.
      Das Modell, das diesen Satz so eminent wichtig für die Praxis werden läßt, ist das folgende :
      1.  Gegeben ist eine Erscheinung, die von einem Komplex zahlreicher Faktoren beeinflußt, beherrscht, determiniert wird.
      2.  Jeder einzelne Faktor des Komplexes übt nur eine sehr kleine Wirkung aus ; für sich allein genommen ist seine Rolle praktisch vernachlässigbar.
      3.  Jedem einzelnen Faktor wird eine Zufallsvariable Xi (i = l, 2, ..., n) zugeordnet.
      4.  Es ist nicht bekannt, wieviel Zufallsvariablen (und damit Faktoren) beteiligt sind.
      5.  Es ist nicht bekannt, wie die einzelnen Xi verteilt sind.
      6.  Man weiß indessen (oder nimmt an), daß die Xi (und damit die Faktoren) sich gegenseitig nicht beeinflussen."
    Es ist sehr fraglich, ob die Bedingungen 2 und 6 in der Forschungs-Realität erfüllt sind. Jedenfalls wäre überall dort, wo der ZGWS angewendet oder benutzt wird, zu begründen, warum und wie genau die Bedingungen 2 und 6 erfüllt sein sollten. Eine solche Diskussion findet gewöhnlich in der Statistikanwendung und -ausbildung nicht statt.
    __
    Zufall. (Welt der Möglichkeiten) Sehr schwieriger, mehrdeutiger und möglicherweise widerspruchsvoller Begriff. Subjektive Bedeutungen: (1) Im einzelnen nicht vorhersagbar (Münzwurfergebnis). (2) ein Ereignis geschieht relativ zu einem Betroffenen nicht absichtsvoll (beim Wähnen, Eigenbezug und im Wahn gestört: hier hat u. U. alles Absicht oder Bedeutung). (3) Regellos, chaotisch, willkürlich.
    __
    Zufallsgröße, Zufallsvariable. Unklarer Grundbegriff der Wahrscheinlichkeitstheorie. Im engeren Sinne hängt der Wert einer Zufallsvariable ausschließlich von einem Zufallsmodell ab (z.B. Würfel, Urnenmodell). Im weiteren Sinne der empirischen Wissenschaften, gilt für die allermeisten Größen oder Variablen: W = f(F1, F2, ..., Fi, ...  Fn), f(Z1, Z2, ..., Zi, ...  Zn), d.h. sie ergeben sich aus beinflussenden Faktoren F1, F2, ..., Fi, ...  Fn und zufälligen Einflüssen Z1, Z2, ..., Zi, ...  Zn.
        Meschkowski definiert:

    Zum Verständnis braucht man den Begriff der normierten Boolschen Algebra. Zunächst die Boolsche Algebra:

    Und schließlich:

    __
    Zuverlässigkeit. > Reliabilität. In der psychologischen Testtheorie meist Messgenauigkeit.
    __
    z-Werte = (Rohwert - Mittelwert) / Standardabweichung.
    __



    Literatur (Auswahl)
    Siehe bitte auch Literaturliste Bayes, Diskriminanzanalyse, Faktorenanalyse, Irrtum, Fehler, Betrug, Kommunalität, Korrelation, Laborwertnormen, Metaanalysen, Numerisch instabile Matrizen und Kollinearität in der Psychologie, ProzentRANG, Signifikanztest, Simpson's Paradox, Statistikpakete, Zeitreihen, ..., ...
     
    • Bagdonavicius, V., Kruopis, J., Nikulin, M.S. (2011). Non-parametric tests for complete data.  ISTE&WILEY: London&Hoboken..
    • Bamberg, Günter (1972). Statistische Entscheidungstheorie. Würzburg: Physica.
    • Borovcnik, M. (1984). Was bedeuten statistische Aussagen. Schriftenreihe für Didaktik der Mathematik. Wien: Hölder-Pichler-Tempsky.
    • Bullen, P. S. (2003). Handbook of Means and Their Inequalities. O?: Kluwer Acad. Pub.  ISBN 1-402-01522-4.
    • Clauss, Günter & Ebner, Heinz (1970), Grundlagen der Statistik. Für Psychologen, Pädagogen und Soziologen. Frankfurt: Deutsch.
    • Cohen, J. (1969 ff). Statistical power analysis for the behavioral sciences. New York, NY: Academic Press.
    • Corder, G.W. & Foreman, D.I. (2009) Nonparametric Statistics for Non-Statisticians: A Step-by-Step Approach, Wiley.
    • Dewdney, Alexander K. (1998).  Alles fauler Zauber ?, Basel: Birkhäuser.
    • Fisher, R.A. (1925). STATISTICAL METHODS FOR RESEARCH WORKERS. Edingburgh: Oliver And Boyd. [Online]
    • Garry, R. C. (1947). Testing for normality. Biometrika 34, 209-242.
    • Gibbons, Jean Dickinson and Chakraborti, Subhabrata (2003) Nonparametric Statistical Inference.
    • Gigerenzer, Gerd (2002). Das Einmaleins der Skepsis. Über den richtigen Umgang mit Zahlen und Risiken. Berlin: Berlin.
    • Grawe, Klaus (1991). Über den Umgang mit Zahlen. In: Grawe et al. (1991, Hrsg.). Über die richtige Art Psychologie zu betreiben. Göttingen: Hogrefe. S. 89-105.
    • Grimm, H (1960). Transformation von Zufallszahlen. Biometrische Zeitschrift, Bd.2, 164-182.
    • Hake, A. (2001). Was sagen gruppenstatistische Kennwerte über den Einzelfall aus? (Materialien für Lehre, Aus- & Weiterbildung 24). Landau: Verlag empirische Pädagogik.
    • Hake, Alexandra (2002). Trugschlüsse in der Statistik im Spannungsfeld zwischen Aggregat und Einzelfall. Eine Bestandsaufnahme und kritische Evaluation. Lengerich [u.a.]: Pabst Science Publisher.
    • Hettmansperger, T. P.; McKean, J. W. (1998). Robust nonparametric statistical methods. Kendall's Library of Statistics. 5 (First ed.). London: Edward Arnold.
    • Horst, Paul (1963). Matrix Algebra for Social Scientist. New York: Holt, Rinehart and Winston.
    • Huff, Darrell (1954, 1973f). How to Lie With Statistics. Penguin.
    • Jecklin, H. (1949). Versuch einer Systematik des mathematischen Mittelwertbegriffs. Commentarii Mathematici Helvetici, Vol. 22, 1. Basel: Birkhäuser.
    • Kolmogoroff, A. (1933). Grundbegriffe der Wahrscheinlichkeitsrechnung. Berlin: Springer. Nachdruck 1973.
    • Kotz, S. & Johnson, N. (1982-1989, Ed.). Encyclopedia of Statistical Sciene.  Vol. 1-10. New York: Wiley.
    • Krämer, Walter (1991). So lügt man mit Statistik. Frankfurt: Campus.
    • Krämer, Walter (1996). Denkste! Trugschlüsse aus der Welt des Zufalls und der Zahlen. Frankfurt: Campus.
    • Matlab: Statistcs Toolbox.
    • Menges, Günter (1972). Statistik 1 Theorie. Opladen: Westdeutscher Verlag.
    • Mises, Richard von (196, 4.A. 1972). Wahrscheinlichkeit, Statistik und Wahrheit. Wien: Springer.
    • Most, Otto (1955). Allgemeine Statistik. Baden-Baden: Lutzeyer.
    • Müller, P.H. (1970, Hrsg.). Lexikon Wahrscheinlichkeitsrechnung und mathematische Statistik. Berlin: Akademie.
    • Ortlieb, Claus Peter (2005). Die Zahlen als Medium und Fetisch. In: Schröter, J. / Schwering, G. / Stäheli, U.  (2006). Media Marx. Ein Handbuch, 153 - 167.  Bielefeld: transcipt.
    • Piattelli-Palmarini, Massimo (dt. 1997, ital. 1993). Die Illusion zu wissen. Was hinter unseren Irrtümern steckt. Reinbek: Rowohlt.
    • Randow, Gero von (1992). Das Ziegenproblem. Denken in Wahrscheinlichkeiten. Reinbek: Rowohlt.
    • Rasch, Dieter (1978). Einführung in die mathematische Statistik. Bd. I. Wahrscheinlichkeitsrechnung und Grundlagen der mathematischen Statistik. Berlin: VEBdWiss.
    • Revenstorf, Dirk (1980). Faktorenanalyse. Stuttgart: Kohlhammer.
    • Rößler, Irene & Ungerer, Albrecht (2010). Statistik für Wirtschaftswissenschaftler. Wprzburg: Physica-Verlag.  Hierzu als PDF im Netz:  Kommentierte Formelsammlung der deskriptiven und induktiven Statistik für Wirtschaftswissenschaftler.
    • Rumsey, Deborah (dt. 2004). Staistik für Dummies. Weinheim: Wiley-VCH.
    • Rumsey, Deborah (dt. 2007). Wahrscheinlichkeitsrechnung für Dummies. Weinheim: Wiley-VCH.
    • Siegel, Sidney (1956): Nonparametric Statistics FOR THE THE BEHAVIORAL SCIENCES. New York, Toronto, London: McGraw-Hill. Deutsche Übersetzung 1976 bei der Fachbuchhandlung für Psychologie, Frankfurt am Main.
    • Sponsel, R. (1994). Numerisch instabile Matrizen und Kollinearität in der Psychologie. Ill Conditioned Matrices and Collinearity in Psychology. Zweisprachig. Ins Englische übersetzt von Agnes Mehl. Mit einem Beitrag (Kap. 6) von Dr. B. Hain: Bemerkungen über Korrelationsmatrizen. Erlangen: IEC Verlag.
    • Sponsel, R. (2005). Fast- Kollinearität in Korrelationsmatrizen mit Eigenwert-Analysen erkennen Ergänzungsband - Band II zu Numerisch instabile Matrizen und Kollinearität in der Psychologie.
    • Statistiklabor. Statistikprogramm.
    • Stegmüller, Wolfgang (1969). Statistische Erklärungen. Deduktiv-nomologische Erklärungen in präzisen Modellsprachen. Offene Probleme. Studienausgabe Teil 5: Probleme und Resultate der Wissenschaftstheorie und analytischen Philosophie Bd. I. Wissenschaftliche Erklärung und Begründung.
    • Stegmüller, Wolfgang (1973). Statistische Begründung. Statistische Analayse. Das Repräsentationstheorem von de Finetti. Metrisierung qualitativer Wahrscheinlichkeitsfelder. Studienausgabe Teil E: Probleme und Resultate der Wissenschaftstheorie und analytischen Philosophie Bd. IV. Personelle und Statistische Wahrscheinlichkeit.
    • Stelzl, Ingeborg (1982). Fehler und Fallen der Statistik. Für Psychologen, Pädagogen und Sozialwissenschaftler. Bern: Huber.
    • Sweschnikow, A.A.S. (1970, Hrsg.). Wahrscheinlichkeitsrechnung und Mathematische Statistik in Aufgaben. Leipzig: Teubner.
    • Székely, Gábor J. (1990). Paradoxa. Klassische und neue Übersetzungen aus Wahrscheinlichkeitsrechnung und mathematischer Statistik. Frankfurt aM.: Deutsch.
    • Wasserman, Larry (2007) All of nonparametric statistics.  Springer. .
    _



    Links (Auswahl)
     
    • Fehlurteile und Missverständnisse: Gerd Gigerenzer und der richtige Umgang mit Zahlen. Für die Interpretation eines Gutachtens ist vor allem die Form, in der es dargestellt wird, von Bedeutung. Daher gilt für Gerd Gigerenzer: Um Fehlschlüsse zu vermeiden, sollten statistische Informationen besser und verständlicher kommuniziert werden. Falsche Auslegung von Statistiken kann fatale Folgen haben: für die eigene Gesundheit, die eigene Freiheit oder auch das Bankkonto. Experten wie Laien sind häufig nicht in der Lage, statistische Informationen richtig zu verstehen. http://www.zdf.de/ZDFde/inhalt/25/0,1872,2054489,00.html.
    • Engineering Statistics Handbook.
    • Lügen mit Statistik.
    • Statistiklabor der Uni Berlin (Schlittgen)
    • Denkfallen und Paradoxa.


    IP-GIPT Links:

    • [R. Sponsel: Der Signifikanztest in der Wissenschaft, Psychologie, klinischen und Psychotherapieforschung. Szientismus zwischen numerologischer Esoterik, Gaukeln und Betrug?]
    • [R. Sponsel: Partielle Korrelationen.]
    • [R. Sponsel: Das Bayes'sche Theorem].
    • [Reader zu den Grundlagen der Statistik: Günter Bamberg: Verschiedene Auffassungen von Statistik und die Auffassung der statistischen Entscheidungstheorie.]
    • [R. Sponsel: Statistik-Pakete - Methodische Anforderungen. Kriterien Checkliste ("TÜV") für Statistik-Pakete.]
    • [R. Sponsel: Dynamische Systeme. Ein Buchhinweis (Schiepek & Strunk).]
    • [R. Sponsel: Diskriminanzanalyse]
    • [R. Sponsel: Meta-Analyse: Was sind und was sagen Meta-Analysen aus?]
    • [R. Sponsel: Die grundlgenden Probleme und Aporie jeglicher Einzelfall- und damit Therapieforschung. Grundzüge einer idiographischen Wissenschaftstheorie. ]
    • [R. Sponsel: Allgemeine Theorie und Praxis des Vergleichens und der Vergleichbarkeit. Grundlagen einer psychologischen Meßtheorie. ]
    • [R. Sponsel: Über den Aufbau einer präzisen Wissenschaftssprache in Psychologie, Psychopathologie, Psychodiagnostik und Psychotherapie aus Allgemeiner und Integrativer Sicht (GIPT).  Operational-Konstruktive Definition psychologischer Termini. Definitionslehre der GIPT.]
    • PORTRAITS OF STATISTICIANS. [1,2,3,]
    _


    Glossar, Anmerkungen, Endnoten:
    GIPT= General and Integrative Psychotherapy, internationale Bezeichnung für Allgemeine und Integrative Psychotherapie.
    ___
    einheitswissenschaftliche Sicht. Ich vertrete die ursprüngliche einheitswissenschaftliche Idee des Wiener Kreises, auch wenn sein Projekt als vorläufig gescheitert angesehen wird und ich mich selbst nicht als 'Jünger' betrachte. Ich meine dennoch und diesbezüglich im Einklang mit dem Wiener Kreis, daß es letztlich und im Grunde nur eine Wissenschaftlichkeit gibt, gleichgültig, welcher spezifischen Fachwissenschaft man angehört. Wissenschaftliches Arbeiten folgt einer einheitlichen und für alle Wissenschaften typischen Struktur, angelehnt an die allgemeine formale Beweisstruktur.
        Schulte, Joachim & McGuinness, Brian (1992, Hrsg.). Einheitswissenschaft - Das positive Paradigma des Logischen Empirismus. Frankfurt aM: Suhrkamp.
     
    Wissenschaft [IL] schafft Wissen und dieses hat sie zu beweisen, damit es ein wissenschaftliches Wissen ist, wozu ich aber auch den Alltag und alle Lebensvorgänge rechne. Wissenschaft in diesem Sinne ist nichts Abgehobenes, Fernes, Unverständliches. Wirkliches Wissen sollte einem Laien vermittelbar sein (PUK - "Putzfrauenkriterium"). Siehe hierzu bitte das Hilbertsche gemeinverständliche Rasiermesser 1900, zu dem auch gut die Einstein zugeschriebene Sentenz passt: "Die meisten Grundideen der Wissenschaft sind an sich einfach und lassen sich in der Regel in einer für jedermann verständlichen Sprache wiedergegeben." 
    ___
    Schaefer & Blohmke (1978, S.111): "Die Mortalität ist das Ergebnis zweier voneinander unabhängiger Determinanten: der Häufigkeit einer Erkrankung und ihrer Gefährlichkeit. Das Maß der ersteren nennt man die Morbidität, eine Maßzahl, welche als Morbiditätsziffer auf 1000 Lebende der betrachteten Bevölkerungsgruppe (Altersgruppe, Geschlecht, Stadt, Land etc.) bezogen wird. Sie ist jedoch eine wenig sinnvolle Größe. Die moderne Démographie und Epidemiologie ersetzt sie daher durch die Prävalenz oder Inzidenz einer Krankheit, die ebenfalls unten definiert sind (Abschn. 4.4.5.). Der Ausdruck Morbidität wird nur noch als allgemeines Kennzeichen für Daten benutzt, welche quantitative Angaben über Krankheitshäufigkeiten machen. Je gefährlicher die Krankheit ist, desto mehr Erkrankte sterben an ihr. Die krankheitsspezifische Mortalitätsziffer ist also besonders hoch für häufig vorkommende und zugleich gefährliche Krankheiten."


    Wird gelegentlich vervollständigt, ergänzt überarbeitet - Anregungen und Kritik erwünscht

    Querverweise
    Standort: Beweis und beweisen in der Statistik.
    *
    Überblick Statistik in der IP-GIPT.
      Einführung, Überblick, Verteilerseite Beweis und beweisen
      Wissenschaft in der IP-GIPT
      Überblick: Abstrakte Grundbegriffe aus den Wissenschaften



    Wird gelegentlich vervollständigt, ergänzt überarbeitet - Anregungen und Kritik erwünscht

    Zitierung
    Sponsel, Rudolf  (DAS).Beweis und beweisen in der Statistik. Blicke über den Zaun zum Auftakt für eine integrative psychologisch-psychotherapeutische Beweislehre. Abteilung Abstrakte Grundbegriffe aus den Wissenschaften: Analogien, Modelle und Metaphern für die allgemeine und integrative Psychologie und Psychotherapie sowie Grundkategorien zur Denk- und Entwicklungspsychologie. Internet Publikation - General and Integrative Psychotherapy   IP-GIPT. Erlangen: http://www.sgipt.org/wisms/gb/beweis/b_stat.htm
    Copyright & Nutzungsrechte
    Diese Seite darf von jeder/m in nicht-kommerziellen Verwertungen frei aber nur original bearbeitet und nicht  inhaltlich verändert und nur bei vollständiger Angabe der Zitierungs-Quelle benutzt werden. Das Einbinden in fremde Seiten oder Rahmen, die die Urheberschaft der IP-GIPT nicht jederzeit klar erkennen lassen, ist nicht gestattet. Sofern die Rechte anderer berührt sind, sind diese dort zu erkunden. Sollten wir die Rechte anderer unberechtigt genutzt haben, bitten wir um Mitteilung. Soweit es um (längere) Zitate aus  ...  geht, sind die Rechte bei/m ... zu erkunden oder eine Erlaubnis einzuholen.

      Ende_Beweise in der Statistik_Überblick_Rel. Aktuelles  _Rel. Beständiges _Titelblatt_ Konzept_ Archiv_ Region_Service_iec-verlag  Mail:  sekretariat@sgipt.org__Wichtiger Hinweis zu Links und zu Empfehlungen

    kontrolliert irs am tt.mm.jj



    Änderungen
    06.02.12    Die Tricks der Margret Thatcher, die Arbeitslosenzahlen runter zu rechnen.
    02.02.12    Manipulation, tricksen, frisieren, täuschen, verdrehen, lügen, ausblenden, weglassen.
    19.01.12    Quellenhinweis paranormale Fähigkeiten testen.
    05.10.11    Link zur Seite Rangzahl.
    10.09.11    Ergänzungen Alternativhypothese, Hypothesendiskussion,  Nullhypothese, Größe.
    09.09.11    Integratives Testprinzip * Hypothesenraum * Zentraler Grenzwertsatz.
    06.09.11    Paradigma * Stat. Paradigma * Fehler * Non-parametrische Statistik * Rang, Rangzahlen, Rangtests *
    04.09.11    Ergänzungen: 1, 2.
    29.08.11    Glossar: Fiduzialkonzept, Prüfstatistik, Statistisches Paradigma, statistische Schlussweisen, Lit: Clauss & Ebner, Dieter Rasch.
    14.05.11    Überarbeitung Simpson's Paradox.
    12.05.11    Kleine Korrekturen und Literaturergänzungen.
    23.05.09    Ergänzungen zum Mittelwert.
    25.04.09    Würfelspielparadoxon erfasst und Laplace-Experiment.
    21.04.09    Grundlagen der Interpretation statistischer Daten und Modelle.
    17.04.09    Simpsons Paradoxon mit fehlender Relationstreue identifiziert.
    16.04.09    Ergänzung zu Simpsons Paradoxon.
    14.04.09    Simpsons Paradoxon. * Vieldeutigkeitssatz.
    15.12.07    Produkt-Moment (kleines, großes). * Regression, Regressionsanalyse.
    30.11.07    Aufnahme wichtiger stat. Begriff: Erwartungstreu(e Schätzung), Inferenz-Statistik, Kovarianz, Zeitpunkt; Erg. z. Wert, wahrer.
    03.08.07    Zur Genauigkeit der amtlichen Daten zum Wirtschaftswachstum.
    21.04.07    Veränderungen der Erhebung statistischer Kenngrößen 1973 und 1978 am Beispiel Verschuldung der Gemeinden.
    09.04.07    Korrektur zum 30.03.07:
    30.03.07    Beispiel MD3b: Schätzung des Gesamtschuldenstandes Nürnbergs am 31.3.1928 in Reichsmark.
    17.03.07    Tradition mehrdeutiger und daher unsinniger Auszeichnungen in der bayerischen Statistik.
    09.03.07    Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen.
    11.03.06   Linkhinweis: Lügen mit Statistik. Hinweis auf das "Statistiklabor" der Uni-Berlin (Schlittgen).
    02.11.03   Einige Ergänzungen, Kurzdefinitionen und Links im Glossar.