Internet Publikation für Allgemeine und Integrative Psychotherapie
    IP-GIPT DAS=08.09.2003 Internet-Erstausgabe, letzte Änderung 15.12.7
    Impressum: Diplom-PsychologInnen Irmgard Rathsmann-Sponsel und Dr. phil. Rudolf Sponsel
    Stubenlohstr. 20     D-91052 Erlangen  *  Mail: sekretariat@sgipt.org_Zitierung  &  Copyright

    Anfang _Beweise in der Statistik_Überblick_Rel. Aktuelles  _Rel. Beständiges  _Titelblatt_ Konzept_ Archiv_ Region_Service_iec-verlag__Wichtiger Hinweis zu Links und zu Empfehlungen

    Willkommen in unserer Abteilung Abstrakte Grundbegriffe aus den Wissenschaften (Analogien, Modelle und Metaphern für die allgemeine und integrative Psychologie und Psychotherapie sowie Grundkategorien zur Denk- und Entwicklungspsychologie), hier speziell zum Thema:

    Beweis und beweisen in der Statistik

    Blicke über den Zaun zum Auftakt für eine integrative psychologisch-psychotherapeutische Beweislehre
    aus allgemein integrativer psychologisch-psychotherapeutischer und einheitswissenschaftlicher Sicht

    Einführung, Überblick, Verteilerseite Beweis und beweisen

    von Rudolf Sponsel, Erlangen

    Hinweis: Wenn nicht ersichtlich werden (Externe Links) in runden und [interne IP-GIPT Links] in eckige Klammern gesetzt, direkte Links im Text auf derselben Seite sind direkt gekennzeichnet. In dieser Übersichtsarbeit wird das Thema im Überblick gesamtheitlich aus einheitswissenschaftlicher Perspektive dargestellt. Im Laufe der Zeit folgen weitere Ausarbeitungen.



    Inhaltsübersicht
    • Einstieg Beweis und beweisen in der Statistik.
      • Beispiele für praktisch-statistische Fragestellungen.
      • Praktisch wichtige Grundfragen an die statatistische Wissenschaft.
      • Genauere Operationaliserungen (Auswahl).
      • Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen.
        • Tradition mehrdeutiger und daher unsinniger Auszeichnungen in der bayerischen Statistik.
          • Missing Data (MD) Unterscheidungen.
          • Beispiel MD3b: Schätzung des Gesamtschuldenstandes Nürnbergs am 31.3.1929 in Reichsmark.
        • Veränderungen der Erhebung statistischer Kenngrößen 1973 und 1978 am Beispiel Verschuldung der Gemeinden.
          • Was "beweist" nun dieser wenig erfreuliche Sachverhalt?
    • Probleme.
      • Grundannahme-Paradoxie: Konstanz des Zufalls?.
      • Mathematik und Statistik.
      • [Der Signifikanztest in der Wissenschaft, Psychologie, klinischen und Psychotherapieforschung. Szientismus zwischen numerologischer Esoterik, Gaukeln und Betrug?]
      • Statistische Paradoxien und Dilemmas nach Stegmüller
      • Die Paradoxie des statistischen Syllogismus (nach Stegmüller).
      • Die Korrelations-Paradoxien.
        • [Partielle Korrelationen]
      • Multivariate Fallstricke.
        • [Kollinearität und numerisch instabilde Matrizen in der Psychologie]
        • [Einführung und Überblick. Kritik der Handhabung der Faktorenanalyse]
    • Glossar: Wahrscheinlichkeit und Statistik (Stichwortsammlung).
    • Literatur * Links * Allgemeine Querverweise.



    Einstieg Beweis und beweisen in der Statistik
    Trau keiner Statistik, die Du nicht selbst gefälscht hast * Man kann mit Statistik alles beweisen

    Diese beiden bösen geflügelten Worte aus Volk und Bildungswelt sagen eigentlich schon alles über den Zustand dieser Wissenschaft, ihrer Vermittelbarkeit und allgemeinen Anerkennung. Das ist sehr schade, weil ich denke, daß Wahrscheinlichkeit und Statistik unverzichtbare und bedeutende Errungenschaften für die Wissenschaft und Gesellschaft sind. Ohne zuverlässige Statistiken, insbesondere langer Zeitreihen über Jahrzehnte und Jahrhunderte kann es keine zuverlässige und vernünftige Analyse, Planung, Erklärung und Prognose geben. Die Amerikaner wissen und können das, Deutschland und Europa kkönnen und wissen es leider anscheinend nicht (> Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen).

    Beispiele für praktisch-statistische Fragestellungen:

    1. Wie viele Menschen umfaßt das deutsche Volk zum Zeitpunkt TT.MM.JJ?
    2. Wie gut wirkt das Medikament M bei Kranken mit der Krankheit K?
    3. Ist das Symptom S1 typisch für Störungen vom Typ T?
    4. Wie gut und treffsicher ist der Test T für die Erkennung von Störungen vom Typ X?
    5. Wie wahrscheinlich ein Sechser im Lotto?
    6. Wie hoch ist Bruttoinlandsprodukt?
    7. Ist Elektrosmog schädlich?
    8. Wer gewinnt die deutsche Fußballmeisterschaftf?
    9. Warum sinkt die [Mordstatistik] gegenüber Ausländern, obwohl mehr gealtpolitisch motiviert umgebracht werden?
    10. Wie entwickelt sich die Bevölkerungszahl?
    11. Jemand hat fünf mal nacheinander eine zwei gewürfelt. Wie wahrscheinlich ist es, daß auch der sechste Wurf eine zwei ergibt?
    12. Wie hoch ist das Erkrankungsrisiko für tbc, wenn man schon röntgenpositiv ist [Bayes]?
    13. Wie sehr wachsen die Arbeitslosen?
    14. Wie hoch ist das Risiko an AIDS zu erkranken? Wie hoch ist das Wachstum von an AIDS-Erkankten?
    15. Wie wahrscheinlich ist es, daß die Therapie T erfolgreich wird?
    16. Wie wahrscheinlich ist es, daß Fritz seine Schuhe aufräumt, wenn er nach Hause kommt, wenn seine bisherige Aufräumungszahl a und seine Nichtaufräumungszahl u ist (alle=n=a+u)?
    17. Wie oft verschlafen Menschen Prüfungstermine?
    18. Wie sicher sind Atomkraftwerke?
    19. Wie kann man verstehen, daß die Arbeitslosenstatistik fällt, obowlh immer weniger Menschen Arbeit haben?
    20. Wie wahrscheinlich ist es, daß man im Skat vier Buben auf eine Hand bekommt?
    21. Weshalb nimmt die [Arztdichte] ständig zu?
    22. Wie sicher sind die Renten?


    Wie man sieht ist das statistische Feld weit und wir tun gut daran, eine Grundordnung entlang am Thema Beweis und beweisen in der Statistik zu entwickeln.

    Praktisch wichtige Grundfragen an die statistische Wissenschaft
     

    1. Wichtige Grundbegriffe und Größen (Parameter) zur Charakterisierung zufälliger oder vom Zufall beeinflußter Prozesse (z.B. relative Häufigkeit, Verteilung).
    2. Wahrscheinlichkeiten von Ereignissen: Wie wahrscheinlich ist ein Ereignis, Merkmal oder Geschehen? Nach Pearson und Neyman wird Wahrscheinlichkeit hier als Grenzwert relativer Häufigkeiten gedeutet.
    3. Wahrscheinlichkeiten von Hypothesen ([Bayes; Entscheidungstheorie, Justiz]): Wie wahrscheinlich sind die Hypothesen H0, H1, H2, ... ?
    4. Welche Repräsentationsverfahren gibt es? Wie stellt man fest, ob und wie das Repräsentationsverfahren (z.B. Zufallsauswahl) gültig ist? Wie repräsentativ ist eine Stichprobe für die betreffende Population?
    5. Wahrscheinlichkeiten von Fehlern: Wie genau gilt eine statistische Aussage? Im statistischen Grundmodell gibt es immer drei Fehler- von den [vier Grundmöglichkeiten]: richtig positiv, falsch positiv, richtig negativ, falsch negativ.
    6. Wahrscheinlichkeiten von Gültigkeiten: wie sicher gelten unter welchen Bedingungen für wie lange statistische Aussagen? Welche Bedingungen sind für die Gültigkeit einer statistischen Aussage wichtig? [Grundannahme-Paradoxie: Konstanz des Zufalls?]
    7. [Entscheidungs- und Risikomodelle]. Man entscheidet immer, ob man will oder nicht, weil auch Nichtstun oder warten als eine Entscheidung anzusehen ist. Auch das kann falsch und folgenreich sein. Bei statistischen Entscheidungen sollten deshalb die wichtigsten Sachverhalte und ihre jeweiligen Folgen berücksichtigt werden.


    Genauere Operationalisierungen (Auswahl):

    Grundgesamtheiten
    Die betrachtete statistische Grundgesamtheit (Mase, Kollektiv) nennt man auch Population. Populationen können potentiell unendlich (alle Menschen, Münzwürfe) oder endlich (alle Magenkrebskranken der Uniklinik U im Zeitraum t) und mehr oder minder genauer bestimmt oder allgemein sein. Es ist meist sehr wichtig, sich genau darüber klar zu werden, über welche Population Aussagen getroffen werden sollen.

    Häufigkeiten
    Wie oft (h) ereignet sich E (z.B. Vulkanausbrüche, Stürme, Hitze-/ Trockenperioden/ HIV, Magenkrebs, arbeitslos, Sterbealter usw.) in einem Zeitraum t und in der sozikulturellen Umgebung u:  h(E | t,u)?
    " | t,u" bedeute unter den Bedingungen t und u. Die Beweismethode ist die Zählung. Nachdem das Zählen sehr aufwendig in Mühe, Zeit und Kosten werden kann, ergibt sich sofort die nächste Beweisfrage:

    Stichproben
    Welche Stichprobe ist wie aussagekräftig für eine Schätzung hs(E | t,u) für h(E | t,u) in der Population? Darin steckt auch: Welche repräsentativen Stichprobenziehungen gibt es?

    Verteilungen
    Je nach der Anzahl und Ausprägung der in eine Verteilung eingehenden Größen ergeben sich unterschiedliche Verteilungsdarstellungen und daher unterschiedliche Modelle für Verteilungen. Modell d-t-a(m) für t Meßzeitpunkte und a Ausprägungsgrade, z.B. 1=wenig, 2=mittel, 3=viel eines Merkmals m. Würde z.B. einmal in der Woche gemessen, wie viel es geregnet (m) hat, so ergäben sich für ein Jahr Vv=3^52 theoretische Verteilungsmöglichkeiten.

    Charakteristische Größen (Parameter)
    Im obigen Beispiel wären charakteristische Parameter z.B. die Anzahl der 1, 2 und 3 und der Perioden, wenn eine Periode z.B. aus einer gleichen Anzahl besteht. Führte man einen solchen Versuch über mehrere Jahre durch, könnte man feststellen, ob es - bezüglich zu nennender Kriterien - Veränderungen gibt, vielleicht oder auch nicht.

    Fehlerschätzungen
    Es gilt als fundamentaler Erfahrungssatz, dass alle empirischen Feststellungen mit Fehlern behaftet sind, die sich aus vielerlei Quellen zusammensetzen, ausgleichen, mindern oder verstärken (potenzieren) können. Zu einer guten empirischen Theorie und Beobachtung, gehört daher auch die Einbeziehung von Fehlern.

    Zur Genauigkeit der amtlichen Daten zum Wirtschaftswachstum
    Pressemitteilung des Statistischen Bundesamtes Nr. 307 vom 3. August 2007
    "WIESBADEN - Wie genau sind die Daten der deutschen amtlichen Statistik, speziell die der Volkswirtschaftlichen Gesamtrechnungen (VGR) zum Wirtschaftswachstum? Eine Frage, die immer wieder von Wirtschaftsforschern, Analysten und Journalisten gestellt wird.
        Berechnungen zeigen: Die laufenden Revisionen des Bruttoinlandsprodukts (BIP) liegen in einem der hohen Aktualität angemessenen und vertretbaren Rahmen. Im internationalen Vergleich gehören die vierteljährlichen deutschen BIP-Berechnungen sogar zu den besten: Nach einer Untersuchung der OECD sind die frühen Quartals-BIP-Schätzungen der Statistikämter aus Deutschland, Frankreich und Großbritannien die zuverlässigsten und genauesten, dicht gefolgt von denen für die USA, Kanada und die Niederlande.
        Dies ist umso bemerkenswerter, da Deutschland mit seiner Schnellmeldung zum vierteljährlichen Bruttoinlandsprodukt (BIP) nach nur 45 Tagen auch in punkto Aktualität zu den Spitzenreitern in Europa zählt. Seit dem Jahr 2000 hat sich die erste Veröffentlichung des BIP, unter anderem auf Drängen der Finanzwelt und des Bedarfs der EZB nach aktuelleren Daten für die Eurozone, von 65 auf nur noch 45 Tage nach Abschluss des Berichtsquartals beschleunigt.
        Mit der Veröffentlichung der von den Nutzern geforderten hochaktuellen Konjunkturdaten befindet sich die amtliche Statistik immer im Spannungsfeld zwischen Aktualität und Genauigkeit. Um möglichst frühzeitig aktuelle Zahlen veröffentlichen zu können, werden die
    Ergebnisse auf unvollständiger Datengrundlage berechnet und zum Teil geschätzt. Diese vorläufigen Ergebnisse werden kontinuierlich
    aktualisiert, wenn neue statistische Ausgangsdaten verfügbar sind. Darauf wird in einem eigenen Qualitätsbericht ausdrücklich hingewiesen."

    Aussagen und Extrapolationen



    Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen.
    Zeitreihen sind von großer Bedeutung für die Planung, Analyse, Prognose und Beeinflussung von sozio-ökonomischen Prozessen, z.B. die Erfassung der Verschuldung von Gebietskörperschaften. Voraussetzung für die angemessene Verarbeitung, Bewertung (Evaluation) der Schuldenentwicklung ist, dass die Definition der Schulden in der Zeitreihe gleich oder wenigstens vergleichbar bleibt. Falls unterschiedliche Schuldenwerte erfasst und mitgeteilt werden, ist es zwingend erforderlich, dass die Repräsentativität, Transparenz und Kontinuität der Daten gewährleistet wird. Dies ist in Deutschland seit 1995 nicht mehr der Fall, wobei sich natürlich die Frage stellt, warum die statistischen Ämter nicht für Repräsentativität, Transparenz und Kontinuität sorgen können oder wollen? Nun, es fällt auf, dass die zunehmende Intransparenz und fragliche Repräsentativität der mitgeteilten Schuldendaten durch die statistischen Landesämter einhergeht mit einer aus dem Ruder laufenden exponentiellen, zunehmend bedrohlich erscheinenderen Schuldenentwicklung auf allen Ebenen der Gebietskörperschaften, besonders auch der größeren Gemeinden (Städte und Großstädte). In Bayern beispielsweise führte das zu unklaren und unzulänglichen Veröffentlichungen [71327-001r]. Dort verwendet man z.B. Spiegelstriche " - " sowohl für "0" als auch für keine Angabe oder unbekannt ("Missing Data"); weder Definition - auch nicht deren Rechtsgrundlage - noch Repräsentativität und Kontinuität werden ausgewiesen, so dass man hier die Frage stellen muss, ob dieses verwirrende Desinformation politisch gewollt ist? [L1; L2].

    Tradition mehrdeutiger und daher unsinniger Auszeichnungen in der bayerischen Statistik
    Anmerkung: Der Unsinn der Vieldeutigkeit von Zeichen könnte - auf jeden Fall in der bayerischen - Statistik sogar Tradition haben. So wird z.B. im Statistischen Jahrbuch der Stadt Nürnberg von 1930 unten beim Inhaltsverzeichnis ausgeführt:

    Ein solches Vorgehen ist wissenschaftlich und praktisch vollkommen abzulehnen. "Nicht vorhanden"  ist etwas ganz anders als die Zahl 0 und gehört infolgedessen auch mit einem eigenen Zeichen versehen, und zwar zwingend eineindeutig und nicht "verodert" (wie z.B. in der Zeugenbefragung geboten). Die Zahl 0 ist natürlich kein fehlendes Datum, insbesondere nicht bei den Schulden, und gehört selbstverständlich zwingend als 0 ausgewiesen, wenn der Schuldenstand eben Null ist (das war in Bayern erfreulicherwiese im Jahre 2004 bei 76 Gemeinden der Fall). Folgende Fallunterscheidungen könnten hierbei sinnvoll sein:

    Missing Data (MD) Unterscheidungen
    • MD1: Zahl liegt grundsätzlich vor, ist aber noch nicht eingetroffen; mit ihr zu rechnen ist bis TT.MM.JJJJ.
    • MD2: Zahl liegt hier nicht vor, kann aber wahrscheinlich bei ... erkundet werden.
    • MD3: Zahl liegt nicht vor und ist auch nicht beschaffbar.
      • MD3a: Schätzmethoden sind derzeit nicht bekannt....
      • MD3b: Als Schätzmethode eignet sich ...


    Beispiel MD3b: Schätzung des Gesamtschuldenstandes Nürnbergs am 31.3.1929 in Reichsmark
    Im folgenden wird dargelegt, wie man den Gesamtschuldenstand - aus Mark ("Papiermark") und Reichsmark - für 1928/29 schätzen kann, wenn die einzubeziehenden Geldgrößen klar ausgewiesen oder UMrechnungsfformeln angegeben würden. Zunächst der Sachverhalt, wie ihn das Statistische Jahrbuch der Stadt Nürnberg 1930 ausweist:

    Man sieht hier zwei Werte in der Rubrik "Schuldenstand am Schlusse des Jahres", einmal in "M" ("Papiermark") und der andere in "RM" (Reichsmark), ohne dass erklärt würde, wie nun der Gesamtschuldenstand zu bilden ist. Das ist wenig verständlich, wenn man sich vergegenwärtigt, dass es sich um das Jahrbuch von 1930 handelt, also 6 Jahre nach der Hyperinflation und die tatsächlichen Verrechnungsdaten ja auf jeden Fall in der Kämmerei vorliegen müssen.

    Für das Haushaltsjahr 1928/29 wird im Verwaltungsbericht der Stadt Nürnberg, bearbeitet im Statistischen Amt und herausgegeben vom Stadtrat 1929, S. 434 ausgeführt:

    Nach diesen Mitteilungen, sollten sich Schätzungen und Umrechnungen durchführen lassen - wenn man wüsste, wie sich die einzelnen Finanzgrößen (Rückkauf 339949 RM; Umtausch mit Auslosungsrechten mit 16916156 RM und Umtausch ohne Auslösungsrechte mit 104375 RM) zu einander verhalten. Das wird aber leider nicht mitgeteilt, so dass der Gesamtschuldenstand natürlich davon abhängt, welche Größen in die Umrechnung "Papiermark" und Reichsmark eingehen. Man kann also rätseln, welcher drei hier möglich erscheinenden Gesamtschuldenstände der richtige ist:
        (1) Spielten die Umtauschgrößen keine Rolle. ergäbe sich für die Gesamtschuld am 31.3.1929 folgender Schätzungsansatz: 140092500 / 336949 = 415.7676681, also ein Verhältnis von 1 Reichsmark zu gerundet 416 Mark ("Papiermark").
        (2) Rechnet man die Umtauschgrößen mit ein, ergibt sich folgende Umrechnung: 140092500 / (336949 + 16916156 + 104375)  =  140092500 / (17357480) = 8.071016069, also ein Verhältnis von 1 Reichsmark zu gerundet 8 Mark ("Papiermark").
        (3) Es zählt nur die Gesamtschuld in Reichsmark, weil die Ablösen schon in die Summe eingerechnet wurden.
    Dies ergibt die möglichen Gesamtschuldenbeträge:
    Rechnung (1), die 140 Mill. Papiermark sind 336949 RM wert, ergäbe 88,676999 Millionen RM Gesamtschuld.
    Rechnung (2), die 140 Mill. Papiermark sind 17,357480 Mill. Reichsmark wert, ergäbe 105,697530 Millionen RM Gesamtschuld.
    Rechnung (3), es zählt nur der mitgeteilte Schuldenstand in Reichsmark, es bliebe wie mitgeteilt, 88,340050 Millionen RM Gesamtschuld.

    Veränderungen der Erhebung statistischer Kenngrößen 1973 und 1978 am Beispiel Verschuldung der Gemeinden
    Den folgenden Ausführungen aus "Statistisches Jahrbuch Deutscher Gemeinden", 66. Jahrgang, 1979, S. 438 kann man entnehmen, dass die Erfassungsmerkmale der Schulden "eine Anknüpfung an die Berichterstattung bis einschließlich 1973 (61. Jahrgang) nicht mehr zu" lassen. "Im Unterschied zu 1977 sind die Krankenhäuser nicht mehr in den Gesamtschuldenstandsbeträgen enthalten. Sie werden wie die Eigenbetriebe nachrichtlich aufgeführt."

    Was "beweist" nun dieser wenig erfreuliche Sachverhalt ?
    Nun, anscheinend ist die deutsche Statistik nicht in der Lage oder motiviert, Sinn und Notwendigkeit vergleichbarer wichtiger sozioökonomischer Daten, wie z.B. die Verschuldung einer Gemeinde, so zu begreifen, dass sie die Kontinuität der Daten auch tatsächlich sicher stellen würden. Das mag auch politisch gewollt sein, um Zusammenhänge zu verschleiern und Transparenz und Kontinuität zu behindern.



    Probleme

    Grundannahme-Paradoxie: Konstanz des Zufalls ?
    Hier gibt es zwei Aspekte: 1) daß es so etwas wie Zufallsgesetze überhaupt gibt; 2) inwiefern dies über die Zeit und Bedingungen hinweg gelten.
        In der schließenden und sog. Inferenzstatistik möchten wir nicht nur Aussagen für den Augenblick treffen, sondern auch über statistische Regelhaftighaften von Dauer etwas erfahren, wobei unklar ist, ob oder inwieweit "Zufall", Dauer und Konstanz eineinder nicht ausschließen. Wie wollen wir Regelhaftigkeiten von Dauer erkennen, wenn schon das einzelne Ereignis sehr unsicher ist und eine große statistische Ereignis-Bandbreite hat?

    Mathematik und Statistik
    Das Wesen mathematischer Statistik besteht auf der Basis einen strengen Theoriegebäudes vielfach darin, die Wahrscheinlichkeit für ein Modell M1 gegenüber einem Vergleichs- oder Kriteriums-Modell M2 oder für Annahmen A1 gegenüber anderen Annahmen A2 zu bestimmen. Das ist einerseits sinnvoll und ergiebig, etwa bei der Frage, ob ein empirischer Datensatz als normalverteilt angesehen werden darf oder nicht, andererseits sehr merkwürdig, wenn die Empirie aus einem Vergleich herausfliegt und nur noch zwei theoretische Modelle oder hypothetische Annahmen [verglichen] werden: Beispiel: der unselige [Signifikanztest], der ja, kurz und bündig formuliert, nur eine statistische Aussage unter der Annahme zuläßt, daß die Nullhypothese richtig ist. Wir testen mit dem Signifikanztest also ein virtuelles Ergebnis.
     
    Denn die gewöhnliche EmpirikerIn wird meist nicht wissen wollen, was ist, wenn die Nullhypothese richtig wäre?, sondern: ist sie anzunehmen oder nicht? Welche Hypothese ist vorzuziehen, falls eine Entscheidung möglich ist ?

    Eine EmpirikerIn interesiert sich also meist nicht dafür, ob ein Ergebnis angenommen oder verworfen werden darf, wenn die Nullhypothese richtig ist, sondern ob sie sie annehmen oder verwerfen soll. Die Gretchenfrage der empirischen Statistik lautet: Welche Hypothese ist anzunehmen, die Null- oder die Alternativhypothese. Weiß man nichts, können im Falle zweiwertiger Logik, beide Hypothesen richtig oder falsch sein, so daß vier Fälle zu unterscheiden wären. Das aber macht der Signifikanztest gerade nicht. Signifikanztesten scheint also ein gigantisches Schautheater und numerologisches Zahlenspiel zu sein, das nicht nur kaum einen Erkenntniswert hat, sondern vor allem Verwirrung stiftet. Dafür ist die mathematische Statistik anscheinend bestens gerüstet. Wissenschaft? Oder Wirrenschaft?
     
    Die großen Probleme in der Wahrscheinlichkeitsrechnung und Statistik liegen weniger in der Theorie als in der Anwendung. Es scheint so, als hätte die mathematische Statistik sich wenig um die sozialwissenschaftlichen Gegebenheiten gekümmert. Die meisten AnwenderInnen können die mathematische Statistik nicht richtig verstehen und die meisten mathematischen StatistikerInnen sind nicht in der Lage, ihre Theorien praktisch sinnvoll zu vermitteln. Theorie und Praxis driften extrem auseinander. Über weite Strecken entsteht der Eindruck, als ob nur theoretische Modell-1/ Annahme-1 gegen theoretisches Modell-2/ Annahme-2 getestet würde, wodurch wir aber nichts über die Wirklichkeit erfahren und wie wir zwischen Hypothesen entscheiden sollten.



    Statistische Paradoxien und Dilemmas nach Stegmüller

    Im großen wissenschaftstheoretischen Werk Stegmüllers finden sich mehrere Kapitel oder Abschnitte, die Wahrscheinlichkeit und Statistik

    Stegmüller (1973, S. 279-303) nennt Elf Paradoxien und Dilemmas
     

    1. (1) Die Paradoxie der Erklärung des Unwahrscheinlichen (S. 281-285), z.B. 7 mal nacheinander eine 6 zu würfeln.
    2. (2) Das Paradoxon der irrelevanten Gesetzesspezialisierung (S. 285-286), z.B. das Problem von Scheinerklärungen zufälliger Koinzidenzen, die falsch interpretiert werden (der Mond erscheint nach einer Finsternis wieder aufgrund des großen Spektakels, das man veranstaltete).
    3. (3)  Das Informationsdilemma. (S. 286-287), fehlende oder widersprüchliche Information mit unterschiedlichen Wahrscheinlichkeiten jenachdem, welche Merlmalskombination zugrundegelegt wird [Partielle Korrelation]
    4. (4) Das Erklärungs-Bestätigungs-Dilemma  (S. 287-289),
    5. (5) Das Paradoxon der reinen ex post facto Kausalerklärung (S. 289-291), Bestätigung und Erklärungen scheinen zirkulär und austauschbar verwendet werden können.
    6. (6) Das Verzahnungsparadoxon. (S. 291-295)
    7. (7) Das Erklärungs-Begründungs-Dilemma. (S. 295-298)
    8. (8) Das Dilemma der nomologischen Implikation (S. 298-299)
    9. (9) Das Weltanschauungsdilemma (S. 299-301)
    10. (10) Das Argumentationsdilemma (S. 301-303)
    11. (11) Das Gesetzesparadoxon. (S. 303) [analog Goodman-Paradoxon]




    Die Paradoxie des statistischen Syllogismus (nach Stegmüller)


    Die Korrelations-Paradoxien

    Was bedeutet ein korrelativer Zusammenhang?
    Was eine Korrelation bedeutet, weiß man nicht genau ['Schein'korrelation], es ist ein rein statistisch-artifizielles ('künstliches') Zusammenhangsmaß, das von Erhebung zu Erhebung, und sogar innerhalb einer einzigen Erhebung von Merkmalsraum zu Merkmalsraum sowohl ganz unterschiedliche Zahlenwerte als auch Bedeutungen annehmen kann. Empirisch gilt meist der Satz: je nachdem welche Variablen in die Berechnung einbezogen oder nicht eingebezogen werden, ändern sich die Korrelationskoeffizienten, und zwar möglicherweise sehr erheblich. Beweis: [Partielle Korrelationen].



    Glossar: Wahrscheinlichkeit und Statistik: Messen, Schätzen, Testen, Schliessen.  (Stichwortsammlung)
    __
    Abweichung. ... von einem Bezugs-, Norm- oder Referenzwert, z. B. die Standardabweichung als Abweichungsgröße vom arithmetischen Mittelwert.
    __
    Alpha-Fehler (Fehler erster Art). Die 0-Hypothese - z. B. A und B sind gleich -  wird verworfen, obwohl sie wahr ist.
    __
    Alternativhypothese(n):
    __
    Ausgleichsrechnung.
    __
    Auswahl, Auswahlverfahren. Vielfach können ganze Populationen nicht vermessen werden, so dass Stichprobenauswahlen erfolgen müssen. Die meisten statistischen Verfahren setzen eine Zufallsausfall voraus, wobei eine solche in den meisten Fällen nicht durchgeführt wird.
    __
    Bayes Theorem.
    __
    Beta-Fehler (Fehler zweiter Art). Die 0-Hypothese wird angenommen - z. B. A und B sind gleich - obwohl sie falsch ist.
    __
    Bedingungen. Überhaupt, aber besonder im statistischen Bereich elementarer Grundbegriff, der eine Erhebungssituation charaktersiert.
    __
    Binominalverteilung. Wahrscheinlichkeitmodell für die zwei Ergebnismöglichkeiten in n Versuchen: Ereignis tritt für jeden Versuch mit der festen Wahrscheinlichkeit p ein ("Erfolg"), Ereignis tritt für jeden Versuch mit der festen Wahrscheinlichkeit q=1-p nicht ein ("Misserfolg"), wobei Vorgänger-  und Nachfolger- Wahrscheinlichkeit voneinander unabhängig sind. Typisches Beispiel: Münzwurf mit dem Ereignis "Zahl" und "Wappen".
    __
    cut off Werte.  "ACOMED statistik" führt aus (071025):"Der Cut-Off-Wert ist der Wert in einem quantitativen diagnostischen Test, der zwischen zwei Testergebnissen (positiv, negativ) unterscheidet und damit einen Patienten einem der zwei untersuchten Krankheitszustände (z. B. krank vs. nicht krank oder Erkrankung 1 vs. Erkrankung 2) zuordnet. Dabei gibt immer einen Überlappungsbereich, in dem je nach Lage des Cut-Off-Punktes Patienten testpositiv oder testnegativ eingeordnet werden. Deshalb ist die Auswahl des Cut-Off-Punktes sorgfältig vorzunehmen. ..."
    __
    Diagnostik := Liegt ein Merkmal in dieser oder jener Ausprägung vor? Hier gibt es immer zwei Fehlerarten.
    __
    Diagnostische Fehlerarten: 1) Ein Merkmal wird zugeschrieben, obwohl es nicht zutrifft (falsch positiv). 2) Ein Merkmal wird nicht erkannt, obwohl es zutrifft (falsch negativ). Man erkennt auf eine Diagnose, obwohl sie nicht vorliegt (falsch positiv) oder man erkennt eine Diagnose nicht, obwohl sie vorliegt (falsch negativ). Dieser Fehlertyp ist universell, so z. B. auch für die Rechtsprechung: jemand wird für eine Tat verurteilt, obwohl er sie nicht begangen hat (falsch positiv) oder er wird frei gesprochen, obwohl er die Tat begangen hat (falsch negativ). Nachdem das Recht idealistisch orientiert ist und vor allem Falsch-Positiv minimieren möchte, ergibt sich zwangsläufig,  dass Falsch-Negativ maximiert wird, d. h. immer mehr intelligente und skrupellose TäterInnen kommen straffrei davon und durchsetzen die Gesellschaft.
    __
    Dichte, Dichtefunktion.
    __
    Differentialdiagnostik := was ist es hier genau, und was nicht?
    __
    Diskret. Mathematischer Grundbegriff unterbrochener ("diskontinuierlicher", "unstetiger") Meßpunkte. Wird z.B. am
    __
    Diskriminanzanalyse. Mathematisch-statistische Methode, ob und wie gut sich aufgrund gegebener Messwerte unterschiedliche Gruppen von einander trennen bzw. zuordnen oder klassifizieren lassen.
    __
    Einzelfall. Recht, Kriminologie, Medizin, Psychologie sind auch angewandte idiographische Wissenschaften, d. h. sie machen Aussagen über ein Individuum. Hierbei ist ein großes und bislang ungelöstes Problem, wie man Erkenntnisse, die für Gruppen (Aggregate) gelten, auf den Einzelfall anwenden kann > Grundzüge einer idiographischen Wissenschaftstheorie. Man bedenke, dass in unseren Praxen, Büros, Kanzleien und Gerichten keine Stichproben und Populationen Platz nehmen, sondern individuelle Menschen.> Praxeologie, > evidenzbasierte Medizin.
    __
    Entscheidbarkeit. Wichtiger mathematischer Begriff aus der Beweistheorie (Turing, Halteproblem > W).
    __
    Entscheidung. Grundlegender Begriff für alle Systeme mit Wahlmöglichkeiten. Watzlawick postulierte für den zwischenmenschlichen Bereich, dass man nicht nicht-kommunizieren könne. Übertragen kann man sagen, dass man nicht nicht-entscheiden kann, denn nichts tun, warten, nicht-entscheiden ist paradoxerweise auch eine Entscheidung.
    __
    Entscheidungstheorie.  [1 (Bamberg), ]
    __
    Epidemiologie. Inzidenz, Letalität, Morbidität, Mortalität, Prävalenz.
    __
    Ereignis. bestimmt durch Ort und Zeit (Grundbegriff).
    __
    Ereignisalgebra (Mengenlehre):
    __
    Ergodisch, Ergodizität, Ergodensätze.
    __
    Erhebungszeitraum. Zeitraum (Anfang - Ende) in dem eine Erhebung erfolgte.
    __
    Erwartungswert. Theoretisch der - immer unbekannte - wahre Mittelwert, praktisch oft der arithmetische Mittelwert als beste empirische Näherung ("richtiger Wert") für den gedachten wahren Wert.
    __
    Erwartungstreu(e Schätzung). Eine Schätzfunktion heißt erwartungstreu, wenn sie im Durchschnitt den richtigen Wert als besten Schätzer für den unbekannten "wahren" Wert liefert.
    __
    Evaluation. Den Wert einer Methode untersuchen und erweisen.
    __
    Evidenz. Offenkundig, offensichtlich, klar, banal, trivial, selbstverständlich.
    __
    Evidenz-basierte Medizin. Neuere Evaluations-Methode in der Heilkunde, die versucht, Entscheidungen durch wissenschaftliche Forschungsergebnisse zu stützen, also eine Verbindung zwischen der idiographischen (einzelfallorientierten, intra-individuellen) und nomothetischen (inter-individuell gültige empirische Gesetze und Regelhaftigkeiten) Betrachtungs- und Herangehensweise einzugehen.
    __
    Exzess := Maß für die Steilheit einer Verteilung (4. Moment).
    __
    Faktorenanalyse.
    __
    f := Hier Zeichen für Fehler. In der psychologischen Testtheorie meist mit "e" (error) bezeichnet.
    __
    Falsch negativ := ein Merkmalsträger wird nicht erkannt.
    __
    Falsch positiv =: ein Nicht-Merkmalsträger wird fälschlich als Merkmalsträger identifiziert..
    __
    Fehler. Alles menschliche Feststellen und jede Messung ist mit einem Fehler behaftet, mag er auch noch so klein sein.
    __
    Fehlerarten: Fehler können durch systematische oder zufällige Störquellen, durch die Messmethode, das Messgerät, die Eichung, Anzeige, Ablesung, Irrtümer oder bewusste Fälschung zustande kommen.
    • Fehler, absoluter. f = x - r.   [> Messfehler]
    • Fehler, relativer. f / Mittelwert
    • Fehler, systematischer. Fehlerhafte Messmethode, fehlerhaftes Gerät, fehlerhaftes Ablesen; mangelnde Kontrolle anderer Einflüsse oder Störvariablen, z. B. leichtfertiges ungeprüftes oder ungesichertes Glauben von Angaben in sehr, sehr interessegeleiteten Situationen (Prüfungen, Bewerbungen, Aufträge erringen, Aussagen vor Gericht oder der MPU).

    • Fehler, zufälliger. Schwieriger statistischer Begriff, meist negativ definiert als nicht-systematisch; klein; durch viele Faktoren bedingt und Abweichungen nach beiden Richtungen, so dass ein gewisser Ausgleich bei der Mittelwertsbildung erfolgt. [> Zufall]
        > Fehler (Genauigkeit, Reliabilität, Zuverlässigkeit):
    __
    Häufigkeit := Anzahl von Ereignissen für einen bestimmten Zeitraum.
    __
    Heteroskedastizität: ungleiche, veränderliche Varianz, Inkonstanz der Varianz.
    __
    Homoskedastizität: gleiche Varianz, Varianz Konstanz
    __
    Hypothese. Wissenschaftlicher Grundbegriff.
    __
    Intra := innerhalb eines Systems (intra-individuell).
    __
    Inter := zwischen verschiedenen Systemen (inter-individuell).
    __
    Inzidenz. Medizinstatistischer, epidemiologischer Begriff. Nach 257Psychyrembel: Anzahl der Neuerkrankungsfälle in einem bestimmten Zeitraum.
    __
    Inzidenzenrate. Medizinstatistischer, epidemiologischer Begriff. Nach 257Psychyrembel: Anzahl der Neuerkrankungsfälle in einem bestimmten Zeitraum im Verhältnis zur Anzahl der exponierten Personen. Das Psychometrische Wörterbuch (Rasch et al. 1987) führt aus: "I, Zugangs- oder Neuerkrankungsrate heißt die relative Häufigkeit bzw. Wahrscheinlichkeit des Neuauftretens einer bestimmten Krankheit in einem bestimmten Zeitraum bezogen auf den Umfang der Population, aus der die Erkrankungen hervorgingen. Die I. kann man kumulativ, d.h. auf dem ganzen Untersuchungszeitraum bezogen, oder in Form der Inzidenzdichte für einen (kurzen) bestimmten Teilzeitraum betrachten. Die Inzidenzdichte dient zum Studium der Veränderung der I. mit der Zeit, z. B. in Abhängigkeit vom Alter. Die I. wird in > Längsschnittstudien analysiert.
    ___
    IQ. Normierungseinheit der Intelligenzschätzung.
    __
    Inferenz, Inferenzstatistik. Schließende, schlußfolgernde Statistik (ergänzend zur deskriptiven, beschreibenden). Zentrale Grundidee und ein Paradigma wahrscheinlichkeitstheoretischer und statistischer Problemlösungen und Aufgaben. Beispiele: Man zieht eine Stichprobe und möchte wissen, wie repräsentativ ist diese Stichprobe für die Grundgesamtheit (Population). Man berechnet einen Wert und möchte wissen, wie gut dieser Wert den unbekannten Parameter schätzt, mit welchen Abweichungen unter diesen oder jenen Annahmen zu rechnen ist? Im Grunde genommen, haben sich Wahrscheinlichkeitstheorie und Statistik in einer eigenen unlösbaren Aufgabe (Aporie) verfangen: Wie gewinnt man Sicherheit (Wissen), wo es keine(s) gibt? Damit ist eine unendliche "Spielwiese" für die mathematische Statistik eröffnet, indem unter "bestimmten" - in Wirklichkeit unbekannten - Anahmen gewisse Annahmen gegenüber anderen Annahmen untersucht und getestet werden. Man bewegt sich weitgehend in virtuellen, fiktiven Welten, obwohl man doch etwas über die Wirklichkeit erfahren möchte. Einen hohen Wert hat allerdings die Mathematik gegenüber allen anderen Wissenschaften: sie zwingt zur Klärung der Voraussetzungen und Annahmen, die ansonsten oft oft leichtfertig und wenig (problem-) bewusst einfach unausgewiesen angenommen werden.
    __
    Kohorte.
    ___
    Kolmogoroff-Axiome.

    Quelle Kolmogoroff, A. (1933; Nachdruck 1973, S. 2).
    __
    Kollinearität: [Kollinearitätsanalyse in Korrelationsmatrizen]
    __
    Konfundiert, Konfundierung. untrennbar zusammenhängend; miterfasst. Sind zwei Merkmale M1 und M2 untrennbar miteinander verbunden, z.B. Alter und Geschlecht, so kann sich die Frage stellen, ob ein Effekt E durch das Alter, das Geschlecht, durch beides oder durch keines von beidem bestimmt ist. Die Kontrolle von miteinander konfundierten Variablen spielt in Experimenten eine wichtige Rolle. Eine Möglichkeit konfundierte Effekte im wahrsten Sinne des Wortes herauszurechnen besteht in der Nutzung partieller Korrelationsanalyse.
    __
    Kontinuität.
    __
    Korrelation. Zusammenhang. Es gibt viele Zusammenhangsmaße und damit unterschiedliche Korrelationsbegriffe, so dass immer dazu gesagt werden sollte, um welche Korrelation es sich handelt. [partielle Korrelation]. > Regression.
    __
    Kovarianz. Ko = mit. Varianz = Streuung. Mit- oder gemeinsame Streuung von zwei Datensätzen: Sxy = 1/n [Summe(xi - mx) (yi - my), wobei hier m der arithmetische Mittelwert sei. Beispiel: X=1,2,3. Y=2,3,4. mx=2;   my=3. n = 3:
    xi
    yi
    xi - mx
    yi - my
    (xi - mx) (yi - my)
    1
    2
    1-2 = -1
    2-3= -1
    (-1 * -1) = 1
    2
    3
    2-2 = 0
    3-3= 0
    (0 * 0 ) = 0
    3
    4
    3-2 = 1
    4-3= 1
    (1 * 1) = 1
    Sum=1+2+3=6
    Sum=2+3+4=9
       
    Sum=1+0+1=2
    mx=6/3 = 2
    my=9/3=3
       
    Sxy = 2/3 = 0.667

    Besonderheiten und Zusammenhänge: Kovarianzen sind nicht standardisiert (nicht normiert auf die Standardabweichung) sein. Wird mit standardisierten Werten gerechnet, ist die Kovarianzmatrix mit der Korrelationsmatrix identisch. In der schließenden (Inferenz-) Statistik wird wegegn der Erwartungstreue nicht durch n, sondern durch 1/(n-1) dividiert. Die Kovarianz steht in der Korrelationsformel nach Bravais-Pearson im Zähler.
    __
    Laborwertnormen.
    __
    Längsschnitt-Statistik (Longitudinal). Erhebung von Werten über verschiedene Zeit- bzw. Messzeitpunkte hinweg, z. B. alle zwei Monate Bestimmung der Leberwerte für die Dauer eines Jahres. > Querschnitt.
    __
    Letalität.
    __
    Likelihood.
    __
    Longitudinal > Längsschnitt.
    __
    Markovkette
    __
    Maximum-Likelihood-Methode. Von R.A. Fisher 1921 entwickeltes Verfahren zur Schätzung von Wahrscheinlichkeiten. Es wählt diejenige aus, die unter bestimmten Annahmen die größte Wahrscheinlichkeit für ein vorliegendes Resultat hat.
    __
    Median. Der Wert, der eine Messwert-Reihe in zwei Hälften teilt, z. B. 3 in:  1, 1, 2, 2, 3,  3,  3, 3, 4, 5, 5.
    __
    Mengenlehre. Nach der Mengenlehre besteht die Messwert-Reihe  "1, 1, 2, 2, 3,  3,  3, 3, 4, 5, 5"  aus 5 Elementen.
    __
    Messen, Messung. Genau beschriebenes und damit prinzipiell wiederholbares und überprüfbares Verfahren zur Feststellung einer Ausprägung. Eine Messung ist lehr- und lernbar.
    __
    Messfehler. Als allgemeiner Erfahrungssatz gilt: jede Messung ist mit einem Fehler behaftet, so das für den Messwert x, den gedachten wahren Wert w und den Messfehler f gilt: x = w + f.  Da der wahre Wert eine gedachte Konstruktion und nie bekannt ist, muss er in praxi geschätzt werden. Diesen Näherungswert nennt man auch den "richtigen" Wert r und damit gilt dann: x = r + f. Man nimmt hierfür oft den arithmetischen Mittelwert.  [> Fehlerarten.]
    __
    Messwert. Zahlenwert.
    __
    Minimum. Der kleinste Wert in einer Reihe, z. B. 1 in: 1, 1, 2, 2, 3,  3,  3, 3, 4, 5, 5.
    __
    Mikrozensus. Stichprobenauswahlverfahren.  [W]
    __
    Mittelwert ohne nähere Angabe. Meist ist der arithmetische gemeint und oft auch so erkennbar. Sicher wäre es, genau zu anzugeben, von welchem man spricht.
    __
    Mittelwert, arithmetischer. Summe aller Werte dividiert durch die Anzahl. [W]
    __
    Mittelwert, geometrischer. Besonders geeignet für Mittelwerte bei Geschwindigkeiten. [W]
    __
    Mittelwert, harmonischer. [W]
    __
    Modalwert. Der häufigste Wert in einer Reihe, z. B. 3 in:  1, 1, 2, 2, 3, 3, 3, 3, 4, 5, 5.
    __
    Moment. Sammelbezeichnung oder Klassenbegriff für die verschiedenen statistischen Kennwerte oder Parameter einer Verteilung:  [W]
    __
    Morbidität. Unklarer medizinstatistischer, epidemiologischer Begriff. 1) Gesundheitsbrockhaus 1990: Gibt die Häufigkeit einer Erkrankung pro 1000 oder 10.000 für ein Jahr oder einen anderen Zeitraum an. 2) Grundmann, E. (1994, Hrsg.; S.4-5): „Die M. ist die Zahl einer bestimmten Erkrankung in einer bestimmten Bevölkerungsgruppe in einem bestimmten Zeitraum (meist einem Jahr). Sie berechnet sich nach der Formel: Mz = (Erkrankungszahl x 10 000) / Bevölkerungszahl“. In dieser Formel fehlen die Einheiten der Zeit und die soziologische Spezifikation. 3) Nach Renner, D. (6.A. 1990, S. 24): „M. - Anzahl an einer bestimmten Krankheit leidender Personen per Gesamtbevölkerung in einem bestimmten Beobachtungszeitraum.“ Nach diesem Autor wird M. auch synonym mit Neuerkrankungsrate (> Inzidenz) verwendet. Die Inzidenz wird von Schaefer & Blohmke (1978, S.111) wiederum der > Prävalenz gleichgesetzt.
    __
    Mortalität. Medizinstatistischer, epidemiologischer Begriff, der die Sterblichkeit einer Krankheit bezogen auf die Gesamtzahl der Lebenden eines Jahrganges pro 10.000 oder 100.000 angibt im Unterschied zur > Letalität, die das Verhältnis der an einer Krankheit Gestorbenen in Beziehung zur Anzahl der Erkrankten angibt.
    ___
    Multikollinearität. In einer Tabelle (Matrix) gibt es mindestens 2 Kollinearitäten (vergleichbarer Datensätze, also aus der gleichen Stichprobe oder Population mit jeweils gleicher Anzahl n).
    __
    Norm. Bezugs- oder Vergleichgröße.
    __
    Normalverteilung. Gaußsche Glockenkurve [1, 2, W, ]. Wichtigste Verteilung der mathematischen Statistik. Häufung der Werte in der Mitte und von aus fortlaufend abnehmend zu den Rändern hin.
     

    Zur Warnung (Grimm 1960, S. 165).
    "Die Erfahrung zeigt, daß eine ausgesprochen Normalverteilung in der Natur nur selten vorkommt. Garry (1947) schreibt sogar: 'Die Normalität ist ein Mythos, es lag nie Normalverteilung vor, und sie wird nie vorliegen." 
    __
    Normalwert. > Referenzwert.
    __
    Normwerte. Werte, die nach einem bestimmten, nachvollzieh- und prüfbaren Verfahren, gewonnen und berechnet werden.  In Straube (1988, Hrsg.), S.9 heißt es: "Der Ausdruck „Normwert" steht hier synonym für Normal-, Richt- oder Referenzwert, wobei sich letztere Bezeichnung durchzusetzen scheint. Es wird nachdrücklich darauf hingewiesen, daß alle Normwertangaben die intraindividuelle Situation des Gesunden und des Kranken nicht berücksichtigen können. Weiterhin muß der Arzt auf tages-, monats- und jahreszeitliche Schwankungen Rücksicht nehmen."
        Hier noch eine Tabelle aus Lienert (1969, 3. A.), S. 337:
    _

    __
    Nullhypothese [1, ] Es gibt keinen Unterschied.
    __
    Numerologie. Nicht prüf- oder wiederholbare Methode, spezielle Bedeutungen von Zahlen zu erkennen. Auch in der modernen Wissenschaft sehr verbreitet, z. B. in der Faktorenanalyse oder Signifikanzstatistik.
    __
    Nutzen: mehr oder - meist - minder intersubjektive Wertzuweisung über den Gebrauchswert von Sachverhalten. Der Nutzen spielt eine große Rolle für die meisten Menschen in fast allen Lebensbereichen, aber auch in der Wissenschaft, besonders in der Ökonomie (Grenznutzentheorie) und Psychologie: Nützlich erscheint, was Bedürfnisse, Wünsche und Interessen befriedigt.
    __
    Objektivität := die Messung soll nicht davon abhängen, wer mißt.
    __
    Objektivität, spezifische := Begriff des Rasch-Modells, wonach die Messergebnisse (Relationen der Messobjekte) nicht vom Messinstrument (Test, Skalierungsverfahren) abhängen darf (>Relationentreue).
    __
    Odds-Ratio. Das Odds Ratio gibt, um wieviel größer die Chance zu erkranken in der Gruppe mit Risikofaktor ist (verglichen mit der Gruppe ohne Risikofaktor). Das Odds Ratio nimmt Werte zwischen 0 und Unendlich an. Ein Wert von 1 bedeutet ein gleiches Chancenverhältnis. [W]
    __
    Ökonomie (Nutzen, Utilität). Kosten, Aufwand, Nutzen, Preis-Leistungs-Verhältnis.
    __
    Parameter: kennzeichnende Größe, z.B. Mittelwert, Varianz, Minimum, Maximum, Spanne, Verteilung.
    __
    Parameter-Konstanz: kennzeichnende Größe, die für bestimmte Bedingungen gleich bleibt, z.B. Mittelwert, Varianz.
    __
    parametrische Verfahren. Sie gehen von bestimmten Modellannahmen, z. B. Normalverteilung, aus.
    __
    Polung. negative oder positive Wertzuweisung zu einem Bearbeitungssachverhalt.
    Population: Gesamtheit, Ganzes.
    __
    Population. Grundgesamtheit, die betrachtet wird.
    __
    Prävalenz. Epidemiologisch-statistischer Begriff, der das Verhältnis aus Anzahl der Kranken zu einem Stichtag gegenüber den Personen mit Merkmal an diesem Stichtag angibt. Anwendung: an X Erkrankte : Medikamentenanwender.  Beaglehole et al (1997, S. 30): "Die Prävalenz einer Krankheit ist die Anzahl der Krankheitsfälle in einer definierten Population zu einem bestimmten Zeitpunkt."
    ___
    Praxeologie. Ein Name für lehr- und lernbares, begründetes praktisches Vorgehen nach Wissenschaft, Erfahrungswissen und individuell situativen Gegebenheiten. In den stark idiographisch geprägten Berufen der JuristInnen, Heilfachkundigen und PsychologInnen  müssen wissenschaftliche Ergebnisse auf einen Einzelfall angewendet werden. Das ist ein bislang von den Universitäten sehr stark vernachlässigtes Gebiet, so gibt es m.W. auch keinen Lehrstuhl für idiographische Wissenschaftstheorie und Praxeologie. Hier spielen auch der berüchtigte sog. "gesunde Menschenverstand" und alltägliches Regelwissen wie praktische Vernunft eine große Rolle. > evidenzbasierte Medizin.
    __
    Produkt-Moment (kleines, großes). Ausdruck aus der Matrixalgebra (z.B. Horst 1963, p. 166-171) im Umfeld multivariater Datenanalyse (z.B. Revenstorf 1980, S.28, 53, 85 ). Sei X eine Matrix, dann wird X'X das kleine (Minor) und XX' gelegentlich das große (Major) Produktmoment genannt. Die Bravais-Pearson Korrelation wird auch als Produkt-Moment-Korrelation bezeichnet. Die Encyclepedia of Statistical Science, 1986, Vol.7, p. 292 führt aus:


    __
    Prozentrang. Prozentsatz derjenigen, die einen so oder so großen Wert erreichen.
    __
    Quantile. Vielheiten, meist in gleiche Klassen zusammengefasst. Quartile und Prozentränge sind Quantile.
    __
    Quartile. 1. Quartil := erstes Viertel der Stichprobe. 2. Quartil:  Zweites Viertel der Stichprobe. Median := halbiert die Stichprobe, 3. Quartil =: drittes Viertel der Stichprobe.  4. Quartil = letztes Viertel der Stichprobe. Seien 100 Messwerte von 1,2,3, ..., 100 gegeben, dann gehören 1-25 zum ersten Quartil, 26-50 zum zweiten Quartil, 51-75 zum dritten und 76 bis 100 zum vierten Quartil.
    __
    Querschnitts-Statistik, eine Statistik, die über verschiedene Objekte im gleichen Zeitraum erhoben wird, z. B. der arithmetische Mittelwert für den durchschnittlichen Alkoholkonsum junger Frauen zwischen 21 und 25 Jahren in Bayern. > Längsschnitt.
    __
    Referenzwert > wörtlich Bezugswert bzw. Bezugswertbereich,  Normwert, Normalbereichswert in der Medizin(im Laborbereich gewöhnlich unzulänglich ausgewiesen).In der Psychologie werden z. B. sog. "Normen" bei Intelligenztests meist für Geschlecht, Alters- und Bildungsklassen bestimmt. In der Medizin sind naturgemäß besonders wichtige Kriterien spezielle Erkrankungen und Risiko-, aber auch ökologische Faktoren (wie z. B. Stadt, Land, Abgasbelastung, Sendemasten, Strahlungsbelastung [Elektrosmog], Chemie- oder Atomkraftwerke in der Nähe, oder Berufe, die mit bestimmten Risiken einhergehen, können sehr wichtig sein. Beispielrechnung. Setzt man bei parametrischen statistischen Verfahren eine Mindeststichprobengröße von N=30 an und geht man aus von 2 Geschlechtern, 5 Altersklassen, 3 Schulbildungsgraden, 6 ökologischen Klassen, 27 Gesundheitsfaktoren (3 Bewegungsgrade, 3 Ernährungsgrade, 3 Körperindexgrade), 100 Krankheitsklassen und 10 Risikofaktoren ergibt sich folgende Rechnung: STC [Stichprobencharakteristiken] = 30 * 2 * 5 * 3 * 6 * 27 * 100 * 10 = 48.600.000, d. h. 48,6 Millionen Laborbefunde. Das wären die theoretischen Erfordernisse, wenn jede Stichprobenkombination vertreten sein soll. Es kann natürlich durchaus vorkommen, dass nicht jede Kombination mit 30 Fällen besetzt werden kann, weil sie zu selten vorkommt.
    __
    Regression, Regressionsanalyse. Einfaches lineares Modell nach y = a + b*x. Ein Wert y wird auf einen Wert x zurückgeführt, z.B. das Gewicht auf die Körpergröße. Das geht auch umgekehrt, indem man die Körpergröße auf das Gewicht zurückführt. Als Maß für den Zusammenhang beider Regressionen dient der Korrelationskoeffzient, der sich auch aus der Wurzel des Produktes beider Regressionskoeffzienten (geometrisches Mittel) errechnen lässt. b ist die Steigung und heißt auch beta-Gewicht. Inhaltlich interpretiert gibt b an, in welchem Verhältnis y steigt (fällt), wenn x um eine Einheit steigt (fällt). Im Prinzip gibt es beliebige Regressionsmodelle, letztlich so viele, wie Datenmodelle und Funktionsverläufe, die sie charakterisieren. Das einfache lineare Modell ist also nur eines, wenn auch das wohl meist angewendete. Regressionen bei Wachstumsprozessen werden "linearisiert" durch logarithmieren (Bsp.).
    __
    Relation (Beziehung). Beispiele: größer, kleiner, gleich, auf, unter, gleich alt wie, besser. Grundlegender, aber wegen seiner Abstraktion schwieriger mathematischer Grundbegriff, der seit der Durchsetzung der Mengenlehre auch über diese definiert wird: Eine Relation ist eine Teilmenge der Kreuzmenge (kartesisches Produkt, Paarmenge). Sei A = {Main, Passau, Frankfurt, Donau}, so ist die Kreuzmenge, AxA, numeriert: 1. (Main, Main), 2. (Main, Passau), 3. (Main, Frankfurt), 4. (Main, Donau), 5. (Passau, Main), 6. (Passau, Passau), 7. (Passau, Frankfurt), 8. (Passau, Donau), 9. (Frankfurt, Main), 10. (Frankfurt, Passau), 11. (Frankfurt, Frankfurt), 12. (Frankfurt, Donau), 13. (Donau, Main),  14. (Donau, Passau), 15. (Donau, Frankfurt) und 16. (Donau, Donau). Relationen können hier sein: I. Fluß und Stadt gehören zusammen: 3 und 8. II. Fluß und Stadt gehören nicht zusammen: 2 und 7. III. identische Flüsse: 1 und 16. IV. Identische Städte: 6 und 11. V. Flüsse: 1, 4, 13 und 16. VI. Städte: 1, 3, 5, 6, 7, 9, 10., 11. VII. Identische Namen: 1, 6, 11, 16. VIII. schwebt über: wird von keinem der Paare erfüllt.
    __
    Relationentreue.
    __
    Reliabilität. Messgenauigkeit. In der Psychologie meist - und nicht unproblematisch - über die Korrelation geschätzt.
    __
    Repräsentation. Grundlegender Begriff für die Stichprobenstatistik, schließende Statistik und für die allgemeine, auch alltägliche "Testtheorie". Erheben wir Werte, so sollen diese repräsentativ für ... sein. Bei Laborwerten kann es sehr darauf ankommen, wie die Randbedingungen der Erhebung sind (z. B. Tageszeit, nüchtern). Ist ein Laborwert, z. B. Gamma-GT pathologisch erhöht, so wird man das im allgemeinen beobachten und Messwiederholungen ansetzen. Ein Gamma-GT-Wert ist sozusagen nur eine einzige Stichprobenziehung aus den praktisch unendlich viel anmutenden Möglichkeiten. Eine besondere Bedeutung hat der Begriff noch in der Messtheorie. Das Repräsentationstheorem dort besagt, dass es eine homomorphe Abbildung von einem empirischen Relativ, z. B. drei Hölzchen, in ein numerisches Relativ mit z. B. drei Zahlen so gibt, dass die Beziehungen zwischen den Hölzchen durch die Zahlen repräsentiert werden.
    __
    Risiko:
    __
    ROC. Diagramm bei dem auf der Ordinate die Sensitivität und auf der Abszisse 1-Spezifität eingetragen wird. Daraus lässt sich das Verhältnis aller richtig positiven und falsch positiven Zuweisungen ersehen. [W]
    __
    Rohwert := scorierter Bearbeitungswert, dem Bearbeitungswert wird ein Zahlenwert zugeordnet. Wichtiger Grundbegriff für sozialwissenschaftliche Fragestellungen.
    __
    Schiefe := Abweichungsmaß von der Symmetrie einer Verteilung; rechtsschief, linksschief.
    __
    Score :=  Zahlenwert, Ausdruck in der Testpsychologie. Bekommt eine ProbandIn auf die Frage, wie der Bundeskanzler der BRD heißt, z. B. einen "Wertpunkt" für die richtige Antwort, so ist dieser Wertpunkt der Rohwert-Score. > Summenscorefunktion.
    __
    Sensitivität. Ein Maß für die Richtig-Positiv-Zuweisungen.
    Sicherheit
    __
    Signifikanz. Zufallskritische Beurteilung von Annahmen. Meist wird nicht die Wirklichkeit geprüft, sondern unter bestimmten Annahmen wird eine Annahme einer anderen Annahme gegenübergestellt, so dass nicht selten der Eindruck einer virtuellen Scheinwissenschaft entsteht. Sog. "signifikante" Ergebnisse werden auch selten in klaren - hierzulande deutschen - Sätzen interpretiert, woran man schon erkennt, wie schwach und unbedeutend (nicht signifikant ;-) solche Erkenntnisse sind. Der "Signifikanz-Popanz" ist vermutlich eine Folge der - oft genug sehr problematischen - Mathematisierung der Sozialwissenschaften. Viele denken zu Unrecht, dass nur, wo Zahlen und Formeln verwendet werden, schon Wissenschaft vorliegt; nicht selten ist es blosse moderne Numerologie und das Gegenteil von Wissenschaft. Signifikanztest
    __
    Skalierung. Messverfahren, Messmethode.
    __
    Spannweite = Maximum - Minimum. Ist die zahlenmäßig kleinste Note in einem Zeugnis 1 und die größte Note eine 4, dann beträgt die Spannweite 4 - 1 = 3. Mit Spannweite kann auch ein Streuungsbereich gemeint sein, z. B. der 1 Sigma Bereich bei der Standard-Normalverteilung umfasst die mittleren 68%, der 2 Sigma-Bereich die mittleren 95,5% und der 3-Sigmabereich 99,7%, also fast die gesamte Verteilung.
    __
    Spezifität. Ein Maß für die Richtig-Negativ-Zuweisungen > Sensitivität.
    __
    Spiel.
    __
    Spieltheorie.
    __
    Stabil, Stabilität [numerische]
    __
    Standardabweichung (Symbol: Sigma) . Wichtiges Streuungsmaß. Wurzel aus der Summe der quadrierten Abweichungen der Rohwerte vom Mittelwert durch n-1 dividiert. Ohne die Wurzel ergibt sich die Varianz = quadrierte Standardabweichung.
    Gegeben seien 5 ProbandInnen mit einem BAK von: 0, 0.5, 1, 1.5, 2.0. n = 5. Das arithmetische Mittel = 5/5 = 1.0. Die Standardabweichung = Wurzel {Summe [(0-1)^2 + (0.5-1)^2 + (1-1)^2 + (1.5-1)^2 + (2-1)^2]/5-1} = 
    Wurzel {[1 + 0.25 + 0 + 0.25 + 1] / 4 } = Wurzel {2.5/4} =  0.79.
    __
    Standardnormalverteilung.
    __
    Standardwert. > z-Wert.
    __
    Stanine. Aus standard und nine gebildete Verdichtung an den Rändern der 13 Centil-Normen auf 9 Werte: [> Normwerte]

    __
    Statistik. Erfassen und Verarbeitung von Zählungen von bestimmten Merkmalen an bestimmten Merkmalsträgern an bestimmten Orten zu bestimmten Zeiten unter bestimmten Bedingungen. > Deskriptive S., > schließende S.. > Querschnitts-S., > Längsschnitts-S..
    __
    Statistik, deskriptive. Sie beschränkt sich auf die Erfassung und Beschreibung statistischer Kennwerte; nicht selten die ehrlichste und letztlich oft aussagestärkste Form der Statistik.
    __
    Statistik, mathematische. Hochentwickelte, komplizierte, umfangreiche und spezialisierte mathematische Fundierung der Statistik. Für mathematische Laien teilweise sehr schwer bis gar nicht verständlich, besonders was die Anwendung und auch den wirklichen Nutzen bezüglich vieler Annahmen betrifft. Teilweise kann man den Eindruck gewinnen, dass sich die Aussagen nur in virtuellen Welten jenseits unserer Wirklichkeit bewegen. Viele ausgearbeitete Modelle beruhen auf Voraussetzungen, die - besonders in der sozialwissenschaftlichen Forschungspraxis - nicht erfüllt werden (Intervallniveau der Daten, Normalverteilung, Zufallsauswahl, Parameterkonstanz). Eine wirklich konsequente Anwendung der Mathematik würde wahrscheinlich mehr als 90% der Veröffentlichungen gar nicht zulassen.
    __
    Statistikpakete/ Statistikprogramme.
    __
    Statistik, schließende. Die schließende Statistik macht Aussagen - teilweise auch sehr fragwürdige oder nichtssagende wie z. B. "signifikant" - über die Bedeutung der deskriptiv erhaltenen Kennwerte mit Hilfe statistischer Modellannahmen.
    __
    Statistische Kennwerte sind z. B. Median, Quartile, Minimum, Maximum, Spanne; Mittelwert (Typ), Standardabweichung; relative Häufigkeiten, Quantile, Prozentränge, Verteilung und Verteilungskennwerte (z. B. Schiefe, Exzess, Gipfel); Stichprobe, Stichprobenumfang; Population; Erhebungszeitraum; Reliabilität und Validität, Sensitivität und Spezifität; cut-off Werte mit  Erläuterungen und Begründungen. Hinzu kommen besonders bei psychologischen Tests auch abgeleitete Normen wie z. B. z-Werte = (Rohwert - Mittelwert) / Standardabweichung, Stanine oder T-Werte.
    __
    Stichprobe. Teil eines Ganzen. Meist ist angestrebt, dass der Teil das Ganze repräsentieren soll und der Teil fürs Ganze stehen kann (pars pro toto). Hierbei entsteht gewöhnlich ein Stichprobenfehler.
    __
    Stichprobenauswahlverfahren. Der Sinn einer Stichprobe ist die Repräsentativität für eine Gesamtheit.
    __
    Stichproben-Kennwerte. Zu jeder wissenschaftlichen statistischen Normwert-Angabe gehören ihre Bedeutung und die charakteristischen Kennwerte, sowie die Bezugsgruppe, d. h. die Stichprobe, Zusammensetzung der Stichprobe, das Auswahlverfahren und die Population, der Zeitraum der Erhebung, die Größe der Stichprobe und der Population. Genau diese Angaben werden von der Labormedizin so gut wie nie ausgewiesen (Stand 10/ 2007).
    __
    Stichprobenumfang. Anzahl der Messobjekte in der Stichprobe.
    __
    Summen-Score-Funktion. Die blosse Anzahl im Sinne des positven Kriteriums bearbeiteter (meist "gelöster") Aufgaben dient als (Ausgangs-) Maß für eine Ausprägung.
    __
    Stationär, Stationarität: Parameter-Konstanz.
    __
    Stetig. Grundlegender mathematischer Begriff mit der alltagssprachlichen Bedeutung einen fortgesetzten Ununterbrochenen, ohne Lücke. Gegensatz diskret.
    __
    Stichprobe: Auswahl eines Teiles von einem Ganzen.
    __
    Stochastik.
    __
    Syllogismus, statistischer. Wenn a aus A mit p1 m zeigt, dann sagt man, a habe mit der Wahrscheinlichkeit p1 das Merkmal m.
    Wenn a aus A mit p1 m zeigt und und a aus B mit p2 m zeigt und p1 ungleich p2 ist, dann gibt zwei unterschiedliche Wahrscheinlichkeitsaussagen bzeüglich der Merkmalszuordnung m. Viele WissenschaftstheortietikerInnen sehen hier einen Widerspruch. Ich kann hier aber keinen sehen. Nicht, wenn  A und B verschiedene Stichproben oder schon gar nicht, wenn A und B aus verschiedenen Popualtionen stammen.
    __
    Test. Stichprobe zur - meist quantitativen - Schätzung eines Sachverhaltes. Ein Fahrtest ist eine Stichprobe aus dem Fahrverhalten einer Person. Aus der Fahrprobe schließt man auf die technische Kraftfahreignung.
    __
    Test: Kontrolliertes und fundiertes Prüfverfahren mittels einer Stichprobe und Kennwerten. Stichprobe zur - meist quantitativen - Schätzung eines Sachverhaltes. Ein Fahrtest ist eine Stichprobe aus dem Fahrverhalten einer Person. Aus der Fahrprobe schließt man auf die technische Kraftfahreignung.
    __
    Testen: Kontrolliertes und fundiertes Prüfen mittels einer Stichprobe und Kennwerten
    __
    Testgütekriterien. > Objektivität,  > Reliabilität, > Validität, > Utilität, > Ökonomie.
    __
    Teststärke (Power). "Die Teststärke gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer spezifischen Alternativhypothese H1 (z. B. „Es gibt einen Unterschied“) entscheidet, falls diese richtig ist. (Die abzulehnende Hypothese wird H0, die Nullhypothese genannt.). Die Teststärke hat den Wert 1-?, wobei ? die Wahrscheinlichkeit bezeichnet, einen Fehler 2. Art zu begehen." [W071027]
    __
    Testtheorie: Theorie zur Konstruktion, Auswertung und Beurteilung von Tests.
    __
    Transformation. Umwandlung von Werten, z. B. y = ax + b. Hierbei kann es sehr wichtig sein, die Relationentreue zu wahren. Achtung: In der Psychologie gibt es sehr merkwürdige Transformationen, die, bei Lichte betrachtet, Datenfälschungen sind, wenn z. B. nicht normalverteilte Rohwertdaten in Quantile gewandelt und dann so zurückgerechnet werden, als ob sie normalverteilt wären (z. B. fragwürdiges McGall-Verfahren). Das gilt auch für die meisten Faktorenanalysen, weil die Kommunalitätsmatrizen den ursprünglichen Korrelationsmatrizen nicht mehr ähnlich sind.
    __
    Transparenz. Klarheit, Durchsichtigkeit, Verständlichkeit, Nachvollziehbarkeit.
    __
    T-Werte. T = 50 + z.

    Unsicherheit. Das Leben und die meisten Entscheidungen, die es abverlangt, sind mit Unsicherheit verbunden. Diese  Unsicherheiten ab- und einschätzen können, ist ein vielfaches und bedeutsames Anliegen von Wissenschaft und alltäglicher Praxeologie.
    __
    Unterscheiden. Grundlegende kognitive Funktion. Eng verbunden mit vergleichen.
    __
    Utilität. Nutzen, Wert eines Tuns. Aufwands-Ergebnis-Verhältnis. [> Ökonomie.]
    __
    Validität. Maß für die Erreichung eines Ziels durch bestimmte Methoden.
    __
    Varianz. Streuungsmaß. Quadrat der Standardabweichung.
    __
    Varianzanalyse. Untersuchungsverfahren, das die Einflüsse von Bedingungen auf statistische Kennwerte durch Analyse der Mittelwerte und Varianzen erforscht. [W]
    __
    Vergleichen := elementares geistiges Handeln, Grundprinzip jeder Messung. Eng verbunden mit unterscheiden.
    __
    Verteilung. Häufigkeit oder Ausprägung von Werten nach geordneten Kriterien. Meist wird die Häufigkeit an der Ordinate und an der Abszisse meist die Zeit.
    __
    Verteilungsannahmen. Es gibt beliebige Verteilungen. Die meisten parametrischen Tests setzen aber bestimmte Verteilungsannahmen, z. B. normalverteilte Daten voraus. Dort, wo mit Verteilungsannahmen gerechnet wird, müssen diese natürlich angegeben werden.
    __
    Verteilungskennwerte (z. B. Schiefe, Exzess, Gipfel).
    __
    Vertrauensintervall (Konfidenz). [W]
    __
    Voraussetzungen. Bestimmte Verfahren erfordern bestimmte Voraussetzungen, die oftmals nicht ausdrücklich genannt werden, z. B. Normalverteilung, Intervallskalenniveau, Zufallsauswahl, Parameterkonstanz über die Zeit, Raum und Bedingungen hinweg. So sind z. B. die Schulnoten auf Ordinalniveau und damit ist die arithmetische Mittelwertsbildung unzulässig, weil hierfür mindestens Intervallskalenniveau erforderlich ist.
    __
    w := Hier Zeichen für gedachten wahren Wert bei einem Messvorgang. Der wahre Wert ist grundsätzlich unbekannt und muss geschätzt werden, hier durch r := Näherungswert für w.
    __
    Wahrscheinlich, Wahrscheinlichkeit. Mehrdeutiger Grundbegriff der Wahrscheinlichkeitstheorie. Ähnlich wie der wahre Wert ist die Wahrscheinlichkeit eines Ereignisses letztlich unbekannt. Als beste Näherungsschätzung wird in der Statistik meist die relative Häufigkeit eines Ereignisses für den Wahrscheinlichkeitsparameter genommen, wobei sich gewöhnlich für den Fall unendlich vieler Realisationen - die in praxi natürlich nicht möglich sind - die Identität von Näherungs- und wahrem Wahrscheinlichkeits-Wert ergibt. Praktisch heisst das: je größer der Stichprobenumfang oder je mehr Messungen vorliegen, desto mehr nähert sich der empirische Wert dem wahren Wert an. In der Mathematik gilt dieser Grundbegriff seit der Axiomatisierung 1933 durch Kolmogorov geklärt.
    __
    Wahrscheinlichkeit, bedingte. p(A|B), d.h. die Wahrscheinlichkeit für das Ereignis A unter der Bedingung B. Wichtiger Grundbegriff. Genau betrachtet kann es gar keine "unbedingte" Wahrscheinlichkeit geben. Wenn daher allgemein von "unbedingter" Wahrscheinlichkeit gesprochen wird, so heißt das meist nur, dass nicht angegeben oder gewusst wird, unter welchen Bedingungen eine Wahrscheinlichkeitsaussage gilt.
    __
    Wahrscheinlichkeitsmodell. Z. B. Urnenmodell mit oder ohne Zurücklegen.
    __
    Wahrscheinlichkeit, objektive. [ > relative Häufigkeit]
    __
    Wahrscheinlichkeit, subjektive. [> Bayes]
    __
    Wahrscheinlichkeit, totale.
    __
    Welten.
    __
    Wert. 1) Zahlenwert im Rahmen einer Messung. 2) anderer Wert, den ein Sachverhalt relativ für einen Bewertenden hat (z. B. Wind für einen Segler, Regen für einen Bauern, Musik und Alkohol für einen Feiernden). [> werten]
    __
    Wert, richtiger. Beste bekannte empirische Näherung an den gedachten wahren Messwert.
    __
    Wert, wahrer. Idee, dass ein Zustand oder Merkmal zum Zeitpunkt der Messung einen wahren Messwert hat, den es "bestmöglich" zu schätzen gilt. Fiktive Größe und nicht immer hinreichend klare Vorstellung, repräsentier- oder schätzbar. Beispiel: Zu messen sei das Volumen einer Streichholzschachtel. Hierbei wird man mehrfache Messfehler begehen. Einmal weil die Ausdehnungen (Länge, Breite, Höhe) nicht streng starr geradlinig sind. Zum andern weil man in aller Regel bei jeder Messung auch Messfehler macht. Trotzdem ist hier die Idee, dass die Streichholzschachtel zu einem bestimmten "Zeitpunkt" - einen fiktive und genau betrachtet unklare Vorstellung - einen wohlbestimmten Volumenwert hat, plausibel und intuitiv unmittelbar einsichtig.
    __
    Wertzuweisung. Bestimmten Sachverhalten können Werte zugewiesen werden, z. B. "nützlich für ...", "gesund", "krank", "Symptom für x". Die Wertzuweisung kann mehr oder minder begründet und methodisch ausgewiesen sein oder willkürlich, "per fiat" nach gutem Glauben oder Fachkompetenz erfolgen.
    __
    Wissenschaftliches Arbeiten.
    __
    x := Hier Zeichen für einen empirischen Messwert.
    __
    Zahlen.
    __
    Zeit. Wichtiger, doch letztlich bezüglich seiner Bedeutung oft sehr unklarer Grundbegriff in der Statistik. > Die Zeit als Variable.
    __
    Zeitpunkt. Fiktive und - genau betrachtet mitunter - problematische Vorstellung einer "Momemtaufnahme". Tatsächlich dürfte in den meisten Fällen der "Moment" nur ein ungefähres Zeit-Intervall bzw einen "Zeitraum" bedeuten. Beispiel: "Tages-Temperatur". Ein "Tag" besteht aus 8-24 Stunden (Arbeitstag, astromischer Tag einschließlich der Nacht), 1440 Minuten oder 86400 Sekunden. Die Temperatur dürfte im Regelfall über die Zeiten schwanken; zudem hängt sie auch vom Ort der Messungen ab.
    __
    Zeitreihenanalyse.
    __
    Zensus (Census). Bevölkerungsdaten.
    __
    Zentraler Grenzwertsatz.
    __
    Zufall. (Welt der Möglichkeiten) Sehr schwieriger, mehrdeutiger und möglicherweise widerspruchsvoller Begriff. Subjektive Bedeutungen: (1) Im einzelnen nicht vorhersagbar (Münzwurfergebnis). (2) ein Ereignis geschieht relativ zu einem Betroffenen nicht absichtsvoll (beim Wähnen, Eigenbezug und im Wahn gestört: hier hat u. U. alles Absicht oder Bedeutung). (3) Regellos, chaotisch, willkürlich.__
    Zufallsgröße.
    __
    Zuverlässigkeit. > Reliabilität. In der psychologischen Testtheorie meist Messgenauigkeit.
    __
    z-Werte = (Rohwert - Mittelwert) / Standardabweichung.
    __



    Literatur (Auswahl)
    Siehe bitte auch Literaturliste Signifikanztest, Bayes, Diskriminanzanalyse, Metaanalysen, Statistikpakete, Zeitreihen, Numerisch instabile Matrizen und Kollinearität in der Psychologie, Faktorenanalyse, Kommunalität, Irrtum, Fehler, Betrug, Laborwertnormen, ..., ...
     
  • Bamberg, Günter (1972). Statistische Entscheidungstheorie. Würzburg: Physica.
  • Garry, R. C. (1947). Testing for normality. Biometrika 34, 209-242.
  • Grimm, H (1960). Transformation von Zufallszahlen. Biometrische Zeitschrift, Bd.2, 164-182.
  • Horst, Paul (1963). Matrix Algebra for Social Scientist. New York: Holt, Rinehart and Winston.
  • Kolmogoroff, A. (1933). Grundbegriffe der Wahrscheinlichkeitsrechnung. Berlin: Springer. Nachdruck 1973.
  • Kotz, S. & Johnson, N. (1982-1989, Ed.). Encyclopedia of Statistical Sciene.  Vol. 1-10. New York: Wiley.
  • Mises, Richard von (196, 4.A. 1972). Wahrscheinlichkeit, Statistik und Wahrheit. Wien: Springer.
  • Müller, P.H. (1970, Hrsg.). Lexikon Wahrscheinlichkeitsrechnung und mathematische Statistik. Berlin: Akademie.
  • Revenstorf, Dirk (1980). Faktorenanalyse. Stuttgart: Kohlhammer.
  • Sponsel, R. (1994). Numerisch instabile Matrizen und Kollinearität in der Psychologie. Ill Conditioned Matrices and Collinearity in Psychology. Zweisprachig. Ins Englische übersetzt von Agnes Mehl. Mit einem Beitrag (Kap. 6) von Dr. B. Hain: Bemerkungen über Korrelationsmatrizen. Erlangen: IEC Verlag.
  • Sponsel, R. (2005). Fast- Kollinearität in Korrelationsmatrizen mit Eigenwert-Analysen erkennen Ergänzungsband - Band II zu Numerisch instabile Matrizen und Kollinearität in der Psychologie.
  • Stegmüller, Wolfgang (1969). Statistische Erklärungen. Deduktiv-nomologische Erklärungen in präzisen Modellsprachen. Offene Probleme. Studienausgabe Teil 5: Probleme und Resultate der Wissenschaftstheorie und analytischen Philosophie Bd. I. Wissenschaftliche Erklärung und Begründung.
  • Stegmüller, Wolfgang (1973). Statistische Begründung. Statistische Analayse. Das Repräsentationstheorem von de Finetti. Metrisierung qualitativer Wahrscheinlichkeitsfelder. Studienausgabe Teil E: Probleme und Resultate der Wissenschaftstheorie und analytischen Philosophie Bd. IV. Personelle und Statistische Wahrscheinlichkeit.

  • _


    Links (Auswahl)
     
    • Fehlurteile und Missverständnisse: Gerd Gigerenzer und der richtige Umgang mit Zahlen. Für die Interpretation eines Gutachtens ist vor allem die Form, in der es dargestellt wird, von Bedeutung. Daher gilt für Gerd Gigerenzer: Um Fehlschlüsse zu vermeiden, sollten statistische Informationen besser und verständlicher kommuniziert werden. Falsche Auslegung von Statistiken kann fatale Folgen haben: für die eigene Gesundheit, die eigene Freiheit oder auch das Bankkonto. Experten wie Laien sind häufig nicht in der Lage, statistische Informationen richtig zu verstehen. http://www.zdf.de/ZDFde/inhalt/25/0,1872,2054489,00.html.
    • Engineering Statistics Handbook.
    • Lügen mit Statistik.
    • Statistiklabor der Uni Berlin (Schlittgen)
    • [R. Sponsel: Der Signifikanztest in der Wissenschaft, Psychologie, klinischen und Psychotherapieforschung. Szientismus zwischen numerologischer Esoterik, Gaukeln und Betrug?]
    • [R. Sponsel: Partielle Korrelationen.]
    • [R. Sponsel: Das Bayes'sche Theorem].
    • [Reader zu den Grundlagen der Statistik: Günter Bamberg: Verschiedene Auffassungen von Statistik und die Auffassung der statistischen Entscheidungstheorie.]
    • [R. Sponsel: Statistik-Pakete - Methodische Anforderungen. Kriterien Checkliste ("TÜV") für Statistik-Pakete.]
    • [R. Sponsel: Dynamische Systeme. Ein Buchhinweis (Schiepek & Strunk).]
    • [R. Sponsel: Diskriminanzanalyse]
    • [R. Sponsel: Meta-Analyse: Was sind und was sagen Meta-Analysen aus?]
    • [R. Sponsel: Die grundlgenden Probleme und Aporie jeglicher Einzelfall- und damit Therapieforschung. Grundzüge einer idiographischen Wissenschaftstheorie. ]
    • [R. Sponsel: Allgemeine Theorie und Praxis des Vergleichens und der Vergleichbarkeit. Grundlagen einer psychologischen Meßtheorie. ]
    • [R. Sponsel: Über den Aufbau einer präzisen Wissenschaftssprache in Psychologie, Psychopathologie, Psychodiagnostik und Psychotherapie aus Allgemeiner und Integrativer Sicht (GIPT).  Operational-Konstruktive Definition psychologischer Termini. Definitionslehre der GIPT.]
    • PORTRAITS OF STATISTICIANS. [1,2,3,]
    _


    Glossar, Anmerkungen, Endnoten:
    GIPT= General and Integrative Psychotherapy, internationale Bezeichnung für Allgemeine und Integrative Psychotherapie.
    ___
    einheitswissenschaftliche Sicht. Ich vertrete die ursprüngliche einheitswissenschaftliche Idee des Wiener Kreises, auch wenn sein Projekt als vorläufig gescheitert angesehen wird und ich mich selbst nicht als 'Jünger' betrachte. Ich meine dennoch und diesbezüglich im Einklang mit dem Wiener Kreis, daß es letztlich und im Grunde nur eine Wissenschaftlichkeit gibt, gleichgültig, welcher spezifischen Fachwissenschaft man angehört. Wissenschaftliches Arbeiten folgt einer einheitlichen und für alle Wissenschaften typischen Struktur, angelehnt an die allgemeine formale Beweisstruktur.
     
    Wissenschaft [IL] schafft Wissen und dieses hat sie zu beweisen, damit es ein wissenschaftliches Wissen ist, wozu ich aber auch den Alltag und alle Lebensvorgänge rechne. Wissenschaft in diesem Sinne ist nichts Abgehobenes, Fernes, Unverständliches. Wirkliches Wissen sollte einem Laien vermittelbar sein (PUK - "Putzfrauenkriterium"). Siehe hierzu bitte das Hilbertsche gemeinverständliche Rasiermesser 1900, zu dem auch gut die Einstein zugeschriebene Sentenz passt: "Die meisten Grundideen der Wissenschaft sind an sich einfach und lassen sich in der Regel in einer für jedermann verständlichen Sprache wiedergegeben." 
    ___
    Schaefer & Blohmke (1978, S.111): "Die Mortalität ist das Ergebnis zweier voneinander unabhängiger Determinanten: der Häufigkeit einer Erkrankung und ihrer Gefährlichkeit. Das Maß der ersteren nennt man die Morbidität, eine Maßzahl, welche als Morbiditätsziffer auf 1000 Lebende der betrachteten Bevölkerungsgruppe (Altersgruppe, Geschlecht, Stadt, Land etc.) bezogen wird. Sie ist jedoch eine wenig sinnvolle Größe. Die moderne Démographie und Epidemiologie ersetzt sie daher durch die Prävalenz oder Inzidenz einer Krankheit, die ebenfalls unten definiert sind (Abschn. 4.4.5.). Der Ausdruck Morbidität wird nur noch als allgemeines Kennzeichen für Daten benutzt, welche quantitative Angaben über Krankheitshäufigkeiten machen. Je gefährlicher die Krankheit ist, desto mehr Erkrankte sterben an ihr. Die krankheitsspezifische Mortalitätsziffer ist also besonders hoch für häufig vorkommende und zugleich gefährliche Krankheiten."


    Wird gelegentlich vervollständigt, ergänzt überarbeitet - Anregungen und Kritik erwünscht

    Querverweise
    Standort: Beweis und beweisen in der Statistik.
    *
    Überblick Statistik in der IP-GIPT.
      Einführung, Überblick, Verteilerseite Beweis und beweisen
      Wissenschaft in der IP-GIPT
      Überblick: Abstrakte Grundbegriffe aus den Wissenschaften



    Wird gelegentlich vervollständigt, ergänzt überarbeitet - Anregungen und Kritik erwünscht

    Zitierung
    Sponsel, Rudolf  (DAS). Beweis und beweisen in der Statistik. Blicke über den Zaun zum Auftakt für eine integrative psychologisch-psychotherapeutische Beweislehre. Abteilung Abstrakte Grundbegriffe aus den Wissenschaften: Analogien, Modelle und Metaphern für die allgemeine und integrative Psychologie und Psychotherapie sowie Grundkategorien zur Denk- und Entwicklungspsychologie. Internet Publikation - General and Integrative Psychotherapy   IP-GIPT. Erlangen: http://www.sgipt.org/wisms/gb/beweis/b_stat.htm
    Copyright & Nutzungsrechte
    Diese Seite darf von jeder/m in nicht-kommerziellen Verwertungen frei aber nur original bearbeitet und nicht  inhaltlich verändert und nur bei vollständiger Angabe der Zitierungs-Quelle benutzt werden. Das Einbinden in fremde Seiten oder Rahmen, die die Urheberschaft der IP-GIPT nicht jederzeit klar erkennen lassen, ist nicht gestattet. Sofern die Rechte anderer berührt sind, sind diese dort zu erkunden. Sollten wir die Rechte anderer unberechtigt genutzt haben, bitten wir um Mitteilung. Soweit es um (längere) Zitate aus  ...  geht, sind die Rechte bei/m ... zu erkunden oder eine Erlaubnis einzuholen.

      Ende_Beweise in der Statistik_Überblick_Rel. Aktuelles  _Rel. Beständiges _Titelblatt_ Konzept_ Archiv_ Region_Service_iec-verlag  Mail:  sekretariat@sgipt.org__Wichtiger Hinweis zu Links und zu Empfehlungen

    kontrolliert irs am tt.mm.jj



    Änderungen
    15.12.07    Produkt-Moment (kleines, großes). * Regression, Regressionsanalyse.
    30.11.07    Aufnahme wichtiger stat. Begriff: Erwartungstreu(e Schätzung), Inferenz-Statistik, Kovarianz, Zeitpunkt; Erg. z. Wert, wahrer.
    03.08.07    Zur Genauigkeit der amtlichen Daten zum Wirtschaftswachstum.
    21.04.07    Veränderungen der Erhebung statistischer Kenngrößen 1973 und 1978 am Beispiel Verschuldung der Gemeinden.
    09.04.07    Korrektur zum 30.03.07:
    30.03.07    Beispiel MD3b: Schätzung des Gesamtschuldenstandes Nürnbergs am 31.3.1928 in Reichsmark.
    17.03.07    Tradition mehrdeutiger und daher unsinniger Auszeichnungen in der bayerischen Statistik.
    09.03.07    Repräsentativität, Transparenz und Kontinuität statistischer Zeitreihen.
    11.03.06   Linkhinweis: Lügen mit Statistik. Hinweis auf das "Statistiklabor" der Uni-Berlin (Schlittgen).
    02.11.03   Einige Ergänzungen, Kurzdefinitionen und Links im Glossar.