Teilweise gekürzte Basisdaten q00b einer Fehlersimulation mit Parametern eines Quaders zur explorativen Untersuchung des Verhaltens der Eigenwerte und Faktoren in Abhängigkeit vom variierten Fehlerbereich 1%-50%
von Rudolf Sponsel, Erlangen
Überblicks- und Verteilerseite
zu diesen Versuchen
Versuchsbeschreibung * Urdatenliste gekürzte "Wahre Werte" * Standard-Matrixanalyse * Korrelationsmatrix * Faktorenanalyse * Querverweise * Originalversuch q00
Versuchsbeschreibung: In der Diskussion um diesen Versuch wurde eingewandt, daß die Ergebnisse der Korrelationsmatrix, Eigenwert- und Faktorenanalyse dadurch verzerrend beeinflußt würden, weil sehr kleine Rohwertdaten sehr großen gegenüberstünden. Tatsächlich spielt dies theoretisch und nach der Mathematik keine Rolle, weil die Korrelationsmatrix invariant gegen lineare Transformationen der Rohdaten ist: man kann also jeden Rohdatenvektor einer beliebigen Transformation vom Typ y = ax+b unterziehen, ohne daß sich die Korrelationen, Eigenwert- oder Faktorenstruktur nennenswert ändert bis auf geringfügige Veränderungen im Nachkommabereich (hier Eigenwertveränderungen ab der 10. Nachkommastelle und Anzeige eines negativen Eigenwertes im Rechnergenauigkeitsgrenzbereich). Dies sei im folgenden für eine Variante der Basisdaten "Wahre Werte" dargelegt.
Mittelwert
Varianz Standard AW
1 50.5
833.25 28.87
2 54.83
812.88 28.51
3 51.34
760.1 27.57
4 150.48
28422.78 168.59
5 16.54
132.27 11.5
6 268.9
46785.84 216.3
7 267.17
60032.56 245.02
8 29.1
535.51 23.14
[Interne Quelle: Programm KOR_D.BAS doppelte Genauigkeit
ohne Missing Data. Daten von C:\OMI\NUMERIK\MATRIX\URDAT\BASIS\BASISAE1.AE1
Dateiname = C:\OMI\NUMERIK\MATRIX\URDAT\BASIS\BASISAE1.DAN.
Korrelation in C:\OMI\NUMERIK\MATRIX\KK\BASISAE1.D08. Auswertung vom 11/07/02
13:34:32]
Standard-Matrixanalyse
der Korrelationsmatrix der gekürzten Basisdaten "Wahre Werte"
| Abstract/ Zusammenfassung Analyse Korrelationsmatrix
der gekürzten Basisdaten
Aufgrund der numerischen Instabilität stimmen die Matrixwerte der "gekürzten" "Wahren Werte" nicht völlig in allen Nachkommastellen mit den Originalwerten überein - was NumerikerInnen sicher nicht verwundert und Nicht-NumerikerInnen zur Verzweiflung treiben kann - aber weitestgehend. Allerdings, und das zeigt eindrucksvoll, wie labil und sensibel solche Matrizen numerisch sind, wird in der gekürzten Version ein negativer Eigenwert im Grenzbereich der Rechnergenauigkeit ausgewiesen, allerdings mit dem exakt gleichen Betrag. Dieser negative Eigenwert ist -2.1684043449710089D-18,also an der 18. Nachkommastelle. Der Gesamtvergleich der Eigenwerte: Eigenwerte Original "Wahre Werte"
Eigenwerte gekürzte "Wahre Werte"
Wie man sieht, sind die beiden kleinsten Eigenwerte zwar
betragsmäßig gleich, haben aber unterschiedliches Vorzeichen,
was ich darauf zurückführe, daß hier der Grenzbereich der
Rechnergenauigkeit berührt wird.
|
Samp _Ord_
MD_
NumS_
Condition_
Determinant_HaInRatioR_
OutInK_
Norm_
C_Norm
100 8 0 --1
2.3D+18 0
6.42D-76 3095 0(2) 0(1)
|
|
********** Summary
of standard correlation matrix analysis ***********
File = BASISAE1.D08 N-order= 8 N-sample= 100
Rank= 8 Missing data = 0
Positiv Definit=Cholesky successful________= Yes with 1 negat.
eigenvalue/s
HEVA: Highest eigenvalue abs.value_________=
5.0484402158325177
LEVA: Lowest eigenvalue absolute value_____=
2.1684043449710089D-18 (negativ)
CON: Condition number HEVA/LEVA___________~=
2.3281821158221367D+18
DET: Determinant original matrix (OMIKRON)_=
8.2146463840484308D-23
DET: Determinant (CHOLESKY-Diagonal^2)_____=
8.1666629190663719D-23
DET: Determinant (PESO-CHOLESKY)___________=
8.1666629190663719D-23
DET: Determinant (product eigenvalues)_____= -7.6097298409955105D-23
DET: Determ.abs.val.(PESO prod.red.norms)__=
8.2057666026646453D-23
HAC: HADAMARD condition number_____________=
5.3371603014677972D-25
HCN: Heuristic condition |DET|CON__________=
3.5283521543363643D-41
D_I: Determinant Inverse absolute value____=
1.2173378539359222D+22
HDA: HADAMARD Inequality absolute value___<=
1.8944019548821121D+97
HIR: HADAMARD RATIO: D_I / HDA ____________=
6.4259744390502209D-76
Highest inverse positive diagonal value____=
2.8763667252407028D+17
thus multiple r( 5.rest)_________________=
1
and 5 multiple r > .99
There are no negative inverse diagonal values.
Maximum range (upp-low) multip-r(1.rest)_=
.059
LES: Numerical stability analysis:
Ratio maximum range output / input _______=
3094.9693464327093
PESO-Analysis correlation least Ratio RN/ON=
0 (<-> Angle = 0 )
Number of Ratios correlation RN/ON < .01__ =
2
PESO-Analysis Cholesky least Ratio RN/ON__ =
0 (<-> Angle = 0 )
Number of Ratios Cholesky RN/ON < .1 _____ =
1
Ncor
L1-Norm L2-Norm Max Min
m|c| M|c| N_comp s-S S-S
64 39.1 5.4
1 -.097 .555 .263
378 .298 .234
class boundaries and distribution of the correlation coefficients
-1 -.8 -.6 -.4 -.2 0
.2 .4 .6 .8 1
0 0 0
0 2 8 2
16 16 20
Original data with 17, input read with 17, computet
with 19, and showed with 3 digit accuracy
(for control here the analysed original matrix):
Läng Breit Höhe Volum Ober
L*B L*H B*H
1 -.097 .099 .546 .562
.627 .715 .053
-.097 1 .121 .474 .537
.608 .057 .705
.099 .121 1 .6
.656 .208 .696 .698
.546 .474 .6 1
.971 .835 .814 .77
.562 .537 .656 .971 1
.841 .839 .811
.627 .608 .208 .835 .841 1
.58 .54
.715 .057 .696 .814 .839 .58
1 .483
.053 .705 .698 .77 .811
.54 .483 1
i.Eigenvalue Cholesky i.Eigenvalue
Cholesky i.Eigenvalue Cholesky
1. 5.04844 1
2. 1.52607 .9953
3. 1.13646 .9864
4. .1156 .4341
5. .10045 .0656
6. .06789 .2932
7. 5.08D-3 .2385
8. 0 0
Cholesky decomposition successful, thus the matrix is (semi)
positive definit.
Eigenwerte in Prozentanteilen von der Spur = 8
1 .6311 2 .1908 3 .1421
4 .0145 5 .0126 6 8.5D-3
7 6D-4 8 0
[analysed: 11/08/02 09:23:36 PRG version 30.10.2002
MABAT9q.BAS
File = C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\BASISAE1.SMA
with data from C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\BASISAE1.D08]
Matrix der 8 Faktoren nach VEK * EIW^1/2:
.562 -.738 -.312 -.177 .082 -.067 .022
0
.532 .723 -.397 -.146 -.117 .047 .024
0
.663 .067 .727 -.013 -.102 -.128 .023
0
.972 -.029 -.028 .187 .093 .089 .039
0
1 3D-3 -8D-3 -3D-3 -1D-3 8D-3
-.025 0
.838 -.03 -.505 .138 -.087 -.122 -.02
0
.84 -.445 .242 -.055 -.114 .146 -.021
0
.811 .506 .197 -.077 .201 -.021 -.023
0
Transponierte der 8 Faktoren:
.562 .532 .663 .972 1
.838 .84 .811
-.738 .723 .067 -.029 3D-3 -.03 -.445
.506
-.312 -.397 .727 -.028 -8D-3 -.505 .242 .197
-.177 -.146 -.013 .187 -3D-3 .138 -.055 -.077
.082 -.117 -.102 .093 -1D-3 -.087 -.114 .201
-.067 .047 -.128 .089 8D-3 -.122 .146 -.021
.022 .024 .023 .039 -.025 -.02 -.021
-.023
0 0 0
0 0 0
0 0
Reproduktionsmatrix aus allen 8 Faktoren:
1 -.097 .099 .546 .562
.627 .715 .053
-.097 1 .121 .474 .537
.608 .057 .705
.099 .121 1 .6
.656 .208 .696 .698
.546 .474 .6 1
.971 .835 .814 .77
.562 .537 .656 .971 1
.841 .839 .811
.627 .608 .208 .835 .841 1
.58 .54
.715 .057 .696 .814 .839 .58
1 .483
.053 .705 .698 .77 .811
.54 .483 1
Residualanalyse Original-Korrelationen und aus 8 Faktoren reproduzierte:
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
Mittelwert der absoluten Abweichungen .. = 8.8580588041486594D-18
Standardabweichung der abs. Abweichungen = 7.6982920584906198D-18
Maximaler absoluter Abweichungswert .... = 3.415236843329339D-17
Reproduktionsmatrix aus 3 Faktoren:
.957 -.111 .096 .577 .562 .65
.725 .022
-.111 .962 .112 .507 .536 .624
.029 .719
.096 .112 .973 .622 .657 .186
.703 .715
.577 .507 .622 .947 .972 .83
.823 .769
.562 .536 .657 .972 .999 .841
.837 .811
.65 .624 .186 .83 .841
.958 .595 .565
.725 .029 .703 .823 .837 .595
.962 .504
.022 .719 .715 .769 .811 .565
.504 .953
Residualanalyse Original-Korrelationen und aus 3 Faktoren reproduzierte:
.043 .014 3D-3 .03 1D-3
.024 .01 .031
.014 .038 8D-3 .033 0
.016 .028 .014
3D-3 8D-3 .027 .022 1D-3 .022
7D-3 .017
.03 .033 .022 .053 1D-3
6D-3 9D-3 1D-3
1D-3 0 1D-3 1D-3
1D-3 1D-3 2D-3 0
.024 .016 .022 6D-3 1D-3 .042
.015 .025
.01 .028 7D-3 9D-3 2D-3
.015 .038 .021
.031 .014 .017 1D-3 0
.025 .021 .047
Mittelwert der absoluten Abweichungen .. = .015878532284142073
Standardabweichung der abs. Abweichungen = .013666471153286723
Maximaler absoluter Abweichungswert .... = .053013340254718839
[Interne Quellen: Faktoren in C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\FAK\BASISAE1.PFA
als 1-zeiliger Spaltenvektor in C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\FAK\BASISAE1.FAK
Vektordaten von C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\BASISAE1.VEK
Negative Eigenwerte wurden 0 gesetzt:
Eigenwerte von C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\BASISAE1.EDI]
Literatur
Sponsel,
Rudolf & Hain, Bernhard (1994). Numerisch instabile Matrizen und Kollinearität
in der Psychologie. Diagnose, Relevanz & Utilität, Frequenz, Ätiologie,
Therapie. Ill-Conditioned Matrices and Collinearity in Psychology.
Deutsch-Englisch. Übersetzt von Agnes Mehl. Kapitel 6 von Dr. Bernhard
Hain: Bemerkungen über Korrelationsmatrizen. Erlangen: IEC-Verlag
[ISSN-0944-5072 ISBN 3-923389-03-5]. Aktueller Preis: http://ww.iec-verlag.de
___
Sponsel, Rudolf (2005). Fast-
Kollinearität in Korrelationsmatrizen mit Eigenwert-Analysen erkennen.
Ergänzungsband - Band II zu
"Numerisch instabile Matrizen und Kollinearität in der Psychologie
- Ill-Conditioned Matrices and Collinearity in Psychology - Diagnose,
Relevanz & Utilität, Frequenz, Ätiologie, Therapie". Erlangen:
IEC-Verlag. ISSN-0944-5072 * ISBN 3-923389-13-2. WIRE-O-Ringbindung
DIN A4.
___
| Suchen in der IP-GIPT,
z.B. mit Hilfe von "google": <suchbegriff>
site:www.sgipt.org
z.B. Eigenwerte site:www.sgipt.org. |