Ist die Alpha-Faktorenanalyse von Kaiser (1965) leistungsfähiger?
Zur Kritik der Faktorenanalyse
von Rudolf Sponsel, Erlangen
Da Kaiser wie die meisten FaktorenanalytikerInnen es vorzieht auf die Darstellung, Analyse und kritische Erörterung der Reproduktionsmatrizen zu verzichten (damit sie nicht sehen müssen, was sie anrichten), betrachten wir zunächst die Originaldaten - und ihre Matrixanalyse - , auf sie sich Kaiser bezieht, um beurteilen zu können, ob mit der sog. Alpha- Faktorenanalyse irgendetwas gewonnen und verbessert wird, oder ob die gleichen abwegigen Reproduktions- Matrizen und Malträtierungen resultieren wie gewöhnlich in einer falsch verstandenen Mathematik der Produkt- Moment- Korrelationsmatrix * Abstract/ Zusammenfassung * Querverweise |
HARMAN, H.H.(USA: Personnel Research Branch, The Adjudant
General's Office)
"Modern Factor Analysis" 3.I. Chicago 1970:
(2) p.80 Table 5.3 Eight physical variables
for 305 Girls
Samp Or MD NumS Condit Determinant
HaInRatio R_OutIn K_Norm C_Norm
305 8 -1 -?
48.4 .000967398 .0062376
3.1 .066(0) .388(0)
|
********** Summary of standard correlation
matrix analysis ***********
File = H808.K08 N-order= 8
N-sample= 305 Rank= 8 Missing data = ?
Positiv Definit=Cholesky successful________= Yes with 0 negat.
eigenvalue/s
HEVA: Highest eigenvalue abs.value_________=
4.6728795957396132
LEVA: Lowest eigenvalue absolute value_____=
.096462640199736698
CON: Condition number HEVA/LEVA___________~=
48.442377132368477
DET: Determinant original matrix___________=
9.6739845312652618D-4
HAC: HADAMARD condition number_____________=
9.8265711281260626D-6
HCN: Heuristic condition |DET|CON__________=
1.99700863251016D-5
D_I: Determinant Inverse absolute value____=
1034
HDA: HADAMARD Inequality absolute value___<=
165719
HIR: HADAMARD RATIO: D_I / HDA ____________=
6.2376765334217995D-3
Highest inverse positive diagonal value____=
6.636303867
thus multiple r( 2.rest)_________________=
.921582178
There are no negative inverse diagonal values.
Maximum range (upp-low) multip-r( 7.rest)_=
9E-3
LES: Numerical stability analysis:
Ratio maximum range output / input _______=
3.060261118198108
PESO-Analysis correlation least Ratio RN/ON=
.065947 (<-> Angle = 3.78 )
Number of Ratios correlation RN/ON < .01__ =
0
PESO-Analysis Cholesky least Ratio RN/ON__ =
.388183 (<-> Angle = 22.84 )
Number of Ratios Cholesky RN/ON < .1 _____ =
0
Ncor L1-Norm L2-Norm Max
Min m|c| s|c| N_comp M-S
S-S
64 37
5.05 1 .237 .519
.208 378 .241 .179
class boundaries and distribution of the correlation-coefficients
-1 -.8 -.6 -.4 -.2 0
.2 .4 .6 .8 1
0 0 0
0 0 0 26
12 6 20
Original input data with 3-digit-accuracy and read with
3-digit-accuracy (for control here the analysed original
matrix):
1 2
3 4 5
6 7 8
1 1 .846 .805 .859
.473 .398 .301 .382 1 Height
2 .846 1 .881 .826
.376 .326 .277 .415 2 Arm span
3 .805 .881 1 .801
.38 .319 .237 .345 3 Length of forearm
4 .859 .826 .801 1
.436 .329 .327 .365 4 Length of lower leg
5 .473 .376 .38 .436
1 .762 .73 .629 5 Weight
6 .398 .326 .319 .329 .762
1 .583 .577 6 Bitrochanteric diameter
7 .301 .277 .237 .327 .73
.583 1 .539 7 Chest girth
8 .382 .415 .345 .365 .629
.577 .539 1 8 Chest width
i.Eigenvalue Cholesky i.Eigenvalue
Cholesky i.Eigenvalue Cholesky
1. 4.67288 1
2. 1.77098 .5332
3. .48104 .4597
4. .42144 .469
5. .23322 .876
6. .18667 .6412
7. .1373 .6665
8. .09646 .7226
Cholesky decomposition successful, thus the matrix is (semi)
positive definit.
[Intern: Analysed: 07/18/85 19:49:58 PRG version
15/03/94 MA_BAT6.BAS]
Die Faktoren nach der Original-Matrix
2 Faktormatrix nach der Originalmatrix F:
.859 .372
.842 .441
.813 .459
.84 .395
.758 -.525
.674 -.533
.617 -.58
.671 -.418
Transpose Factor Matrix F' :
.859 .842 .813 .84 .758
.674 .617 .671
.372 .441 .459 .395 -.525 -.533 -.58
-.418
Reproduction Matrix F * F' with DET= 1.8444830978194555D-115
.877 .887 .87 .869 .456
.381 .315 .421
.887 .903 .887 .881 .407
.332 .264 .38
.87 .887 .872 .864 .376
.304 .236 .353
.869 .881 .864 .861 .429
.355 .289 .398
.456 .407 .376 .429 .850
.791 .772 .728
.381 .332 .304 .355 .791 .739
.726 .675
.315 .264 .236 .289 .772 .726
.717
.657
.421 .38 .353 .398 .728
.675 .657 .625
[Intern: Analysis from 10/21/02 20:35:44 with
KORFAK1.BAS (08/31/94) 2 Factors data from file C:\OMI\NUMERIK\MATRIX\FAK\NEU\H808\FAK\H808.F2
Reproduction matrix in C:\OMI\NUMERIK\MATRIX\FAK\NEU\H808IMA
Reproduction correlations in C:\OMI\NUMERIK\MATRIX\FAK\NEU\H8D.F08
Einlesen im MAT-Format 11,12,13,...N*M-Werte eingelesen
8 urspruengl. Zahl Variable reproduziert durch 2 Faktoren]
RO-Residual-Analyse zwischen Originalmatrix und der aus den zwei Faktoren rückgerechneten Reproduktionsmatrix RO
Matrix residuals (whole matrix inclusive diagonal):
Mean absolute values of residuals = .057819710012820761
Sigma absolute values of residuals = .069870909870785513
Maximum range absolute values = .37517270860428772
(r8.8)
Matrix residuals upper triangular matrix without diagonal:
Mean absolute values of residuals = .038291497867569948
Sigma absolute values of residuals = .03604363
Maximum range absolute values = .14251385172588222
(r6.7)
RO-Residual-Analysis: Mean= .05781971 Sigma= .06987091 Maximum range= .37517271 (r8.8)
Original Korrelations-Matrix A:
1 .846 .805 .859
.473 .398 .301 .382
.846 1 .881 .826
.376 .326 .277 .415
.805 .881 1 .801
.38 .319 .237 .345
.859 .826 .801 1
.436 .329 .327 .365
.473 .376 .38 .436 1
.762 .73 .629
.398 .326 .319 .329 .762 1
.583 .577
.301 .277 .237 .327 .73
.583 1 .539
.382 .415 .345 .365 .629 .577
.539 1
Reproduktionsmatrix aus zwei Faktoren der Original Matrix B:
.877 .887 .87 .869 .456
.381 .315 .421
.887 .903 .887 .881 .407 .332
.264 .38
.87 .887 .872 .864 .376
.304 .236 .353
.869 .881 .864 .861 .429 .355
.289 .398
.456 .407 .376 .429 .85
.791 .772 .728
.381 .332 .304 .355 .791 .739
.726 .675
.315 .264 .236 .289 .772 .726
.717 .657
.421 .38 .353 .398 .728
.675 .657 .625
Original Matrix of residuals:
.123 -.041 -.065 -.01 .017 .017 -.014 -.039
-.041 .097 -6E-3 -.055 -.031 -6E-3 .013 .035
-.065 -6E-3 .128 -.063 4E-3 .015 1E-3 -8E-3
-.01 -.055 -.063 .139 7E-3 -.026 .038 -.033
.017 -.031 4E-3 7E-3 .15 -.029 -.042
-.099
.017 -6E-3 .015 -.026 -.029 .261 -.143 -.098
-.014 .013 1E-3 .038 -.042 -.143 .283 -.118
-.039 .035 -8E-3 -.033 -.099 -.098 -.118 .375
Die Faktoren nach der Alpha-Faktorenanalyse von Kaiser (1965)
KAISER, H.F. & CAFFREY, J. (1965). Alpha Factor Analysis. Psychometrika 30, 1-14., p. 13
Alpha-Faktormatrix F:
.814 .42
.803 .496
.758 .494
.787 .432
.805 -.482
.68 -.42
.62 -.444
.645 -.29
Transpose Alpha-Factor Matrix F' :
.814 .803 .758 .787 .805 .68
.62 .645
.42 .496 .494 .432 -.482 -.42
-.444 -.29
Reproduction Alpha Matrix F * F' with DET= -2.1530485312129525D-118
.839 .862 .824 .822 .453 .377
.318 .403
.862 .891 .854 .846 .407 .338
.278 .374
.824 .854 .819 .81 .372
.308 .251 .346
.822 .846 .81 .806 .425
.354 .296 .382
.453 .407 .372 .425 .88
.75 .713 .659
.377 .338 .308 .354 .75
.639 .608 .56
.318 .278 .251 .296 .713 .608
.582 .529
.403 .374 .346 .382 .659 .56
.529 .5
[Intern: Analysis from 10/21/02 13:48:48
with KORFAK1.BAS (08/31/94) 2 Factors data from file C:\OMI\NUMERIK\MATRIX\FAK\NEU\H08\ALPHA8.F02
Reproduction matrix in C:\OMI\NUMERIK\MATRIX\FAK\NEU\ALPHA8.IMA
Reproduction correlations in C:\OMI\NUMERIK\MATRIX\FAK\NEU\ALPHAD.F08
Einlesen im MAT-Format 11,12,13,...N*M-Werte
eingelesen 8 urspruengl. Zahl Variable reproduziert
durch 2 Faktoren]
RA-Residual-Analyse zwischen Originalmatrix und der aus der Alpha-Faktorenanalyse mit zwei Faktoren rückgerechneten Reproduktionsmatrix RA
Original-Matrix A:
1 .846 .805 .859
.473 .398 .301 .382
.846 1 .881 .826
.376 .326 .277 .415
.805 .881 1 .801
.38 .319 .237 .345
.859 .826 .801 1
.436 .329 .327 .365
.473 .376 .38 .436 1
.762 .73 .629
.398 .326 .319 .329 .762 1
.583 .577
.301 .277 .237 .327 .73
.583 1 .539
.382 .415 .345 .365 .629 .577
.539 1
Aus 2-Faktoren der Alpfa-Faktorenanalyse rückgerechnete
Matrix B:
.839 .862 .824 .822 .453
.377 .318 .403
.862 .891 .854 .846 .407
.338 .278 .374
.824 .854 .819 .81 .372
.308 .251 .346
.822 .846 .81 .806 .425
.354 .296 .382
.453 .407 .372 .425 .880
.750 .713 .659
.377 .338 .308 .354 .750 .639
.608 .560
.318 .278 .251 .296 .713 .608
.582
.529
.403 .374 .346 .382 .659 .560
.529 .500
RA-Residual-Analysis: Mean= .0482 Sigma= .093 Maximum range= .4999 (r8.8)
Matrix residuals (whole matrix inclusive diagonal):
Mean absolute values of residuals = .0482
Sigma absolute values of residuals = .093
Maximum range absolute values = .4999 (r8.8)
Matrix residuals upper triangular matrix without diagonal:
Mean absolute values of residuals = .0186
Sigma absolute values of residuals = 9.7D-3
Maximum range absolute values = .0409 (r2.8)
Matrix of residuals:
.1610 -.016 -.0195 .0369 .0202
.0209 -.0172 -.0212
-.016 .1092 .0273 -.0202 -.0313 -.0117
-6D-4 .0409
-.0195 .0273 .1814 -9D-3 7.9D-3
.011 -.0136 -6D-4
.0369 -.0202 -9D-3 .1940 .0107 -.0247
.0309 -.0173
.0202 -.0313 7.9D-3 .0107 .1197
.0122 .0169 -.03
.0209 -.0117 .011 -.0247 .0122 .3612
-.0251 .0166
-.0172 -6D-4 -.0136 .0309 .0169 -.0251 .4185
.0103
-.0212 .0409 -6D-4 -.0173 -.03 .0166
.0103 .4999
Die Originalmatrix ist positiv definit und
kann daher problemlos faktorisiert werden. Die Determinante ist zwar mit
DET = .000967398 bei nur 8 Variablen relativ klein, was eine oder mehrere
Fast-Kollinearitäten anzeigen könnte, doch wie man sieht, sind
zwei Faktoren viel zu wenig, um eine halbwegs angemessene Reproduktionsmatrix
zu erzeugen. Um zu sehen, ob die Alpha-Faktorenanalyse von Kaiser Besseres
leistet, vergleichen wir die Reproduktionsmatrix RO aus den zwei Faktoren
der Originalmatrix mit der Reproduktionsmatrix RA der zwei Faktoren nach
der Alpha-Faktorenanalyse von Kaiser:
RO-Residual-Analysis:Die Abweichungen der Original-Reproduktionsmatrix ergeben im Mittel 0.0578 gegenüber 0.0482 der Alpha-Reproduktionsmatrix, das ist ein um 0.0096 besserer Wert. Vergleicht man die maximalen Wertabweichungen beider Verfahren, so ergibt sich bei der Alpha- Faktorenanalyse ein um 0.1247 höherer und damit viel schlechterer Wert. So gesehen zeigt sich die Alpha-Faktorenanalyse zumindest bei diesem Beispiel als keineswegs bessere oder überlegenere Methode. Man wird hier mindestens vier Faktoren brauchen, vielleicht sogar 6 oder 7, um die Ursprungsmatrix gut zu reproduzieren. Querverweise |
Suchen in der IP-GIPT,
z.B. mit Hilfe von "google": <suchbegriff>
site:www.sgipt.org
z.B. Faktorenanalyse site:www.sgipt.org |
Änderungen - wird unregelmäßig
überarbeitet, kleine Änderungen werden nicht extra dokumentiert
16.03.15 Linkfehler geprüft und
korrigiert, Layoutaktualisierung.