Vikipedi, özgür ansiklopedi
İstatistik bilim dalında D'Agostino'nun K2 sınaması normal dağılımdan ayrılmayı ölçmek için kullanılan bir uygulama iyiliği ölçüsüdür. Örneklem basıklık ve çarpıklık ölçülerinin dönüşümlerinden elde edilmiştir. K2 istatistiği şöyle elde edilir:
n değerinin gözlem sayısı ve böylelikle genellikle serbestlik derecesi olduğu bilinmektedir. Örneklem çarpıklık ölçüsü,
b
1
{\displaystyle {\sqrt {b_{1}}}}
, şöyle tanımlanır:
b
1
=
μ
3
σ
3
=
μ
3
(
σ
2
)
3
/
2
=
1
n
∑
i
=
1
n
(
x
−
x
¯
)
3
(
1
n
∑
i
=
1
n
(
x
−
x
¯
)
2
)
3
/
2
{\displaystyle {\sqrt {b_{1}}}={\frac {\mu _{3}}{\sigma ^{3}}}={\frac {\mu _{3}}{\left(\sigma ^{2}\right)^{3/2}}}={\frac {{\frac {1}{n}}\sum _{i=1}^{n}\left(x-{\bar {x}}\right)^{3}}{\left({\frac {1}{n}}\sum _{i=1}^{n}\left(x-{\bar {x}}\right)^{2}\right)^{3/2}}}}
Örneklem basıklık ölçüsü,
b
2
{\displaystyle {\sqrt {b_{2}}}}
ise şöyle tanimlanır:
b
2
=
μ
4
σ
4
=
μ
4
(
σ
2
)
2
=
1
n
∑
i
=
1
n
(
x
−
x
¯
)
4
(
1
n
∑
i
=
1
n
(
x
−
x
¯
)
2
)
2
{\displaystyle b_{2}={\frac {\mu _{4}}{\sigma ^{4}}}={\frac {\mu _{4}}{\left(\sigma ^{2}\right)^{2}}}={\frac {{\frac {1}{n}}\sum _{i=1}^{n}\left(x-{\bar {x}}\right)^{4}}{\left({\frac {1}{n}}\sum _{i=1}^{n}\left(x-{\bar {x}}\right)^{2}\right)^{2}}}}
Burada
x
¯
{\displaystyle {\bar {x}}}
örneklem ortalaması , σ2 ikinci merkezsel moment veya varyans ve sırasiyla μ3 ve μ4 üçüncü ve dördüncü merkezsel moment lerdir.
Önce, çarpıklık ölçüsü
b
1
{\displaystyle {\sqrt {b_{1}}}}
'nin bir dönüşümü olan
Z
(
b
1
)
{\displaystyle Z\left({\sqrt {b_{1}}}\right)}
hesaplanır. Verinin normal dağılım gösterdiğine dair sıfır hipotez geçerli ise, bu ifade yaklaşık olarak normal dağılım gösterir:
Y
=
b
1
⋅
(
n
+
1
)
(
n
+
3
)
6
(
n
−
2
)
{\displaystyle Y={\sqrt {b_{1}}}\cdot {\sqrt {\frac {(n+1)(n+3)}{6(n-2)}}}}
β
2
(
b
1
)
=
3
(
n
2
+
27
n
−
70
)
(
n
+
1
)
(
n
+
3
)
(
n
−
2
)
(
n
+
5
)
(
n
+
7
)
(
n
+
9
)
{\displaystyle \beta _{2}\left({\sqrt {b_{1}}}\right)={\frac {3(n^{2}+27n-70)(n+1)(n+3)}{(n-2)(n+5)(n+7)(n+9)}}}
W
2
=
−
1
+
2
(
β
2
(
b
1
)
−
1
)
{\displaystyle W^{2}=-1+{\sqrt {2(\beta _{2}\left({\sqrt {b_{1}}}\right)-1)}}}
δ
=
1
/
l
n
(
W
)
{\displaystyle \delta =1/{\sqrt {ln(W)}}}
α
=
2
W
2
−
1
{\displaystyle \alpha ={\sqrt {\frac {2}{W^{2}-1}}}}
Z
(
b
1
)
=
δ
l
n
(
Y
/
α
+
(
Y
/
α
)
2
+
1
)
{\displaystyle Z\left({\sqrt {b_{1}}}\right)=\delta ln\left(Y/\alpha +{\sqrt {(Y/\alpha )^{2}+1}}\right)}
Sonra, basıklık ölçüsü olan
b
2
{\displaystyle b_{2}}
'in bir dönüşümü olan
Z
(
b
2
)
{\displaystyle Z\left(b_{2}\right)}
hesaplanır. Verinin normal dağılım gösterdiğine dair sıfır hipotez geçerli ise, bu ifade de yaklaşık olarak normal dağılım gösterir:
E
(
b
2
)
=
3
(
n
−
1
)
n
+
1
{\displaystyle E\left(b_{2}\right)={\frac {3(n-1)}{n+1}}}
σ
b
2
2
=
24
n
(
n
−
2
)
(
n
−
3
)
(
n
+
1
)
2
(
n
+
3
)
(
n
+
5
)
{\displaystyle \sigma _{b_{2}}^{2}={\frac {24n(n-2)(n-3)}{(n+1)^{2}(n+3)(n+5)}}}
x
=
b
2
−
E
(
b
2
)
σ
b
2
{\displaystyle x={\frac {b_{2}-E\left(b_{2}\right)}{\sigma _{b_{2}}}}}
Bundan sonra ise, basıklık ifadesinin çaprazlığı bulunur:
β
1
(
b
2
)
=
6
(
n
2
−
5
n
+
2
)
(
n
+
7
)
(
n
+
9
)
6
(
n
+
3
)
(
n
+
5
)
n
(
n
−
2
)
(
n
−
3
)
{\displaystyle {\sqrt {\beta _{1}\left(b_{2}\right)}}={\frac {6(n^{2}-5n+2)}{(n+7)(n+9)}}{\sqrt {\frac {6(n+3)(n+5)}{n(n-2)(n-3)}}}}
A
=
6
+
8
β
1
(
b
2
)
[
2
β
1
(
b
2
)
+
1
+
4
β
1
(
b
2
)
]
{\displaystyle A=6+{\frac {8}{\sqrt {\beta _{1}\left(b_{2}\right)}}}\left[{\frac {2}{\sqrt {\beta _{1}\left(b_{2}\right)}}}+{\sqrt {1+{\frac {4}{\beta _{1}\left(b_{2}\right)}}}}\right]}
Z
(
b
2
)
=
(
(
1
−
2
9
A
)
−
1
−
2
/
A
1
+
x
2
/
(
A
−
4
)
3
)
9
A
2
{\displaystyle Z\left(b_{2}\right)=\left(\left(1-{\frac {2}{9A}}\right)-{\sqrt[{3}]{\frac {1-2/A}{1+x{\sqrt {2/(A-4)}}}}}\right){\sqrt {\frac {9A}{2}}}}
Şimdi, bu
Z
(
b
1
)
{\displaystyle Z\left({\sqrt {b_{1}}}\right)}
ile
Z
(
b
2
)
{\displaystyle Z\left(b_{2}\right)}
ifadelerini birleştirip normallik sınaması için D'Agustino'nun sınama istatistiği şöyle tanımlanır:
K
2
=
(
Z
(
b
1
)
)
2
+
(
Z
(
b
2
)
)
2
{\displaystyle K^{2}=\left(Z\left({\sqrt {b_{1}}}\right)\right)^{2}+\left(Z\left(b_{2}\right)\right)^{2}}
K
2
{\displaystyle K^{2}}
istatistiği yaklaşık olarak serbestlik derecesi 2 olan bir
χ
2
{\displaystyle \chi ^{2}}
ile dağılım gösterir.
D'Agostino, Ralph B., Albert Belanger, and Ralph B. D'Agostino, Jr. "A Suggestion for Using Powerful and Informative Tests of Normality", The American Statistician , Cilt. 44, No. 4. (Kasım., 1990), say. 316-321.