ebooksgratis.com

See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Spearman'ın sıralama korelasyon katsayısı - Vikipedi

Spearman'ın sıralama korelasyon katsayısı

Vikipedi, özgür ansiklopedi

İstatistik bilim dalında, Spearman'ın sıralama korelasyon katsayısı veya Spearman'ın rho, bu istatistiksel ölçüyü ilk ortaya atan Amerikan istatistikçi Charles Spearman'a atfen adlandırılmıştır.[1] Matematik notasyon olarak çok defa eski Yunan harfi ρ (rho okunur) ile belirtilir. Bir parametrik olmayan istatistik ölçüsüdür ve iki değişken arasındaki bağımlılık, yani korelasyon, ölçüsü olarak bulunup kullanılır. Bu demektir ki Spearman'in rho (ρ) katsayısı iki değişken için çokluluklar dağılımı hakkinda hiç bir varsayım yapmayarak, bu iki değişken arasında bulunan bağlantının herhangi bir monotonik fonksiyon ile ne kadar iyi betimlenebilineceğini değerlendirmek amaçlı incelemedir.[2][3]


Konu başlıkları

[değiştir] Yöntem

Prensip olarak Spearman'ın sıralama korelasyon katsayısı ρ Pearson çarpım-moment korelasyon katsayısının özel bir halidir. ρ değerinin hesaplanması için iki değişken (Y ve X) içinde örneklem verilerinin sıralama düzeninde olmaları gereklidir. Genel olarak, örneklem verileri için bu koşul uygun değildir ve veriler sıralama düzeni halinde olmadan oransal ölçekli veya aralıksal ölçekli veya sırasal ölçekli olarak bulunur ve bu halde bir dönüşümle sıralama düzeni haline sokulurlar. Böylece ρ formulü için sıralama düzenli xi ve yi örneklem verileri kullanılır[4].

Sonra iki değişken için karşılıklı veri elemanları (xi ve yi)nin sıra numaraları arasındaki fark di i=1,...n olarak bulunur. Bu tüm karşılıklı veriler (i=1...n) için uygulanır. Eğer sıra numaraları arasında hiç beraberlik yoksa, ρ değerini bulmak için şu formül kullanılır:

 \rho = 1- {\frac {6 \sum d_i^2}{n(n^2 - 1)}}

Burada

di = xiyi : i elamni Xi ile Yi sıra numaraları arasındaki fark;
n : iki değişkenli örneklemde toplam gözlem sayısı.

Eğer sıralama esnasında beraberlikler bulunursa, sıralama numaraları verileri olarak kullanılarak klasik Pearson çarpım-moment korelasyon katsayısı formulü kullanılması tavsiye edilir. [4] Bu halde sıralama düzeni hazırlanırken beraberlikler halinde kullanılacak strateji her beraber sıra numaralı veriye beraberlik sira ortalama değeri verilmesidir (yani 1 2,5 2,5 3 stratejisinin uygulanmasıdır). Bu halde formül şu olur :


\rho=\frac{n(\sum x_iy_i)-(\sum x_i)(\sum y_i)}
{\sqrt{n(\sum x_i^2)-(\sum x_i)^2}~\sqrt{n(\sum y_i^2)-(\sum y_i)^2}}.

Spearman'in ρ katsayısı değerleri de (aynı Pearson'un çarpım-moment korelasyon katsayısı gibi) -1 ile +1 arasında değişir. Uç değerler (yani ρ=-1 ve ρ=+1 ve yakın değerler) iki değişken sıralaması arasında bağlantının çok iyi olduğunu (eğer sıralamalar noktalar olarak bir serpme diyagramına konulursa hepsinin çizilen bir doğru üzerinde olduğunu) gösterirler. Eğer ρ<0 ise, sıralamalar arasında indirek aksi değişme vardır; yani biri artınca diğeri azalır ve aksi olur. Eğer ρ>0 ise sıralamalar arasında birlikte (yani birlikte artma veya eksilme) değişme görülür. Eğer ρ=0 ise, sıralamalar arasında hiçbir bağlantını bulunmadığı (ve serpme diyagrami üzerinde noktalarin rastgele dağıldıkları) sonucu çıkartılır.

[değiştir] Diğer sıralama korelasyon ölçüleriyle ilişki

Spearman'in ρ sıralama korelasyon katsayısı ile Kendal'ın sıralama korelasyon katsayısı τ, bu ölçüleri destekleyen varsayımlara göre, birbiri ile aynıdır. Ancak aynı örneklem veriler serisi ile hesaplanan Spearman ρ katsayısı değeri ile Kendal'ın τ katsayısı değeri birbirinden farklı olacaktır. Buna başlıca neden hesaplama formüllerin geliştirilmesi için kullanılan mantıksal önerimlerin başka olması ve bu nedenle bibirinden çok değişik iki formülün ortaya çıkmasıdır. Bu iki katsayı arasındaki ilişki bir eşitsizlik ile ifade edilmiştir:

-1 < = 3 * τ - 2 * ρ < = 1

[5] Spearman'in ρ katsayısı sıralama düzeni verileri ile Pearson çarpım-moment korelasyon katsayısının hesaplanmasıdır ve temel mantik olarak bu iki katsayı aynı önerimlere dayanırlar. Halbuki Kendal'in τ katsayısı bir olasılık ifade eder ve uyuşma ve uyuşmama puanları için gerçek toplam ile maksimum mümkün toplam arasında bir orantıdır.

[değiştir] Örneğin

Tabloda iki değişken X ve Y için n=8 gözlem sayılı örneklem verileri için Spearman'ın sıralama korelasyon katsayısı ρ hesaplanması için örneğin verilmektedir. [A] ve [B] sütunlarında bu iki değişken X ve Y için örneklem verileri verilmiştir. [C] ve [D] sütunlarinda bu iki değişkenlerin verileri için ayrı ayrı sıralama düzeni uygulanıp sıra numaraları x ve y olarak verilmiştir. X için verilerde 2 değişik beraberlik görülmektedir: 3 ve 10. Bu nedenle iki tekrarlı 3 için verilen sıra numaralari ortalaması (2+3)/2= 2,5 dur. Aynı şeklide 2 tekrarlı 10 için sıra numaraları 7,5 7,5 olarak verilmiştir. Y icin verilerde ise 1,5 icin 2 beraberlik ve 5 icin 2 beraberlik bulunmaktadir ve bunlara da ortalama sıra numaraları verilmiştir. Sütun [E]de sıra numaraları farkları d verilmekte ve son [F] sütununda fark kareleri d2 hesaplanmaktadır.

[A] [B] [C] [D] [E] [F]
X Y x : X için sıralama y : Y için sıralama d : Sıralama
farkları
d2 : Farkların karesi
2 1,5 1 2,5 -1,5 2,25
3 1,5 2,5 2,5 0 0
3 4 2,5 5 -2,5 6,25
5 3 4 4 0 0
5,5 1 5 1 4 16
8 5 6 6,5 -0,5 0,25
10 5 7,5 6,5 1 1
10 9,5 7,5 8 -0,5 0,25
        Kareler
Toplamı
26


Fark kareleri toplamı \sum d_i^2 = 26 olarak bulunmuştur. Hesaplarin değerleri formüle şöyle konulur:

 \rho = 1- {\frac {6\times26}{8(8^2 - 1)}}

ve şu sonuç bulunur ρ = − 0.3.

Bu ρ=-0.3 degeri sıfıra yakin negatifdir. Sıfıra yakınlığı X ve Y sıralamaları arasındaki bağlantının (korelasyonun) az olduğunu gösterir ve negatif olma ise var zayıf bağlantının aksi yönde olduğunu ifade eder (yani X sıralaması artarsa Y sıralaması düşer ve aksi olur).

Bu veriler içinde beraberlikler bulunmaktadır. Bu nedenle kullanılan genel ρ formülü uygun sonuç vermeyebilir. Daha uygun sonuç bulmak için x ve y sıra numaraları için Pearson'un çarpım-moment korelasyon katsayısı bulunması tavsiye edilmektedir.

[değiştir] ρ kestirimi için anlamlılık sınaması

Eğer hesaplar ve anlamlılık sınaması el hesap makinaları ile yapılmakta ise klasik sonuç çıkartıcı istatistik yöntemleri kullanılmalıdır.

ρ kestirminin anlamlılık sınanması için en basit yaklaşım belirli gözlem sayısı ve belirli anlamlılık düzeyi değerleri için hazırlanmış özel tablolar kullanılarak başarılır [5]. Ancak bu tablolar belirli veri sayısı ve anlamlılık düzeyi dışında ise kullanılamaz.

Önemli kompüter istatistik paketleri Spearman'in sıralamalı korelasyon katsayısını hesapladıkları zaman ek olarak anlamlılık sınaması için p-değerini de yanında vermektedirler.

Diğer bir alternatif yaklaşım eğer örneklem hacmi 20den büyük ise uygulanabilir. Bu halde Student'in t dağılımına bir yaklaşım kullanılır:

t = \frac{\rho}{\sqrt{(1-\rho^2)/(n-2)}}
\rho = \frac{t}{\sqrt{n-2+t^2}}

değişkeni sıfır hipotez olan ρ=0 için bir Student'in t dağılımı gösterir. Ancak karşıt hipotez biraz zayıftır ve sifir hipotez ret edilnece ρ'nun ne değer alacağını göstermez.

Gözümlenen ρ değerinin anlamlı şekilde 0dan başka değerde olmasını sınama için modern yaklaşım olarak tekrar örnekleme sınaması yöntemi kullanılmaktadır ve bu tip sınama için, sıfır hipotez verilmişse anakütle ρ değerinin örneklemle elde edilen değerde ve ondan büyük olma olasılığı hesap edilir. Bu modern sınama yöntemi ancak kompüter programı yazabilen ve kompüteri iyi kullanabilen bir bilim adamı için çok kolay olabilir.

[değiştir] İçsel kaynaklar

[değiştir] Dışsal kaynaklar

  • [1] Küçük örneklemler için ρ için kritik değerler tablosu.
  • [2] Online ρ hesaplayıcısı.
  • [3] Beraberlikler olursa kullanılabilecek bir diğer formül vermekte.
  • [4] Spearman'ın sıralama korelasyon katsayısı: Öğrenciler için hazırlanmış bir örnek problem çözümü ve notlar. Hesaplama için Microsoft Excel kullanılması da gösterilir.

[değiştir] Referanslar

  1. ^ Spearman,C.(1904) "The proof and measurement of association between two things" Amer.J.Psychol. C.15 say.72–101
  2. ^ Kendall,M.G. (1962) Rank correlation methods, Griffin
  3. ^ Hollander,M. ve Wolfe,D.A. (1973) Nonparametric statistical methods, New York:Wiley
  4. ^ a b Myers,J.L. ve Well,A.D. (2003), Research Design and Statistical Analysis (2.ed.), Lawrence Erlbaum
  5. ^ a b Siegel,S. ve Castellan,N.J. (1988), Nonparametric statistics for the behavioral sciences 2. ed. New York: McGraw-Hill


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -