Varyans analizi
Vikipedi, özgür ansiklopedi
İstatistik bilim dalinda varyans analizi (veya ANOVA), gözlenen varyansı çeşitli kısımlara ayırma yöntemiyle bazı değişkenlerin başka bir değişken üzerindeki etkisini incelemeye yarayan bir grup modelleme türü ve bu modellerle ilişkili işlemlere verilen genel isimdir. Bu tür modeller gözümlenen varyansın çeşitli açıklayıcı değişkenlerin etki parçalarına bölmelesini incelerler.
Bu yöntem ilk defa İngiliz istatistikçi ve genetikçi Ronald Fisher tarafından 1920'li ve 1930'lu yıllarda geliştirilmiştir. Genel olarak istatistiksel anlamlılık sınamaları içinde F-dağılımıni kullanmaları ile karakterize edildikleri için bazan Fisher'in varyans analizi adı da verilmektedir.
Konu başlıkları |
[değiştir] Genel Bakış
Bu tür modeller için üç kavramsal sınıf ayrımı yapılabilir:
- Sabit etki modelleri, verinin normal dağılım gösteren bir anakütleden geldiğini ve ancak farklı ortalamalar dolayısıyla ayrım yapılabileceğini varsaymaktadırlar.
- Rasgele etki modelleri, verinin bir farklar hiyerarşisi ile sınırlanmış olan değişik hiyerarşi içeren anakütlelerden geldiğini varsayar.
- Karışık etki modelleri, içinde hem sabit etkiler hem de rastgele etkiler kapsayan durumları inceler.
Pratik problemlerde varyans analizi deneylemler için kullanılır ve deneylem elemanlarına uygulanan sağlatımların sayısına ve nasıl uygulandıklarına göre birkaç değişik tipe sınıflandırılmaktadırlar:
- Tek-yönlü varyans analizi
Bu tür analiz iki veya daha çok sayıda bağımsız gruplar arasındaki farklılıkların sınanması istenildiği hallerde uygulanır. Tipik olarak tek yönlü varyans analizi en aşağı üç değişik grup olduğu zaman uygulanmaktadır. İki-grup halinde daha kolay olarak t-sınaması aynı sonuçları vermektedir; çünkü bu halde t-sınaması ve F-sınaması birbirine çok yakından ilişkilidir. Bu yakın ilişki şöyle ifade edilir:
- F = t2.
- Tekrarlanan ölçülerle tek-yönlü varyans analizi
Bu tür varyans analizinde ayni elamanlara her değişik sağlatım uygulanır, yani elamanlar tekrarlanan ölçülere tabi tutulurlar. Bu yöntem kullanılırken elemanlar kalıntı etkilerine maruz kalabilirler.
- Faktöryel varyans analizi
Bu tür varyans analizi eğer deneyci iki veya daha çok sayıda sağlanım değişkenin etkilerini incelemek isterse kullanılır. En çok kullanılan faktöryel varyans analizi iki bağımsız değişken ve her değişken için iki değişik değer veya seviye olduğu 2x2 (ikiye iki) tasarımdır. Faktöryel varyans analizi çoklu seviyeli, 3x3 (üçe üç) veya daha yüksek sıralı 2x2x2 (ikiye ikiye iki) v.b. deneylem tasarımlarında da kullanılabilirler. Ancak bu daha yüksek sayıda faktörler için analizler çok nadir olarak yapılmaktadır. Buna neden hesapların çok karmaşık ve uzun olması ve ortaya çıkattılan sonuçların açıklanmalarının çok zor olduğudur.
- Karışık tasarım varyans analizi
Eğer iki veya daha çok sayıda bağımsız gruplarda elemanları tekrar edilen olçüler uygulayıp sınamak istenilince bir faktöryel karışık tasarım varyans analizi gerçekleştirilebilinir. Bunda bir faktör bağımsız olur ve diğer faktör tekrar edilebilir ölçülere bağlıdır. Bu karışık etkiler modeline bir örnektir.
- Çoklu değişirli varyans analizi:
Birden çok bağımlı değişken bulunduğu zaman bu tür varyans analizi kullanılır.
[değiştir] Modeller
[değiştir] Sabit etkiler modelleri
Varyans analizi içinde sabit etkiler modeli, bir deneylem içinde deneycinin deney örneklem elemanlarına yanıt değişkeni değerlerinin birkaç değişik sağlanim uyguladığı zaman değişip değişmediğini inclemek istediği hallere tatbik edilir. Bu modeller deneyciye sağlanımın tüm anakütle içinde ortaya çıkarabileceği yanıt değişken değerlerinin açıklığını kestirim yapma imkanı sağlar.
[değiştir] Rastgele etkiler modelleri
Rastgele etkiler modelleri, saglanimlar sabit olmadiklari hallerde kullanilirlar. Bu (faktor seviyeleri adi ile de bilinen) degisik saglanimlar daha buyuk bir anakutleden orneklem ile bulunmalari halidir. Saglanimlari kendileri rassal degisken olmalari nedeniyle, sabit etkiler modelinden daha degisik bazi varsayimlarin ve saglanimlarin karsilastirilmalari gerekmektedir.
Rastgele etkiler modelerinin veya karisik etki modellerinin cogunda iyi belirenmis orneklemi alinmis faktorleri ilgilendiren sonuc cikartici analizlerle ilgili degildir. Bunu aciklamak icin ayni mali uretmek icin cok degisik makinalarin kullanildigi bir sanayi birimi ele alinsin. Bu isletmeyi inceleyen istatisikci uc degisik makinenin birbirleri ile karsilastirilmasi ile ilgili olmayacaktir. Buna karsilik tum makinalar hakkinda, tum ortalama uretkenlik ve degisik makinelerde uretkenligin yayilimi hakkinda sonuc cikartici istatistik sinamalarla ilgilenebilir.
[değiştir] Varsayımlar
- İstatistiksel bağımsızlık: Bu varsayım deneylem tasarımı için gerekmekte ve sağlatım uygulanan elamanların bağımsız oldukları varsayılmaktadır.
- Normallik: Her bir grup içindeki elamanların normal dağılım gösteren anakütlelerden geldikleri varsayılır. Verilerinin normallik özelliği olup olmadığı ya normallik sınamaları olan Kolmogorov-Smirnov sınaması veya Shapiro-Wilk sınaması kullanılarak incelenebilir. Normallik varsayımını incelemek için parametrik olmayan istatistik sınaması olan Kruskal-Wallis sınaması da kullanılabilir.
- Eşit varyanslar veya homoskedastiklik: Her bir grup elemanlarının geldikleri anakütlelerde varyansların ayni olduğu varsayılır. Verilerin eşit varyanslar varsayımına uyup uymadıklarını sınamak için tipik olarak Levene'in sınamas kullanılır.
Bazı istatistikçiler verilerin normallikten ayrılması halinde varyans analizinin esası olan F-sınamasınin güvenilmez olacaçını bildirmektedir [1]. Diğer istatistikçiler ise F-sınamasının güçlü olup normal olmamakdan fazla etkilenmediğini savunmaktadırlar.[2]
Bu ortak varsayımlar yanında sabit etki modelleri için hataların bağımsız ve aynı şekilde normal dağılım gosterdikleri de yani
olduğu varsayılmaktadır. Varyans analizi için kullanılan rastgele etki modelleri ve karışık etki modelleri için hataların ortalama ve varyansı için daha karmaşık varsayımlar gerekmektedir çünkü faktörler kendilerine özel dağılımlardan ortaya çıkartılabilirler.
[değiştir] Varyans analizinin inceleme yaklaşımı
Varyans analizinde temel yöntem toplam kareler toplamını modelde kullanılan etkilere uygun olan parçalara bölmektir. Bu yönteme aşağıda verilen örnek tek bir sağlatımın değişik seviyelere uygulanması halidir.
[değiştir] Kareler toplamının parçalara bölünmesi
Örnek olarak tek bir sağlatımın değişik seviyeler uygulanması sonucu ortaya çıkan toplam kareler toplamı şu parçalara bölünür:
Serbestlik dereceleri de aynı şekilde parçalara bölünmektedir ve her ilgili parçanın bir [[ki-kare dağılımı] gösterdiği belirlenmektedir.
[değiştir] F-sınaması
Toplam sapmanın parçalarinin karşılaştırılması için F-sınaması uygulanır. Tek yönlü veya tek faktörlü varyans analizi için istatistik anlamlılığın sınanması, F-sınama istatistiği olan şu
- burada:
- , I = sağlatımlar sayısı
- ve
- , nT = toplam gözlem eleman sayısı
ifade ile I-1 ve nT serbestlik derecelerinde F-dağılımı ifadesini karşılaştırmak suretiyle gerçekleştirilir.
F-dağılımı kullanmak doğal bir uygulamadır çünkü sınama istatistiği her biri ki-kare dağılımı gösteren iki kareler toplamları ortalamasının bir diğerine bölümüne eşittir.
[değiştir] İçsel kaynaklar
- Covaryanslar analizi
- Duncan'ın yeni çoklu açıklık sınaması
- açıklanan varyans ve açıklanmayan varyans
- Çok değişirli varyans analizi
- F-sınaması
- Ölçüm belirsizliği
- Sapmaların karesi
- Çoklu karşılaştırmalar
- t-sınaması
- Kruskal-Wallis sınaması
- Friedman sınaması
[değiştir] Referanslar
- ^ Lindman,H.R. (1974), Analysis of variance in complex experimental designs. San Francisco: W. H. Freeman & Co.
- ^ Ferguson,G.A. ve Takane,Y. (2005), Statistical Analysis in Psychology and Education 6.Ed.. Montréal, Quebec: McGraw-Hill Ryerson Ltd.
[değiştir] Dışsal kaynaklar
- [1]] Oxford Üniversitesi psikoloji bölümü öğrencileri için varyans analizine giriş dersi.
- [2] Rasgelelestirilmiş blok, ayırılmış parseller, tekrarlanan ölçüler ve Latin kareler deneylem tasarımlarını kapsayan üç saglatıma kadar tüm varyans analizi ve çoklu değişirli varyans analizi modelleri için örnekler.
- NIST/SEMATECH e-Handbook of Statistical Methods, section 7.4.3: "Are the means equal?" İstatistik Yöntemler Kilavuzu.
- [3] TDS1 Belirsizlik Hesaplayıcısıİ