Varyans analizi

1. Varyans analizi kavramı

Varyans analizi Herhangi bir kontrollü değişken faktörün etkisi altında bir özelliğin değişkenliğinin analizidir. Yabancı literatürde varyans analizi sıklıkla ANOVA olarak anılır ve bu, değişkenlik analizi (Varyans Analizi) olarak tercüme edilir.

ANOVA sorunu bir özelliğin genel değişkenliğinden farklı türdeki değişkenliğin izole edilmesinden oluşur:

a) incelenen bağımsız değişkenlerin her birinin etkisinden kaynaklanan değişkenlik;

b) incelenen bağımsız değişkenlerin etkileşiminden kaynaklanan değişkenlik;

c) diğer tüm bilinmeyen değişkenlerden kaynaklanan rastgele değişkenlik.

İncelenen değişkenlerin etkisinden ve bunların etkileşiminden kaynaklanan değişkenlik, rastgele değişkenlik ile ilişkilidir. Bu ilişkinin bir göstergesi Fisher'in F testidir.

F kriterini hesaplama formülü, varyans tahminlerini, yani özelliğin dağılım parametrelerini içerir, dolayısıyla F kriteri parametrik bir kriterdir.

Bir özelliğin değişkenliği, incelenen değişkenlerden (faktörlerden) veya bunların etkileşiminden ne kadar fazla kaynaklanıyorsa, o kadar yüksek olur. ampirik kriter değerleri.

Sıfır varyans analizindeki hipotez, çalışılan etkili özelliğin ortalama değerlerinin tüm derecelendirmelerde aynı olduğunu belirtecektir.

Alternatif hipotez, incelenen faktörün farklı derecelerinde ortaya çıkan özelliğin ortalama değerlerinin farklı olduğunu belirtecektir.

Varyans analizi, bir özellikteki değişikliği belirtmemize izin verir, ancak bunu belirtmez. yön bu değişiklikler.

Varyans analizine ilişkin değerlendirmemize yalnızca değişkenin eylemini incelediğimizde en basit durumla başlayalım. bir değişken (bir faktör).

2. İlgisiz örnekler için tek yönlü varyans analizi

2.1. Yöntemin amacı

Tek faktörlü varyans analizi yöntemi, etkili bir özellikteki değişikliklerin, bir faktörün değişen koşullarının veya derecelerinin etkisi altında incelendiği durumlarda kullanılır. Yöntemin bu versiyonunda, faktörün derecelendirilmesinin her birinin etkisi şu şekildedir: farklı konu örnekleri. Faktörün en az üç derecelendirmesi olmalıdır. (İki derecelendirme olabilir ancak bu durumda doğrusal olmayan bağımlılıklar kuramayacağız ve daha basit olanları kullanmak daha mantıklı görünüyor).

Bu tür analizin parametrik olmayan bir versiyonu Kruskal-Wallis H testidir.

hipotezler

H 0: Faktör dereceleri arasındaki farklar (farklı koşullar), her grup içindeki rastgele farklardan daha büyük değildir.

H 1: Faktör dereceleri arasındaki farklar (farklı koşullar), her grup içindeki rastgele farklardan daha büyüktür.

2.2. İlişkisiz Örnekler İçin Tek Yönlü Varyans Analizinin Sınırlamaları

1. Tek yönlü varyans analizi, faktörün en az üç derecelendirilmesini ve her derecelendirmede en az iki konunun olmasını gerektirir.

2. Ortaya çıkan karakteristik, incelenen örnekte normal şekilde dağılmalıdır.

Doğru, genellikle incelenen numunenin tamamındaki özelliğin dağılımından mı yoksa dağılım kompleksini oluşturan kısmından mı bahsettiğimiz belirtilmez.

3. Örnek kullanılarak ilgisiz örnekler için tek yönlü varyans analizi yöntemini kullanarak bir problemin çözülmesine bir örnek:

Altı kişiden oluşan üç farklı gruba on kelimelik listeler verildi. Kelimeler birinci gruba 5 saniyede 1 kelime olmak üzere düşük hızda, ikinci gruba 2 saniyede 1 kelime olmak üzere ortalama hızda, üçüncü gruba ise saniyede 1 kelime olmak üzere yüksek hızda sunuldu. Çoğaltma performansının kelime sunumunun hızına bağlı olacağı tahmin ediliyordu. Sonuçlar Tabloda sunulmaktadır. 1.

Çoğaltılan kelime sayısı tablo 1

Konu No.

düşük hız

ortalama sürat

yüksek hız

toplam tutar

H 0: Kelime üretim aralığındaki farklılıklar arasında gruplar rastgele farklılıklardan daha belirgin değildir içeri her grup.

H1: Kelime üretim hacmindeki farklılıklar arasında gruplar rastgele farklılıklardan daha belirgindir içeri her grup. Tabloda sunulan deneysel değerlerin kullanılması. 1'de F kriterini hesaplamak için gerekli olacak bazı değerleri oluşturacağız.

Tek yönlü varyans analizi için ana büyüklüklerin hesaplanması tabloda sunulmaktadır:

Tablo 2

Tablo 3

İlgisiz örnekler için tek yönlü varyans analizinde işlem sırası

Bu ve sonraki tablolarda sıklıkla bulunan SS tanımı, "kareler toplamı"nın kısaltmasıdır. Bu kısaltma çoğunlukla tercüme edilmiş kaynaklarda kullanılır.

SS hakikat incelenen faktörün etkisine bağlı olarak özelliğin değişkenliği anlamına gelir;

SS genel olarak- özelliğin genel değişkenliği;

S CA.- hesaba katılmayan faktörlerden kaynaklanan değişkenlik, "rastgele" veya "artık" değişkenlik.

HANIM- “ortalama kare” veya kareler toplamının matematiksel beklentisi, karşılık gelen SS'nin ortalama değeri.

df - parametrik olmayan kriterleri göz önüne aldığımızda Yunan harfiyle gösterdiğimiz serbestlik derecesi sayısı v.

Sonuç: H 0 reddedilir. H 1 kabul edilir. Gruplar arasındaki kelime hatırlama farklılıkları, her grup içindeki rastgele farklardan daha büyüktü (α=0.05). Dolayısıyla kelimelerin sunulma hızı, çoğaltılma hacmini etkiler.

Sorunu Excel'de çözmenin bir örneği aşağıda sunulmuştur:

İlk veri:

Şu komutu kullanarak: Araçlar->Veri Analizi->Tek Yönlü ANOVA, aşağıdaki sonuçları elde ederiz:

Zeka sadece bilgiden değil aynı zamanda bilgiyi pratikte uygulama yeteneğinden de oluşur. (Aristo)

Varyans analizi

Giriş niteliğindeki genel bakış

Bu bölümde ANOVA'nın temel yöntemlerini, varsayımlarını ve terminolojisini inceleyeceğiz.

İngilizce literatürde varyans analizine genellikle varyasyon analizi adı verildiğini unutmayın. Bu nedenle, konuyu kısaltmak adına aşağıda bazen terimini kullanacağız. ANOVA (Bir analiz Ö F evet riasyon) sıradan ANOVA ve terim için MANOVAçok değişkenli varyans analizi için. Bu bölümde varyans analizinin ana fikirlerini sırayla gözden geçireceğiz ( ANOVA), kovaryans analizi ( ANÇOVA), çok değişkenli varyans analizi ( MANOVA) ve çok değişkenli kovaryans analizi ( MANÇOVA). Kontrast analizi ve post hoc testlerin yararları hakkında kısa bir tartışmanın ardından ANOVA yöntemlerinin dayandığı varsayımlara bakalım. Bu bölümün sonuna doğru, tekrarlanan ölçüm analizi için çok değişkenli bir yaklaşımın geleneksel tek değişkenli yaklaşıma göre avantajları açıklanmaktadır.

Anahtar Fikirler

Varyans analizinin amacı. Varyans analizinin temel amacı ortalamalar arasındaki farkların önemini incelemektir. Bölüm (Bölüm 8) istatistiksel anlamlılık çalışmasına kısa bir giriş sağlar. Eğer sadece iki numunenin ortalamalarını karşılaştırıyorsanız, varyans analizi sıradan analizle aynı sonucu verecektir. T- bağımsız örnekler için test (eğer iki bağımsız nesne grubu veya gözlem karşılaştırılıyorsa) veya T- bağımlı örnekler için kriter (iki değişken aynı nesne veya gözlem kümesinde karşılaştırılırsa). Bu kriterlere aşina değilseniz giriş bölümüne genel bakışa bakmanızı öneririz. (Bölüm 9).

Adı nereden geldi? Varyans analizi? Ortalamaları karşılaştırma prosedürünün varyans analizi olarak adlandırılması garip görünebilir. Gerçekte bunun nedeni, ortalamalar arasındaki farkların istatistiksel anlamlılığını incelediğimizde aslında varyansları analiz ediyor olmamızdır.

Kareler toplamını bölme

N örneklem büyüklüğü için örneklem varyansı, örneklem ortalamasından sapmaların karelerinin toplamının n-1'e bölünmesiyle hesaplanır (örneklem büyüklüğü eksi bir). Dolayısıyla, sabit bir örneklem büyüklüğü n için varyans, kısalık amacıyla belirtilen kareler (sapmalar) toplamının bir fonksiyonudur, SS(İngilizce Kareler Toplamı - Karelerin Toplamı'ndan). Varyans analizinin temeli, varyansın parçalara ayrılmasıdır (veya bölümlenmesidir). Aşağıdaki veri kümesini göz önünde bulundurun:

İki grubun ortalamaları önemli ölçüde farklıdır (sırasıyla 2 ve 6). Karesel sapmaların toplamı içeri her grup 2'ye eşittir. Bunları topladığımızda 4 elde ederiz. Şimdi bu hesaplamaları tekrarlarsak hariç grup üyeliği, yani hesaplarsak SS iki örneğin genel ortalamasına dayalı olarak 28 elde ederiz. Başka bir deyişle, grup içi değişkenliğe dayalı varyans (kareler toplamı), genel değişkenliğe dayalı olarak hesaplanandan çok daha küçük değerlerle sonuçlanır (karelerin toplamına göre). genel ortalama). Bunun nedeni elbette ortalamalar arasındaki önemli farktır ve ortalamalar arasındaki bu fark da bunu açıklamaktadır. mevcut farklılıklar kareler toplamları arasında. Aslında, verilen verileri analiz etmek için modülü kullanırsanız Varyans analizi aşağıdaki sonuçlar elde edilecektir:

Tablodan da görülebileceği gibi kareler toplamı SS=28, verilen karelerin toplamına bölünür grup içi değişkenlik ( 2+2=4 ; bkz. tablonun ikinci satırı) ve ortalama değerlerdeki fark nedeniyle kareler toplamı. (28-(2+2)=24; bkz. tablonun ilk satırı).

SS hatalar veSS etki. Grup içi değişkenlik ( SS) genellikle dispersiyon olarak adlandırılır hatalar. Bu, bir deney yapıldığında genellikle tahmin edilemeyeceği veya açıklanamayacağı anlamına gelir. Diğer tarafta, SS etki(veya gruplar arası değişkenlik), çalışma gruplarının ortalamaları arasındaki farklılıklarla açıklanabilir. Başka bir deyişle belirli bir gruba ait olmak açıklıyor gruplar arası değişkenlik, çünkü bu grupların farklı araçları olduğunu biliyoruz.

Önem kontrolü.İstatistiksel anlamlılık testinin temel fikirleri Bölüm'de tartışılmaktadır. İstatistiğin temel kavramları(Bölüm 8). Bu bölüm aynı zamanda birçok testin açıklanan varyansın açıklanmayan varyansa oranını kullanmasının nedenlerini de açıklamaktadır. Bu kullanıma bir örnek varyans analizinin kendisidir. ANOVA'da anlamlılık testi, gruplar arası varyanstan kaynaklanan varyansın karşılaştırılmasına dayanır (buna grup adı verilir). ortalama kare etkisi veya HANIMEtki) ve grup içi varyasyondan kaynaklanan varyans (buna ortalama kare hatası veya HANIMhata). Eğer sıfır hipotezi (iki popülasyondaki ortalamaların eşitliği) doğruysa, o zaman rastgele varyasyondan dolayı örnek ortalamalarında nispeten küçük bir fark beklenebilir. Bu nedenle sıfır hipotezi altında, grup içi varyans pratikte grup üyeliği dikkate alınmadan hesaplanan toplam varyansla örtüşecektir. Ortaya çıkan grup içi varyanslar aşağıdakiler kullanılarak karşılaştırılabilir: F- Varyans oranının 1'den önemli ölçüde büyük olup olmadığını kontrol eden test. Yukarıda tartışılan örnekte F- kriter ortalamalar arasındaki farkın istatistiksel olarak anlamlı olduğunu göstermektedir.

Varyans analizinin temel mantığı.Özetlemek gerekirse, ANOVA'nın amacı ortalamalar arasındaki farkın (gruplar veya değişkenler için) istatistiksel anlamlılığını test etmektir. Bu kontrol varyans analizi kullanılarak gerçekleştirilir; toplam varyansı (varyansı) parçalara bölerek, bunlardan biri rastgele hatadan (yani grup içi değişkenlikten) kaynaklanır ve ikincisi ortalama değerlerdeki farklılıklarla ilişkilidir. Son varyans bileşeni daha sonra ortalamalar arasındaki farkın istatistiksel anlamlılığını analiz etmek için kullanılır. Bu fark anlamlı ise sıfır hipotezi reddedilir ve ortalamalar arasında fark olduğunu ifade eden alternatif hipotez kabul edilir.

Bağımlı ve bağımsız değişkenler. Değerleri bir deney sırasında yapılan ölçümlerle belirlenen değişkenlere (örneğin test puanı) denir. bağımlı değişkenler. Bir deneyde kontrol edilebilen değişkenlere (örneğin, öğretim yöntemleri veya gözlemleri gruplara ayırmaya yönelik diğer kriterler) denir. faktörler veya bağımsız değişkenler. Bu kavramlar bu bölümde daha ayrıntılı olarak açıklanmaktadır. İstatistiğin temel kavramları(Bölüm 8).

Çok değişkenli varyans analizi

Yukarıdaki basit örnekte, uygun modül seçeneğini kullanarak bağımsız örnekler t-testini hemen hesaplayabilirsiniz. Temel istatistikler ve tablolar. Elde edilen sonuçlar doğal olarak varyans analizi sonuçlarıyla örtüşecektir. Ancak ANOVA esnek ve güçlü bir yapıya sahiptir. teknik araçlarçok daha karmaşık araştırmalar için kullanılabilir.

Birçok faktör. Dünya doğası gereği karmaşık ve çok boyutludur. Belirli bir olgunun tamamen tek bir değişken tarafından tanımlandığı durumlar son derece nadirdir. Örneğin büyük domates yetiştirmeyi öğrenmeye çalışıyorsak bitkinin genetik yapısı, toprak tipi, ışık, sıcaklık vb. gibi faktörleri göz önünde bulundurmalıyız. Bu nedenle, tipik bir deneyi yürütürken çok sayıda faktörle uğraşmak gerekir. ANOVA'nın kullanılmasının, iki örneğin farklı faktör seviyelerinde tekrarlanan karşılaştırmaları yerine tercih edilmesinin ana nedeni T- kriter, varyans analizinin daha fazla olmasıdır etkili ve küçük örnekler için daha bilgilendirici.

Faktör yönetimi. Yukarıda tartışılan iki örnekli analiz örneğinde başka bir faktör eklediğimizi varsayalım; Zemin- Cinsiyet. Her grup 3 erkek ve 3 kadından oluşsun. Bu deneyin tasarımı 2'ye 2'lik bir tablo şeklinde sunulabilir:

Deney. Grup 1 Deney. Grup 2
Erkekler2 6
3 7
1 5
Ortalama2 6
Kadınlar4 8
5 9
3 7
Ortalama4 8

Hesaplamaları yapmadan önce bu örnekte toplam varyansın en az üç kaynağı olduğunu fark edebilirsiniz:

(1) rastgele hata (grup varyansı dahilinde),

(2) deney grubu üyeliğiyle ilişkili değişkenlik ve

(3) gözlem nesnelerinin cinsiyetine bağlı değişkenlik.

(Değişkenliğin başka bir olası kaynağı olduğunu unutmayın - faktörlerin etkileşimi, bunu daha sonra tartışacağız). Eklemezsek ne olur? zemincinsiyet analizde bir faktör olarak kullanın ve olağan olanı hesaplayın T-kriter? Kareler toplamını hesaplarsak zemin -cinsiyet(yani, grup içi varyansı hesaplarken farklı cinsiyetteki nesneleri bir grupta birleştirmek, böylece her grup için şuna eşit kareler toplamı elde etmek: SS=10 ve karelerin toplamı SS= 10+10 = 20), o zaman şunu elde ederiz: daha yüksek değer göre ek alt gruplama ile daha kesin bir analize göre grup içi varyans yarı cinsiyet(bu durumda grup içi ortalamalar 2'ye eşit olacak ve grup içi karelerin toplamı şuna eşit olacaktır: SS = 2+2+2+2 = 8). Bu fark ortalama değerin yüksek olmasından kaynaklanmaktadır. erkekler - erkekler ortalamasından daha az kadınlar -dişi ve ortalamalardaki bu farklılık, cinsiyet dikkate alınmadığında genel grup içi değişkenliği artırır. Hata varyansının kontrol edilmesi testin duyarlılığını (gücünü) artırır.

Bu örnek, geleneksel analize kıyasla varyans analizinin başka bir avantajını göstermektedir. T- iki numune için kriter. Varyans analizi, kalan faktörlerin değerlerini kontrol ederek her bir faktörü incelemenize olanak tanır. Aslında istatistiksel gücünün daha yüksek olmasının ana nedeni budur (anlamlı sonuçlar elde etmek için daha küçük örneklem boyutları gerekir). Bu nedenle varyans analizi küçük örneklemlerde bile istatistiksel olarak daha fazla sonuç verir. önemli sonuçlar basitten daha T- kriter.

Etkileşim Etkileri

Geleneksel analize kıyasla varyans analizi kullanmanın başka bir avantajı daha vardır: T- kriter: varyans analizi tespit etmemizi sağlar etkileşim faktörler arasındadır ve bu nedenle daha karmaşık modellerin incelenmesine olanak tanır. Açıklamak için başka bir örneği düşünün.

Ana etkiler, ikili (iki faktörlü) etkileşimler.İki grup öğrenci olduğunu ve psikolojik olarak birinci gruptaki öğrencilerin verilen görevleri tamamlamaya kararlı olduklarını ve tembel öğrencilerden oluşan ikinci gruptaki öğrencilere göre daha amaçlı olduklarını varsayalım. Her grubu rastgele ikiye bölelim ve her grubun bir yarısına zor, diğer yarısına ise kolay bir görev verelim. Daha sonra öğrencilerin bu görevler üzerinde ne kadar sıkı çalıştıklarını ölçeceğiz. Bu (kurgusal) çalışmanın ortalamaları tabloda gösterilmektedir:

Bu sonuçlardan ne gibi bir sonuç çıkarılabilir? Şu sonuca varabilir miyiz: (1) öğrenciler karmaşık bir görev üzerinde daha yoğun çalışırlar; (2) Motivasyonlu öğrenciler tembel öğrencilerden daha mı çok çalışırlar? Bu ifadelerin hiçbiri tabloda gösterilen araçların sistematik doğasının özünü yansıtmamaktadır. Sonuçlara bakıldığında sadece motive öğrencilerin zor görevlerde daha çok çalıştıklarını, sadece tembel öğrencilerin ise kolay görevlerde daha çok çalıştıklarını söylemek daha doğru olacaktır. Başka bir deyişle öğrencilerin karakteri ve görevin zorluğu etkileşimli harcanan çaba üzerinde birbirlerini etkilerler. Bu bir örnek çift ​​etkileşimiÖğrencilerin karakteri ile görevin zorluğu arasında. 1 ve 2 numaralı ifadelerin açıkladığını unutmayın. ana etkiler.

Üst düzey etkileşimler.İkili etkileşimleri açıklamak hala nispeten kolay olsa da, yüksek dereceli etkileşimleri açıklamak çok daha zordur. Yukarıda ele alınan örnekte başka bir faktörün devreye girdiğini düşünelim. zemin -Cinsiyet ve aşağıdaki ortalamalar tablosunu elde ettik:

Şimdi elde edilen sonuçlardan ne gibi sonuçlar çıkarılabilir? Ortalama grafikler karmaşık etkilerin yorumlanmasını kolaylaştırır. ANOVA modülü, bu grafikleri neredeyse tek bir fare tıklamasıyla oluşturmanıza olanak tanır.

Aşağıdaki grafiklerde yer alan görüntü, üzerinde çalışılan üç faktörlü etkileşimi temsil etmektedir.

Grafiklere baktığımızda, kadınlar için kişilik ile testin zorluğu arasında bir etkileşim olduğunu söyleyebiliriz: Motivasyona sahip kadınlar zor bir görev üzerinde kolay bir görevden daha çok çalışırlar. Erkeklerde ise aynı etkileşim tersinedir. Faktörler arasındaki etkileşimin tanımının daha kafa karıştırıcı hale geldiği görülebilir.

Etkileşimleri tanımlamanın genel bir yolu. Genel olarak faktörler arasındaki etkileşim, bir etkinin diğerinin etkisi altında değişmesi olarak tanımlanmaktadır. Yukarıda tartışılan örnekte iki faktörlü etkileşim, öğrencinin karakterini tanımlayan faktörün etkisi altında görevin zorluğunu karakterize eden faktörün ana etkisinin değişmesi olarak tanımlanabilir. Önceki paragrafta bahsedilen üç faktörün etkileşimi için, iki faktörün (görevin karmaşıklığı ve öğrencinin karakteri) etkileşiminin etki altında değiştiğini söyleyebiliriz. cinsiyetCinsiyet. Dört faktörün etkileşimi incelenirse, üç faktörün etkileşiminin dördüncü faktörün etkisi altında değiştiğini söyleyebiliriz. Dördüncü faktörün farklı düzeylerinde farklı türde etkileşimler vardır. Birçok alanda beş hatta hatta etkileşimin olduğu ortaya çıktı. Daha faktörler olağandışı değildir.

Karmaşık planlar

Gruplar arası ve grup içi tasarımlar (tekrarlanan ölçüm tasarımları)

İki farklı grubu karşılaştırırken genellikle kullanılır T- bağımsız örnekler için kriter (modülden Temel istatistikler ve tablolar). İki değişken aynı nesne kümesinde (gözlemler) karşılaştırıldığında, T-bağımlı örnekler için kriter. Varyans analizi için örneklemlerin bağımlı olup olmadığı da önemlidir. Aynı değişkenlerin tekrarlanan ölçümleri varsa (ile farklı koşullar veya içinde farklı zaman) aynı nesneler için, sonra varlığından bahsediyorlar tekrarlanan ölçüm faktörü(olarak da adlandırılır grup içi faktör, Grup içi kareler toplamı, önemini değerlendirmek için hesaplandığından). Farklı nesne grupları karşılaştırıldığında (örneğin, erkekler ve kadınlar, üç bakteri türü vb.), gruplar arasındaki fark açıklanır. Gruplararası faktör. Tanımlanan iki faktör türü için anlamlılık kriterlerini hesaplama yöntemleri farklıdır ancak bunların genel mantığı ve yorumları aynıdır.

Grup içi ve grup içi planlar.Çoğu durumda deney, hem denekler arası faktörün hem de tekrarlanan ölçüm faktörünün tasarıma dahil edilmesini gerektirir. Örneğin kız ve erkek öğrencilerin matematik becerileri ölçülür (burada zemin -Cinsiyet-gruplararası faktör) yarıyılın başında ve sonunda. Her öğrencinin becerilerinin iki ölçümü, grup içi bir faktör (tekrarlanan ölçüm faktörü) oluşturur. Konular arası ve tekrarlanan ölçüm faktörleri için ana etkilerin ve etkileşimlerin yorumlanması tutarlıdır ve her iki faktör türü de açıkça birbirleriyle etkileşime girebilir (örneğin, kadınlar bir dönem boyunca beceriler kazanırken erkekler bunları kaybeder).

Tamamlanmamış (yuvalanmış) planlar

Çoğu durumda etkileşim etkisi ihmal edilebilir. Bu durum ya popülasyonda herhangi bir etkileşim etkisinin olmadığı bilindiğinde ya da tam bir etkileşim etkisi uygulandığında meydana gelir. faktöriyel planlamak imkansızdır. Örneğin dört yakıt katkı maddesinin yakıt tüketimine etkisi araştırılmaktadır. Dört araba ve dört sürücü seçilir. Tam dolu faktöriyel deney, her kombinasyonun (katkı maddesi, sürücü, araba) en az bir kez görünmesini gerektirir. Bu, en az 4 x 4 x 4 = 64 grup test gerektirir ve bu da çok zaman alıcıdır. Ayrıca sürücü ile yakıt katkısı arasında herhangi bir etkileşimin olması pek olası değildir. Bunu dikkate alarak planı kullanabilirsiniz. Latin kareleri, yalnızca 16 test grubu içeren (dört katkı maddesi A, B, C ve D harfleriyle gösterilmiştir):

Latin kareleri deneysel tasarımla ilgili kitapların çoğunda anlatılmıştır (örneğin, Hays, 1988; Lindman, 1974; Milliken ve Johnson, 1984; Winer, 1962) ve burada ayrıntılı olarak tartışılmayacaktır. Latin karelerinin OlumsuzNtam dolu faktör düzeylerinin tüm kombinasyonlarının dahil edilmediği tasarımlar. Örneğin, 1. sürücü 1. arabayı yalnızca A katkısıyla kullanıyor, 3. sürücü 1. arabayı yalnızca C katkısıyla kullanıyor. Faktör seviyeleri katkı maddeleri ( A, B, C ve D) tablo hücrelerinde yuvalanmıştır otomobil X sürücü - yuvalardaki yumurtalar gibi. Bu anımsatıcı doğayı anlamak için faydalıdır iç içe veya iç içe planlar. Modül Varyans analizi sağlar basit yollar bu tür planların analizi.

Kovaryans Analizi

ana fikir

Bölümde Anahtar Fikirler Faktör kontrolü fikri ve ilave faktörlerin dahil edilmesinin karesel hataların toplamını nasıl azalttığı ve tasarımın istatistiksel gücünü nasıl arttırdığı kısaca tartışıldı. Bütün bunlar sürekli bir değer kümesine sahip değişkenlere genişletilebilir. Bu tür sürekli değişkenler bir tasarımda faktör olarak yer aldığında bunlara denir. ortak değişkenler.

Sabit ortak değişkenler

İki farklı ders kitabı kullanılarak eğitim verilen iki grup öğrencinin matematik becerilerini karşılaştırdığımızı varsayalım. Ayrıca her öğrenci için zeka bölümü (IQ) verilerinin mevcut olduğunu varsayalım. IQ'nun matematik becerileriyle ilgili olduğunu varsayabilir ve bu bilgiyi kullanabilirsiniz. Her iki öğrenci grubu için IQ ile matematik becerileri arasındaki korelasyon katsayısı hesaplanabilir. Bu korelasyon katsayısını kullanarak, IQ'nun etkisiyle açıklanan gruplardaki varyans oranını ve açıklanamayan varyans oranını izole etmek mümkündür (ayrıca bkz. İstatistiğin temel kavramları(Bölüm 8) ve Temel istatistikler ve tablolar(bölüm 9)). Varyansın geri kalan kısmı analizde hata varyansı olarak kullanılır. IQ ile matematik becerileri arasında bir korelasyon varsa hata varyansı önemli ölçüde azaltılabilir SS/(N-1) .

Ortak değişkenlerin etkisiF- kriter. F- kriter, gruplardaki ortalama değerlerdeki farkın istatistiksel önemini değerlendirir ve gruplar arası varyansın oranı hesaplanır ( HANIMetki) hata varyansına ( HANIMhata) . Eğer HANIMhataörneğin IQ faktörü dikkate alındığında değer azalır F artışlar.

Çok sayıda ortak değişken. Yukarıda tek bir ortak değişken (IQ) için kullanılan mantık, kolaylıkla birden fazla ortak değişkene genişletilebilir. Örneğin, IQ'ya ek olarak bir motivasyon ölçümü de ekleyebilirsiniz. mekansal düşünme vesaire. Alışılmış korelasyon katsayısı yerine çoklu korelasyon katsayısı kullanılır.

Değer ne zamanF -kriterler azalır. Bazen ortak değişkenlerin deneysel bir tasarıma dahil edilmesi, deneysel tasarımın önemini azaltır. F-kriter . Bu genellikle ortak değişkenlerin yalnızca bağımlı değişkenle (örneğin matematik becerileri) değil aynı zamanda faktörlerle de (örneğin farklı ders kitapları) ilişkili olduğunu gösterir. IQ'nun, neredeyse bir yıl boyunca iki grup öğrenciye iki farklı ders kitabı kullanarak ders verdikten sonra dönem sonunda ölçüldüğünü varsayalım. Öğrenciler gruplara rastgele atanmasına rağmen, ders kitabı farklılıkları o kadar büyük olabilir ki hem IQ hem de matematik becerileri gruplar arasında büyük farklılıklar gösterebilir. Bu durumda, ortak değişkenler yalnızca hata varyansını değil aynı zamanda gruplar arası varyansı da azaltır. Başka bir deyişle, gruplar arasındaki IQ farklılıkları kontrol edildikten sonra matematik becerilerindeki farklılıklar artık anlamlı değildir. Farklı söyleyebilirsin. IQ'nun etkisi "dışlandıktan" sonra, ders kitabının matematik becerilerinin gelişimi üzerindeki etkisi istemeden de dışlanır.

Ortalamalar düzeltildi. Bir ortak değişken denekler arası faktörü etkilediğinde, hesaplama yapılmalıdır. düzeltilmiş araçlar yani tüm ortak değişken tahminleri çıkarıldıktan sonra elde edilen ortalamalar.

Ortak değişkenler ve faktörler arasındaki etkileşimler. Faktörler arasındaki etkileşimler incelendiği gibi, ortak değişkenler arasındaki ve faktör grupları arasındaki etkileşimler de incelenebilir. Ders kitaplarından birinin özellikle akıllı öğrenciler için uygun olduğunu varsayalım. İkinci ders kitabı zeki öğrenciler için sıkıcıdır ve aynı ders kitabı daha az zeki öğrenciler için zordur. Sonuç olarak, birinci gruptaki (daha zeki öğrenciler, daha iyi sonuç) ve ikinci grupta sıfır veya küçük negatif korelasyon (öğrenci ne kadar akıllıysa, ikinci ders kitabından matematik becerileri kazanma olasılığı o kadar az olur). Bazı çalışmalar bu durumu kovaryans analizinin varsayımlarının ihlaline örnek olarak ele almaktadır. Bununla birlikte, ANOVA modülü kovaryans analizinin en yaygın yöntemlerini kullandığından, özellikle faktörler ve ortak değişkenler arasındaki etkileşimin istatistiksel önemini değerlendirmek mümkündür.

Değişken ortak değişkenler

Ders kitaplarında sabit ortak değişkenler oldukça sık tartışılırken, değişken ortak değişkenlerden çok daha az bahsedilmektedir. Tipik olarak, tekrarlanan ölçümlerle deneyler yürütürken, aynı niceliklerin ölçümlerindeki farklılıklarla ilgileniriz. farklı anlar zaman. Yani biz bu farklılıkların önemiyle ilgileniyoruz. Ortak değişkenler bağımlı değişkenlerin ölçümleriyle eş zamanlı olarak ölçülürse, ortak değişken ile bağımlı değişken arasındaki korelasyon hesaplanabilir.

Örneğin, matematiğe ilgi ve matematik becerileri dönem başında ve sonunda araştırılabilir. Matematiğe olan ilgideki değişikliklerin matematik becerilerindeki değişikliklerle ilişkili olup olmadığını test etmek ilginç olurdu.

Modül Varyans analizi V İSTATİSTİK Mümkün olan yerlerde tasarımlardaki ortak değişkenlerdeki değişikliklerin istatistiksel önemini otomatik olarak değerlendirir.

Çok değişkenli tasarımlar: çok değişkenli varyans ve kovaryans analizi

Gruplararası planlar

Daha önce tartışılan örneklerin tümü yalnızca bir bağımlı değişken içeriyordu. Aynı anda birden fazla bağımlı değişken olduğunda hesaplamaların yalnızca karmaşıklığı artar ancak içeriği ve temel ilkeleri değişmez.

Örneğin iki farklı ders kitabı üzerinde bir çalışma yapılıyor. Aynı zamanda öğrencilerin fizik ve matematik çalışmalarındaki başarıları da araştırılır. Bu durumda iki bağımlı değişken vardır ve iki farklı ders kitabının bunları aynı anda nasıl etkilediğini bulmanız gerekir. Bunu yapmak için çok değişkenli varyans analizini (MANOVA) kullanabilirsiniz. Tek boyutlu olmak yerine F kriter, çok boyutlu kullanılır F hata kovaryans matrisi ile gruplar arası kovaryans matrisinin karşılaştırılmasına dayanan test (Wilks' l testi).

Bağımlı değişkenler birbirleriyle ilişkili ise anlamlılık kriteri hesaplanırken bu korelasyonun dikkate alınması gerekir. Açıkçası, aynı ölçüm iki kez tekrarlanırsa yeni bir şey elde edilemez. Mevcut bir boyuta ilişkili bir boyut eklenirse, bazı yeni bilgiler elde edilir, ancak yeni değişken, değişkenler arasındaki kovaryansa yansıyan gereksiz bilgiler içerir.

Sonuçların yorumlanması. Genel çok değişkenli test anlamlıysa, buna karşılık gelen etkinin (örneğin ders kitabı türü) anlamlı olduğu sonucuna varabiliriz. Ancak kalkarlar sonraki sorular. Ders kitabı türü yalnızca matematik becerilerindeki, yalnızca fiziksel becerilerdeki veya her iki becerideki gelişmeleri etkiler mi? Aslında anlamlı bir çok değişkenli test elde edildikten sonra, bireysel ana etki veya etkileşim için tek değişkenli bir test incelenir. F kriter. Bir başka deyişle çok değişkenli testin anlamlılığına katkı sağlayan bağımlı değişkenler ayrı ayrı incelenmektedir.

Tekrarlanan Ölçü Tasarımları

Öğrencilerin matematik ve fizik becerileri dönem başında ve sonunda ölçülüyorsa bunlar tekrarlanan ölçümlerdir. Bu tür planlarda önem kriterinin incelenmesi mantıksal gelişim tek boyutlu durum. Çok değişkenli varyans analizi tekniklerinin, ikiden fazla seviyeye sahip tek değişkenli tekrarlanan ölçüm faktörlerinin önemini incelemek için yaygın olarak kullanıldığına dikkat edin. İlgili uygulamalar bu bölümün ilerleyen kısımlarında ele alınacaktır.

Değişken değerlerin toplamı ve çok değişkenli varyans analizi

Eşit deneyimli kullanıcılar Tek değişkenli ve çok değişkenli ANOVA'lar sıklıkla sorunlu hale gelir; çok değişkenli bir ANOVA'yı örneğin üç değişkene uygularken ve tek değişkenli bir ANOVA'yı üç değişkenin toplamına sanki tek bir değişkenmiş gibi uygularken farklı sonuçlar üretir.

Fikir toplam Değişkenler, her değişkenin üzerinde çalışılan bazı gerçek değişkenlerin yanı sıra rastgele bir ölçüm hatası içermesidir. Bu nedenle değişkenlerin değerlerinin ortalaması alınırken tüm ölçümler için ölçüm hatası 0'a yakın olacak ve ortalama değerler daha güvenilir olacaktır. Aslında bu durumda değişkenlerin toplamına ANOVA uygulamak mantıklı ve güçlü bir tekniktir. Ancak bağımlı değişkenler doğası gereği çok boyutlu ise değişkenlerin değerlerinin toplanması uygun değildir.

Örneğin bağımlı değişkenler dört göstergeden oluşsun toplumdaki başarı. Her gösterge, insan faaliyetinin tamamen bağımsız bir yönünü karakterize eder (örneğin, mesleki başarı, iş dünyasında başarı, aile refahı vb.). Bu değişkenleri eklemek elma ve portakal eklemek gibidir. Bu değişkenlerin toplamı uygun bir tek boyutlu ölçüm olmayacaktır. Bu nedenle bu tür verilerin çok boyutlu göstergeler olarak ele alınması gerekmektedir. çok değişkenli varyans analizi.

Kontrast analizi ve post hoc testler

Neden ayrı ortalama kümeleri karşılaştırılıyor?

Tipik olarak deneysel verilere ilişkin hipotezler, yalnızca ana etkiler veya etkileşimler açısından formüle edilmez. Bir örnek şu hipotez olabilir: Belirli bir ders kitabı yalnızca erkek öğrencilerin matematik becerilerini geliştirirken, başka bir ders kitabı her iki cinsiyet için de yaklaşık olarak eşit derecede etkilidir, ancak erkekler için hala daha az etkilidir. Ders kitabı etkililiğinin öğrencinin cinsiyetiyle etkileşim içinde olduğu öngörülebilir. Ancak bu tahmin de geçerli doğa etkileşimler. Bir kitabı kullanan öğrenciler için cinsiyetler arasında anlamlı bir fark olması beklenirken, diğer kitabı kullanan öğrenciler için cinsiyete göre neredeyse bağımsız sonuçlar beklenmektedir. Bu tür hipotezler genellikle kontrast analizi kullanılarak incelenir.

Kontrastların Analizi

Kısacası kontrast analizi, karmaşık etkilerin belirli doğrusal kombinasyonlarının istatistiksel öneminin değerlendirilmesine olanak tanır. Kontrast analizi, herhangi bir karmaşık ANOVA planının ana ve zorunlu unsurudur. Modül Varyans analizi Her türlü ortalama karşılaştırmasını izole etmenize ve analiz etmenize olanak tanıyan oldukça çeşitli kontrast analizi yeteneklerine sahiptir.

Bir posteriori karşılaştırmalar

Bazen bir deneyin işlenmesi sonucunda beklenmedik bir etki keşfedilir. Çoğu durumda yaratıcı bir araştırmacı herhangi bir sonucu açıklayabilecek olsa da, bu daha fazla analize ve tahmine yönelik tahminlere izin vermez. Bu sorun, bunlardan biri a posteriori kriterler yani kullanılmayan kriterler Önsel hipotezler. Örneklemek için aşağıdaki deneyi düşünün. İçinde 1'den 10'a kadar sayıların yer aldığı 100 kart olduğunu varsayalım. Tüm bu kartları bir başlığa koyarak 5 kartı 20 kez rastgele seçiyoruz ve her örnek için ortalama değeri (kartların üzerinde yazan sayıların ortalaması) hesaplıyoruz. Ortalamaları önemli ölçüde farklı olan iki örneğin olmasını bekleyebilir misiniz? Bu çok makul! Maksimum ve minimum ortalamaya sahip iki örnek seçerek, örneğin ilk iki örneğin ortalamalarındaki farktan çok farklı bir ortalama farkı elde edebilirsiniz. Bu fark örneğin kontrast analizi kullanılarak araştırılabilir. Ayrıntılara girmeden, birkaç sözde var. a posteriori tam olarak ilk senaryoya dayanan kriterler (20 örnekten ekstrem ortalamaların alınması), yani bu kriterler tasarımdaki tüm ortalamaların karşılaştırılması için en farklı araçların seçilmesine dayanmaktadır. Bu kriterler yapay bir etkinin tamamen tesadüfen elde edilmemesini sağlamak için kullanılır; örneğin ortalamalar arasında anlamlı bir fark olmadığında anlamlı bir farkın tespit edilmesi için. Modül Varyans analizi teklifler geniş seçim bu tür kriterler. Birden fazla grubun yer aldığı bir deneyde beklenmeyen sonuçlarla karşılaşıldığında, a posteriori Elde edilen sonuçların istatistiksel anlamlılığının incelenmesine yönelik prosedürler.

I, II, III ve IV tipi karelerin toplamı

Çok değişkenli regresyon ve varyans analizi

Çok değişkenli regresyon yöntemi ile varyans analizi (varyans analizi) arasında yakın bir ilişki vardır. Her iki yöntemde de doğrusal bir model çalışılır. Kısacası hemen hemen tüm deneysel tasarımlar çok değişkenli regresyon kullanılarak incelenebilir. Aşağıdaki basit gruplararası 2 x 2 tasarımını düşünün.

D.V. A B BaltaB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

A ve B sütunları, A ve B faktörlerinin seviyelerini karakterize eden kodları içerir; AxB sütunu, A ve B iki sütununun çarpımını içerir. Bu verileri çok değişkenli regresyon kullanarak analiz edebiliriz. Değişken D.V. bağımlı değişken olarak tanımlanan değişkenler Aönce BaltaB bağımsız değişkenler olarak. Regresyon katsayılarının anlamlılık çalışması, faktörlerin ana etkilerinin anlamlılığının varyans analizindeki hesaplamalarla örtüşecektir. A Ve B ve etkileşim etkisi BaltaB.

Dengesiz ve dengeli planlar

Yukarıda gösterilen veriler gibi tüm değişkenler için korelasyon matrisini hesaplarken, faktörlerin ana etkilerinin olduğunu fark edeceksiniz. A Ve B ve etkileşim etkisi BaltaB ilişkisiz. Etkilerin bu özelliğine diklik de denir. Efekt diyorlar A Ve B - dikey veya bağımsız birbirinden. Yukarıdaki örnekte olduğu gibi bir plandaki tüm etkiler birbirine dik ise, o zaman plan denir. dengeli.

Dengeli planlar “ iyi mülk" Bu tür planları analiz etmek için yapılan hesaplamalar çok basittir. Tüm hesaplamalar, etkiler ve bağımlı değişkenler arasındaki korelasyonun hesaplanmasına dayanır. Etkiler dik olduğundan, kısmi korelasyonlar (tam olarak olduğu gibi) çok boyutlu regresyonlar) hesaplanmaz. Ancak, gerçek hayat Planlar her zaman dengeli değildir.

Hücrelerdeki eşit olmayan sayıda gözlem içeren gerçek verileri ele alalım.

Faktör A Faktör B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Bu verileri yukarıdaki gibi kodlarsak ve tüm değişkenler için bir korelasyon matrisi hesaplarsak tasarım faktörlerinin birbiriyle ilişkili olduğunu buluruz. Bir plandaki faktörler artık dik değildir ve bu tür planlara plan denir. dengesiz. Söz konusu örnekte, faktörler arasındaki korelasyonun tamamen veri matrisinin sütunlarındaki 1 ve -1 frekanslarındaki farktan kaynaklandığına dikkat edin. Başka bir deyişle, eşit olmayan hücre hacimlerine (daha doğrusu orantısız hacimlere) sahip deney tasarımları dengesiz olacak, bu da ana etkilerin ve etkileşimlerin birbirine karışacağı anlamına geliyor. Bu durumda etkilerin istatistiksel anlamlılığını hesaplamak için tam çok değişkenli regresyonun hesaplanması gerekir. Burada birkaç strateji var.

I, II, III ve IV tipi karelerin toplamı

Karelerin toplamı türüBENVeIII. Çok değişkenli bir modelde her faktörün önemini incelemek için, diğer tüm faktörlerin modelde zaten hesaba katılması koşuluyla, her faktörün kısmi korelasyonu hesaplanabilir. Modele faktörleri de girebilirsiniz adım adım yol Modele önceden girilmiş tüm faktörler sabitlenir ve diğer tüm faktörler göz ardı edilir. Genel olarak aradaki fark bu tip III Ve tipBEN kareler toplamı (bu terminoloji SAS'ta tanıtıldı, örneğin bkz. SAS, 1982; ayrıntılı tartışma aynı zamanda Searle, 1987, s. 461; Woodward, Bonett ve Brecht, 1990, s. 216 veya Milliken'de de bulunabilir) ve Johnson, 1984, s.138).

Karelerin toplamı türüII. Bir sonraki “ara” model oluşturma stratejisi aşağıdakilerden oluşur: tek bir ana etkinin önemi incelenirken tüm ana etkilerin kontrol edilmesi; bireysel bir ikili etkileşimin önemini incelerken tüm ana etkileri ve tüm ikili etkileşimleri kontrol etmede; tüm ikili etkileşimlerin ve üç faktörün tüm etkileşimlerinin tüm ana etkilerinin kontrol edilmesinde; üç faktörün bireysel etkileşimini incelerken vb. Bu şekilde hesaplanan etkilerin karelerinin toplamına denir. tipII karelerin toplamı. Bu yüzden, tipII Aynı ve daha düşük düzeydeki tüm etkiler için karelerin toplamı kontrolleri, tüm yüksek dereceli efektleri göz ardı eder.

Karelerin toplamı türüIV. Son olarak, eksik hücreleri olan bazı özel planlar (tamamlanmamış planlar) için sözde hesaplamak mümkündür. tip IV karelerin toplamı. Bu yöntem daha sonra tamamlanmamış tasarımlarla (eksik hücreli tasarımlar) bağlantılı olarak tartışılacaktır.

Tip I, II ve III'ün kareler toplamı hipotezinin yorumlanması

Karelerin toplamı tipIII yorumlaması en kolayı. Karelerin toplamının olduğunu hatırlayın tipIII Diğer tüm etkileri kontrol ettikten sonra etkileri inceleyin. Örneğin, istatistiksel olarak anlamlı bir sonuç bulduktan sonra tipIII faktör etkisi A modülde Varyans analizi faktörünün tek anlamlı etkisinin olduğunu söyleyebiliriz. A diğer tüm etkileri (faktörleri) ortaya koyduktan sonra bu etkiyi buna göre yorumlayın. Muhtemelen tüm ANOVA uygulamalarının %99'unda bu, araştırmacının ilgilendiği test türüdür. Bu tür kareler toplamı genellikle modülo olarak hesaplanır. Varyans analizi seçeneğin seçili olup olmadığına bakılmaksızın varsayılan olarak Regresyon yaklaşımı ya da değil (modülde benimsenen standart yaklaşımlar Varyans analizi Aşağıda tartışılmıştır).

Kareler toplamları kullanılarak elde edilen önemli etkiler tip veya tipII Karelerin toplamını yorumlamak o kadar kolay değil. Bunlar en iyi şekilde adım adım çok değişkenli regresyon bağlamında yorumlanır. Eğer kareler toplamını kullanırken tipBEN ana etki B faktörünün anlamlı olması (A faktörünün modele dahil edilmesinden sonra, ancak A ile B arasındaki etkileşimin eklenmesinden önce), A ve B faktörleri arasında herhangi bir etkileşim olmaması koşuluyla, B faktörünün anlamlı bir ana etkisinin olduğu sonucuna varabiliriz. B. (Eğer testi kullanıyorsanız tipIII, B faktörünün de anlamlı olduğu ortaya çıkarsa, diğer tüm faktörleri ve bunların etkileşimlerini modele dahil ettikten sonra, B faktörünün önemli bir ana etkisinin olduğu sonucuna varabiliriz).

Marjinal ortalamalar hipotezi açısından tipBEN Ve tipII genellikle basit bir yorumu yoktur. Bu durumlarda etkilerin öneminin sadece marjinal araçlara bakarak yorumlanamayacağı söylenmektedir. Oldukça sundu P ortalamalar, ortalamaları ve örneklem büyüklüğünü birleştiren karmaşık bir hipotezle ilgilidir. Örneğin, tipII Daha önce tartışılan 2 x 2 tasarımın basit örneğinde A faktörüne ilişkin hipotezler şöyle olacaktır (bkz. Woodward, Bonett ve Brecht, 1990, s. 219):

nij- hücredeki gözlem sayısı

uij- hücredeki ortalama değer

N. J- marjinal ortalama

Çok fazla ayrıntıya girmeden (daha fazla ayrıntı için bkz. Milliken ve Johnson, 1984, Bölüm 10), bunların basit hipotezler olmadığı ve çoğu durumda hiçbirinin araştırmacının ilgisini çekmediği açıktır. Ancak hipotezlerin ortaya çıktığı durumlar vardır. tipBEN ilginç olabilir.

Modüldeki varsayılan hesaplamalı yaklaşım Varyans analizi

Seçenek işaretli değilse varsayılan Regresyon yaklaşımı, modül Varyans analizi kullanır hücre ortalama modeli. Bu modelin özelliği, hücre ortalamalarının doğrusal kombinasyonları için farklı etkiler için kareler toplamlarının hesaplanmasıdır. Tam faktöriyel bir deneyde bu, daha önce tartışılan karelerin toplamlarıyla aynı olan karelerin toplamlarıyla sonuçlanır. tip III. Ancak seçenekte Planlanan karşılaştırmalar(pencerede ANOVA sonuçları), kullanıcı ağırlıklı veya ağırlıksız hücre araçlarının herhangi bir doğrusal kombinasyonuna karşı bir hipotezi test edebilir. Böylece kullanıcı yalnızca hipotezleri test etmekle kalmaz tipIII ancak her türden hipotez (dahil) tipIV). Bu genel yaklaşım özellikle eksik hücreli (eksik tasarımlar olarak adlandırılan) tasarımları incelerken faydalıdır.

Tam faktöriyel tasarımlar için bu yaklaşım, ağırlıklı marjinal ortalamaların analiz edilmesi istendiğinde de faydalıdır. Örneğin, daha önce ele alınan basit 2 x 2 tasarımında, ağırlıklı (faktör düzeylerine göre) karşılaştırma yapmamız gerektiğini varsayalım. B) faktör A için marjinal ortalama. Bu, gözlemlerin hücreler arasındaki dağılımı deneyci tarafından hazırlanmadığı, ancak rastgele oluşturulduğu ve bu rastgeleliğin, faktör B düzeyleri boyunca gözlem sayısının dağılımına yansıdığı durumlarda kullanışlıdır. agrega.

Örneğin bir faktör var; dul kadınların yaşı. Olası yanıtlayıcı örneklemi iki gruba ayrılmıştır: 40 yaş altı ve 40 yaş üstü (B faktörü). Plandaki ikinci faktör (Faktör A), dul kadınların bazı kuruluşlardan sosyal destek alıp almadığıydı (bazı dul kadınlar rastgele seçilmişti, diğerleri ise kontrol grubu olarak görev yapıyordu). Bu durumda, örneklemdeki dul kadınların yaşa göre dağılımı, nüfustaki dul kadınların yaşa göre gerçek dağılımını yansıtmaktadır. Grup etkililiği değerlendirmesi sosyal Destek dul kadınlar her yaştan ikisinin ağırlıklı ortalamasına karşılık gelecektir yaş grupları(gruptaki gözlem sayısına karşılık gelen ağırlıklarla).

Planlanan karşılaştırmalar

Girilen kontrast katsayılarının toplamının mutlaka 0'a (sıfır) eşit olmayabileceğini unutmayın. Bunun yerine program, ilgili hipotezlerin genel ortalamayla karıştırılmamasını sağlamak için otomatik olarak ayarlamalar yapacaktır.

Bunu göstermek için daha önce tartışılan basit 2 x 2 planına geri dönelim. Bu dengesiz tasarımın hücrelerindeki gözlem sayısının -1, 2, 3 ve 1 olduğunu hatırlayın. A faktörünün ağırlıklı marjinal ortalamalarını (B faktörünün seviyelerinin frekansıyla ağırlıklandırılmış) karşılaştırmak istediğimizi varsayalım. Kontrast katsayılarını girebilirsiniz:

Bu katsayıların toplamının 0'a ulaşmadığını unutmayın. Program, katsayıları, toplamları 0 olacak şekilde ayarlayacak ve göreceli değerleri korunacaktır, yani:

1/3 2/3 -3/4 -1/4

Bu kontrastlar Faktör A için ağırlıklı ortalamaları karşılaştıracaktır.

Temel ortalamaya ilişkin hipotezler. Ağırlıklandırılmamış temel ortalamanın 0 olduğu hipotezi, katsayılar kullanılarak araştırılabilir:

Ağırlıklı temel ortalamanın 0 olduğu hipotezi aşağıdakiler kullanılarak test edilir:

Program hiçbir durumda kontrast oranlarını ayarlamaz.

Eksik hücreli planların analizi (eksik planlar)

Boş hücreler (gözlemi olmayan hücrelerin işlem kombinasyonları) içeren faktöriyel tasarımlara eksik denir. Bu tür tasarımlarda bazı faktörler genellikle dik değildir ve bazı etkileşimler hesaplanamaz. Hiç mevcut değil en iyi yöntem Bu tür planların analizi.

Regresyon yaklaşımı

Çok değişkenli regresyon kullanarak ANOVA tasarımlarını analiz etmeye dayanan bazı eski programlarda, tamamlanmamış tasarımlardaki faktörler her zamanki gibi varsayılan olarak belirtilir (sanki tasarım tamamlanmış gibi). Daha sonra bu yapay kodlanmış faktörler üzerinde çok değişkenli regresyon analizleri gerçekleştirilir. Ne yazık ki, bu yöntem, yorumlanması imkansız olmasa da çok zor olan sonuçlar üretmektedir çünkü her bir etkinin, ortalamaların doğrusal kombinasyonuna nasıl katkıda bulunduğu belirsizdir. Aşağıdaki basit örneği düşünün.

Faktör A Faktör B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Kaçırıldı

Formun çok değişkenli regresyonunu yaparsak Bağımlı Değişken = Sabit + Faktör A + Faktör B o zaman A ve B faktörlerinin ortalamaların doğrusal kombinasyonları açısından önemi hakkındaki hipotez şuna benzer:

Faktör A: Hücre A1,B1 = Hücre A2,B1

Faktör B: Hücre A1,B1 = Hücre A1,B2

Bu dava basit. Daha karmaşık tasarımlarda aslında tam olarak neyin inceleneceğini belirlemek imkansızdır.

Hücre anlamına gelir, ANOVA yaklaşımı , Tip IV hipotezler

Literatürde önerilen ve tercih edilebilir görünen yaklaşım anlamlı (araştırma soruları açısından) çalışmalar yapmaktır. Önsel Planın hücrelerinde gözlemlenen araçlarla ilgili hipotezler. Bu yaklaşımın ayrıntılı tartışması Dodge (1985), Heiberger (1989), Milliken ve Johnson (1984), Searle (1987) veya Woodward, Bonett ve Brecht (1990)'de bulunabilir. Etkilerin bir kısmına ilişkin tahminleri inceleyen tamamlanmamış tasarımlarda ortalamaların doğrusal kombinasyonu hakkındaki hipotezlerle ilişkili kareler toplamlarına aynı zamanda kareler toplamları da denir. IV.

Tip hipotezlerinin otomatik oluşturulmasıIV. Çok faktörlü planlar olduğunda karmaşık doğa eksik hücreler varsa, incelenmesi ana etkiler veya etkileşimlerin incelenmesine eşdeğer olan ortogonal (bağımsız) hipotezlerin tanımlanması tavsiye edilir. Bu tür karşılaştırmalar için uygun ağırlıkların üretilmesi amacıyla algoritmik (hesaplamalı) stratejiler (sözde ters tasarım matrisine dayalı) geliştirilmiştir. Ne yazık ki son hipotezler benzersiz bir şekilde tanımlanmamıştır. Elbette etkilerin belirlenme sırasına bağlıdırlar ve nadiren basit bir yoruma izin verirler. Bu nedenle, eksik hücrelerin doğasının dikkatlice incelenmesi ve ardından hipotezlerin formüle edilmesi önerilir. tipIV, çalışmanın amaçlarına en anlamlı şekilde karşılık gelenler. Daha sonra seçeneği kullanarak bu hipotezleri keşfedin Planlanan karşılaştırmalar pencerede sonuçlar. Bu durumda karşılaştırmaları belirtmenin en kolay yolu, tüm faktörler için bir kontrast vektörünün eklenmesini gerektirmektir. birlikte pencerede Planlanan karşılaştırmalar.İletişim kutusunu çağırdıktan sonra Planlanan karşılaştırmalar Mevcut plandaki tüm gruplar gösterilecek ve eksik olanlar işaretlenecektir.

Eksik hücreler ve spesifik etkinin test edilmesi

Eksik hücrelerin konumunun rastgele olmadığı, ancak diğer etkileri etkilemeden ana etkilerin basit analizine olanak tanıyan dikkatlice planlandığı çeşitli tasarım türleri vardır. Örneğin bir planda gerekli sayıda hücre mevcut olmadığında planlar sıklıkla kullanılır. Latin kareleriÇeşitli faktörlerin ana etkilerini çok sayıda düzeyle tahmin etmek. Örneğin, 4 x 4 x 4 x 4 faktöriyel tasarım 256 hücre gerektirir. Aynı zamanda kullanabilirsiniz Greko-Latin meydanı tasarımdaki yalnızca 16 hücreyle ana etkileri tahmin etmek (Bölüm Deney planlama, Cilt IV, bu tür planların ayrıntılı bir açıklamasını içerir). Ana etkilerin (ve bazı etkileşimlerin) basit doğrusal ortalama kombinasyonları kullanılarak tahmin edilebildiği tamamlanmamış tasarımlara denir. dengeli tamamlanmamış planlar.

Dengeli tasarımlarda, ana etkiler ve etkileşimler için kontrastlar (ağırlıklar) oluşturmanın standart (varsayılan) yöntemi, ilgili etkilerin karelerinin toplamlarının birbiriyle karıştırılmadığı bir varyans analizi tablosu üretecektir. Seçenek Spesifik etkiler pencere sonuçlar eksik plan hücrelerine sıfır yazarak eksik kontrastlar oluşturacaktır. Seçenek talep edildikten hemen sonra Spesifik etkiler Bazı hipotezleri inceleyen kullanıcı için gerçek ağırlıkların yer aldığı bir sonuç tablosu görünür. Dengeli bir tasarımda, karşılık gelen etkilerin karelerinin toplamlarının, yalnızca bu etkilerin diğer tüm ana etkilere ve etkileşimlere dik (bağımsız) olması durumunda hesaplanacağını unutmayın. Aksi takdirde seçeneği kullanmanız gerekir. Planlanan karşılaştırmalar Ortalamalar arasındaki anlamlı karşılaştırmaları araştırmak.

Eksik hücreler ve birleştirilmiş etkiler/hata terimleri

Eğer seçenek Regresyon yaklaşımı modül başlatma panelinde Varyans analizi seçili değilse, efektler için karelerin toplamı hesaplanırken hücre ortalama modeli kullanılacaktır (varsayılan ayar). Tasarım dengeli değilse, ortogonal olmayan efektleri birleştirirken (seçenek ile ilgili yukarıdaki tartışmaya bakın) Kaçırılan hücreler ve spesifik etki) dik olmayan (veya üst üste binen) bileşenlerden oluşan bir kareler toplamı elde edilebilir. Elde edilen sonuçlar genellikle yorumlanamaz. Bu nedenle karmaşık, tamamlanmamış deneysel tasarımları seçerken ve uygularken çok dikkatli olunmalıdır.

Farklı plan türlerinin ayrıntılı tartışmalarını içeren birçok kitap vardır. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken ve Johnson, 1984; Searle, 1987; Woodward ve Bonett, 1990), ancak bu tür bilgiler bu ders kitabının kapsamı dışındadır. Ancak farklı plan türlerinin analizi bu bölümün ilerleyen kısımlarında gösterilecektir.

Varsayımlar ve varsayımları ihlal etmenin etkileri

Normal dağılım varsayımından sapma

Bağımlı değişkenin sayısal bir ölçekte ölçüldüğünü varsayalım. Ayrıca bağımlı değişkenin her grupta normal dağıldığını varsayalım. Varyans analizi bu varsayımı destekleyecek geniş bir grafik ve istatistik yelpazesi içerir.

Kesintinin etkileri. Hiç F test normallikten sapmalara karşı çok dayanıklıdır (ayrıntılı sonuçlar için bkz. Lindman, 1974). Basıklık 0'dan büyükse istatistiğin değeri Fçok küçük hale gelebilir. Sıfır hipotezi doğru olmasa da kabul edilir. Basıklık 0'dan küçük olduğunda durum tersine döner. Dağılım çarpıklığının genellikle üzerinde çok az etkisi vardır. Fİstatistik. Bir hücredeki gözlem sayısı yeterince büyükse normallikten sapma olmaz. özel önem sayesinde Merkezi Limit Teoremi, buna göre, başlangıç ​​​​dağılımı ne olursa olsun, ortalama değerin dağılımı normale yakındır. Sürdürülebilirliğin ayrıntılı tartışması F istatistikler Box ve Anderson (1955) veya Lindman'da (1974) bulunabilir.

Varyansın tekdüzeliği

Varsayımlar. Farklı tasarım gruplarının varyanslarının aynı olduğu varsayılmaktadır. Bu varsayıma varsayım denir varyansın homojenliği. Bu bölümün başında hataların karelerinin toplamının hesaplanmasını anlatırken her grup içinde toplama işlemi yaptığımızı hatırlayın. İki gruptaki varyanslar birbirinden farklıysa, bu durumda bunların toplanması pek doğal değildir ve grup içi toplam varyansın tahminini sağlamaz (çünkü bu durumda hiçbir toplam varyans yoktur). Modül Varyans analizi -ANOVA/MANOVA içerir büyük set varyansın homojenliği varsayımlarından sapmaları tespit etmek için istatistiksel kriterler.

Kesintinin etkileri. Lindman (1974, s. 33) şunu gösteriyor: F varyansın homojenliği varsayımlarının ihlali açısından kriter oldukça kararlıdır ( heterojenlik varyans, ayrıca bkz. Box, 1954a, 1954b; Hsu, 1938).

Özel durum: ortalamaların ve varyansların korelasyonu.Öyle zamanlar vardır ki F istatistikler yapabilir yanıltmak. Bu, tasarım hücrelerinin araçları varyansla ilişkilendirildiğinde gerçekleşir. Modül Varyans analizi bu tür bir korelasyonu tespit etmek için ortalamaya karşı varyans veya standart sapmanın dağılım grafiklerini çizmenize olanak tanır. Bu korelasyonun tehlikeli olmasının nedeni şudur. Planda 8 hücre olduğunu, bunların 7'sinin hemen hemen aynı ortalamaya sahip olduğunu ve bir hücrede ortalamanın diğerlerine göre çok daha yüksek olduğunu düşünelim. Daha sonra F test istatistiksel olarak anlamlı bir etki tespit edebilir. Ancak ortalama değeri büyük olan bir hücrede varyansın diğerlerinden önemli ölçüde daha büyük olduğunu varsayalım; hücrelerdeki ortalama değer ve varyans bağımlıdır (ortalama ne kadar yüksek olursa varyans da o kadar büyük olur). Bu durumda büyük bir ortalama güvenilmezdir çünkü verilerdeki büyük farklılıklardan kaynaklanabilir. Fakat F dayalı istatistikler Birleşik Hücreler içindeki varyans genel ortalamayı yakalayacaktır, ancak her bir hücre içindeki varyansa dayalı testler ortalamalardaki tüm farklılıkları anlamlı olarak dikkate almayacaktır.

Bu tür veriler (büyük ortalama ve büyük varyans) genellikle aykırı gözlemler olduğunda ortaya çıkar. Bir veya iki aykırı değer gözlemi ortalamayı büyük ölçüde kaydırır ve varyansı büyük ölçüde artırır.

Varyans ve Kovaryansın Homojenliği

Varsayımlar.Çok değişkenli bağımlı ölçümlere sahip çok değişkenli tasarımlar, daha önce açıklanan varyansın homojenliği varsayımını da uygular. Ancak çok değişkenli bağımlı değişkenler mevcut olduğundan, bunların karşılıklı korelasyonlarının (kovaryanslarının) tasarımın tüm hücrelerinde aynı olması da gerekir. Modül Varyans analizi bu varsayımları test etmek için farklı yollar sunar.

Kesintinin etkileri. Çok boyutlu analog F- kriter - Wilks'in λ testi. Yukarıdaki varsayımların ihlali açısından Wilks λ testinin sağlamlığı hakkında pek fazla şey bilinmemektedir. Ancak modül sonuçlarının yorumlanmasından bu yana Varyans analizi genellikle tek değişkenli etkilerin önemine dayanır (önemliliğin belirlenmesinden sonra) genel kriter), sağlamlık tartışması temel olarak tek değişkenli varyans analiziyle ilgilidir. Bu nedenle tek değişkenli etkilerin anlamlılığı dikkatle incelenmelidir.

Özel durum: kovaryans analizi.Özellikle ciddi ihlaller Ortak değişkenler tasarıma dahil edildiğinde varyansların/kovaryansların homojenliği ortaya çıkabilir. Özellikle, ortak değişkenler ile bağımlı ölçümler arasındaki korelasyon tasarımdaki hücreler arasında değişiklik gösteriyorsa, sonuçların yanlış yorumlanması ortaya çıkabilir. Kovaryans analizinin esasen, ortak değişken tarafından açıklanan varyans kısmını izole etmek için her hücrede bir regresyon analizi gerçekleştirdiğini unutmayın. Varyans/kovaryans homojenliği varsayımı, bu regresyon analizinin aşağıdaki kısıtlama altında yürütüldüğünü varsayar: tüm hücreler için tüm regresyon denklemleri (eğimler) aynıdır. Bu varsayılmazsa, büyük hatalar ortaya çıkabilir. Modül Varyans analizi Bu varsayımı test etmek için çeşitli özel kriterleri vardır. Farklı hücrelere yönelik regresyon denklemlerinin yaklaşık olarak aynı olmasını sağlamak için bu kriterlerin kullanılması tavsiye edilir.

Küresellik ve karmaşık simetri: varyans analizinde tekrarlanan ölçümlere çok değişkenli bir yaklaşım kullanmanın nedenleri

İkiden fazla seviyeye sahip tekrarlanan ölçüm faktörlerini içeren tasarımlarda, tek değişkenli ANOVA'nın kullanımı ek varsayımlar gerektirir: bileşik simetri varsayımı ve küresellik varsayımı. Bu varsayımlar nadiren karşılanır (aşağıya bakınız). Bu nedenle, son yıllarda bu tür tasarımlarda çok değişkenli varyans analizi popülerlik kazanmıştır (her iki yaklaşım da modülde birleştirilmiştir). Varyans analizi).

Karmaşık simetri varsayımı Bileşik simetri varsayımı, farklı tekrarlanan ölçümler için varyansların (gruplar içinde paylaşılan) ve kovaryansların (gruplar içinde paylaşılan) homojen (aynı) olmasıdır. Bu, tekrarlanan ölçümlerin geçerli olması için tek değişkenli F testinin geçerli olması için yeterli bir durumdur (yani rapor edilen F değerleri ortalama olarak F dağılımıyla tutarlıdır). Ancak, bu durumda bu şart gerekli değildir.

Küresellik varsayımı. Küresellik varsayımı gereklidir ve yeterli koşul F testinin geçerli olabilmesi için Gruplar içinde tüm gözlemlerin bağımsız ve eşit olarak dağılmış olması gerçeğinden oluşur. Bu varsayımların doğası ve bunları ihlal etmenin etkisi ANOVA ile ilgili kitaplarda genellikle iyi bir şekilde açıklanmaz; bunlar aşağıdaki paragraflarda ele alınacaktır. Ayrıca tek değişkenli yaklaşımın sonuçlarının çok değişkenli yaklaşımın sonuçlarından farklı olabileceği gösterilecek ve bunun ne anlama geldiği açıklanacaktır.

Hipotezlerin bağımsızlığı ihtiyacı. ANOVA'da verileri analiz etmenin genel yolu modeli uydurma. Verilere uyan modele göre bazı Önsel hipotezler, daha sonra bu hipotezleri test etmek için varyans bölünür (ana etkiler, etkileşimler için kriterler). Hesaplamalı bir bakış açısından bakıldığında, bu yaklaşım bir dizi karşıtlık (plan araçlarının bir dizi karşılaştırması) üretir. Ancak zıtlıklar birbirinden bağımsız değilse varyansların bölümlenmesi anlamsız hale gelir. Örneğin iki zıtlık varsa A Ve B aynıdır ve varyansın karşılık gelen kısmı çıkarılır, ardından aynı kısım iki kez çıkarılır. Örneğin iki hipotez tanımlamak aptalca ve anlamsızdır: "1. hücredeki ortalama, hücre 2'deki ortalamadan daha yüksektir" ve "hücre 1'deki ortalama, hücre 2'deki ortalamadan daha yüksektir." Bu nedenle hipotezlerin bağımsız veya dik olması gerekir.

Tekrarlanan ölçümlerde bağımsız hipotezler. Genel algoritma, modülde uygulanan Varyans analizi, her efekt için bağımsız (dik) kontrastlar oluşturmaya çalışacaktır. Tekrarlanan ölçümler faktörü için bu zıtlıklar, konuyla ilgili birçok hipotez sağlar. farklılıklar Söz konusu faktörün seviyeleri arasında. Bununla birlikte, eğer bu farklılıklar gruplar içinde ilişkilendiriliyorsa, o zaman ortaya çıkan zıtlıklar artık bağımsız değildir. Örneğin, öğrencilerin bir yarıyılda üç kez ölçüldüğü öğretimde, 1. ve 2. ölçümler arasındaki değişimin, konuların 2. ve 3. ölçümleri arasındaki değişimle negatif ilişkili olması söz konusu olabilir. 1. ve 2. boyut arasında konunun büyük bir kısmına hakim olanlar, 2. ve 3. boyut arasında geçen sürede daha küçük bir kısma hakim olurlar. Aslında ANOVA'nın tekrarlanan ölçümler için kullanıldığı çoğu durumda, düzeyler arasındaki değişikliklerin denekler arasında ilişkili olduğu varsayılabilir. Ancak bu gerçekleştiğinde karmaşık simetri varsayımı ve küresellik varsayımı geçerli olmaz ve bağımsız kontrastlar hesaplanamaz.

İhlallerin etkisi ve bunları düzeltmenin yolları. Karmaşık simetri veya küresellik varsayımları karşılanmadığında ANOVA hatalı sonuçlar üretebilir. Çok değişkenli prosedürler yeterince geliştirilmeden önce, bu varsayımların ihlallerini telafi etmek için çeşitli varsayımlar önerildi. (Örneğin bkz. Greenhouse & Geisser, 1959 ve Huynh & Feldt, 1970). Bu yöntemler hala yaygın olarak kullanılmaktadır (bu nedenle modülde sunulmaktadırlar). Varyans analizi).

Tekrarlanan ölçümlere çok değişkenli varyans analizi yaklaşımı. Genel olarak karmaşık simetri ve küresellik sorunları, tekrarlanan ölçüm faktörlerinin (2'den fazla seviyeli) etkilerine ilişkin çalışmada yer alan zıtlık kümelerinin birbirinden bağımsız olmamasıyla ilgilidir. Ancak kullanıldıkları takdirde bağımsız olmalarına gerek yoktur. çok boyutlu iki veya daha fazla tekrarlanan ölçümün faktör kontrastlarının istatistiksel anlamlılığını eş zamanlı olarak test etmek için bir test. Bu, çok değişkenli varyans analizi tekniklerinin, 2'den fazla seviyeye sahip tek değişkenli tekrarlanan ölçüm faktörlerinin önemini test etmek için giderek daha fazla kullanılmasının nedenidir. Bu yaklaşım genel olarak karmaşık simetri veya küresellik gerektirmediği için geniş çapta kabul görmektedir.

Çok değişkenli varyans analizi yaklaşımının kullanılamadığı durumlar.Çok değişkenli varyans analizi yaklaşımının uygulanamadığı örnekler (tasarımlar) vardır. Tipik olarak bunlar hiçbir şeyin olmadığı durumlardır. çok sayıda tasarımdaki konular ve tekrarlanan ölçümler faktöründeki birçok seviye. Bu durumda çok değişkenli bir analiz yürütmek için çok az gözlem olabilir. Örneğin 12 konu varsa; P = 4 tekrarlanan ölçümler faktörü ve her faktörün k = 3 seviyeleri. Daha sonra 4 faktörün etkileşimi "tüketilecek" (k-1)P = 2 4 = 16 özgürlük derecesi. Ancak yalnızca 12 denek olduğundan bu örnekte çok değişkenli bir test gerçekleştirilemez. Modül Varyans analizi bağımsız olarak bu gözlemleri tespit edecek ve yalnızca tek boyutlu kriterleri hesaplayacaktır.

Tek değişkenli ve çok değişkenli sonuçlardaki farklılıklar. Bir çalışma çok sayıda tekrarlanan ölçüm içeriyorsa, tek değişkenli tekrarlanan ölçümler ANOVA yaklaşımının, çok değişkenli yaklaşımla elde edilenlerden çok farklı sonuçlar ürettiği durumlar olabilir. Bu, karşılık gelen tekrarlanan ölçümlerin seviyeleri arasındaki farkların denekler arasında ilişkili olduğu anlamına gelir. Bazen bu gerçek bağımsız olarak ilgi çekici olabilir.

Çok değişkenli varyans analizi ve yapısal eşitlik modellemesi

Son yıllarda, yapısal eşitlik modellemesi çok değişkenli varyans analizine alternatif olarak popüler hale gelmiştir (örneğin bakınız, Bagozzi ve Yi, 1989; Bagozzi, Yi ve Singh, 1991; Cole, Maxwell, Arvey ve Salas, 1993). . Bu yaklaşım, yalnızca farklı gruplardaki ortalamalara ilişkin değil aynı zamanda bağımlı değişkenlerin korelasyon matrislerine ilişkin hipotezlerin test edilmesine olanak sağlar. Örneğin, varyansların ve kovaryansların homojenliği varsayımları gevşetilebilir ve her grup için modele hata varyansları ve kovaryanslar açıkça dahil edilebilir. Modül İSTATİSTİKYapısal Eşitlik Modellemesi (SEPATH) (bkz. Cilt III) böyle bir analize olanak sağlar.

Varyans analizi, herhangi bir kontrollü değişken faktörünün etkisi altında etkili bir özelliğin değişkenliğinin analizidir. (Yabancı literatürde buna ANOVA – “Varyans Analizi” denir).

Ortaya çıkan karakteristik aynı zamanda bağımlı karakteristik olarak da adlandırılır ve etkileyen faktörlere bağımsız özellikler denir.

Yöntemin sınırlaması: bağımsız özellikler nominal, sıralı veya metrik ölçekte ölçülebilir, bağımlı olanlar ise yalnızca metrik ölçekte ölçülebilir. Varyans analizini gerçekleştirmek için faktör özelliklerinin çeşitli dereceleri tanımlanır ve tüm örnek öğeler bu derecelendirmelere göre gruplandırılır.

Varyans analizinde hipotezlerin oluşturulması.

Boş hipotez: “Faktörün (veya faktörün derecelerinin) tüm koşullarında ortaya çıkan özelliğin ortalama değerleri aynıdır.”

Alternatif hipotez: “Faktörün farklı koşulları altında etkili özelliğin ortalama değerleri farklıdır.”

Varyans analizi aşağıdakilere bağlı olarak birkaç kategoriye ayrılabilir:

dikkate alınan bağımsız faktörlerin sayısı;

faktörlere maruz kalan sonuç değişkenlerinin sayısı;

niteliği, elde edilmesinin niteliği ve karşılaştırılan değerler arasında bir ilişkinin varlığı.

Etkisi incelenen bir faktör varsa, varyans analizine tek faktörlü analiz denir ve iki türe ayrılır:

- İlgisiz (yani farklı) numunelerin analizi . Örneğin, bir grup katılımcı bir sorunu sessiz koşullarda çözüyor, ikincisi ise gürültülü bir odada. (Bu arada, sıfır hipotezi şöyle görünecektir: "bu tür problemleri çözmek için ortalama süre sessiz ve gürültülü bir odada aynı olacaktır", yani gürültüye bağlı değildir faktör.)

- Bağlantılı Örnek Analizi yani aynı grup katılımcı üzerinde farklı koşullar altında gerçekleştirilen iki ölçüm. Aynı örnek: Sorun ilk kez sessizce çözüldü, ikincisi - benzer bir sorun - gürültü girişimi koşullarında. (Uygulamada bu tür deneylere ihtiyatla yaklaşılmalıdır, çünkü hesaba katılmayan "öğrenme yeteneği" faktörü devreye girebilir; araştırmacı bunun etkisini koşullardaki bir değişikliğe, yani gürültüye atfetme riski taşır.)

İki veya daha fazla faktörün eş zamanlı etkisi incelenirse, çok değişkenli varyans analizi, aynı zamanda örnek türüne göre de alt bölümlere ayrılabilir.

Birden fazla değişken faktörlerden etkileniyorsa, - Hakkında konuşuyoruzÖ çok değişkenli analiz . Çok değişkenli varyans analizinin yapılması, tek değişkenli analize göre yalnızca bağımlı değişkenlerin birbirinden bağımsız olmadığı ve birbiriyle ilişkili olduğu durumlarda tercih edilir.

Genel olarak varyans analizinin görevi, bir özelliğin genel değişkenliğinden üç özel varyasyonu tanımlamaktır:

    incelenen bağımsız değişkenlerin (faktörlerin) her birinin eyleminin neden olduğu değişkenlik.

    incelenen bağımsız değişkenlerin etkileşiminden kaynaklanan değişkenlik.

    açıklanmayan tüm durumlardan kaynaklanan rastgele değişkenlik.

Çalışılan değişkenlerin eyleminin ve bunların etkileşiminin neden olduğu değişkenliği değerlendirmek için, karşılık gelen değişkenlik göstergesinin ve rastgele değişkenliğin oranı hesaplanır. Bu ilişkinin bir göstergesi Fisher F testidir.

Bir özelliğin değişkenliği, etkileyen faktörlerin etkisinden veya bunların etkileşiminden kaynaklanıyorsa, kriterin ampirik değerleri de o kadar yüksek olur .

Kriteri hesaplama formülünde varyans tahminlerini içerir ve bu nedenle bu yöntem parametrik yöntemler kategorisine aittir.

Bağımsız örnekler için tek yönlü varyans analizinin parametrik olmayan bir analoğu Kruskal-Wallace testidir. Her biri için sıralamaları toplaması dışında, iki bağımsız örnek için Mann-Whitney testine benzer. gruplar.

Ayrıca varyans analizinde medyan kriteri de kullanılabilir. Kullanıldığında her grup için tüm gruplar için hesaplanan ortancayı aşan gözlem sayısı ve ortancadan küçük gözlem sayısı belirlenerek iki boyutlu bir olasılık tablosu oluşturulur.

Friedman testi, karşılaştırılan değişken sayısının ikiden fazla olduğu durumlarda tekrarlanan ölçümlere sahip numuneler için eşleştirilmiş t testinin parametrik olmayan bir genellemesidir.

Korelasyon analizinden farklı olarak, varyans analizinde araştırmacı, bazı değişkenlerin (faktörler veya bağımsız değişkenler olarak adlandırılır) etkileyici değişkenler olarak hareket ettiği, diğerlerinin (sonuç özellikleri veya bağımlı değişkenler) bu faktörlerden etkilendiği varsayımından yola çıkar. Her ne kadar bu varsayım matematiksel hesaplama prosedürlerinin temelini oluştursa da, neden ve sonuç hakkında çıkarımlarda bulunurken yine de dikkatli olmayı gerektirir.

Örneğin, bir memurun çalışmasının başarısının H faktörüne (Cattell'e göre sosyal cesaret) bağlı olduğuna dair bir hipotez öne sürersek, o zaman bunun tersi göz ardı edilmez: katılımcının sosyal cesareti şu şekilde ortaya çıkabilir (artabilir). işinin başarısının sonucu - bu bir yandan. Öte yandan “başarı”nın tam olarak nasıl ölçüldüğünü bilmemiz gerekir mi? Nesnel özelliklere (şu anda moda olan "satış hacimleri" vb.) değil, meslektaşların uzman değerlendirmelerine dayanıyorsa, o zaman "başarı" nın davranışsal veya kişisel özelliklerle (istemli, iletişimsel, vb.) yer değiştirmesi olasılığı vardır. saldırganlığın dış belirtileri vb.).

İki ortalama arasındaki farkların önemi hakkındaki istatistiksel hipotezleri test etmek için yukarıda tartışılan tekniklerin pratikte uygulaması sınırlıdır. Bunun nedeni, herkesin eylemlerini tanımlamak için olası koşullar Etkili bir özellik için faktörler ve saha ve laboratuvar deneyleri, kural olarak iki değil, daha fazla sayıda numune (1220 veya daha fazla) kullanılarak gerçekleştirilir.

Çoğu zaman araştırmacılar, tek bir komplekste birleştirilen birkaç numunenin araçlarını karşılaştırır. Örneğin, etkiyi incelemek çeşitli türler ve gübre dozlarının ürün verimi üzerindeki etkisi göz önüne alınarak deneyler tekrarlanmıştır. farklı seçenekler. Bu durumlarda ikili karşılaştırmalar külfetli hale gelir ve tüm kompleksin istatistiksel analizi, özel yöntem. Matematiksel istatistik alanında geliştirilen bu yönteme varyans analizi adı verilmektedir. İlk kez İngiliz istatistikçi R. Fisher tarafından tarımsal deneylerin sonuçlarını işlerken kullanıldı (1938).

Varyans analizi Etkili bir özelliğin bir veya daha fazla faktöre bağımlılığının tezahürünün güvenilirliğini istatistiksel olarak değerlendirmek için bir yöntemdir. Varyans analizi yöntemi kullanılarak, normal dağılıma sahip çeşitli genel popülasyonlardaki ortalamalara ilişkin istatistiksel hipotezler test edilir.

Varyans analizi, deney sonuçlarının istatistiksel değerlendirilmesinde ana yöntemlerden biridir. Ekonomik bilgilerin analizinde de giderek daha fazla kullanılmaktadır. Varyans analizi, sonuç ve faktör özellikleri arasındaki ilişkiye ilişkin örnek göstergelerin, örneklemden elde edilen verileri genel popülasyona genişletmek için ne ölçüde yeterli olduğunu belirlemeyi mümkün kılar. Bu yöntemin avantajı küçük örneklerden oldukça güvenilir sonuçlar vermesidir.

Varyans analizi kullanarak bir veya daha fazla faktörün etkisi altında etkili bir özelliğin değişimini inceleyerek, bağımlılıkların önemine ilişkin genel tahminlere ek olarak, aynı zamanda oluşan ortalamaların büyüklüğündeki farklılıkların bir değerlendirmesi de elde edilebilir. faktörlerin farklı düzeylerinde ve faktörlerin etkileşiminin önemi. Varyans analizi hem niceliksel hem de niteliksel özelliklerin bağımlılıklarını ve bunların kombinasyonlarını incelemek için kullanılır.

Bu yöntemin özü, bir veya daha fazla faktörün etkisinin olasılığının yanı sıra bunların ortaya çıkan özellik üzerindeki etkileşiminin istatistiksel olarak incelenmesidir. Buna göre varyans analizi kullanılarak üç temel problem çözülmektedir: 1) Genel Değerlendirme grup ortalamaları arasındaki farkların önemi; 2) faktörler arasındaki etkileşim olasılığının değerlendirilmesi; 3) ortalama çiftleri arasındaki farkların öneminin değerlendirilmesi. Çoğu zaman, araştırmacılar, çeşitli faktörlerin etkili bir özellik üzerindeki etkisi incelendiğinde, saha ve zooteknik deneyler yaparken bu tür sorunları çözmek zorunda kalırlar.

Varyans analizinin temel şeması, etkili karakteristikteki ana varyasyon kaynaklarının belirlenmesini ve varyasyon hacminin (sapmaların karelerinin toplamı) oluşum kaynaklarına göre belirlenmesini içerir; toplam varyasyonun bileşenlerine karşılık gelen serbestlik derecesi sayısının belirlenmesi; dağılımların, karşılık gelen değişim hacimlerinin serbestlik derecesi sayısına oranı olarak hesaplanması; varyanslar arasındaki ilişkinin analizi; Ortalamalar arasındaki farkın güvenilirliğinin değerlendirilmesi ve sonuçların çıkarılması.

Belirtilen şema sanki basit modeller varyans analizi, veriler bir özelliğe göre gruplandırıldığında ve karmaşık modeller Veriler iki veya daha fazla özelliğe göre gruplandırıldığında. Ancak grup özelliklerinin sayısı arttıkça toplam varyasyonun oluşum kaynaklarına göre ayrıştırılması süreci daha karmaşık hale gelir.

Prensip diyagramına göre, varyans analizi ardışık beş aşama şeklinde temsil edilebilir:

1) varyasyonun tanımı ve genişletilmesi;

2) varyasyon serbestliği derecesi sayısının belirlenmesi;

3) varyansların ve oranlarının hesaplanması;

4) varyansların ve bunların ilişkilerinin analizi;

5) ortalamalar arasındaki farkın öneminin değerlendirilmesi ve sıfır hipotezinin test edilmesi için sonuçların formüle edilmesi.

Varyans analizinin en emek yoğun kısmı, varyasyonun oluşum kaynaklarına göre belirlenmesi ve ayrıştırılması olan ilk aşamadır. Toplam varyasyon hacminin ayrıştırılma sırası Bölüm 5'te ayrıntılı olarak tartışılmıştır.

Varyans analizi problemlerini çözmenin temeli, ortaya çıkan özelliğin toplam varyasyonunun (dalgalanmalarının) ikiye bölündüğü genişleme (ekleme) varyasyon yasasıdır: incelenen faktör(ler)in eyleminin neden olduğu varyasyon. ve rastgele nedenlerin eyleminin neden olduğu varyasyon, yani

İncelenen popülasyonun, faktör özelliklerine göre, her biri ortaya çıkan özelliğin kendi ortalama değeri ile karakterize edilen birkaç gruba ayrıldığını varsayalım. Aynı zamanda bu değerlerin değişimi iki tür sebeple açıklanabilir: Etki işaretine sistematik olarak etki eden ve deney sırasında ayarlanabilenler ve ayarlanamayanlar. Gruplar arası (faktöriyel veya sistematik) varyasyonun öncelikle incelenen faktörün etkisine bağlı olduğu ve grup içi (artık veya rastgele) varyasyonun öncelikle rastgele faktörlerin etkisine bağlı olduğu açıktır.

Grup ortalamaları arasındaki farklılıkların güvenilirliğini değerlendirmek için gruplar arası ve grup içi farklılıkları belirlemek gerekir. Gruplar arası (faktöriyel) varyasyon, grup içi (artık) varyasyonu önemli ölçüde aşarsa, faktör, grup ortalamalarının değerlerini önemli ölçüde değiştirerek ortaya çıkan özelliği etkilemiştir. Ancak şu soru ortaya çıkıyor: Grup ortalamaları arasındaki farklılıkların güvenilirliğini (anlamlılığını) belirlemek için gruplar arası ve grup içi varyasyonlar arasındaki ilişkinin yeterli olduğu düşünülebilir.

Ortalamalar arasındaki farkların önemini değerlendirmek ve varyans analizinde sıfır hipotezini (H0:x1 = x2 =... = xn) test etmek için sonuçları formüle etmek için bir tür standart kullanılır - G kriteri, dağılım yasası R. Fisher tarafından kurulmuştur. Bu kriter iki varyansın oranıdır: incelenen faktörün eylemiyle oluşturulan faktöriyel ve rastgele nedenlerin etkisinden kaynaklanan artık:

Dağılım ilişkisi Γ = £>u : Amerikalı istatistikçi Snedecor, varyans analizinin mucidi R. Fisher'ın onuruna £*2'nin G harfiyle ifade edilmesini önerdi.

°2 io2 varyansları popülasyon varyansının tahminleridir. Değerlerdeki değişimin rastgele olduğu aynı genel popülasyondan °2 °2 varyanslı numuneler yapılmışsa, o zaman °2 °2 değerlerindeki tutarsızlık da rastgele olur.

Bir deney, birden fazla faktörün (A, B, C, vb.) etkili bir özellik üzerindeki etkisini aynı anda test ediyorsa, bu durumda bunların her birinin etkisinden kaynaklanan varyans, şu şekilde karşılaştırılabilir olmalıdır: °e.gP, yani

Faktör dağılımının değeri artık değerden önemli ölçüde büyükse, o zaman faktör, ortaya çıkan özelliği önemli ölçüde etkilemiştir ve bunun tersi de geçerlidir.

Çok faktörlü deneylerde, her faktörün etkisinden kaynaklanan varyasyona ek olarak, hemen hemen her zaman faktörlerin etkileşiminden kaynaklanan varyasyon da vardır ($ав: ^лс ^вс $ліс). Etkileşimin özü, bir faktörün etkisinin ikincinin farklı seviyelerinde önemli ölçüde değişmesidir (örneğin, farklı gübre dozlarında Toprak kalitesinin etkinliği).

Faktörlerin etkileşimi, karşılık gelen varyanslar karşılaştırılarak da değerlendirilmelidir 3 ^v.gr:

B kriterinin gerçek değeri hesaplanırken payda varyansların büyük olanı alınır, yani B > 1. Açıkçası, B kriteri ne kadar büyük olursa, varyanslar arasındaki farklar da o kadar anlamlı olur. B = 1 ise, varyanslardaki farklılıkların öneminin değerlendirilmesi sorunu ortadan kalkar.

Dağılım oranındaki rastgele dalgalanmaların sınırlarını belirlemek için G. Fischer özel B-dağılım tabloları geliştirdi (Ek 4 ve 5). Kriter işlevsel olarak olasılıkla ilgili olacaktır ve değişimin serbestlik derecelerinin sayısına bağlı olacaktır. k1 ve karşılaştırılan iki varyansın k2'si. Tipik olarak, 0,05 ve 0,01 anlamlılık seviyeleri için kriterin son derece yüksek değeri hakkında sonuca varmak için iki tablo kullanılır. 0,05 (veya %5) anlamlılık düzeyi, 100 B kriterinden yalnızca 5'inde tabloda belirtilene eşit veya daha yüksek bir değer alabileceği anlamına gelir. Anlamlılık düzeyinin 0,05'ten 0,01'e düşürülmesi, yalnızca rastgele nedenlerin etkisiyle iki varyans arasındaki kriterin değerinin artmasına neden olur.

Kriterin değeri aynı zamanda doğrudan karşılaştırılan iki dispersiyonun serbestlik derecelerinin sayısına da bağlıdır. Serbestlik derecesi sayısı sonsuza (k-me) eğilimliyse, o zaman iki dağılım için B oranı birliğe eğilimlidir.

B kriterinin tablolaştırılmış değeri, belirli bir anlamlılık düzeyinde iki varyansın oranının olası rastgele değerini ve karşılaştırılan varyansların her biri için karşılık gelen serbestlik derecesi sayısını gösterir. Belirtilen tablolar, değerlerdeki değişikliklerin nedenlerinin yalnızca rastgele olduğu, aynı genel popülasyondan yapılan numuneler için B değerini göstermektedir.

Γ değeri, karşılık gelen sütun (daha büyük dağılım için serbestlik derecesi sayısı - k1) ve satırın (daha az dağılım için serbestlik derecesi sayısı - k2) kesişimindeki tablolardan (Ek 4 ve 5) bulunur. ). Yani, eğer daha büyük varyans (pay Г) k1 = 4 ise ve daha küçük varyans (payda Г) k2 = 9 ise, o zaman а = 0,05 anlamlılık düzeyindeki Г 3,63 olacaktır (Ek 4). Yani rastlantısal nedenler sonucunda örneklemlerin küçük olması nedeniyle bir örneğin varyansı %5 anlamlılık seviyesinde ikinci örneğin varyansını 3,63 kat aşabilmektedir. Anlamlılık düzeyi 0,05'ten 0,01'e düştüğünde yukarıda belirtildiği gibi G kriterinin tablo değeri artacaktır. Yani aynı serbestlik dereceleri k1 = 4 ve k2 = 9 ve a = 0,01 ile G kriterinin tablo değeri 6,99 olacaktır (Ek 5).

Varyans analizinde serbestlik derecesi sayısını belirleme prosedürünü ele alalım. Sapmaların toplam toplamına karşılık gelen serbestlik derecesi sayısı, sapmaların kareleri toplamının ayrıştırılmasına benzer şekilde karşılık gelen bileşenlere ayrıştırılır (^toplam = No^gr + ]¥vhr), yani toplam serbestlik derecesi sayısı (k"), gruplar arası (k1) ve grup içi (k2) varyasyonlar için serbestlik derecesi sayısına ayrıştırılır.

Dolayısıyla, aşağıdakilerden oluşan bir örnek popülasyon varsa N gözlemler bölünmüş T gruplar (deneysel seçeneklerin sayısı) ve P alt gruplar (tekrar sayısı) varsa, serbestlik derecesi sayısı k buna göre şöyle olacaktır:

a) sapmaların karelerinin toplamı için (s7zag)

b) gruplar arası sapmaların kareleri toplamı için ^m.gP)

c) Grup içi sapmaların kareleri toplamı için V v.gR)

Varyasyon ekleme kuralına göre:

Örneğin, bir deneyde deneyin dört varyantı her biri beş tekrarda (n = 5) oluşturulmuşsa (t = 4) ve toplam gözlem sayısı N = = T o p = 4 * 5 = 20 ise serbestlik derecesi sayısı buna karşılık gelecek şekilde eşittir:

Sapmaların karesi toplamını ve serbestlik derecesi sayısını bilerek, üç varyans için tarafsız (düzeltilmiş) tahminler belirleyebiliriz:

H0 sıfır hipotezi, Öğrenci t testiyle aynı şekilde B kriteri kullanılarak test edilir. H0'ın kontrol edilmesine karar vermek için kriterin gerçek değerini hesaplamak ve bunu H0 ile karşılaştırmak gerekir. tablo değeri Kabul edilen önem düzeyi a ve serbestlik derecesi sayısı için Ba k1 ve iki dağılım için k2.

Bfaq > Ba ise, kabul edilen anlamlılık düzeyine uygun olarak, örneklem varyanslarındaki farklılıkların yalnızca rastgele faktörler tarafından belirlenmediği; bunlar önemlidir. Bu durumda sıfır hipotezi reddedilir ve faktörün ortaya çıkan özelliği önemli ölçüde etkilediğini iddia etmek için neden vardır. Eğer< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Belirli bir varyans analizi modelinin kullanımı, hem incelenen faktörlerin sayısına hem de örnekleme yöntemine bağlıdır.

c Ortaya çıkan özelliğin değişimini belirleyen faktörlerin sayısına bağlı olarak bir, iki veya daha fazla faktöre göre numuneler oluşturulabilir. Buna göre varyans analizi tek faktörlü ve çok faktörlü olarak ikiye ayrılmaktadır. Aksi takdirde tek faktörlü ve çok faktörlü dağılım kompleksi olarak da adlandırılır.

Toplam varyasyonun ayrıştırma şeması grupların oluşumuna bağlıdır. Rastgele olabilir (bir grubun gözlemleri ikinci grubun gözlemleriyle ilişkili değildir) ve rastgele olmayabilir (iki örneğin gözlemleri ortak deney koşullarıyla birbiriyle ilişkilidir). Buna göre bağımsız ve bağımlı örnekler elde edilir. Hem eşit hem de tek sayılarla bağımsız örnekler oluşturulabilir. Bağımlı örneklerin oluşumu eşit büyüklükte olduğunu varsayar.

Gruplar rastgele bir sırada oluşturulmuşsa, sonuçta ortaya çıkan özelliğin toplam varyasyon hacmi, faktöriyel (gruplar arası) ve artık varyasyonun yanı sıra tekrarların varyasyonunu da içerir;

Uygulamada çoğu durumda gruplar ve alt gruplar için koşullar eşitlendiğinde bağımlı örneklerin dikkate alınması gerekir. Yani bir saha deneyinde tüm alan çok çeşitli koşullara sahip bloklara bölünür. Bu durumda, deneyin her bir varyantı tüm bloklarda temsil edilmek için eşit fırsatlara sahip olur, böylece deneyin test edilen tüm varyantları için koşullar eşitlenir. Bu deney oluşturma yöntemine rastgele blok yöntemi denir. Hayvanlarla yapılan deneyler de benzer şekilde yapılır.

Varyans analizi yöntemini kullanarak sosyo-ekonomik verileri işlerken, çok sayıda faktör ve bunların birbirleriyle olan ilişkileri nedeniyle, koşulların en dikkatli şekilde dengelenmesiyle bile objektiflik derecesini belirlemenin zor olduğunu akılda tutmak gerekir. her bir faktörün ortaya çıkan karakteristik üzerindeki etkisi. Bu nedenle, artık varyasyonun düzeyi yalnızca rastgele nedenlere göre değil, aynı zamanda varyans analizi modeli oluşturulurken dikkate alınmayan önemli faktörlere göre de belirlenir. Bunun bir sonucu olarak, karşılaştırmanın temeli olarak kalan varyans bazen amacına uygun hale gelmez; değeri açıkça olduğundan fazla tahmin edilir ve faktörlerin etkisinin önemi için bir kriter olarak hareket edemez. Bu bağlamda, varyans analizi modellerini oluştururken seçim sorunu önem kazanmaktadır. en önemli faktörler ve her birinin eyleminin tezahürü için koşulları eşitlemek. Ayrıca. Varyans analizinin kullanılması, incelenen istatistiksel popülasyonların normal veya normale yakın bir dağılıma sahip olduğunu varsayar. Bu koşulun sağlanmaması durumunda varyans analizinde elde edilen tahminler abartılmış olacaktır.

Varyans analizi(Latince Dispersio'dan - dağılım / İngilizce Varyans Analizi - ANOVA), bir veya daha fazla niteliksel değişkenin (faktörlerin) bir bağımlı niceliksel değişken (yanıt) üzerindeki etkisini incelemek için kullanılır.

Varyans analizinin temeli, bazı değişkenlerin neden (faktörler, bağımsız değişkenler): ve diğerlerinin sonuç (bağımlı değişkenler) olarak değerlendirilebileceği varsayımıdır. Bağımsız değişkenlere bazen tam olarak ayarlanabilir faktörler denir çünkü bir deneyde araştırmacının bunları değiştirme ve ortaya çıkan sonucu analiz etme fırsatı vardır.

Ana hedef varyans analizi(ANOVA), varyansların karşılaştırmasını (analizini) kullanarak ortalamalar arasındaki farkların öneminin araştırılmasıdır. Toplam varyansın birden fazla kaynağa bölünmesi, gruplar arası farklılıklardan kaynaklanan varyansın, grup içi varyasyondan kaynaklanan varyansla karşılaştırılmasına olanak tanır. Boş hipotez (popülasyondan seçilen çeşitli gözlem gruplarında ortalamaların eşit olduğu) doğruysa, grup içi değişkenlikle ilişkili varyansın tahmini, gruplar arası varyansın tahminine yakın olmalıdır. Basitçe iki numunedeki ortalamaları karşılaştırıyorsanız, ANOVA sıradan bir bağımsız numune t-testi (iki bağımsız denek veya gözlem grubunu karşılaştırıyorsanız) veya bağımlı numune t-testiyle (iki değişkeni aynı üzerinde karşılaştırıyorsanız) aynı sonucu verecektir. ve aynı nesne veya gözlem kümesi).

Varyans analizinin özü, incelenen özelliğin toplam varyansını belirli faktörlerin etkisiyle belirlenen bireysel bileşenlere bölmek ve bu faktörlerin incelenen özellik üzerindeki etkisinin önemi hakkındaki hipotezleri test etmektir. Fisher'in F testini kullanarak varyans bileşenlerini birbirleriyle karşılaştırarak, sonuçta ortaya çıkan özelliğin toplam değişkenliğinin ne kadarının kontrollü faktörlerin etkisinden kaynaklandığını belirlemek mümkündür.

Varyans analizi için kaynak materyal, üç veya daha fazla örnekten oluşan bir çalışmadan elde edilen verilerdir: sayıları eşit veya eşit olmayan, hem bağlantılı hem de tutarsız olabilen. Belirlenen düzenlenmiş faktörlerin sayısına göre varyans analizi yapılabilir. tek faktörlü(bu durumda, bir faktörün deneyin sonuçları üzerindeki etkisi incelenir), iki faktörlü(iki faktörün etkisini incelerken) ve çok faktörlü(sadece her faktörün etkisini ayrı ayrı değil, aynı zamanda etkileşimlerini de değerlendirmenizi sağlar).

Varyans analizi parametrik yöntemler grubuna aittir ve bu nedenle yalnızca dağılımın normal olduğu kanıtlandığında kullanılmalıdır.

Bağımlı değişken bir oran, aralık veya sıra ölçeğinde ölçülüyorsa ve etkileyen değişkenler sayısal olmayan nitelikteyse (isim ölçeği) varyans analizi kullanılır.

Örnek problemler

Varyans analizi ile çözülen problemlerde, nominal nitelikteki birçok değişkenden etkilenen sayısal nitelikte bir yanıt vardır. Örneğin, çeşitli hayvancılık besi rasyonları veya bunları saklamanın iki yöntemi vb.

Örnek 1: Hafta boyunca üç farklı yerde faaliyet gösteren çok sayıda eczane büfesi vardı. Gelecekte sadece bir tane bırakabiliriz. Kiosklardaki ilaç satış hacimleri arasında istatistiksel olarak anlamlı bir fark olup olmadığının tespit edilmesi gerekmektedir. Cevabınız evet ise günlük ortalama satış hacmi en yüksek olan kiosku seçeceğiz. Satış hacmindeki fark istatistiksel olarak önemsiz çıkarsa, kiosk seçiminin temeli diğer göstergeler olmalıdır.

Örnek 2: Grup ortalama kontrastlarının karşılaştırılması. Yedi siyasi eğilim son derece liberalden aşırı muhafazakarlığa doğru sıralanır ve grup gelirlerinin sıfırdan farklı bir artış eğilimi olup olmadığını, yani sıralanan gruplar göz önüne alındığında ortalama yaşta önemli bir doğrusal artış olup olmadığını test etmek için doğrusal bir kontrast kullanılır. Liberalden muhafazakarlığa doğru bir gidiş var.

Örnek 3:İki faktörlü varyans analizi. Mağazanın büyüklüğüne ek olarak bir ürünün satış sayısı genellikle ürünün bulunduğu rafların konumundan da etkilenir. Bu örnek dört tür raf düzeni ve üç mağaza boyutu için haftalık satış rakamlarını içerir. Analiz sonuçları, her iki faktörün de (malların bulunduğu rafların konumu ve mağazanın büyüklüğü) satış sayısını etkilediğini, ancak bunların etkileşiminin önemli olmadığını göstermektedir.

Örnek 4: Tek Değişkenli ANOVA: İki tedaviyle rastgele tam blok tasarımı. Üç yağın ve üç hamur mayalama maddesinin olası tüm kombinasyonlarının ekmeğin pişirilmesi üzerindeki etkisi araştırılmıştır. Dört farklı kaynaktan alınan dört un numunesi blok faktör olarak görev yaptı.Yağ-yırtıcı etkileşiminin öneminin belirlenmesi gerekiyor. Bundan sonra, hangi faktör düzeyi kombinasyonlarının farklı olduğunu bulmanızı sağlayacak kontrastları seçmek için çeşitli olasılıkları belirleyin.

Örnek 5: Hiyerarşik (kümelenmiş) karma efektli tasarım modeli. Bir makineye monte edilen rastgele seçilmiş dört başlığın, üretilen cam katot tutucuların deformasyonuna etkisi incelenmiştir. (Kafalar makinenin içine yerleştirilmiştir, dolayısıyla aynı kafa farklı makinelerde kullanılamaz.) Baş etkisi rastgele bir faktör olarak ele alınır. ANOVA istatistikleri, makineler arasında önemli bir fark olmadığını gösteriyor ancak kafaların farklı olabileceğine dair göstergeler var. Tüm makineler arasındaki fark önemli değildir ancak iki tanesinde kafa tipleri arasındaki fark önemlidir.

Örnek 6: Bölünmüş çizim tasarımı kullanılarak tek değişkenli tekrarlanan ölçüm analizi. Bu deney, ardışık dört denemede bireysel kaygı derecelendirmelerinin sınav performansı üzerindeki etkisini belirlemek için yapıldı. Veriler, tüm veri setinin (“tüm çizim”) alt küme grupları olarak görüntülenebilecek şekilde düzenlenmiştir. Kaygının etkisi önemsizdi ama girişimin etkisi anlamlıydı.

Yöntem listesi

  • Faktöriyel deney modelleri. Örnekler: matematik problemlerini çözme başarısını etkileyen faktörler; Satış hacimlerini etkileyen faktörler.

Veriler, birbirinden bağımsız örneklerin gerçekleştirilmesi olarak kabul edilen birkaç dizi gözlemden (süreçten) oluşur. İlk hipotez, tedavilerde hiçbir fark olmadığını belirtir; tüm gözlemlerin toplam popülasyondan bir örnek olarak kabul edilebileceği varsayılmaktadır:

  • Tek faktörlü parametrik model: Scheffe yöntemi.
  • Tek faktörlü parametrik olmayan model [Lagutin M.B., 237]: Kruskal-Wallis testi [Hollender M., Wolf D.A., 131], Jonckheere kriteri [Lagutin M.B., 245].
  • Sabit faktörlü bir modelin genel durumu, Cochran teoremi [Afifi A., Eisen S., 234].

Veriler yinelenen gözlemleri temsil eder:

  • İki faktörlü parametrik olmayan model: Friedman kriteri [Lapach, 203], Page kriteri [Lagutin M.B., 263]. Örnekler: üretim yöntemlerinin etkinliğinin karşılaştırılması, tarımsal uygulamalar.
  • Eksik veriler için iki faktörlü parametrik olmayan model

Hikaye

Adı nereden geldi? varyans analizi? Ortalamaları karşılaştırma prosedürünün varyans analizi olarak adlandırılması garip görünebilir. Gerçekte bunun nedeni, iki (veya daha fazla) grubun ortalamaları arasındaki farkın istatistiksel anlamlılığını incelediğimizde aslında örnek varyanslarını karşılaştırıyor (analiz ediyor) olmamızdır. Varyans analizinin temel konsepti önerildi Fischer 1920'de. Belki daha doğal terim kareler toplamı analizi veya varyasyon analizi olabilir, ancak gelenek nedeniyle varyans analizi terimi kullanılır. Başlangıçta, varyans analizi, özel olarak tasarlanmış deneyler sırasında elde edilen verilerin işlenmesi için geliştirildi ve doğru şekilde incelenen tek yöntem olarak kabul edildi. nedensel bağlantılar. Yöntem, bitkisel üretimdeki deneyleri değerlendirmek için kullanılmıştır. Daha sonra psikoloji, pedagoji, tıp vb. alanlardaki deneyler için varyans analizinin genel bilimsel önemi açıklığa kavuştu.

Edebiyat

  1. Şeffe G. Varyans analizi. - M., 1980.
  2. Ahrens H. Leuter Yu.Çok değişkenli varyans analizi.
  3. Kobzar A. I. Uygulamalı matematiksel istatistik. - M.: Fizmatlit, 2006.
  4. Lapach S.N., Chubenko A.V., Babich P.N. Bilim ve iş dünyasında istatistik. - Kiev: Morion, 2002.
  5. Lagutin M.B. Görsel matematiksel istatistikler. İki cilt halinde. - M .: P-merkez, 2003.
  6. Afifi A., Eisen S.İstatistiksel analiz: Bilgisayar yaklaşımı.
  7. Hollender M., Wolf D.A. Parametrik olmayan istatistik yöntemleri.

Bağlantılar