Varyans Bileşenlerinin Negatif Kestirilme Olasılıkları İçin

Bir Benzetim Çalışması

 

Serdar KURT*                                      Ahmet KAYA**

 

ÖZET

Ürün kalitesini geliştirme ve hayvan ıslahı araştırmalarında  önemli bir yer tutan varyans bileşenleri kestirimi için sıkça kullanılan yöntemlerden birisi de ANOVA kestiricileri olarak bilinen ve kestirimleri VÇ tablosundaki kareler ortalamalarının beklenen değerlerinden hesaplayan yöntemdir. Varyans çözümlemesi için yapılan tüm varsayımlar geçerli olsa bile bu yöntem ile negatif varyans bileşeni kestirimi elde etme olasılığı bulunmaktadır. Bu çalışmada dengeli tek etkenli tam rasgele deney için  olarak tanımlanabilen bu olasılığın, her deneme ile yapılan tekrar sayısına (n) ve ’ye bağlı olarak nasıl değiştiği, yapılan varsayımların sağlandığı bir kitleden  çekilen örneklemler ile yapılacak bir benzetim çalışması ile araştırılacaktır. Bu benzetim çalışmasında Minitab istatistiksel yazılımı kullanılacak ve yapılan program da verilecektir.

 

 

 

*Prof.Dr           Dokuz Eylül Üniversitesi Fen-Edebiyat Fakültesi İstatistik Bölümü.

**Y.Doç.Dr        Ege Üniversitesi Tire Kutsan Meslek Yüksekokulu Bilgisayar Bölümü.

 

GİRİŞ

            Dengeli tek etkenli tam rasgele bir deneye ilişkin model denklemi,

                                            

olarak verilebilir. Burada deneme sayısı,  ise her deneme ile yapılan tekrar sayısıdır. Buna göre sayıda etken düzeyi tüm olası düzeyler arasından tamamen rasgele olarak seçilmişlerdir. Etken düzeyleri rasgele seçildiğinden model denklemi, rasgele etkili model olarak isimlendirilir. Bu model için  ve ’nin birer raslantı değişkeni,

            ~  ve  ~ ya da ~ 

varsayımlarının da sağlanmakta olduğu kabul edilir. Burada  ve  varyans bileşenleri olarak bilinir. Herhangi bir gözlemin varyansı, varyans bileşenlerinin toplamı olarak,

                       

biçiminde ifade edilir (1). Böyle tür bir deneyde araştırıcının temel amacı bu varyans bileşenlerinin kestirimlerini bulmaktır. Böylece araştırıcı bağımlı değişken üzerinde etkide bulunan çeşitli değişim kaynaklarının toplam değişim üzerindeki ağırlıklarını görebilecektir. Varyans bileşenlerinin varyans çözümlemesi kestiricileri (ANOVA kestiricileri) olarak bilinen kestiricileri,

                            ve        

eşitlikleri ile elde edilir. Bu kestiriciler en küçük varyanslı ve yansız kestiricileridir (2).

            Varyans çözümlemesi yöntemi ile bulunan varyans bileşenlerinden ’nin uygulamada bazen negatif olarak kestirilmesi mümkün olabilmektedir. Bu durumda akla ilk gelen hesaplama hatası yapılabileceğidir. Hesaplama hatası yapılmadığı konusunda emin olunduğunda ise model için yapılan varsayımların geçerli olup olmadıkları düşünülmektedir. Bu konuda da emin olunabilirse, kuramsal zorluklar nedeni ile negatif olan varyans bileşeninin sıfır olarak varsayılması yoluna gidilmektedir.

            Model için yapılan tüm varsayımlar geçerli olsa bile ’nin negatif  olasılıkları üzerinde L.R.Verdooren tarafından 1982 yılında yapılan bir çalışmada bu olasılığın,

             

eşitliği ile elde edilebileceği gösterilmiştir. Buna göre  olasılığının deneme sayısına (), her deneme ile yapılan tekrar sayısına () ve oranına bağlıdır (5).

            Bu olasılık çeşitli  ve  değerleri ile  oranı kullanılarak hesaplanmış ve tablolar halinde verilmiştir. Buna göre =5 ve =2,3,4,5 olduğunda oranı 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5 ve 4.0 olduğunda elde edilen olasılıklar Tablo-1’de verilmektedir (6).

 

Tablo-1: Deneme Sayısı 5 Olan Tek Etkenli Tam Rasgele Düzen İçin Kuramsal Olarak Elde edilen Varyans Bileşenlerinin Negatif Olma Olasılıkları

 

k=5

Oran

n=2

n=3

n=4

n=5

0.5

.2627

.1950

.1485

.1162

1.0

.1518

.0959

.0653

.0472

1.5

.0982

.0566

.0364

.0253

2.0

.0686

.0372

.0232

.0158

2.5

.0506

.0263

.0160

.0107

3.0

.0388

.0196

.0117

.0078

3.5

.0307

.0152

.0090

.0059

4.0

.0249

.0121

.0071

.0046

 

Bu tabloya göre  ve  ne olursa olsun  olasılığının sıfırdan büyük olduğu ve bu olasılığın büyüyen  ve  değerleri için küçüldüğü görülmektedir.

ÇALIŞMA

            Burada istatistiksel model denklemi için yapılan tüm varsayımlar geçerli olsa bile  olasılığının bulunması için bir benzetim çalışması yapılacak ve bu benzetim çalışmasından elde edilen sonuçlar Tablo-1’de verilen kuramsal sonuçlarla karşılaştırılacaktır. Bu benzetim çalışması =5 için =2,3,4, ve 5 olduğunda oranı 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5 ve 4.0 için yapılacaktır. Benzetim çalışmasında sonuçlar 100000 tekrarlı olarak elde edilecek ve bunun için Minitab İstatistiksel Hazır Yazılım programı kullanılacaktır (3,4).

            Benzetim çalışması üç aşamada gerçekleştirilecektir. Önce model varsayımlarını sağlayan kitle oluşturulacak, sonra bu kitleden rasgele çekilen örneklemlerle yapılan varyans çözümlemesi sonucunda varyans bileşenlerinin kestirimleri elde edilecek, daha sonra da  olasılığı hesaplanacaktır. Aşağıda verilen örnek benzetim programı =288, =5 ve =5 içindir.

1-  ve~ varsayımlarını sağlayacak ~ olan her birinde 1000 gözlem bulunan 50 adet düzey için kitlenin oluşturulması:

 

BEN1.MTB

SET C51;

1:50

END

RANDOM 50 C100;

NORMAL 0, 12.

LET C100=C100-MEAN(C100)

LET K11=0

LET K25=SQRT(288)

EXEC 'BEN10' 50

LET K11=0

EXEC 'BEN11' 50

 

BEN10.MTB

LET K11=K11+1

LET K10=C100(K11)

RANDOM 1000 CK11;

NORMAL K10 K25.

 

BEN11.MTB

LET K11=K11+1

LET K10=MEAN(CK11)

LET CK11=CK11-K10+C100(K11)

 

2- Her defasında 50 olası düzey arasından rastgele 5 düzey seçmek ve bu düzeylerden =5 olan rastgele örneklem çekerek varyans çözümlemesi yapıp ve değerini bulmak:  

 

BEN2.MTB

LET K1=5

LET K2=5

LET K20=0

EXEC 'BEN3' 100000

 

BEN3.MTB

SAMPLE K1 C51 C52

SORT C52 C52

LET K11=C52(1)

LET K12=C52(2)

LET K13=C52(3)

LET K14=C52(4)

LET K15=C52(5)

SAMPLE K2 CK11 C101

SAMPLE K2 CK12 C102

SAMPLE K2 CK13 C103

SAMPLE K2 CK14 C104

SAMPLE K2 CK15 C105

STACK C101-C105 C55;

SUBSCRIPTS C54.

ANOVA C55=C54;

RESIDUALS C56.

LET K10=SSQ(C56)

LET K13=(K1*K2-1)-(K1-1)

LET K30=K10/K13

LET K11=SSQ(C55)-(SUM(C55))**2/(K1*K2)

LET K12=K11-K10

LET K31=K12/(K1-1)

LET K41=(K31-K30)/K2

LET K40=K30

LET K20=K20+1

LET C60(K20)=K40

LET C61(K20)=K41

PRINT K20

 

 

3.  Olasılığını hesaplamak.

 

BEN4.MTB

SORT C61 C60 C61 C60

LET C62=(C61>0)

LET K25=(100000-SUM(C62))/100000

PRINT K25

SAVE 'A55'

 

Burada ve kestirimleri C60 ve C61 kolonlarına yazılmakta, sonra C61 kolonuna göre küçükten büyüğe doğru sıralanarak bir isim altında saklanmaktadır. =5 ve =0.5 olduğunda elde edilen benzetim sonuçları ‘A55.MTW’ isimli dosyaya yazılmıştır.

 

            Bu şekilde hesaplanan benzetim sonuçları Tablo-2’ de verilmektedir. Bu sonuçlara  göre de  olasılığının her deneme ile yapılan tekrar sayısına () ve oranına bağlı olduğu görülmektedir.

 

Tablo-2: Deneme Sayısı k=5 ve =144 Olan Tek Etkenli Tam Rasgele Düzen İçin

 Benzetim Sonucu Elde edilen Varyans Bileşenlerinin Negatif Olma

 Olasılıkları

 Oran

k=5

 

 

n=2

n=3

n=4

n=5

0.5

288

.2500

.1818

.1335

.1021

1.0

144

.1405

.0834

.0515

.0339

1.5

96

.0884

.0449

.0269

.0182

2.0

72

.0597

.0279

.0161

.0101

2.5

57

.0418

.0195

.0102

.0061

3.0

48

.0312

.0138

.0077

.0046

3.5

41

.0235

.0106

.0057

.0032

4.0

36

.0189

.0078

.0039

.0027

 

SONUÇ

Kuramsal olarak elde edilen olasılıklar ile benzetim çalışması sonucunda elde edilen olasılıklar arasındaki farklar Tablo-3’de verilmektedir.  Buna göre kuramsal sonuçlar her durumda daha büyük olasılıkları göstermekte, iki olasılık arasındaki fark büyüyen n değerleri ve büyüyen  oranı için küçülmektedir. Bu farklar istatistiksel olarak anlamlı sayılamayacak kadar küçük değerler olarak elde edilmişlerdir.  Buradan yapılan benzetim çalışmasında yaratılan kitlenin varsayımları sağladığı, benzetim çalışmasının da gerçek değerlere çok yakın değerler verdiği söylenebilir.

 

Tablo-3: Kuramsal Olasılıklar İle Benzetim Sonuçları Arasındaki

Farklar

 Oran

k=5