Varyans Bileşenlerinin Negatif Kestirilme Olasılıkları İçin
Bir Benzetim Çalışması
Serdar KURT*
Ahmet
KAYA**
Ürün kalitesini geliştirme ve hayvan
ıslahı araştırmalarında önemli bir yer
tutan varyans bileşenleri kestirimi için sıkça kullanılan yöntemlerden birisi
de ANOVA kestiricileri olarak bilinen ve kestirimleri VÇ tablosundaki kareler
ortalamalarının beklenen değerlerinden hesaplayan yöntemdir. Varyans
çözümlemesi için yapılan tüm varsayımlar geçerli olsa bile bu yöntem ile
negatif varyans bileşeni kestirimi elde etme olasılığı bulunmaktadır. Bu
çalışmada dengeli tek etkenli tam rasgele deney için
olarak tanımlanabilen bu olasılığın, her
deneme ile yapılan tekrar sayısına (n) ve
’ye
bağlı olarak nasıl değiştiği, yapılan varsayımların sağlandığı bir
kitleden çekilen örneklemler ile yapılacak
bir benzetim çalışması ile araştırılacaktır. Bu benzetim çalışmasında Minitab
istatistiksel yazılımı kullanılacak ve yapılan program da verilecektir.
*Prof.Dr Dokuz Eylül Üniversitesi Fen-Edebiyat
Fakültesi İstatistik Bölümü.
**Y.Doç.Dr Ege Üniversitesi Tire Kutsan Meslek
Yüksekokulu Bilgisayar Bölümü.
GİRİŞ
Dengeli tek etkenli tam rasgele bir
deneye ilişkin model denklemi,
![]()
olarak
verilebilir. Burada
deneme
sayısı,
ise her deneme ile yapılan tekrar sayısıdır.
Buna göre
sayıda
etken düzeyi tüm olası düzeyler arasından tamamen rasgele olarak
seçilmişlerdir. Etken düzeyleri rasgele seçildiğinden model denklemi, rasgele
etkili model olarak
isimlendirilir. Bu model için
ve
’nin
birer raslantı değişkeni,
~
ve
~
ya da ![]()
~![]()
![]()
varsayımlarının
da sağlanmakta olduğu kabul edilir. Burada
ve
varyans bileşenleri olarak bilinir. Herhangi
bir gözlemin varyansı, varyans bileşenlerinin toplamı olarak,
![]()
biçiminde
ifade edilir (1). Böyle
tür bir deneyde araştırıcının temel amacı bu varyans bileşenlerinin
kestirimlerini bulmaktır. Böylece araştırıcı bağımlı değişken üzerinde etkide
bulunan çeşitli değişim kaynaklarının toplam değişim üzerindeki ağırlıklarını
görebilecektir. Varyans bileşenlerinin varyans çözümlemesi kestiricileri (ANOVA
kestiricileri) olarak bilinen kestiricileri,
ve ![]()
eşitlikleri ile
elde edilir. Bu kestiriciler en küçük varyanslı ve yansız kestiricileridir (2).
Varyans çözümlemesi yöntemi ile
bulunan varyans bileşenlerinden
’nin uygulamada bazen negatif olarak kestirilmesi mümkün olabilmektedir.
Bu durumda akla ilk gelen hesaplama hatası yapılabileceğidir. Hesaplama hatası
yapılmadığı konusunda emin olunduğunda ise model için yapılan varsayımların
geçerli olup olmadıkları düşünülmektedir. Bu konuda da emin olunabilirse,
kuramsal zorluklar nedeni ile negatif olan varyans bileşeninin sıfır olarak
varsayılması yoluna gidilmektedir.
Model için yapılan tüm varsayımlar
geçerli olsa bile
’nin
negatif olasılıkları üzerinde L.R.Verdooren
tarafından 1982 yılında yapılan bir çalışmada bu olasılığın,
eşitliği ile
elde edilebileceği gösterilmiştir. Buna göre
olasılığının deneme sayısına (
), her
deneme ile yapılan tekrar sayısına (
) ve
oranına
bağlıdır
(5).
Bu olasılık çeşitli
ve
değerleri ile
oranı kullanılarak hesaplanmış ve tablolar
halinde verilmiştir. Buna göre
=5 ve
=2,3,4,5
olduğunda
oranı
0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5 ve 4.0 olduğunda elde edilen olasılıklar
Tablo-1’de verilmektedir (6).
Tablo-1: Deneme Sayısı 5 Olan Tek Etkenli
Tam Rasgele Düzen İçin Kuramsal Olarak Elde edilen Varyans Bileşenlerinin
Negatif Olma Olasılıkları
|
|
k=5 |
|||
|
Oran |
n=2 |
n=3 |
n=4 |
n=5 |
|
0.5 |
.2627 |
.1950 |
.1485 |
.1162 |
|
1.0 |
.1518 |
.0959 |
.0653 |
.0472 |
|
1.5 |
.0982 |
.0566 |
.0364 |
.0253 |
|
2.0 |
.0686 |
.0372 |
.0232 |
.0158 |
|
2.5 |
.0506 |
.0263 |
.0160 |
.0107 |
|
3.0 |
.0388 |
.0196 |
.0117 |
.0078 |
|
3.5 |
.0307 |
.0152 |
.0090 |
.0059 |
|
4.0 |
.0249 |
.0121 |
.0071 |
.0046 |
Bu tabloya göre
ve
ne olursa olsun
olasılığının sıfırdan büyük olduğu ve bu
olasılığın büyüyen
ve
değerleri için küçüldüğü görülmektedir.
ÇALIŞMA
Burada istatistiksel model denklemi
için yapılan tüm varsayımlar geçerli olsa bile
olasılığının bulunması için bir benzetim
çalışması yapılacak ve bu benzetim çalışmasından elde edilen sonuçlar
Tablo-1’de verilen kuramsal sonuçlarla karşılaştırılacaktır. Bu benzetim
çalışması
=5 için
=2,3,4,
ve 5 olduğunda
oranı
0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5 ve 4.0 için yapılacaktır. Benzetim
çalışmasında sonuçlar 100000 tekrarlı olarak elde edilecek ve bunun için
Minitab İstatistiksel Hazır Yazılım programı kullanılacaktır (3,4).
Benzetim çalışması üç aşamada
gerçekleştirilecektir. Önce model varsayımlarını sağlayan kitle oluşturulacak,
sonra bu kitleden rasgele çekilen örneklemlerle yapılan varyans çözümlemesi
sonucunda varyans bileşenlerinin kestirimleri elde edilecek, daha sonra da
olasılığı hesaplanacaktır. Aşağıda verilen
örnek benzetim programı
=288,
=5 ve
=5 içindir.
1-
ve
~
varsayımlarını sağlayacak
~
olan her birinde 1000 gözlem bulunan 50 adet düzey için kitlenin
oluşturulması:
BEN1.MTB
SET C51;
1:50
END
RANDOM 50 C100;
NORMAL 0, 12.
LET C100=C100-MEAN(C100)
LET K11=0
LET K25=SQRT(288)
EXEC 'BEN10' 50
LET K11=0
EXEC 'BEN11' 50
BEN10.MTB
LET K11=K11+1
LET K10=C100(K11)
RANDOM 1000 CK11;
NORMAL K10 K25.
BEN11.MTB
LET K11=K11+1
LET K10=MEAN(CK11)
LET CK11=CK11-K10+C100(K11)
2- Her defasında
50 olası düzey arasından rastgele 5 düzey seçmek ve bu düzeylerden
=5 olan rastgele örneklem çekerek varyans çözümlemesi yapıp
ve
değerini bulmak:
BEN2.MTB
LET K1=5
LET K2=5
LET K20=0
EXEC 'BEN3' 100000
BEN3.MTB
SAMPLE K1 C51 C52
SORT C52 C52
LET K11=C52(1)
LET K12=C52(2)
LET K13=C52(3)
LET K14=C52(4)
LET K15=C52(5)
SAMPLE K2 CK11 C101
SAMPLE K2 CK12 C102
SAMPLE K2 CK13 C103
SAMPLE K2 CK14 C104
SAMPLE K2 CK15 C105
STACK C101-C105 C55;
SUBSCRIPTS C54.
ANOVA C55=C54;
RESIDUALS C56.
LET K10=SSQ(C56)
LET K13=(K1*K2-1)-(K1-1)
LET K30=K10/K13
LET K11=SSQ(C55)-(SUM(C55))**2/(K1*K2)
LET K12=K11-K10
LET K31=K12/(K1-1)
LET K41=(K31-K30)/K2
LET K40=K30
LET K20=K20+1
LET C60(K20)=K40
LET C61(K20)=K41
PRINT K20
3.
Olasılığını hesaplamak.
BEN4.MTB
SORT C61 C60 C61 C60
LET C62=(C61>0)
LET K25=(100000-SUM(C62))/100000
PRINT K25
SAVE 'A55'
Burada
ve
kestirimleri C60 ve C61 kolonlarına yazılmakta, sonra C61 kolonuna göre küçükten
büyüğe doğru sıralanarak bir isim altında saklanmaktadır.
=5 ve
=0.5 olduğunda elde edilen benzetim sonuçları ‘A55.MTW’
isimli dosyaya yazılmıştır.
Bu şekilde hesaplanan benzetim
sonuçları Tablo-2’ de verilmektedir.
Bu sonuçlara göre de
olasılığının her deneme ile yapılan tekrar
sayısına (
) ve
oranına
bağlı olduğu görülmektedir.
Tablo-2: Deneme Sayısı k=5 ve
=144 Olan Tek Etkenli Tam
Rasgele Düzen İçin
Benzetim Sonucu Elde edilen Varyans
Bileşenlerinin Negatif Olma
Olasılıkları
|
Oran |
|
k=5 |
|||
|
|
|
n=2 |
n=3 |
n=4 |
n=5 |
|
0.5 |
288 |
.2500 |
.1818 |
.1335 |
.1021 |
|
1.0 |
144 |
.1405 |
.0834 |
.0515 |
.0339 |
|
1.5 |
96 |
.0884 |
.0449 |
.0269 |
.0182 |
|
2.0 |
72 |
.0597 |
.0279 |
.0161 |
.0101 |
|
2.5 |
57 |
.0418 |
.0195 |
.0102 |
.0061 |
|
3.0 |
48 |
.0312 |
.0138 |
.0077 |
.0046 |
|
3.5 |
41 |
.0235 |
.0106 |
.0057 |
.0032 |
|
4.0 |
36 |
.0189 |
.0078 |
.0039 |
.0027 |
SONUÇ
Kuramsal olarak elde edilen olasılıklar
ile benzetim çalışması sonucunda elde edilen olasılıklar arasındaki farklar Tablo-3’de verilmektedir. Buna göre kuramsal sonuçlar her durumda daha büyük olasılıkları
göstermekte, iki olasılık arasındaki fark büyüyen n değerleri ve büyüyen
oranı için küçülmektedir. Bu farklar
istatistiksel olarak anlamlı sayılamayacak kadar küçük değerler olarak elde
edilmişlerdir. Buradan
yapılan benzetim çalışmasında yaratılan kitlenin varsayımları sağladığı,
benzetim çalışmasının da gerçek değerlere
çok yakın değerler verdiği
söylenebilir.
Tablo-3: Kuramsal Olasılıklar İle Benzetim Sonuçları
Arasındaki
Farklar
|
Oran |
|
k=5 |
|||
|
|
|||||