YANLI KESTİRİCİLERİN BİR SINIFI VE BU SINIF İÇİN TANILAMA ÖLÇÜLERİ

 

 

A. Seda TOPÇUBAŞI* ve Nedret BİLLOR

Çukurova Üniversitesi

Balcalı, Adana

 

ÖZET

 

Çoklu lineer regresyonda; ön kestiriciler arasında lineer bağımlılık olması ve sapan değerlerin varlığı durumunda en küçük kareler analizi tutarlı sonuçlar vermemektedir. Ön kestiricilerin (açıklayıcı değişkenler) lineer bağımlı olması durumunda, en küçük kareler kestiricisine alternatif olabilecek çeşitli yanlı kestiriciler vardır. Lee ve Birch (1988) yanlı kestiricilerin büyük bir bölümünü (ridge , genelleştirilmiş ridge , ana bileşenler , ondalıklı rank ve Stein kestiricisi) içine alan bir sınıf tanımladılar. Bu çalışmada yanlı kestiricilerin bir kısmını içeren bu sınıfa,  Liu ve genelleştirilmiş Liu kestiricileri de dahil edilmiştir. Ayrıca bu sınıfta yer alan  yanlı kestiricilerin kullanılması durumunda,  veride tekli ve çoklu satır etkisinin belirlenmesi için tanılama ölçüleri verilerek;  elde edilen ölçüler  hesaplama kolaylığı ve yeni ölçülerin elde edilmesini sağlayacağı düşüncesiyle tek  sınıfta  toplanmıştır.

 

1.      GİRİŞ

 

En küçük kareler (E.K.K.) kestiricisi,  regresyon analizinde bilinmeyen parametrelerin kestirilmesi için kullanılan en yaygın kestirim yöntemlerinden biridir. Ancak E.K.K. kestiricisi, bir takım temel varsayımların sağlanması durumunda sağlıklı sonuçlar verebilmektedir. Özellikle gözlemler ve ön kestiriciler üzerindeki varsayımlar sağlanmadığında en küçük kareler kestiricilerinin kararlı, küçük varyanslı ve dolayısıyla iyi kestiriciler olma özelliği bozulur.

Ön kestiriciler matrisinin kolonlarının doğrusal bağımsız olması varsayımı en küçük kareler kestiricisinin tekliği için gerekli olan temel varsayımlardandır. Kolonlar arasında yaklaşık bir doğrusal ilişki olması iç ilişki problemi olarak isimlendirilir. Dolayısıyla veride önemli derecede iç ilişki problemi varsa E.K.K. kestiricisine alternatif olarak önerilebilen, iç ilişki problemine daha dayanıklı çok sayıda yanlı kestirici vardır (Stein, 1960;  Hoerl ve Kennard,  1970,a,b;  Marquardt, 1970;  Liu,  1993). Bu yöntemlerden elde edilen kestiricilerin istatistiksel özelliklerinin araştırılması ve bu kestiricilerin karşılaştırılması işlemlerini kolaylaştıracağı düşüncesine dayalı olarak yanlı kestiricilerin büyük  bölümünün tek bir sınıfta toplanması üzerinde çalışmalar yapılmıştır (Hocking ve ark. ,1976  ;  Lee ve Birch, 1988).

E.K.K. kestiricisi için temel varsayımlardan birisi de tüm gözlemlerin regresyon sonuçları üzerinde eşit etkili olması varsayımıdır. Veri kümesinde  diğer gözlemlerden farklı davranan gözlemler sapan değer (outlier) olarak isimlendirilir ve bu tip gözlemlerin belirlenmesi regresyon analizinde oldukça önemlidir. Sapan değerlerin  belirlenmesine ilişkin;  bir ve birden fazla satırın etkisini saptamak üzere pek çok tanılama ölçüsü verilmiştir (Belsley ve ark, 1980 ; Cook ve Weisberg, 1982 ; Atkinson, 1985; Chatterjee ve Hadi, 1988 ). Hesaplama kolaylığı ve yeni ölçülerin tanımlanmasını sağladığı düşüncesiyle bu ölçülerin büyük bir kısmını içeren JI sınıfı verilerek  bu sınıf üzerinde çeşitli çalışmalar yapılmıştır (Hadi ve ark. ,  1995  ; Jones ve Ling, 1988).

            Veri kümesinde iç ilişki probleminin ve sapan değerlerin  aynı anda bulunması  karşılaşılabilecek bir diğer önemli problemdir. Bu durumda, öncelikle iç ilişki problemini indirgemek ya da ortadan kaldırmak için E.K.K. kestiricisi yerine yanlı kestiriciler kullanılmalıdır. İç ilişki problemine çözüm olarak önerilen yanlı kestiricilerin kullanımı durumunda ise sapan değerlerin belirlenebilmesi için tanılama ölçülerine gereksinim duyulur. Literatürde yanlı kestiriciler  için tanılama ölçülerine ilişkin az sayıda çalışma vardır (Walker ve Birch, 1988 ; Walker, 1990 ; Chalton ve Troskie, 1992 ; Akdeniz, 2001). Bu çalışmada E.K.K. kestiricisi için verilen tanılama ölçülerinden yararlanarak,  yanlı kestiriciler için tanılama ölçüleri verilmiştir.

            Bu çalışmanın ikinci bölümünde yanlı kestiricilerin bir sınıfı verilmiş,  üçüncü bölümde  bu sınıf kestiriciler için tanılama ölçüleri tanımlanarak bu ölçüler JI* adı verilen bir sınıfta toplanmıştır. Verilen yöntemlerin uygulanabilirliği bir veri kümesi kullanılarak dördüncü bölümde gösterilmiştir.

 

2. GENEL YANLI KESTİRİCİLER

 

            Standart  çoklu doğrusal regresyon modeli:

 

y=Xb+e                                                        (1)

 

formunda olup,  X; nxp tipinde bilinen ön kestiricilerin merkezileştirilmiş ve ölçeklendirilmiş (korelasyon formunda) matrisi,  b ; px1 tipinde bilinmeyen regresyon katsayılarının,  e ; nx1 tipinde E(e)=0 ortalamalı ve Var(e)=s2I varyans-kovaryans matrisli rastgele hataların vektörleridir. X¢X matrisinin özdeğerleri, (genelliği kaybetmeksizin) l1>l2>l3...>lp>0 ve L; köşegen elemanları X¢X matrisinin özdeğerleri olan pxp tipinde köşegen matristir.

X=[X1   X2  X3 ... Xp] ön kestiricilerin matrisi olmak üzere eğer  hepsi birden sıfır olmayan c1,c2,...cp sayıları için c1X1+ c2X2 +……+ cpXp » 0 oluyorsa,  X matrisinin kolonları yaklaşık olarak doğrusal bağımlıdır ve dolayısıyla veri kümesinde iç ilişki problemi  söz konusudur. İç ilişki problemi,  en küçük kareler kestiricisinin boyunun (normunun) büyümesine; varyansının  ve  gerçek b parametresi ile arasındaki uzaklığın artmasına neden olur. Olumsuz etkileri nedeniyle veride ciddi bir iç ilişki probleminin olup olmadığı analiz öncesinde araştırılmalıdır. X¢X matrisinin lj » 0 olacak şekildeki bir özdeğeri varsa;  Vj bu özdeğere karşılık gelen özvektör olmak üzere XVj»0 olup bu küçük özdeğer iç ilişki probleminin göstergesidir. Bu nedenle  özdeğerlere dayalı olarak hesaplanan koşul sayısı ve koşul indisleri iç ilişki probleminin önemli belirleyicilerindendir. Bu belirleyicilerin iç ilişki problemini  işaret etmesi  durumunda  daha küçük varyanslı bir kestirici elde etmenin bir yolu,  b nın kestiricisinin yansız olması özelliğini değiştirmektir. b parametresinin, * gibi öyle bir yanlı kestiricisi bulunabilir ki;  yansız  dan daha küçük varyansa sahiptir. Hata kareler ortalaması (MSE); b ve * arasındaki uzaklığın karesinin beklenen değeri olup, * yanlı kestiricisi için MSE(*)=E[(*- b)¢(*- b)] şeklindedir. Hata kareler ortalaması * kestiricisi varyans ve yanlılık teriminin karesinin toplamı olarak;

 

MSE(*)=trace(Var(*))+[(E(*  )-b)¢ (E(*)-b)]                     (2)

 

şeklinde verilir. Yanlı kestirim yöntemlerinde amaç; yanlılık terimi kullanarak varyansı daha küçük bir kestirici elde etmektir. Buna bağlı olarak yanlı kestirici için daha dar güven aralıkları elde edilecek ve böylece özellikle iç ilişkinin varlığı durumunda b  parametresinin daha uygun bir kestiricisi elde edilmiş olacaktır. En yaygın olarak kullanılan yanlı kestiriciler;  ridge,  genelleştirilmiş ridge,  ana bileşenler,  ondalıklı rank,  Stein,  Liu ve genelleştirilmiş Liu kestiricileridir.

Yanlı kestiricilerin istatistiksel özelliklerinin araştırılması ve bu kestiricilerin karşılaştırılmasını kolaylaştıracağı düşüncesine dayalı olarak bu kestiricilerin  büyük bölümü tek bir sınıfta toplanmıştır (Hocking ve ark. ,1976;  Lee ve Birch, 1988). V; pxp tipinde kolonları X¢X matrisinin özdeğerlerine karşılık gelen normalleştirilmiş özvektörler olan ortogonal matris,  Z=XV ve a=V¢b olmak üzere (1) ile verilen modelin kanonik formu;

 

y=Za +e                                                                      (3)

 

şeklindedir. Bu durumda X¢X matrisinin spektral ayrışımı X¢X=VLV¢ ve (Z¢Z)-1=L-1 olmak üzere a parametresinin E.K.K. kestiricisi;

 

                                                                                                                                                         =(Z¢Z) -1Z¢y=L-1Z¢y                                                                                                                                                     (4)

 

ile verilir. Buradan (1) modelinin E.K.K. kestiricisi; =V olarak elde edilir.

qi=(1 2...i 0 0...0)¢; i=1,2,...,p  yani ilk i elemanı kanonik modelin en küçük kareler kestiricisi  ile aynı olan vektör olsun. Dikkat edilirse qi vektörleri lineer bağımsız  p  vektördür. Dolayısıyla (q1, q2,...,qp); p boyutlu uzay için baz olarak düşünülebilir. a parametresinin kestiricileri de p boyutlu uzayda vektörler olduğundan,  qi vektörlerinin lineer kombinasyonu olarak yazılabilir. Başka bir deyişle a’ nın herhangi bir kestiricisi;

qi=diag [(a1+a2+...+ ap)    (a2+a3 ...+ap)    (a3+a4+ ...+ap).... ap]

şeklindedir. Burada ai ler önceden hesaplanmış sabitlerdir ve bu sabitlerin farklı seçimleri ile a parametresinin farklı kestiricileri elde edilebilir.

 

Tanım 1 : fi= ve F=diag( f1, f2 ,..., fp )  olmak üzere,  *=F  şeklinde yazılan kestiriciye a  parametresinin genel yanlı kestiricisi denir. F matrisinin farklı seçimleri ile elde edilen kestiricilerin oluşturduğu sınıf ise genel yanlı sınıf olarak isimlendirilir.

Lee ve Birch (1988), Tanım 1 ile verilen kestiriciye “ondalıklı ana bileşenler kestiricisi” adını vermişlerdir. İki yanlı kestiricinin isminin birleştirilmesi ile elde edilen bu isim,  tüm yanlı kestiricileri ifade etmekte yeterli olmadığından bu çalışmada ondalıklı ana bileşenler kestiricisi yerine,  genel yanlı kestirici ifadesi kullanılacaktır.

E(*)-a = - (Ip - F)a  olup * kestiricisi  yanlı bir kestiricidir (F¹Ip). Bu nedenle fj’ ler yanlılık parametresi ve F matrisi de yanlılık matrisi olarak isimlendirilir. Genel yanlı kestirici için hata kareler ortalaması;

MSE(*)=E[(*-a)¢(*-a)]=s2                                      (5)

olarak elde edilir. j=1,2,...,p için fj®0 iken Var(aj*) ®0 ; bias2(aj*) ®aj2 ve eğer fj®1 ise Var(aj*)= Var(j) ile  bias2(aj*) ®0 olacaktır.

fj  yanlılık parametrelerinin optimal değeri,  MSE(*) yı minimum yapacak şekilde elde edilir. Bunun için MSE(*) nın fj  ye göre (j=1,2,...,p) türevi alınıp,  sıfıra eşitlenirse optimal yanlılık parametresi;

                                               fj0==                                                                                        (6)

olarak elde edilir (tj2=aj2lj /s2; j=1,2,...,p). Genel yanlı kestiricinin hesaplanabilmesi için optimal fj0 değerleri (j=1,2,...,p için) bilinmelidir. Ancak (6) ile verilen optimal yanlılık parametresi formülü bilinmeyen kitle parametreleri içerdiğinden kullanılmaz. Bu nedenle optimal fj0 değerinin elde edilmesi için önerilen çeşitli yaklaşımlar vardır:

 

·                                                                                                                           Birinci yaklaşım Hoerl ve Kennard tarafından (1976) optimal k için verilen iteratif yöntemi esas alır. (6) ile verilen formülde; t iterasyon sayısını göstermek üzere, yerine en küçük kareler kestiricisi  s2 ; aj2 yerine R(t)¢R(t)/p (R(t) ; t-inci iterasyonda elde edilen ridge kestiricisi) yazılırsa;

fj,Ridge(t+1) =                                                             (7)

elde edilir (t=0,1,...). t=0 için R(0)= yani ridge kestiricisi yerine,  a’ nın E.K.K. kestiricisi kullanılacaktır. İteratif işleme; ridge kestiricisinin uzunluğu sabitleninceye  kadar devam edilir (Lee ve Birch, 1988).

 

·     İkinci yaklaşım; t=0 için ridge kestiricisi yerine,  a’ nın E.K.K. kestiricisini kullanmanın iç ilişki problemi durumunda güvenilir olmadığı düşünülerek önerilmiştir. Bu yaklaşım da başlangıç değer olarak ana bileşenler kestiricisini ve her iterasyon için yerine s2(t)=[y-ZR(t)]¢ [y-ZR (t)]÷ (n-p)  ifadesini kullanır ve t-inci  iterasyonda elde edilen yanlılık parametresi fj,PCV(t+1) ile gösterilir. Bu değer iteratif olarak hesaplanabileceği gibi, tek iterasyon sonucunda hesaplanan değer de kullanılabilir (Lee ve Birch, 1988). Yapılan simulasyon çalışmalarında (Lee, 1986) genel olarak bir yöntemin diğerinden daha iyi olmadığı sonucuna ulaşılmıştır.

Bu yöntemlere ek olarak, yine k değeri için verilen  iteratif yönteme benzer yeni bir yöntem önerilebilir. (7) ile verilen formülde R(t)¢R(t)/p yerine *(0)= olmak üzere *(t)¢¢*(t)/p  (*(t); fj*(t) yanlılık parametreleri kullanılarak  elde edilen genel yanlı  kestirici); s2 yerine  s2(t) yazılırsa fj,*PCV(t+1) ile gösterilen  fj,PCV(t+1) yaklaşımına benzer başka bir yaklaşım;

fj,*PCV(t+1=                                                 (8)

şeklindedir.

(6) ile verilen  optimal fj0 değeri,  (5) ile verilen MSE(*) formülünde yerine yazılıp,  gerekli işlemler yapılırsa;

MSE()- min MSE(*)=                                        (9)

elde edilir. Dikkat edilirse (9) ile verilen fark 0< fj<1 olmak üzere her zaman pozitiftir.  Ayrıca bu farkın lj ile ters orantılı olduğu görülür. Başka bir deyişle X¢X matrisinin özdeğerleri küçüldükçe (kötü koşulluluk arttıkça);  kestiricisinin MSE değeri ile * kestiricisinin MSE arasındaki fark artacak, böylece MSE kriterine göre * kestiricisi  kestiricisinden daha iyi bir kestirici olacaktır.

            Kanonik model için a  parametresinin genel yanlı kestiricisi  *  olmak üzere (1) modeli için b  parametresi için genel yanlı kestirici;

 

*=V F