TÜRKİYE’DE İLLERİN SOSYO-EKONOMİK ÖZELLİKLERE GÖRE SINIFLANDIRILMASI

 

Selçuk KOÇ*

 

 

1.ÖZET

Kümeleme analizi, küme adı verilen nispeten homojen grupların iç içe durumların yada objelerin sınıflandırılması için kullanılan teknikler sınıfıdır. Her obje birbirine benzer yada diğer kümelerden ayrı olma eğilimindedir. Kümeleme analizi ayrıca “sınıflandırma analizi” yada “sayısal taksonomi” olarak ta adlandırılır.

Kümeleme analizi içinde yer alacak basamakların sıralaması yöntemin düzgün işlemesi için önem arz eder. Önce konu ile ilgili yayınlar taranmış benzer çalışmalarda hangi tür değişkenler ile çalışıldığı ortaya çıkarılmıştır. Daha sonra ortaya çıkarılan değişkenlerin tedarik edinmesine çalışılmıştır. Ancak ekonometrik araştırmalarda ortaya çıkan en önemli problem olan “yeterli veri bulamama”  problemi bu çalışmada da ortaya çıkmıştır. (Gerek 12 ilin yeni il statüsüne kavuşması sebebiyle bahsedilen 12 ile ait verilerin bulunmaması, gerekse bazı değişken değerlerine ait ölçüm ve hesaplamaların yapılmaması sebebiyle 22 değişken kullanılmıştır.)  Sonuçta belirlenen değişkenlerden elde edilebilenler analize dahil edilmiştir. Gerekli bir değişkenin modele alınmamasının yöntem sonuçları üzerinde etkisinin fazla olduğu bir analiz tekniği olan yöntemde, bu konu çalışmanın zayıf yönü olarak ortaya çıkmaktadır

Değişkenler belirlendikten sonra   mesafe ölçüleri ilgili ön araştırma yapılmıştır. Yapılan ön değerlendirmede sonra Kareli Öklid Uzaklığının çalışma için en uygun yöntem olduğuna karar verilmiştir.

Kümeleme prosedüründe hiyerarşik ve hiyerarşik olmayan kümeleme yöntemleri uygulanmış olup hiyerarşik yöntemler çeşitli alt başlıklar altında yer alan yedi ayrı metot ile kümeleme yapılmıştır. Sonuçlar incelenip değerlendirildiğinde Medyan ile Ward Metodu ve Grup içi ile Gruplar arası yöntem sonuçlarının aynı küme sonuçlarını vermiştir. İnceleme sonucunda Ward ve medyan yönteminin en uygun yöntemler olduğu sonucuna varılmıştır.

Küme sayısına karar vermek için literatürde kullanılan yöntemlerin çalışma için uygun yöntemler olmadığı sonucuna varılmıştır. Küme sayısına karar vermek için kullanılan ilk formülasyon  k’nın küme sayısını ifade ettiği eşitlik çalışmaya uygulandığında küme sayısının 6 yada 7 olması gerekiyordu. Fakat 6 yada 7 küme illerin kümelenmesinde yetersiz kaldığı anlaşılmıştır. Küme sayısına karar verir iken buz diyagramlarından ve hiyerarşik kümelemede kümelerin birleştiği mesafeler kritik olarak kullanılmış ve küme sayısının 15 olmasının uygun olacağına karar verilmiştir.

Kümeleme analizi sübjektif özelliği çok fazla olan bir yöntem olması sebebiyle, sübjektifliği en aza indirmek amacıyla – literatürde bir çok araştırmacının ortak görüşü olarak- farklı kümeleme yöntemlerinin bir arada kullanılması ve beraber değerlendirilmesi şeklindedir. Bu yüzden Hiyerarşik kümeleme analizinde yedi, hiyerarşik olmayan kümeleme analizinde bir yöntem kullanılmıştır

 

2. GİRİŞ

 

Kümeleme analizinin temel hedefi, dağınık bir halde bulunan verileri benzerliklerine göre bir araya getirip sınıflandırarak işlenebilir hale getirmek, analizin veriler üstünde uygulanmasına olanak sağlamayan çok değişkenli istatistiksel bir yöntemdir.

Aynı anakütle içinde yer alan verilerin benzer özelliklerinden yararlanarak bir araya getirme çabasında olan çok değişkenli istatistiksel bir yöntem ve çabalar bütünüdür. Kümeleme analizinin uygulanması sırasında izlenecek adımlar gösterilecek olursa:

 

 

 

Kümeleme analizi ile kümelerin aldığı durum, değişkenler ile kümeler arasındaki ilişkilere basit ve kesin bir yapı kazandırmaktadır. Kümeleme işleminin sonucunda elde edilen kümeler gözlenen değişkenler üzerine oturtulmuş anlamlı hipotezlerdir. Kümeler belirlenmiş çalışma alanında, önemli etkileri ve objektif karşılıklı etkileşimleri kapsamaktadır. Bundan dolayı analiz, önceden belirlenmiş çalışma alanıyla sınırlıdır. Çalışma alanını açıklayan hipotezler, kümeler aracılığıyla açıklanmaktadır. Bu yüzden kümeleme analizi ile yeni tezler geliştirirken değişkenlerin seçiminde son derece dikkatli davranmalıdır.

Yüzölçümüne göre belli bir büyüklüğe sahip tüm ülkeler daha iyi yönetilmek için çeşitli idare kısımlara ayrılmışlardır. (yüzölçümüne göre çok küçük ülkelerde buna gerek görülmemiştir Ör : Vatikan) bu ayrım kimi yerde eyalet, (Ör: A.B.D ve Almanya) kimilerinde kantonlara (Ör: İsviçre) kimilerinde ise illere (Ör:Türkiye) ayrılmıştır. Ayrım ne şekilde olursa olsun esas sebep coğrafi büyüklük sebebiyle idarenin daha kolay hale gelmesidir.

 

3.UYGULAMA

 

Kümeleme analizinin amaçları, esas olarak bireylerin tüm değişkenler itibariyle benzerliklerini esas alarak benzer bireylerin aynı gruplarda veya kümelerde toplanması, bu kümelerin tanımlanması ve yeni bireylerin hangi gruba dahil olduğunun tahmin edilmesidir. Bu bağlamda  çalışmanın amacı illerin tüm değişkenler itibariyle benzerliklerini esas alarak benzer illerin aynı kümede toplanması hedeflenmiştir. Kümeleme analizi 3 aşamadan oluşur. Örnek boyutunun belirlenmesi, hiyerarşik ve hiyerarşik olmayan kümeleme analizinin uygulanması. Bu çalışmada bu fikir temel alınmıştır. Çalışma da sıralama değil, sınıflandırılma amaçlanmıştır.

 

3.1 Gözlem Sayısının ve Değişkenlerin Belirlenmesi :

 

Sayısal bir sınıflandırma veri ile başlar ve sınıflandırmayı ampirik olarak şekillendirmeyi amaçlar. Bu çalışmaya konu olan ülke idari yapılanması 81 ile ayrılmıştır. Kümeleme analizi uygulamasında veri olarak iller baz alınacaktır. Her ne kadar ülke 81 ile sahip olsa da bu çalışmada 79 il kullanılmıştır. Bunun sebebi 80. ve 81. iller olan Osmaniye ve Düzce’nin 1997 den sonra il statüsüne kavuşmuşlardır bu sebepten dolayı  baz alınan değişkenlere ait verilerin bulunmamasıdır. Düzce’ye ait veriler Bolu’nun, Osmaniye’ye ait verilerde Adana ili içerisinde yer almaktadır. Son yıllarda ilçelerin il yapılması ile 1986 yılında 67 olan il sayısı günümüzde 81’dir. Bu durumda yeni olan illere ait verilerin bulunmasını zorlaştırmış değişken sayısının daha fazla olmasına engel teşkil etmiştir.

Kümeleme analizi birbiri ile ilgili çok sayıda değişkenin kullanılmasına uygun bir analiz tekniğidir. Bu yüzden çalışmada değişken sayısı –gelişen bilgisayar programlarının da yardımıyla- mümkün olduğunca yüksek tutulmuştur. Verilen değişkenlerin büyük bir kısmı 1997 yılına aittir ve il bazında verileri içermektedir. Araştırmaya ülke genelinde 79 ilin sosyo-ekonomik özelliği yansıttığı düşünülen 29 değişken ile başlanmış fakat çeşitli sebeplerle değişken sayısı 22 ye indirilmiştir. Söz konusu değişkenler şunlardır;

 

Motor: İl bazında 10.000 kişiye düşen motorlu araç sayısını ifade eder.

Ozeloto: İl bazında 10.000 kişiye düşen özel oto sayısı

Bagsay: O ile kayıtlı Bağkurlu sayısını ifade eder.

Bagem: O ile kayıtlı Bağkurlu sayısını ifade eder

Emsan: O ilde  Emekli sandığına kayıtlı olarak emekli aylığı alanların sayısı

Ssksay: O ilde çalışan SSK’lı (Sosyal Sigortalar Kurumu) çalışan sayısı

Sskem: O ilde SSK dan emekli aylığı alanların sayısı

Hekim: O ilde  doktor başına düşen nüfus sayısı

Dıshekim: Diş hekimi başına düşen nüfus sayısı

Saglık: Sağlık personeli başına düşen kişi sayısı

Kbelek :Yıl içinde kişi başına düşen elektrik tüketimi (KWh)

Suor: İlde bulunan köylerin % kaçının su şebekesine dahil olduğunu gösterir.

Asfalt : Kırsal  yerleşim merkezlerinin asfaltlanma oranı

Tarim: Yıl içinde üretilen tarımsal ürünlerin kişi başına değeri

Vergi: Toplanan ortalama kişi başına düşen vergi miktarı (milyon)

Kbgsyh: Kişi başına düşen Gayri safi yurtiçi Hasıla değeri (milyon)

Kamuyat: Kişi başına düşen kamu yatırımları

Kredi: Baz alınan ilde kullanılan ortalama kredi miktarını ifade eder

Mevduat: İlde toplanan ortalama kişi başı banka mevduatını ifade eder

Anaogrt: Anaokulunda öğretmen başına düşen ortalama öğrenci sayısı

Ilkogrt: İlköğretim okullarında öğretmen başına düşen ortalama öğrenci sayısı

Lıseogrt: Tüm liselerde öğretmen başına düşen ortalama öğrenci sayısı

 

Değişkenler, belli bir dönem içindeki değişmeyi değil, belirli bir yıldaki mevcut durumu yansıtmaktadır. Bu yüzden araştırma bir kesit serisi özelliğindedir.

Çalışmada SPSS 8.0 for Windows bilgisayar programının kümeleme analizi ile ilgili seçeneklerini kullanmıştır. Öncelikle değişkenler belirlenmiştir. Belirlenen değişkenler uygunluğu daha önce yapılan benzer çalışmalarda karşılaştırılmış ve uygun olanlar modele dahil edilmiştir. Modele alınması düşünülen değişkenler ile veriler karşılaştırılmış gözlemleri eksik olan değişkenler modelden çıkarılmıştır. Sonuçta uygulamada 79 gözlem (il sayısı) ve 22 değişken analizde kullanılmıştır. Küme elemanlarının tam olarak belli olmaması hesaplamaları güçleştirmektedir. Bu yüzden kümeler ayrı ayrı değerlendirilip en uygun yöntem seçilecektir.

Çalışmaya sosyal ve ekonomik, olarak illerin ekonomik ve sosyal kümelenmesinde etkili olduğu düşünülen 22 değişken ile 79 il veri matrisinde kullanılmıştır. Bu durumda veri matrisi 79 x 22 boyutundadır

 

Hiyerarşik Küme Analizi Sonuçları

 

 

i.küme

Gruplar arası

Grup içi

Tek Bağlantı

Tam

Bağlantı

Ortalama

Bağlantı

Medyan

Ward

1

1

1

1

1

1

1

1

2

1

1

1

1

1

1

1

3

1

1

1

1

1

1

1

4

1

1

1

1

1

1

1

5

1

1

1

1

1

1

1

6

1

1

1

1

1

1

1

7

2

2

1

3

1

1

1

8

6

6

7

5

12

6

6

9

9

9

8

5

4

13

13

10

3

3

3

3

1

1

1

11

42

42

14

11

41

38

38

12

2

2

24

7

11

10

10

13

1

1

5

25

1

2

2

14

7

7

7

7

1

1

1

15

1

1

4

7

1

1

1

 

 

 

 

 

 

Hiyerarşik Kümeleme Analizi Sonuçları

 

Kümeler

1

2

3

4

5

6

7

8

Küme

Üyeliği

İstanbul

İzmir

Ankara

Kocaeli

Şırnak

Zonguldak

Bursa

Bilecik

9

10

11

12

13

14

15

Adıyaman

Ardahan

Artvin

Bingöl

Giresun

Iğdır

Kars

Kilis

Rize

Siirt

Trabzon

Tunceli

Van

Ağrı