TÜRKİYE’DE İLLERİN
SOSYO-EKONOMİK ÖZELLİKLERE GÖRE SINIFLANDIRILMASI
Selçuk KOÇ*
1.ÖZET
Kümeleme analizi, küme adı
verilen nispeten homojen grupların iç içe durumların yada objelerin
sınıflandırılması için kullanılan teknikler sınıfıdır. Her obje birbirine
benzer yada diğer kümelerden ayrı olma eğilimindedir. Kümeleme analizi ayrıca
“sınıflandırma analizi” yada “sayısal taksonomi” olarak ta adlandırılır.
Kümeleme analizi içinde yer
alacak basamakların sıralaması yöntemin düzgün işlemesi için önem arz eder. Önce konu ile ilgili yayınlar taranmış benzer
çalışmalarda hangi tür değişkenler ile çalışıldığı ortaya çıkarılmıştır. Daha
sonra ortaya çıkarılan değişkenlerin tedarik edinmesine çalışılmıştır. Ancak
ekonometrik araştırmalarda ortaya çıkan en önemli problem olan “yeterli veri
bulamama” problemi bu çalışmada da
ortaya çıkmıştır. (Gerek 12 ilin yeni il statüsüne kavuşması sebebiyle
bahsedilen 12 ile ait verilerin bulunmaması, gerekse bazı değişken değerlerine
ait ölçüm ve hesaplamaların yapılmaması sebebiyle 22 değişken
kullanılmıştır.) Sonuçta belirlenen
değişkenlerden elde edilebilenler analize dahil edilmiştir. Gerekli bir
değişkenin modele alınmamasının yöntem sonuçları üzerinde etkisinin fazla
olduğu bir analiz tekniği olan yöntemde, bu konu çalışmanın zayıf yönü olarak
ortaya çıkmaktadır
Değişkenler belirlendikten
sonra mesafe ölçüleri ilgili ön
araştırma yapılmıştır. Yapılan ön değerlendirmede sonra Kareli Öklid
Uzaklığının çalışma için en uygun yöntem olduğuna karar verilmiştir.![]()
Kümeleme prosedüründe
hiyerarşik ve hiyerarşik olmayan kümeleme yöntemleri uygulanmış olup hiyerarşik
yöntemler çeşitli alt başlıklar altında yer alan yedi ayrı metot ile kümeleme
yapılmıştır. Sonuçlar incelenip değerlendirildiğinde Medyan ile Ward Metodu ve
Grup içi ile Gruplar arası yöntem sonuçlarının aynı küme sonuçlarını vermiştir.
İnceleme sonucunda Ward ve medyan yönteminin en uygun yöntemler olduğu sonucuna
varılmıştır.
Küme sayısına karar vermek için literatürde kullanılan yöntemlerin
çalışma için uygun yöntemler olmadığı sonucuna varılmıştır. Küme sayısına karar
vermek için kullanılan ilk formülasyon
k’nın küme sayısını
ifade ettiği eşitlik çalışmaya uygulandığında küme sayısının 6 yada 7 olması
gerekiyordu. Fakat 6 yada 7 küme illerin kümelenmesinde yetersiz kaldığı
anlaşılmıştır. Küme sayısına karar verir iken buz diyagramlarından ve
hiyerarşik kümelemede kümelerin birleştiği mesafeler kritik olarak kullanılmış
ve küme sayısının 15 olmasının uygun olacağına karar verilmiştir.
Kümeleme analizi sübjektif özelliği çok fazla olan bir
yöntem olması sebebiyle, sübjektifliği en aza indirmek amacıyla – literatürde
bir çok araştırmacının ortak görüşü olarak- farklı kümeleme yöntemlerinin bir
arada kullanılması ve beraber değerlendirilmesi şeklindedir. Bu yüzden
Hiyerarşik kümeleme analizinde yedi, hiyerarşik olmayan kümeleme analizinde bir
yöntem kullanılmıştır
2. GİRİŞ
Kümeleme analizinin temel hedefi, dağınık bir halde
bulunan verileri benzerliklerine göre bir araya getirip sınıflandırarak
işlenebilir hale getirmek, analizin veriler üstünde uygulanmasına olanak
sağlamayan çok değişkenli istatistiksel bir yöntemdir.
Aynı anakütle içinde yer alan verilerin benzer
özelliklerinden yararlanarak bir araya getirme çabasında olan çok değişkenli
istatistiksel bir yöntem ve çabalar bütünüdür. Kümeleme analizinin uygulanması sırasında
izlenecek adımlar gösterilecek olursa:
Kümeleme analizi ile kümelerin aldığı durum,
değişkenler ile kümeler arasındaki ilişkilere basit ve kesin bir yapı
kazandırmaktadır. Kümeleme işleminin sonucunda elde edilen kümeler gözlenen
değişkenler üzerine oturtulmuş anlamlı hipotezlerdir. Kümeler belirlenmiş
çalışma alanında, önemli etkileri ve objektif karşılıklı etkileşimleri
kapsamaktadır. Bundan dolayı analiz, önceden belirlenmiş çalışma alanıyla
sınırlıdır. Çalışma alanını açıklayan hipotezler, kümeler aracılığıyla
açıklanmaktadır. Bu yüzden kümeleme analizi ile yeni tezler geliştirirken
değişkenlerin seçiminde son derece dikkatli davranmalıdır.
Yüzölçümüne göre belli bir büyüklüğe sahip tüm ülkeler
daha iyi yönetilmek için çeşitli idare kısımlara ayrılmışlardır. (yüzölçümüne
göre çok küçük ülkelerde buna gerek görülmemiştir Ör : Vatikan) bu ayrım kimi
yerde eyalet, (Ör: A.B.D ve Almanya) kimilerinde kantonlara (Ör: İsviçre)
kimilerinde ise illere (Ör:Türkiye) ayrılmıştır. Ayrım ne şekilde olursa olsun
esas sebep coğrafi büyüklük sebebiyle idarenin daha kolay hale gelmesidir.
Kümeleme analizinin amaçları, esas olarak bireylerin
tüm değişkenler itibariyle benzerliklerini esas alarak benzer bireylerin aynı
gruplarda veya kümelerde toplanması, bu kümelerin tanımlanması ve yeni
bireylerin hangi gruba dahil olduğunun tahmin edilmesidir. Bu bağlamda çalışmanın amacı illerin tüm değişkenler
itibariyle benzerliklerini esas alarak benzer illerin aynı kümede toplanması
hedeflenmiştir. Kümeleme analizi 3 aşamadan oluşur. Örnek boyutunun
belirlenmesi, hiyerarşik ve hiyerarşik olmayan kümeleme analizinin uygulanması.
Bu çalışmada bu fikir temel alınmıştır. Çalışma da sıralama değil,
sınıflandırılma amaçlanmıştır.
Sayısal bir sınıflandırma veri ile başlar ve
sınıflandırmayı ampirik olarak şekillendirmeyi amaçlar. Bu çalışmaya konu olan ülke
idari yapılanması 81 ile ayrılmıştır. Kümeleme analizi uygulamasında veri
olarak iller baz alınacaktır. Her ne kadar ülke 81 ile sahip olsa da bu
çalışmada 79 il kullanılmıştır. Bunun sebebi 80. ve 81. iller olan Osmaniye ve
Düzce’nin 1997 den sonra il statüsüne kavuşmuşlardır bu sebepten dolayı baz alınan değişkenlere ait verilerin
bulunmamasıdır. Düzce’ye ait veriler Bolu’nun, Osmaniye’ye ait verilerde Adana
ili içerisinde yer almaktadır. Son yıllarda ilçelerin il yapılması ile 1986
yılında 67 olan il sayısı günümüzde 81’dir. Bu durumda yeni olan illere ait
verilerin bulunmasını zorlaştırmış değişken sayısının daha fazla olmasına engel
teşkil etmiştir.
Kümeleme analizi birbiri ile ilgili çok sayıda
değişkenin kullanılmasına uygun bir analiz tekniğidir. Bu yüzden çalışmada
değişken sayısı –gelişen bilgisayar programlarının da yardımıyla- mümkün
olduğunca yüksek tutulmuştur. Verilen değişkenlerin büyük bir kısmı 1997 yılına
aittir ve il bazında verileri içermektedir. Araştırmaya ülke genelinde 79 ilin
sosyo-ekonomik özelliği yansıttığı düşünülen 29 değişken ile başlanmış fakat
çeşitli sebeplerle değişken sayısı 22 ye indirilmiştir. Söz konusu değişkenler
şunlardır;
Motor: İl bazında 10.000 kişiye düşen motorlu araç sayısını
ifade eder.
Ozeloto: İl bazında 10.000 kişiye düşen özel oto sayısı
Bagsay: O ile kayıtlı Bağkurlu sayısını ifade eder.
Bagem: O ile kayıtlı Bağkurlu sayısını ifade eder
Emsan: O ilde Emekli
sandığına kayıtlı olarak emekli aylığı alanların sayısı
Ssksay: O ilde çalışan SSK’lı (Sosyal Sigortalar Kurumu)
çalışan sayısı
Sskem: O ilde SSK dan emekli aylığı alanların sayısı
Hekim: O ilde doktor
başına düşen nüfus sayısı
Dıshekim: Diş hekimi başına düşen nüfus sayısı
Saglık: Sağlık personeli başına düşen kişi sayısı
Kbelek :Yıl içinde kişi başına düşen elektrik tüketimi (KWh)
Suor: İlde bulunan köylerin % kaçının su şebekesine dahil
olduğunu gösterir.
Asfalt : Kırsal yerleşim
merkezlerinin asfaltlanma oranı
Tarim: Yıl içinde üretilen tarımsal ürünlerin kişi başına
değeri
Vergi: Toplanan ortalama kişi başına düşen vergi miktarı
(milyon)
Kbgsyh: Kişi başına düşen Gayri safi yurtiçi Hasıla değeri
(milyon)
Kamuyat: Kişi başına düşen kamu yatırımları
Kredi: Baz alınan ilde kullanılan ortalama kredi miktarını
ifade eder
Mevduat: İlde toplanan ortalama kişi başı banka mevduatını
ifade eder
Anaogrt: Anaokulunda öğretmen başına düşen ortalama öğrenci
sayısı
Ilkogrt: İlköğretim okullarında öğretmen başına düşen ortalama
öğrenci sayısı
Lıseogrt: Tüm liselerde öğretmen başına düşen ortalama öğrenci
sayısı
Değişkenler, belli bir dönem içindeki değişmeyi değil,
belirli bir yıldaki mevcut durumu yansıtmaktadır. Bu yüzden araştırma bir kesit
serisi özelliğindedir.
Çalışmada SPSS 8.0 for Windows bilgisayar programının
kümeleme analizi ile ilgili seçeneklerini kullanmıştır. Öncelikle değişkenler
belirlenmiştir. Belirlenen değişkenler uygunluğu daha önce yapılan benzer
çalışmalarda karşılaştırılmış ve uygun olanlar modele dahil edilmiştir. Modele
alınması düşünülen değişkenler ile veriler karşılaştırılmış gözlemleri eksik
olan değişkenler modelden çıkarılmıştır. Sonuçta uygulamada 79 gözlem (il
sayısı) ve 22 değişken analizde kullanılmıştır. Küme elemanlarının tam olarak
belli olmaması hesaplamaları güçleştirmektedir. Bu yüzden kümeler ayrı ayrı
değerlendirilip en uygun yöntem seçilecektir.
Çalışmaya sosyal ve ekonomik, olarak illerin ekonomik
ve sosyal kümelenmesinde etkili olduğu düşünülen 22 değişken ile 79 il veri
matrisinde kullanılmıştır. Bu durumda veri matrisi 79 x 22 boyutundadır
|
i.küme |
Gruplar
arası |
Grup içi |
Tek Bağlantı |
Tam Bağlantı |
Ortalama Bağlantı |
Medyan |
Ward |
|
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
2 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
3 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
4 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
5 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
6 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
7 |
2 |
2 |
1 |
3 |
1 |
1 |
1 |
|
8 |
6 |
6 |
7 |
5 |
12 |
6 |
6 |
|
9 |
9 |
9 |
8 |
5 |
4 |
13 |
13 |
|
10 |
3 |
3 |
3 |
3 |
1 |
1 |
1 |
|
11 |
42 |
42 |
14 |
11 |
41 |
38 |
38 |
|
12 |
2 |
2 |
24 |
7 |
11 |
10 |
10 |
|
13 |
1 |
1 |
5 |
25 |
1 |
2 |
2 |
|
14 |
7 |
7 |
7 |
7 |
1 |
1 |
1 |
|
15 |
1 |
1 |
4 |
7 |
1 |
1 |
1 |
Hiyerarşik Kümeleme Analizi Sonuçları
|
Kümeler |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
Küme Üyeliği |
İstanbul |
İzmir |
Ankara |
Kocaeli |
Şırnak |
Zonguldak |
Bursa |
Bilecik |
|
9 |
10 |
11 |
12 |
13 |
14 |
15 |
||
|
Adıyaman Ardahan Artvin Bingöl Giresun Iğdır Kars Kilis Rize Siirt Trabzon Tunceli Van |
Ağrı | |||||||