İŞ HAYATI VERİ MADENCİLİĞİ İLE İSTATİSTİK UYGULAMALARINI

 

YENİDEN KEŞFEDİYOR.

 

Doç. Dr. Şule ÖZMEN

Marmara Universitesi İ.İ.B.F.

İngilizce İşletme Bölümü

 

 

GİRİŞ

 

Günümüz dünyasında işletmeler başarılı olabilmek için yeni ekonominin ve yeni iş modellerinin kurallarına uygun hareket etmek durumundadırlar. Bilgisayar ve iletişim teknolojilerindeki gelişmeler çok daha fazla verinin hızlı toplanmasına, depolanmasına, işlenmesine ve bilgiye dönüştürülüp yeniden istenilen noktalara iletilmesine olanak sağlamıştır. Yeni teknolojilerden önemli ölçüde etkilenen ve dijital  ekonomi olarak da adlandırılan bu yeni ekonominin kuralları gereği “bilgi” ve  “zaman” boyutlarının önemi çok daha artmış ve  dolayısıyla işletmelerin karar verme süreçlerinde doğru ve anlamlı bilgiye dayalı hızlı karar alma gereği her zamankinden daha fazla ön plana çıkmıştır.

 

Bunun için de müşteriler  başta olmak üzere işletme ile ilgili taraflar ve  süreçler hakkında bilgi sahibi olmak, bilgi sahibi olmanın gereği olarak da veri toplamak gerekir. Bu amaçla hazırlanan veri ambarlarında tutulan veriler  çeşitli istatistiksel yöntemlerle analiz edilerek anlamlı, kullanılabilir  ve karar verme sürecinin etkinliğini ve verimliliğini artırıcı bilgilere dönüştürülür. Müşteriler hakkında tutulan veriler sadece demografik özelliklerle ilgili verilerden ibaret değildir. Müşterinin firmayla yaptığı işlemlerle ilgili kayıtlar tutulmaktadır. Örneğin işlem saati, aldığı ürün veya hizmet, bunların tutarı gibi veriler müşteri bazında veya ürün bazında veriler tutulmakta ve bu verilerden müşterinin satın alma tutum ve davranışları hakkında bilgiler üretilebilmektedir. Firma için karlı bir müşteri olup olmadığı ya da ne derece karlı bir müşteri olduğu, sadık bir müşteri olup olmadığı yönünde bilgiler elde edilebilmekte, bunun sonucunda müşterilerin hangi yaşam evresinde oldukları tesbit edilip ve ona göre pazarlama stratejileri geliştirilebilmektedir.

 

Tutulmasi gereken verilerin miktarının ve çeşitliliğinin artması, analizlerin daha hızlı yapılması gereği ve sonuçta anlamlı ve eyleme yönelik bilgiler ortaya çıkarılması yeni ekonominin ve değişen piyasalardaki yoğun rekabet ortamının bir gereğidir. Rekabetin yoğunlaşması; değişim ve uyum sürecinin gerektirdiği  hızı yakalayabilmenin, müşteri odaklı olmanın ve verimliliğin önemini her zamankinden daha çok arttırmıştır. Bunları mümkün kılan ise, yine yeni ekonomide sunulan teknik olanaklardır. Milyonlarca bitlik verilerin depolandığı veri ambarlarının tutulduğu donanımlar ve bunlardan çok hızlı bir şekilde anlamlı bilgiler  elde edebilmek için kullanılabilecek yazılımlar yeni teknolojinin sunduğu olanaklardır. 

 

VERİ MADENCİLİĞİ

 

Büyük miktarlarda ve oldukça hızlı toplanan verilerin çeşitli analizler sonucunda anlamlı bilgilere dönüştürülmesi noktasında “veri madenciliği” süreci  devreye girmektedir. Veri madenciliği tanımları  incelendiğinde, bu tanımlardan ortak olan unsurlardan ilki “çok fazla” miktarlarda verinin veri ambarlarında tutulması ikincisi ise bu verilerden “anlamlı” bilgiler elde edilmesidir. 

 

Veri madenciliği; veri ambarlarındaki tutulan çok çeşitli verilere dayanarak  daha önce keşfedilmemiş bilgileri ortaya çıkarmak, bunları karar vermek ve eylem planını gerçekleştirmek için  kullanma sürecidir. (Swift, 2001) Bu noktadaKendi başına bir çözüm değil çözüme ulaşmak için verilecek karar sürecini destekleyen, problemi çözmek için gerekli olan  bilgileri sağlamaya yarayan bir araçtır.

 

Veri madenciliğiyle ilgili yazılım ürünleri ve uygulamalarında görülmektedir ki veri madenciliği esasen istatistiğin kullanıldığı bir tekniktir. Dolayısıyla işletmelerde önemli bir kullanım alanı bulması çok doğaldır. Özellikle çok müşterisi olan firmalar, bankalar tarafından büyük bir hızla benimsenmektedir. İşte bu nedenledir ki işletmeler istatistik uygulamalarını özellikle pazarlama amaçlarına yönelik uygulamalarını adeta yeniden keşfetmektedirler.

 

            Veri madenciliğinde vurgulanan unsurlar istatistiğin tanımı içinde zaten yer almaktadır.  İstatistik verilerin toplanması, sınıflandırılması, özetlenmesi, grafik ve tablolarla sunulması, analiz edilerek ana kütle hakkında anlamlı bilgiler elde edilmesi ve yorumlar yapılmasıdır. Veri madenciliğinde ulaşılmak istenen amaç aslında istatistik biliminin amacı ile aynı doğrultudadır. Verilerden bilgiyi keşfetmek. Zaten veri madenciliğinde kullanılan temel aracın istatistiksel yöntemler olduğu birçok tanımda ve uygulamada vurgulanmaktadır. Her ikisinde de temel olan öğeler veri ve bilgidir. Bu nedenle birbiriyle oldukça örtüşen konulardır.

 

Veri madenciliği 1990’larda  ortaya çıkan ve dünya da yeni yaygınlaşan bir kavram. Veri madenciliği uygulamalarında kullanılan ve büyük miktarlarda verilerin tutulduğu veri ambarı projeleri de benzer şekilde son yıllarda önem kazanan projelerdir. Bilişim sektöründe veri ambarı ve veri madenciliğiyle ilgili gerek donanım gerek  yazılım ürünleri üstünde çalışan firmalar son yılllarda artış göstermektedir. Bunların arasında istatistikçilerin hiç yabancı olmadıkları SPSS firması da bulunmaktadır. SPSS veri madenciliği uygulamaları için ileri düzey istatistik bilgisi gerektirmeyen, kullanıcıya uygun arayüzlerle sunulan Clementine, AnswerTree gibi ürünler çıkartmıştır.

 

Veri ambarlarında verileri tutmak ve veri madenciliği uygulamaları kullanmak, geleneksel işleri elektronik ortama taşıma ve elektronik işletme olmanın da gereklerinden ve ileri aşamalrından biridir. Bu aşama internet bağlantısına sahip olma, elektronik posta sahibi olma, web sitesine sahip olarak sanal dünyada var olma, hatta Internet üzerinden alım ve satım işleminin gerçekleştirilmekten daha ileri bir aşamadır. Tüm bunları gerçekleştirmenin yanısıra elektronik işletme olabilmek için satış ve kar artırıcı amaca yönelik uygulamalara yönelmek gerekir. Bu da, ancak müşteri odaklı çalışmakla, müşterilerle ilgili gerekli verileri tutarak anlamlı bilgiler elde etmekle dolayısıyla çok sayıda müşteriyle birebir ilişki kuracak teknolojik ve yönetsel altyapının kurulmasıyla mümkün olabilmektedir. 

 

Veri Madenciliği istatistik biliminin teknolojiyle bütünleşmesi sonucu oluşturulan bir araçtır. Uygulamada istatistiğin yeniden keşfedilmesine olanak sağlayan hiç kuşkusuz yeni teknolojilerin sunduğu fırsatlardır. Teknik olarak eskisinden çok daha fazla miktarlarda verilerin toplanması, depolanması ve hızlı bir şekilde işlenmesi mümkümdür. Ancak veri madenciliğinde unutulmaması gereken önemli kavramlardan biri bunun paket programdan ibaret olmadığıdır. Her ne kadar kullanıcı için kolaylık sağlayıcı arayüzler hazırlansa da en azından temel istatistik bilgisine ihtiyaç vardır. Bu ihtiyaç elbette bu programı sağlıklı kullanmak ve isabetli kararlar alabilmek açısından önemlidir. Örneğin iki değişken arasında korelasyon bulmak istediğiniz zaman paket programın buna itiraz etme şansı olmayabilir, üstelik korelasyon derecesinin anlamlı olduğu sonucu elde edilebilir, ancak sonuç bu iki değişken arasında korelasyon katsayısının gerçekten istenen bilgi olduğu anlamına gelmez.

 

VERİ MADENCİLİĞİNİN İŞLETMELERDE KULLANIM AMACI

 

            İstatistiğin amacı nasıl ana kütle hakkında anlamlı bilgiler elde etmek ve yorum yapmaksa veri madenciliğinin amacı da anlamlı bilgiler elde etmek ve bunu eyleme dönüştürecek kararlar için kulllanmaktır. İlgilendiği ana kütle örneğin mevcut veya potansiyel müşteriler olabilir.  Müşterilerin profillerini, satın alma eğilimlerini, bir ürünü veya hizmeti kabul etme veya etmeme ihtimallerini tahmin etme veri madenciliğinde hedeflenen amaçlar arasındadır.  Bu tahminlerin ise ana hedef olan strateji belirlemek için çeşitli kararlar vermek için kullanılır. 

 

            Ürün ve hizmet sektöründe müşterilerle ilgili veri madenciliği uygulama amaçlarına ilişkin çok çeşitli örnekler vermek mümkün. En karlı pazar bölümlerini, en karlı müşterileri, yeni bir promosyon kampanyasında müşteriye sunulan  ürün veya hizmetin kabul edilme oranlarını saptamak pazarlamada veri madenciliği uygulamasında önemli amaçlardır.  Veri madenciliği uygulamalarından elde edilecek faydalara ilişkin bazı örnekler aşağıda sıralanmıştır.

 

Ø      Bir işletme kendi müşterisiyken rakibine giden müşterilerle ilgili analizler yaparak rakiplerini tercih eden müşterilerinin özelliklerini  elde edebilir ve bundan yola çıkarak gelecek dönemlerde kaybetme olasılığı olan müşterilerin kimler olabileceği yolunda tahminlerde bulunarak onları kaybetmemek, kaybettiklerini geri kazanmak  için strateji geliştirebilir.

 

Ø      Ürün veya hizmette hangi özelliklerin ne derecede müşteri memnuniyetini etkilediği, hangi özelliklerinden dolayı müşterini bunları  tercih ettiği ortaya çıkarılabilir.

 

Ø      Müşterilerin kredi riskleri hesaplanarak hangi müşterilerin kredi riskinin yüksek olduğu, hangi müşterilerin geri ödemesini zamanında yapamayabileceği kestirilebilir. Kredi kartı ödemelerini aksatan, gecikmeli olarak yapan veya hiç yapmayanların özelliklerinden yola çıkılarak bundan sonra aynı duruma düşebilecek muhtemel kişiler saptanabilir.

 

Ø      En karlı mevcut müşteriler saptanarak, potansiyel müşteriler arasından en karlı olabilecekler belirlenebilir. Karlı müşteriler tesbit edilerek onlara özel kampanyalar uygulanabilir. En masraflı müşteriler daha masrafsız müşteri haline dönüştürülebilir. Örneğin en çok bankacılık işlemi yapanlar ortaya çıkarılıp bunlar şube bankacılığı yerine daha masrafsız Internet bankacılığına yönlendirilebilir.

 

Ø      Bir ürün veya hizmetle ilgili bir kampanya programı oluşturmak için hedef kitlenin seçiminden başlayarak bunun hedef kitleye hangi kanallardan sunulacağı kararına kadar olan süreçte veri madenciliği kullanılabilir. Bu kararlar için yapılan gerçek bir uygulama örneği kullanılan istatistiksel yöntemlerle birlikte aşağıdaki bölümde anlatılmıştır.

 

           

            VERİ MADENCİLİĞİ UYGULAMASI: KAMPANYA YÖNETİMİ

 

            Bu bölümde bir işletmede veri madenciliği uygulamalarından faydalanılarak gerçekleştirilen bir pazarlama kampanyası  örneği sunulacaktır. Gerçek bir vaka olan bu uygulama sonucunda kampanyadan başarılı bir sonuç elde edilmiştir. Burada özellikle üzerinde durulan nokta, veri madenciliği araçlarında kullanılan analizlerin önemli bir bölümünün istatistiksel analizler olduğu ve bu analizlerin hangi amaçlar için kullanıldığıdır.

 

            Kredi kartı pazarlama amaçlı bu kampanya bir çapraz satış kampanyası olup amaç ödeme davranışı “iyi” olan bireysel kredi kullanıcılarına “kredi kartı” sunmaktır. 

 

1-     İstatistik işin içine hemen ilk amaç aşamasında girmiştir. Kampanya için öncelikle mevcut müşteriler arasından ödeme davranışı “iyi” olanların belirlenmesi gerekmektedir.  “İyi” ödeme davranışının ölçülebilir (operasyonel) tanımının yapılabilmesi için hangi özelliklerdeki müşterilerin iyi ödeme davranışlı müşteriler olduğunun belirlenmesi gerekir. Bu noktada  ödeme davranışına etki eden özelliklerin yani değişkenlerin ve bu değişkenlerin ödeme davranışın ne derece etkilediğinin bulunması istatistiksel analizlerle mümkündür. Örneğin discriminant analiziyle veya lojistik regresyon kullanarak ödeme davranışı iyi ve kötü olan müşteriler sınıflandırılabilir.   Ki-kare analizleriyle ödeme davranışı iyi ve kötü olarak kategorize edilen müşterilerin diğer kategorik özellikleriyle ilişkili olup olmadığına bakılabilir. Söz konusu kampanyada ise “iyi” ödeme davranışlı müşterinin tanımı ilgili departman yönetimlerinin tecrübelerine dayanarak karşılıklı görüş alışverişleri sonunda saptanmıştır. 

 

Örneğin;

·        Kredi ödemesini ödeme süresi içinde  yapanlar ve

·        Kredi ödemesini ödeme süresi içinde  yapmayanlar filtreleme yöntemiyle ayrıştırılmıştır.

 

Ödemesini zamanında yapmayanlar ise gecikme süreleri ve kaç kez geciktirdiklerine göre sınıflandırılmış ve bu sınıflandırma sonunda belirlenen bir gecikme zaman ve sayısı baz alınarak tekrar sınıflandırılmıştır.. 

 

·        Kredi geri ödemesini belli bir zamandan fazla geciktirenler ve 

·        Kredi geri ödemesini belli bir zamandan fazla  geciktirmeyenler   

 

Ödemesini belli bir zamandan fazla geciktirmeyenler ise bu kez;

 

·        Bir kez geciktirenler

·        Birden fazla geciktirenler olarak sınıflandırılmışlardır.

 

Anlaşılacağı üzere burada kullanılan yöntemler tanımlayıcı istatistiksel analiz yöntemleridir. Veri ambarlarında depolanan veriler kullanılarak bu sınıflandırmalar binlerce, onbinlerce mevcut müşteri için, teknolojik destekle, dakikalarla ifade edilecek çok kısa bir zaman içinde yapılmıştır. Bu aşama sonunda ödeme davranışı “iyi” olan müşteriler ortaya çıkmış ve kredi kartı hedef pazarı olarak tesbit edilmiştir.

 

2-     Hedef kitlenin belirlenmesinin ardından yine istatistiksel analizler kullanarak karar verilmesi gereken iki önemli husus kredi kartı limiti kararı ve kartın cinsidir. Limitin müşterinin hangi özelliklerine göre tayin edilmesi gerekir. Bu bilgi kredi kartının klasik mi yoksa gold kart mı olacağı kararını etkilediğinden dolayı önemlidir.  Söz konusu özellikler gelir seviyesi, mesleği, araba, ev sahibi olma gibi özellikler olabilir.  Bunların yanısıra geri ödemesini düzgün yapan  müşterilerin aldığı kredi tutarına veya aylık taksit ödeme tutarına ilişkin veriler de kredi limiti kararını vermek için kullanılacak uygun değişkenler olabilir. Bunun  cevabını yine istatistiksel analizler sonucu  elde etmek mümkündür.

3-     Birinci ve ikinci aşamalardan sonra saptanan hedef kitleye, belirlenen kanallarla erişip ürünü sunmanın ardından kampanyanın etkinliğini ölçme aşamasında yine istatistik devreye girmektedir. Kampanyanın sonuçlarını değerlendirme aşamasında öncelikle kabul oranları incelenmiş ve bununla ilgili öngörülerin  ne denli başarılı olduğu  kontrol edilmiştir.  Bu aşamada hedef kitle saptarken kullanılan yöntemlerin, çeşitli karar aşamalarında kriter olarak kullanılan değişkenlerin  ne denli uygun olup olmadığı bu şekilde test edilebilmiştir. Bu uygulamada başarı oranı oldukça yüksek %75 ler civarında olmuştur. Ürün, sunulan hedef  kitlenin % 75’i tarafından kabul etmiştir. Bu kabul oranı geleneksel yöntemlerle yönetilen bir kampanya yönetimine göre oldukça yüksek bir orandır. Bu oran veri madenciliği uygulamasını sunan firma tarafından dahi çok yüksek bulunmuştur. Başarı oranının yüksek olmasında etkin ve verimli biçimde kullanılabilen istatististiksel yöntemlerin payı oldukça fazladır. Kriter değişkenlerin doğru yöntemlerle tesbiti kabul oranını artırmıştır.

 

Kampanya sonunda hedeflenerek erişilen  müşteriler  için  yepyeni bir değişken daha ortaya çıkmıştır. Kredi kartı kampanyasında ürünü kabul etme ve etmeme kararları yeni bir kategorik değişken olarak veri ambarında yerini alır. Bu veri, yeni bir kampanya için oldukça değerli bir veridir. Çünkü bu değişkeni kriter değişkeni olarak kullanarak ürünü kabul eden müşteri ile etmeyen müşterileri özelliklerine göre tekrar sınıflandırmak ve hangi özellikteki müşterilerin kabul etme olasılığının daha çok olduğunu belirlemek mümkündür. Bu şekilde bir sonraki kampanyanın etkinliği artırılabilir. Hangi müşterilerin kabul etme ihtimalleri yüksekse onlara erişilerek zaman ve maliyet tasarrufu yapılabilir.

 

Sonuçta bir kampanya  aslında bir sonraki için çok değerli verilerin ortaya çıkmasını sağlamaktadır ve süreç bu şekilde sürekli kendi kendine geri besleme yaparak devam edebilir. Hem kampanya öncesinde mevcut müşteri bilgilerini  hem de kampanya sonunda elde edilen sonuçları istatistiksel analizlerle değerlendirmek gerekir Verilerin miktarı ve değişkenler arttıkça yeni analizler yapmak kaçınılmaz olacaktır. Veri madenciliği ve veri ambarı projelerinde en büyük sıkıntılardan biri henüz bu kavramlar ve uygulamalar yeni olduğu için geriye dönük verilerin şimdilik yeterli olamadığı durumlar söz konusu olmaktadır. Zaman içinde uygulamalar geliştikçe ve piyasada istatistiği daha etkin kullanabilenler arttıkça ve başarılı sonuçlar elde edilmey başlandıkça iş dünyası istatistik uygulamalarının önemini daha da iyi anlayacaktır.

 

 

 

SONUÇ

 

Yoğun rekabet ortamında çalışan işletmeler kendilerini farklılaştırabilmek için bilgiyi  etkin ve verimli bir biçimde kullanma yoluna gitmektedirler. Bilgiyi elde etmek için eskiden beri kullanılmakta olan yöntemlerin en önemlilerinden biri olan istatistiksel yöntemler, hakettikleri öneme kavuşmaktadırlar. Sağladığı faydayı gören iş dünyası istatistik uygulamalarını adeta yeniden keşfetmeye başlamışlardır. 

 

Veri madenciliği uygulamalarından fayda sağlanmasına neden olan en önemli faktörlerden birisi çok miktarda veriyi istediğiniz şekilde işleyebilme olanağıdır. Altını çizilmesi gereken husus ise bu verileri işleme yöntemlerinin aslında senelerdir en temel işletme istatistiği  derslerinde de okutulan yöntemler olmasıdır. Yeni olan uygulama, teknolojik olanaklar sayesinde yapılması gereken analizlerin çok daha düşük maliyet ve sürelerde yapabilmesidir. Dolayısıyla zaten çok önemli olduğu kimse tarafından inkar edilemeyen istatistiksel analizlerin bu denli kolay uygulanabilir olmasından dolayıdır ki istatistik uygulamalarını iş dünyası yeniden keşfetmiştir ve bunun yararlarını her dönemden daha çok ve daha somut bir biçimde şahit olmaktadır. Yukarda uygulama örneği olarak anlatılan kampanyanın yöneticisi bu konuda şöyle söylemektedir.

 

“.....Veri ambarları ve veri madenciliği uygulamaları sayesinde, pazarlamacılar ile bilgi işlemciler ayrılmaz kardeşler olmaya başlamışlardır. Yepyeni bir “pazarlamacı” kavramı ortaya çıkacaktır. İstatistik ve yöneylem araştırması bilmeyen pazarlamacıların devri kapanacaktır...”

 

Bunun istatistik bilimine ve ilgili taraflara çok büyük yararlar sağlayacağı yadsınamaz. İstatistikler ve istatistiksel analizler her alanda her zaman çok önem taşımıştır. Günümüzde farklı olan bilgisayar, internet teknolojilerinin sağladığı olanaklardır. İstatistiğin öneminin daha fazla  kişi tarafından anlaşılmasıdır. 

REFERANSLAR

Berry M.J., Linoff G.S.; (2000); Mastering Data Mining; John Wiley & Sons, Inc.             New York.

Ronald Swift; (2001);Accelerating Customer Relationship; Prentice Hall PTR

Glymour C., Madigan D., Pregibon D., Smyth P.; (1997); Statistical Themes and Lessons for Data Mining; Data Mining and Knowledge Discovery 1;11-28

Kolsky J.; (1997); Statistics and Data Mining in the Analysis of Massive Data Sets; http://www.infosense.com/publicatons

Maindonald J.H.; (2000); New Approaches to Using Scientific –Data Statistics, Data Mining & Related Technologies In Research and Research Training; http://www.anu.edu.au ;  The Australian National University.

Rocke David M.; (2001); A Perspective on Statistical Tools for Data Mining Applications;

http://lac.uic.edu