Araştırmalarda Đki Aşamalı Kümeleme (Two-Step Clustering
Transkript
Araştırmalarda Đki Aşamalı Kümeleme (Two-Step Clustering
Eurasian Journal of Educational Research, 28, pp, 89-99 / 2007 Araştırmalarda Đki Aşamalı Kümeleme (Two-Step Clustering) Analizi ve Bir Uygulaması Murat KAYRĐ Öz Problem Durumu: Heterojen olan bir veri setinin elde edeceği tanımlayıcı istatistik ve parametre tahminleme denklem değerlerinin sapmalı olacağı bildirilmektedir. Heterojen olan veri setinin homojen olan alt sınıf ya da kümelere bölünmesinden sonra elde edilen istatistiksel çalışmaların daha sağlıklı sonuçlara sahip olduğu literatürde bildirilmektedir. Eğitim bilimleri araştırmaları için veri setindeki birey ya da değişkenlerin çok olması durumunda iki aşamalı kümeleme analizinin uygulanabilirliği çalışmanın temel problemini oluşturmaktadır. Araştırmanın amacı: Bu çalışmada, genel amacı gruplanmamış verileri benzerliklerine göre kümelemek olan iki aşamalı kümeleme analizi ele alınmıştır. Küme sayısı hususunda bir ön bilginin olmadığı durumlarda kullanılabilen iki aşamalı kümeleme analizinin avantaj ve dezavantajları irdelenmiştir. Özellikle gizli sınıf (latent class) ve küme analiz (cluster analysis) ileri istatistik tekniklerinin log-olabilirlik (log-likelihood) uzayında verileri nasıl grupladığı ve yine aynı uzay içerisinde kullanmış olduğu Bayesçi bilgi ve Akaike bilgi ölçütlerinin (BIC, AIC) nasıl bir fonksiyon üstlendikleri açıklanmaya çalışılmıştır. Araştırmanın Yöntemi: Örneklem olarak Doğu Anadolu bölgesindeki büyük bir üniversitede okuyan 608 öğrenciye ait bir veri seti incelenmiştir. Bu veri setine ait 7 adet değişken kullanılmıştır. Bu verilerden üç tanesi sürekli değişken (öss puanı, mekik skoru, oöbp), geriye kalan dört değişken ise kategorik özellik arz etmektedir (baba mesleği, lise mezuniyet kolu, bölge ve cinsiyet) . Bu 7 değişken merkezli 608 birey kümelenmiştir. 608 bireyden oluşan veri setine iki aşamalı kümeleme yöntemi kullanılmıştır. Bulgular ve Sonuçlar: Bu çalışmanın sonucunda, log-olabilirlik temelli Bayesçi bilgi kriteri (BIC)doğrultusunda 608 birey ortak özellikleri bakımından (7 değişken merkezinde) 7 kümeye anlamlı bir şekilde bölünmüştür. Đki aşamalı kümeleme analizinin sürekli ve kategorik verileri bir arada kümeleyebildiği gözlemlenmiştir. Yine bu çalışmada iki aşamalı kümeleme analizinin sürekli ve kategorik değişkenleri kümelemede bazen yetersiz kaldığı bulgusuna rastlanmıştır. Bununla birlikte sürekli değişkenleri ideal düzeyde kümeleyebildiği kabul edilmiştir. Öneriler: Eğitim bilimcilerin karışık (sophisticated) istatistik içerikli araştırmalarında bu tür ileri düzey istatistikleri bilinçli bir şekilde kullanmaları önerilmektedir. Bu çalışma ile iki aşamalı küme analiz tekniğinin bilimsel çalışmalara farklı bir ışık tutacağı düşünülmektedir. Sınırlılıkları ile birlikte iki aşamalı kümeleme analizinin homojen olmayan büyük veri setlerine uygulanabilirliği kanısına varılmıştır. Anahtar Sözcükler: Küme analizi, iki aşamalı kümeleme analizi, Bayesçi bilgi ölçütü, eğitim bilimleri 89
Benzer belgeler
P9-Kümeleme Analizi - Başkent Üniversitesi Tıp Fakültesi
içinde bulunan gözlemlerden ortalama uzaklığını esas alır.
Hiyerarşik kümeleme tekniklerinde kümeler art arda birleştirilir ve bir grup diğeri ile bir
kez birleştirildikten sonra, devam eden adımla...