Küme analizi veya kümeleme, bir grup nesneyi aynı gruba diğer gruplardaki olanlardan daha birbirlerine benzer şekilde gruplandırmaktır.

Basitçe, amaç benzer özelliklere sahip grupları ayırmak ve onları kümelere atamaktır.

Örneğin, bir tekstil şirketinin başındasınız ve işinizi büyütmek için müşterilerinizin tercihlerini anlamak istiyorsunuz. Her müşterinin ayrıntılarına bakmanız ve her biri için benzersiz bir iş stratejisi geliştirmeniz gerekiyor, ancak bu neredeyse imkansız. Yapabileceğiniz, tüm müşterilerinizi satın alma alışkanlıklarına dayalı olarak on gruba ayırmak ve bu on grubun her birinde müşteriler için ayrı bir strateji kullanmak olacaktır. Buna kümeleme diyoruz.

Kümeleme Algoritması Türleri:

  • Bağlantı Modelleri: Bu modeller veri alanındaki veri noktalarının birbirlerine daha uzaktaki veri noktalarından daha fazla benzerlik sergilediği düşüncesine dayanmaktadır.
  • Merkez Modelleri: Bunlar, bir veri noktasının kümelerin merkezine yakın olmasıyla benzerlik kavramının türetildiği yinelemeli kümeleme algoritmalarıdır. K-Means kümeleme algoritması, bu kategoriye giren popüler bir algoritmadır. Bu modellerde, sonunda gerekli olan kümelerin önceden belirlenmesinden önce, veri kümesiyle ilgili önceden bilgi sahibi olmayı önemsemektedir. Bu modeller, yerel optimumu bulmak için yinelemeli olarak çalışır.
  • Dağılım Modelleri: Bu kümeleme modelleri, kümedeki tüm veri noktalarının aynı dağılıma (örneğin: Normal, Gauss) ait olma ihtimali üzerine kuruludur. Bu modeller çoğunlukla aşırı uyum gösterir. Bu modellerin popüler bir örneği, çok değişkenli normal dağılımları kullanan beklenti maksimizasyon algoritmasıdır.
  • Yoğunluk Modelleri: Bu modeller, veri alanındaki veri noktalarının yoğunluğunun yoğun olduğu alanlar için veri alanını arar. Farklı yoğunluk bölgelerini izole eder ve bu bölgelerdeki veri noktalarını aynı kümeye atar. Yoğunluk modellerinin popüler örnekleri DBSCAN ve OPTICS’dir.

 

Designed by Freepik