Öznitelik Mühendisliği


Öznitelik Mühendisliği Makine öğrenmesinde modellere verilen gerçek dünya verileri birer öznitelik vektörü halindedir ve bu öznitelik vektörleri ham veriden çıkartılır. Öznitelik mühendisliği, makine öğrenmesi modeli veya görevi için verilerden en uygun özellikleri elde etme işlemidir. Özelliklerin kendileri kadar sayısı da önemlidir, modele verilen, gerçek dünya verilerini temsil eden öznitelik vektörlerindeki özellikler yeterli değilse model asıl görevini yerine getiremeyecektir; eğer gereğinden fazla ve alakasız özellikler içeren … Okumaya devam et Öznitelik Mühendisliği

Büyük Veri ve Küçük Veri


Büyük Veri ve Küçük Veri Büyük veri, varolan geleneksel yöntemlerle etkili bir şekilde işlenemeyen, analiz edilemeyen çok sayıda veriyi ifade eder. Geleneksel yaklaşımlar ile analiz edilemeyen ve işlenemeyen büyük miktardaki bu veri kullanılabilir değildir. Büyük veri altyapılarının ve teknolojilerinin gelişmesi ile, büyük veri analizleri gerçekleştirilebilir bir hale gelmiştir. Böylece, büyük hacimli bu veri kümelerinden faydalı bilgilerin çıkartılması sağlanabilmektedir. Büyük veri, doğru analiz yöntemleri ile işlendiğinde, … Okumaya devam et Büyük Veri ve Küçük Veri

Veri Nesneleri ve Öznitelik Çeşitleri


Veri Nesneleri ve Öznitelik Çeşitleri Veri setleri, genelde vektörler ile ifade edilebilen veri nesnelerinden oluşmaktadır. Veri nesnelerini ise öznitelikler oluşturur. Veri nesneleri eğer bir veri tabanında saklanabiliyorsa, veritabanının satırları veri nesnelerine ve sütunlar da özniteliklere karşılık gelir. Bir öznitelik, veri nesnesinin bir özelliğini, niteliğini temsil eden bir veri alanıdır..Veri madenciliğinde özniteliklere değişken veya nitelik, veri ambarında özniteliklere boyut denirken makine öğrenmesinde verinin her özniteliğine bir … Okumaya devam et Veri Nesneleri ve Öznitelik Çeşitleri

Veri Türleri


Veri Türleri Nitel ve Nicel Veri Nitel veriler belirli bir sorun hakkında içgörü ve anlayış sağlayan verileri ifade eder. Nitel veri tanımlayıcıdır ancak hesaplanamaz ve bu nedenle analiz edilmesi biraz zordur. Adından da anlaşılacağı gibi nicel veriler, nicelikle veya sayılarla ilgilenir. Değerleri hesaplanabilen ve sayılabilen, sayısal terimlerle ifade edilebilen veriler nicel veriler olarak adlandırır. Kısaca nitel veriler, nesnelerin sınıflandırılmasının nesnelerin niteliklerine ve özelliklere dayandığı veri … Okumaya devam et Veri Türleri

Verinin Yapısı


Verinin Yapısı Yapılandırılmış ve Yapılandırılmamış Veri Geleneksel veriler olarak da bilinen yapılandırılmış veriler çoğunlukla çok iyi organize edilmiş bilgileri içeren metin dosyalarıdır. Yapılandırılmış veriler genelde daha etkili işlemenin sağlanabilmesi ve analizlerin gerçekleştirilebilmesi için biçimlendirilmiş bir veritabanında, veri ambarında saklanan düzenli verilerdir. Büyük veriden önce, yapılandırılmış veriler şirketlerin stratejik iş kararlarını vermek için kullandığı tek şeydi çünkü yapılandırılmış veriler çok iyi organize edilebilmekle beraber işlenmesi de … Okumaya devam et Verinin Yapısı

Veri Kaynakları


Veri Kaynakları Birincil ve İkincil Veri Birincil veriler, incelenmekte olan olayın gerçek tanığı olan araştırmacının kendisi tarafından ilk elden toplanan verilerdir. İkincil veriler ise daha önce başkası tarafından toplanan veriler anlamına gelir. Birincil veriler gerçek zamanlı veriler iken ikincil veriler geçmiş verilerdir. Birincil verilere, anketler, gözlemler, deneyler ve kişisel görüşmeler örnek olarak verilirken ikincil verilere, devlet yayınları, web siteleri, kitaplar, gazete ve dergi yazıları örnek … Okumaya devam et Veri Kaynakları

Boyutsallığın Laneti


Boyutsallığın Laneti Gerçek dünyadaki verileri doğru bir şekilde temsil edebilmek için yalnızca 1 veya 2 boyuttan daha fazlasına ihtiyaç duyarız. İlk olarak, boyutsallığın veri setlerimiz üzerindeki etkisini inceleyelim. Sadece Ev 1’e ait öznitelikler aşağıdaki gibi. Şimdi Ev 1’e ait olan öznitelikleri biraz zenginleştirelim. Ev 1’e ait öznitelik vektörlerimizi bütün evler için genişlettiğimiz zaman artık 3 boyutlu bir veri setine sahip olacağız. Makine öğrenmesi modellerinin öğrenme … Okumaya devam et Boyutsallığın Laneti

Öznitelik Vektörü


Öznitelik Vektörü Öznitelik vektörleri (özellik vektörleri), gerçek dünyada ele alınamayacak kadar karmaşık olabilen verilerin makinelerin anlayabileceği bir şekilde basitleşirilmiş bir halidir. Emlak sektörünü ele alalım; emlakçılar, birbirinden farklı birçok evi kiraya vermeye ve satmaya çalışıyorlar. Pazarlamaya çalıştıkları evler, gerçek dünyada müşterilerine tarif ettiklerinden çok daha fazla özelliğe sahiptir ancak bir evi tanımlayabilmek için yeteri sayıda bilgi içeren bir özellik kümesi kullanıyorlar. Evleri anlatırken evin konumundan, … Okumaya devam et Öznitelik Vektörü

Lineer Cebir


Lineer Cebir Lineer cebir (doğrusal cebir), vektörler, matrisler ve doğrusal dönüşümlerle ilgilenen matematiğin bir alt alanıdır. Lineer cebir, yüksek boyutlardaki düzlemlerin, koordinatlarını ve etkileşimlerini daha kesin olarak tanımlamaya ve üzerinde işlem yapmaya olanak sağlar. Lineer cebir kavramları, makine öğrenmesinin özellikle derin öğrenmenin arkasındaki teoriyi anlamak için çok önemlidir. Makine öğrenmesine başlamadan önce lineer cebiri anlamanıza gerek yoktur ancak bir noktada, farklı makine öğrenmesi algoritmalarının gerçekte … Okumaya devam et Lineer Cebir

Verinin Temsil Edilmesi


Bilgisayarlar aslında büyük birer hesap makineleridir ve makine öğrenmesi sistemlerini besleyen veriler de bu nedenle matematiksel birer nesne olmak zorundadır. Skaler: Skaler, bir tek sayıdır. Matematikte skalerlerin ait olduğu değerler kümesini tanımlamak gerekir. notasyonu skalerinin gerçek sayılar kümesinin bir elemanı olduğunu gösterir. Makine öğrenmesi de çeşitli sayı kümeleri ile ilgilenir. doğal sayılar kümesidir, tam sayılar kümesidir, rasyonel sayılar kümesidir. Vektör: Vektör, sayıların sıralı dizileridir. Vektörler, … Okumaya devam et Verinin Temsil Edilmesi