Veri Nesneleri ve Öznitelik Çeşitleri


Veri Nesneleri ve Öznitelik Çeşitleri Veri setleri, genelde vektörler ile ifade edilebilen veri nesnelerinden oluşmaktadır. Veri nesnelerini ise öznitelikler oluşturur. Veri nesneleri eğer bir veri tabanında saklanabiliyorsa, veritabanının satırları veri nesnelerine ve sütunlar da özniteliklere karşılık gelir. Bir öznitelik, veri nesnesinin bir özelliğini, niteliğini temsil eden bir veri alanıdır..Veri madenciliğinde özniteliklere değişken veya nitelik, veri ambarında özniteliklere boyut denirken makine öğrenmesinde verinin her özniteliğine bir … Okumaya devam et Veri Nesneleri ve Öznitelik Çeşitleri

Veri Türleri


Veri Türleri Nitel ve Nicel Veri Nitel veriler belirli bir sorun hakkında içgörü ve anlayış sağlayan verileri ifade eder. Nitel veri tanımlayıcıdır ancak hesaplanamaz ve bu nedenle analiz edilmesi biraz zordur. Adından da anlaşılacağı gibi nicel veriler, nicelikle veya sayılarla ilgilenir. Değerleri hesaplanabilen ve sayılabilen, sayısal terimlerle ifade edilebilen veriler nicel veriler olarak adlandırır. Kısaca nitel veriler, nesnelerin sınıflandırılmasının nesnelerin niteliklerine ve özelliklere dayandığı veri … Okumaya devam et Veri Türleri

Verinin Yapısı


Verinin Yapısı Yapılandırılmış ve Yapılandırılmamış Veri Geleneksel veriler olarak da bilinen yapılandırılmış veriler çoğunlukla çok iyi organize edilmiş bilgileri içeren metin dosyalarıdır. Yapılandırılmış veriler genelde daha etkili işlemenin sağlanabilmesi ve analizlerin gerçekleştirilebilmesi için biçimlendirilmiş bir veritabanında, veri ambarında saklanan düzenli verilerdir. Büyük veriden önce, yapılandırılmış veriler şirketlerin stratejik iş kararlarını vermek için kullandığı tek şeydi çünkü yapılandırılmış veriler çok iyi organize edilebilmekle beraber işlenmesi de … Okumaya devam et Verinin Yapısı

Veri Kaynakları


Veri Kaynakları Birincil ve İkincil Veri Birincil veriler, incelenmekte olan olayın gerçek tanığı olan araştırmacının kendisi tarafından ilk elden toplanan verilerdir. İkincil veriler ise daha önce başkası tarafından toplanan veriler anlamına gelir. Birincil veriler gerçek zamanlı veriler iken ikincil veriler geçmiş verilerdir. Birincil verilere, anketler, gözlemler, deneyler ve kişisel görüşmeler örnek olarak verilirken ikincil verilere, devlet yayınları, web siteleri, kitaplar, gazete ve dergi yazıları örnek … Okumaya devam et Veri Kaynakları

Boyutsallığın Laneti


Boyutsallığın Laneti Gerçek dünyadaki verileri doğru bir şekilde temsil edebilmek için yalnızca 1 veya 2 boyuttan daha fazlasına ihtiyaç duyarız. İlk olarak, boyutsallığın veri setlerimiz üzerindeki etkisini inceleyelim. Sadece Ev 1’e ait öznitelikler aşağıdaki gibi. Şimdi Ev 1’e ait olan öznitelikleri biraz zenginleştirelim. Ev 1’e ait öznitelik vektörlerimizi bütün evler için genişlettiğimiz zaman artık 3 boyutlu bir veri setine sahip olacağız. Makine öğrenmesi modellerinin öğrenme … Okumaya devam et Boyutsallığın Laneti

Öznitelik Vektörü


Öznitelik Vektörü Öznitelik vektörleri (özellik vektörleri), gerçek dünyada ele alınamayacak kadar karmaşık olabilen verilerin makinelerin anlayabileceği bir şekilde basitleşirilmiş bir halidir. Emlak sektörünü ele alalım; emlakçılar, birbirinden farklı birçok evi kiraya vermeye ve satmaya çalışıyorlar. Pazarlamaya çalıştıkları evler, gerçek dünyada müşterilerine tarif ettiklerinden çok daha fazla özelliğe sahiptir ancak bir evi tanımlayabilmek için yeteri sayıda bilgi içeren bir özellik kümesi kullanıyorlar. Evleri anlatırken evin konumundan, … Okumaya devam et Öznitelik Vektörü

Verinin Temsil Edilmesi


Bilgisayarlar aslında büyük birer hesap makineleridir ve makine öğrenmesi sistemlerini besleyen veriler de bu nedenle matematiksel birer nesne olmak zorundadır. Skaler: Skaler, bir tek sayıdır. Matematikte skalerlerin ait olduğu değerler kümesini tanımlamak gerekir. notasyonu skalerinin gerçek sayılar kümesinin bir elemanı olduğunu gösterir. Makine öğrenmesi de çeşitli sayı kümeleri ile ilgilenir. doğal sayılar kümesidir, tam sayılar kümesidir, rasyonel sayılar kümesidir. Vektör: Vektör, sayıların sıralı dizileridir. Vektörler, … Okumaya devam et Verinin Temsil Edilmesi

Varyasyonel Otomatik Kodlayıcı (Variational Autoencoder)


Otomatik Kodlayıcılar hakkında daha fazla bilgi için tıklayınız. Varyasyonel Otomatik Kodlayıcı Nedir? Standart otomatik kodlayıcılar, kompakt gösterimleri oluşturmayı (veri sıkıştırma işlevini) ve girdileri iyi bir şekilde yeniden yapılandırmayı öğrenirler, gürültü giderici otomatik kodlayıcı gibi birkaç otomatik kodlayıcı dışında diğerleri uygulamada oldukça sınırlıdırlar. Otomatik kodlayıcıların üretim için temel sorunu, girdilerini, kodlanmış vektörlerin bulunduğu uzaya dönüştürdüğü gizli alanın (latent space) sürekli olmaması veya kolay enterpolasyona izin vermesidir. Ancak, üretici bir … Okumaya devam et Varyasyonel Otomatik Kodlayıcı (Variational Autoencoder)

Seyrek Otomatik Kodlayıcı (Sparse Autoencoder)


Otomatik Kodlayıcılar hakkında daha fazla bilgi için tıklayınız. Seyrek Otomatik Kodlayıcı Nedir? Otomatik kodlayıcının girdi verisini temsil eden yararlı özellikleri öğrenmesi için iki yoldan bahsetmiştik: kod boyutunu küçük tutmak (i.e. vanilla autoencoder) ve gürültü giderici otomatik kodlayıcılar. Üçüncü yöntem ise düzenli hale getirme (regularization) kullanıyor. Gürültü Giderici Otomatik Kodlayıcı (Denoising Autoencoder)  ile ilgili yazıda düzenlenmiş otomatik kodlayıcılardan bahsetmiştik. Düzenlenmiş otomatik kodlayıcıları hatırlayalım. Düzenlenmiş otomatik kodlayıcılar (regularized autoencoder) lineer olmayan (non-linear) … Okumaya devam et Seyrek Otomatik Kodlayıcı (Sparse Autoencoder)

Gürültü Giderici Otomatik Kodlayıcı (Denoising Autoencoder)


Otomatik Kodlayıcılar hakkında daha fazla bilgi için tıklayınız. Gürültü Giderici Otomatik Kodlayıcı Nedir? Gürültü giderici otomatik kodlayıcı, denoising autoencoder (DAE), girdi verilerinden anlamlı ve sağlam özellikler çıkarmak için eğitilen özel bir sinir ağıdır. Gürültü giderici otomatik kodlayıcı, overcomplete yapıdadır. Overcomplete otomatik kodlayıcıların, girdiden yararlı özellikleri çıkartabilmesi için bazı düzenlemeler yapılmalıdır. Bu tarz otomatik kodlayıcılara düzenlenmiş otomatik kodlayıcı (regularized autoencoder) denir. Düzenlenmiş otomatik kodlayıcılar lineer olmayan … Okumaya devam et Gürültü Giderici Otomatik Kodlayıcı (Denoising Autoencoder)