Verinin Yapısı


Verinin Yapısı Yapılandırılmış ve Yapılandırılmamış Veri Geleneksel veriler olarak da bilinen yapılandırılmış veriler çoğunlukla çok iyi organize edilmiş bilgileri içeren metin dosyalarıdır. Yapılandırılmış veriler genelde daha etkili işlemenin sağlanabilmesi ve analizlerin gerçekleştirilebilmesi için biçimlendirilmiş bir veritabanında, veri ambarında saklanan düzenli verilerdir. Büyük veriden önce, yapılandırılmış veriler şirketlerin stratejik iş kararlarını vermek için kullandığı tek şeydi çünkü yapılandırılmış veriler çok iyi organize edilebilmekle beraber işlenmesi de … Okumaya devam et Verinin Yapısı

Veri Kaynakları


Veri Kaynakları Birincil ve İkincil Veri Birincil veriler, incelenmekte olan olayın gerçek tanığı olan araştırmacının kendisi tarafından ilk elden toplanan verilerdir. İkincil veriler ise daha önce başkası tarafından toplanan veriler anlamına gelir. Birincil veriler gerçek zamanlı veriler iken ikincil veriler geçmiş verilerdir. Birincil verilere, anketler, gözlemler, deneyler ve kişisel görüşmeler örnek olarak verilirken ikincil verilere, devlet yayınları, web siteleri, kitaplar, gazete ve dergi yazıları örnek … Okumaya devam et Veri Kaynakları

Boyutsallığın Laneti


Boyutsallığın Laneti Gerçek dünyadaki verileri doğru bir şekilde temsil edebilmek için yalnızca 1 veya 2 boyuttan daha fazlasına ihtiyaç duyarız. İlk olarak, boyutsallığın veri setlerimiz üzerindeki etkisini inceleyelim. Sadece Ev 1’e ait öznitelikler aşağıdaki gibi. Şimdi Ev 1’e ait olan öznitelikleri biraz zenginleştirelim. Ev 1’e ait öznitelik vektörlerimizi bütün evler için genişlettiğimiz zaman artık 3 boyutlu bir veri setine sahip olacağız. Makine öğrenmesi modellerinin öğrenme … Okumaya devam et Boyutsallığın Laneti

Öznitelik Vektörü


Öznitelik Vektörü Öznitelik vektörleri (özellik vektörleri), gerçek dünyada ele alınamayacak kadar karmaşık olabilen verilerin makinelerin anlayabileceği bir şekilde basitleşirilmiş bir halidir. Emlak sektörünü ele alalım; emlakçılar, birbirinden farklı birçok evi kiraya vermeye ve satmaya çalışıyorlar. Pazarlamaya çalıştıkları evler, gerçek dünyada müşterilerine tarif ettiklerinden çok daha fazla özelliğe sahiptir ancak bir evi tanımlayabilmek için yeteri sayıda bilgi içeren bir özellik kümesi kullanıyorlar. Evleri anlatırken evin konumundan, … Okumaya devam et Öznitelik Vektörü

Lineer Cebir


Lineer Cebir Lineer cebir (doğrusal cebir), vektörler, matrisler ve doğrusal dönüşümlerle ilgilenen matematiğin bir alt alanıdır. Lineer cebir, yüksek boyutlardaki düzlemlerin, koordinatlarını ve etkileşimlerini daha kesin olarak tanımlamaya ve üzerinde işlem yapmaya olanak sağlar. Lineer cebir kavramları, makine öğrenmesinin özellikle derin öğrenmenin arkasındaki teoriyi anlamak için çok önemlidir. Makine öğrenmesine başlamadan önce lineer cebiri anlamanıza gerek yoktur ancak bir noktada, farklı makine öğrenmesi algoritmalarının gerçekte … Okumaya devam et Lineer Cebir

Verinin Temsil Edilmesi


Bilgisayarlar aslında büyük birer hesap makineleridir ve makine öğrenmesi sistemlerini besleyen veriler de bu nedenle matematiksel birer nesne olmak zorundadır. Skaler: Skaler, bir tek sayıdır. Matematikte skalerlerin ait olduğu değerler kümesini tanımlamak gerekir. notasyonu skalerinin gerçek sayılar kümesinin bir elemanı olduğunu gösterir. Makine öğrenmesi de çeşitli sayı kümeleri ile ilgilenir. doğal sayılar kümesidir, tam sayılar kümesidir, rasyonel sayılar kümesidir. Vektör: Vektör, sayıların sıralı dizileridir. Vektörler, … Okumaya devam et Verinin Temsil Edilmesi

Varyasyonel Otomatik Kodlayıcı (Variational Autoencoder)


Otomatik Kodlayıcılar hakkında daha fazla bilgi için tıklayınız. Varyasyonel Otomatik Kodlayıcı Nedir? Standart otomatik kodlayıcılar, kompakt gösterimleri oluşturmayı (veri sıkıştırma işlevini) ve girdileri iyi bir şekilde yeniden yapılandırmayı öğrenirler, gürültü giderici otomatik kodlayıcı gibi birkaç otomatik kodlayıcı dışında diğerleri uygulamada oldukça sınırlıdırlar. Otomatik kodlayıcıların üretim için temel sorunu, girdilerini, kodlanmış vektörlerin bulunduğu uzaya dönüştürdüğü gizli alanın (latent space) sürekli olmaması veya kolay enterpolasyona izin vermesidir. Ancak, üretici bir … Okumaya devam et Varyasyonel Otomatik Kodlayıcı (Variational Autoencoder)

Seyrek Otomatik Kodlayıcı (Sparse Autoencoder)


Otomatik Kodlayıcılar hakkında daha fazla bilgi için tıklayınız. Seyrek Otomatik Kodlayıcı Nedir? Otomatik kodlayıcının girdi verisini temsil eden yararlı özellikleri öğrenmesi için iki yoldan bahsetmiştik: kod boyutunu küçük tutmak (i.e. vanilla autoencoder) ve gürültü giderici otomatik kodlayıcılar. Üçüncü yöntem ise düzenli hale getirme (regularization) kullanıyor. Gürültü Giderici Otomatik Kodlayıcı (Denoising Autoencoder)  ile ilgili yazıda düzenlenmiş otomatik kodlayıcılardan bahsetmiştik. Düzenlenmiş otomatik kodlayıcıları hatırlayalım. Düzenlenmiş otomatik kodlayıcılar (regularized autoencoder) lineer olmayan (non-linear) … Okumaya devam et Seyrek Otomatik Kodlayıcı (Sparse Autoencoder)

Gürültü Giderici Otomatik Kodlayıcı (Denoising Autoencoder)


Otomatik Kodlayıcılar hakkında daha fazla bilgi için tıklayınız. Gürültü Giderici Otomatik Kodlayıcı Nedir? Gürültü giderici otomatik kodlayıcı, denoising autoencoder (DAE), girdi verilerinden anlamlı ve sağlam özellikler çıkarmak için eğitilen özel bir sinir ağıdır. Gürültü giderici otomatik kodlayıcı, overcomplete yapıdadır. Overcomplete otomatik kodlayıcıların, girdiden yararlı özellikleri çıkartabilmesi için bazı düzenlemeler yapılmalıdır. Bu tarz otomatik kodlayıcılara düzenlenmiş otomatik kodlayıcı (regularized autoencoder) denir. Düzenlenmiş otomatik kodlayıcılar lineer olmayan … Okumaya devam et Gürültü Giderici Otomatik Kodlayıcı (Denoising Autoencoder)

Otomatik Kodlayıcı (Autoencoder)


Otomatik Kodlayıcı Nedir? Otomatik kodlayıcı, girdi katmanındaki değerleri çıktı katmanına kopyalayan bir sinir ağıdır. Yani, sinir ağına girdi olarak verdiğimiz veriyi, çıktı katmanında tekrar oluştururuz. Otomatik kodlayıcı, veri setini eğitirken belirgin olarak (explicit) etiketlerin belirlenmediği bir denetimsiz öğrenme modelidir. Otomatik kodlayıcı, veriyi eğitirken kendi etiketlerini kendi ürettiği için öz-denetimli (self-supervised) bir öğrenme modeli olarak da geçer. Bu sinir ağı iki ayrı fazdan oluşmaktadır; kodlayıcı (encoder) … Okumaya devam et Otomatik Kodlayıcı (Autoencoder)