Verinin Yapısı


Verinin Yapısı Yapılandırılmış ve Yapılandırılmamış Veri Geleneksel veriler olarak da bilinen yapılandırılmış veriler çoğunlukla çok iyi organize edilmiş bilgileri içeren metin dosyalarıdır. Yapılandırılmış veriler genelde daha etkili işlemenin sağlanabilmesi ve analizlerin gerçekleştirilebilmesi için biçimlendirilmiş bir veritabanında, veri ambarında saklanan düzenli verilerdir. Büyük veriden önce, yapılandırılmış veriler şirketlerin stratejik iş kararlarını vermek için kullandığı tek şeydi çünkü yapılandırılmış veriler çok iyi organize edilebilmekle beraber işlenmesi de … Okumaya devam et Verinin Yapısı

Veri Kaynakları


Veri Kaynakları Birincil ve İkincil Veri Birincil veriler, incelenmekte olan olayın gerçek tanığı olan araştırmacının kendisi tarafından ilk elden toplanan verilerdir. İkincil veriler ise daha önce başkası tarafından toplanan veriler anlamına gelir. Birincil veriler gerçek zamanlı veriler iken ikincil veriler geçmiş verilerdir. Birincil verilere, anketler, gözlemler, deneyler ve kişisel görüşmeler örnek olarak verilirken ikincil verilere, devlet yayınları, web siteleri, kitaplar, gazete ve dergi yazıları örnek … Okumaya devam et Veri Kaynakları

Boyutsallığın Laneti


Boyutsallığın Laneti Gerçek dünyadaki verileri doğru bir şekilde temsil edebilmek için yalnızca 1 veya 2 boyuttan daha fazlasına ihtiyaç duyarız. İlk olarak, boyutsallığın veri setlerimiz üzerindeki etkisini inceleyelim. Sadece Ev 1’e ait öznitelikler aşağıdaki gibi. Şimdi Ev 1’e ait olan öznitelikleri biraz zenginleştirelim. Ev 1’e ait öznitelik vektörlerimizi bütün evler için genişlettiğimiz zaman artık 3 boyutlu bir veri setine sahip olacağız. Makine öğrenmesi modellerinin öğrenme … Okumaya devam et Boyutsallığın Laneti

Verinin Temsil Edilmesi


Bilgisayarlar aslında büyük birer hesap makineleridir ve makine öğrenmesi sistemlerini besleyen veriler de bu nedenle matematiksel birer nesne olmak zorundadır. Skaler: Skaler, bir tek sayıdır. Matematikte skalerlerin ait olduğu değerler kümesini tanımlamak gerekir. notasyonu skalerinin gerçek sayılar kümesinin bir elemanı olduğunu gösterir. Makine öğrenmesi de çeşitli sayı kümeleri ile ilgilenir. doğal sayılar kümesidir, tam sayılar kümesidir, rasyonel sayılar kümesidir. Vektör: Vektör, sayıların sıralı dizileridir. Vektörler, … Okumaya devam et Verinin Temsil Edilmesi

Tek Değişkenli Analiz ve İki Değişkenli Analiz (Univariate Analysis, Bivariate Analysis)


İçerik Tek Değişkenli Analiz√ Kategorik Değişkenler√ Sayısal Değişkenler√ İki değişkenli Analiz√ Sayısal ve Sayısal√ Dağılım grafiği√ Doğrusal Korelasyon√ Kategorik ve Kategorik√ Yığılmış Sütun Grafiği√ Kombinasyon Tablosu√ Ki-Kare Testi√ Sayısal ve Kategorik√ Hata Çubuklarıyla Çizgi Grafik√  Kombinasyon Tablosu√ Z-testi ve t-testi√ Varyans Analizi (ANOVA)√ Tek Değişkenli Analiz Tek değişkenli analiz, değişkenleri(nitelikleri) tek tek inceler. Değişkenler kategorik veya sayısal olabilir. Her değişken türü için farklı istatistiksel ve … Okumaya devam et Tek Değişkenli Analiz ve İki Değişkenli Analiz (Univariate Analysis, Bivariate Analysis)

Veri Araştırması (Data Exploration)


Makine Öğrenmesi, Veri Madenciliği, Veri Analizi, Veri Bilimi bu içiçe geçmiş tüm disiplinler veri ile çalışmaktadır. Veriyi anlamak, veri ile çalışan bütün disiplinler için en başta gelmektedir. Veri Araştırması, verilerin istatistiksel ve görselleştirme teknikleriyle tanımlanması ile ilgilidir. Veri araştırması için herhangi bir kısayol yoktur. Makine Öğrenmesi ile bir süre uğraştıktan sonra, modelin doğruluğunu geliştirme konusunda mücadele ettiğinizin farkına varacaksınız. Böyle bir durumda veri araştırması teknikleri aklınıza … Okumaya devam et Veri Araştırması (Data Exploration)