Keşifsel Veri Analizi


Keşifsel Veri Analizi Keşifsel veri analizi veya açıklayıcı veri analizi (exploratory data analysis (EDA)), verilerin derlenmesinden ve öznitelik mühendisliğinden sonra, herhangi bir makine öğrenmesi modellemesinin yapılmasından önce, gerçekleştirilmesi gereken çok önemli bir süreçtir. Keşifsel veri analizi, veri setine ilişkin içgörüyü oluşturabilmek ve geliştirebilmek, verinin altında yatan yapıyı veya örüntüyü ortaya çıkarabilmek, veriye ait önemli değişkenleri ve değişkenler arasındaki ilişkiyi açıklayabilmek, aykırı değerleri ve anomalileri tespit … Okumaya devam et Keşifsel Veri Analizi

Olasılık – Bayes Teoremi


Olasılık Olasılık, temelde iki türe ayrılabilir; öznel olasılık, belirli bir olayın ortaya çıkıp çıkmadığına dair kişisel kararlardan türetilmiş bir olasılık türüdür ve nesnel olasılık ise kaydedilen gözlemleri kullanarak bir olayın olabileceği ihtimalini tahmin etmeye dayanan bir olasılık türüdür. Yani, nesnel olasılık, tekrarlanabilen rastgele bir deneye bağlıdır ve öznel olasılık ise kişiden kişiye, günden güne değişebilen kişisel inançlara ve deneyimlere dayanmaktadır. Nesnel olasılık içerisinde, klasik olasılık … Okumaya devam et Olasılık – Bayes Teoremi

İstatistiksel Çıkarım – Tahminleme – Hipotez Testleri


İstatistiksel Çıkarım İstatistiksel çıkarım, belirli veri örneklerine dayanarak tüm veri hakkında çıkarımlar yapmakla ilgilenir. Veri örnekleri ile verilen veriyi daha iyi anlayabilmek için farklı tahmin testleriyle birlikte hipotez testleri kullanılabilmektedir. İstatistiksel Tahminleme Bir tahmin edici, veri parametresini (örneğin veri kümesinin ortalaması, medyanı), veri örnekleri (örneklem) üzerinden elde edebilen bilgilere dayanan rastgele bir değişkendir ve tahmin edicinin aldığı değerler bilinmeyen veri parametresi hakkında yaklaşık bir değer … Okumaya devam et İstatistiksel Çıkarım – Tahminleme – Hipotez Testleri

Merkezi Limit Teoremi


İstatistikte, hakkında araştırma yapılacak birimler topluluğuna evren adı verilir ve bu sonlu evrenin içerisindeki her birim üzerinden, araştırma kapsamında, istenen bilgilerin elde edilmesi, yani, verilerin derlenmesi işlemine tamsayım denir. Tamsayım sonucunda bir veri kümesi elde edilir. Evrenden, sınırlı sayıda birimin, çeşitli yöntemler ile seçilmesi işlemine örnekleme ve seçilen birimlere örneklem adı verilir. Tanımlanan evrene ilişkin sayısal karakteristiklere parametre denir. Tamsayım yapılamadığı durumlarda, örneklem istatistiklerinden, istatistiksel … Okumaya devam et Merkezi Limit Teoremi

Veri Dağılımının Şekli


Veri Dağılımının Şekli Veri kümesinin dağılımı görselleştirildiğinde, yalnızca bir tepeye sahip ise tek modlu dağılım, iki tepeye sahip ise iki modlu dağılım olarak adlandırılır. Tek modlu dağılımda, eğer bu tepe, grafiğin tam ortasında meydana gelirse, bu çan şeklindeki bir dağılımdır. Eğer grafiğin sağ ve sol yarısı birbirinin aynada yansımış hali gibi ise de bu dağılıma simetrik denir. Çan şeklindeki bir normal dağılım en bilinen simetrik … Okumaya devam et Veri Dağılımının Şekli

Veri Dağılım Ölçüleri


Veri Dağılım Ölçüleri Veri dağılım ölçüleri bir veri kümesinin nasıl yayıldığını açıklamanın bir yoludur. Veri dağılım ölçülerinin değerleri negatif olmayan gerçek sayılardır; tüm veriler aynı olduğunda veri dağılım ölçüsü sıfır ve veriler daha çeşitli hale geldikçe ölçünün değeri artmaktadır. Veri dağılım ölçüleri verinin ne kadar değişken olduğunu göstermeye yarar ve çeyrekler açıklığı, varyans ile standart sapma en sık kullanılan ölçülerdir. Aralık, Çeyreklik ve Çeyrekler Açıklığı … Okumaya devam et Veri Dağılım Ölçüleri

Merkezi Eğilim Ölçüleri


Merkezi Eğilim Ölçüleri Betimsel istatistiğin ilgilendiği alanların başında merkezi eğilim ölçüleri ve veri dağılım ölçüleri gelir. Merkezi eğilim ölçüsü, bir veri kümesinin merkezi konumunu belirleyerek bu veri kümesini tanımlamaya çalışan tek bir değerdir. Kısaca, merkezi eğilim ölçüsü, bir veri kümesinin merkez noktasını veya tipik değerini temsil eden istatistiki bir özettir. İstatistikte, merkezi eğilimin en yaygın ölçüsü olarak ortalama, medyan ve mod kullanılır. Aritmetik Ortalama Bir … Okumaya devam et Merkezi Eğilim Ölçüleri

İstatistik


İstatistik İstatistik, belirli bir amaç için verilerin toplanması, sınıflandırılması, sunulması, çözümlenmesi ve sonuçların yorumlanması süreçlerini içeren bir yöntemler bilimidir. İstatistik, betimsel istatistik ve çıkarımsal istatistik olarak ikiye ayrılabilir. Betimsel istatistik bu toplanan verilerin derlenmesi, özetlenmesi ve analiz edilmesi ile ilgilenir. Çıkarımsal istatistik veya istatistiksel çıkarım ise verinin analiz edilmesi ile verinin ait olduğu dağılımın özelliklerini anlama ve ilgili çıkarımlarda bulunma süreçleri ile ilgilenir. Makine öğrenmesi … Okumaya devam et İstatistik

Veri Nesneleri ve Öznitelik Çeşitleri


Veri Nesneleri ve Öznitelik Çeşitleri Veri setleri, genelde vektörler ile ifade edilebilen veri nesnelerinden oluşmaktadır. Veri nesnelerini ise öznitelikler oluşturur. Veri nesneleri eğer bir veri tabanında saklanabiliyorsa, veritabanının satırları veri nesnelerine ve sütunlar da özniteliklere karşılık gelir. Bir öznitelik, veri nesnesinin bir özelliğini, niteliğini temsil eden bir veri alanıdır..Veri madenciliğinde özniteliklere değişken veya nitelik, veri ambarında özniteliklere boyut denirken makine öğrenmesinde verinin her özniteliğine bir … Okumaya devam et Veri Nesneleri ve Öznitelik Çeşitleri

Verinin Yapısı


Verinin Yapısı Yapılandırılmış ve Yapılandırılmamış Veri Geleneksel veriler olarak da bilinen yapılandırılmış veriler çoğunlukla çok iyi organize edilmiş bilgileri içeren metin dosyalarıdır. Yapılandırılmış veriler genelde daha etkili işlemenin sağlanabilmesi ve analizlerin gerçekleştirilebilmesi için biçimlendirilmiş bir veritabanında, veri ambarında saklanan düzenli verilerdir. Büyük veriden önce, yapılandırılmış veriler şirketlerin stratejik iş kararlarını vermek için kullandığı tek şeydi çünkü yapılandırılmış veriler çok iyi organize edilebilmekle beraber işlenmesi de … Okumaya devam et Verinin Yapısı