Veri analizi, yararlı bilgileri keşfetmek, sonuç çıkarmak ve karar vermeyi desteklemek amacıyla verileri incelemek, temizlemek, dönüştürmek ve modellemek için kullanılan bir süreçtir. Veri analizi, farklı iş, bilim ve sosyal bilim alanlarında çeşitli isimler altında çeşitli teknikleri kapsayan çok yönlü ve farklı yaklaşımlara sahiptir.

Veri entegrasyonu veri analizinin öncüsüdür. Veri analizi, veri görselleştirme ve veri dağılımı ile yakından ilişkilidir. Veri analizi terimi bazen veri modellemesi için eşanlamlı olarak da kullanılır.

VERİ ANALİZİ SÜRECİ

Veri analizi, ham veriler elde ederek bunları kullanıcıların karar vermesinde yararlı bilgilere dönüştürmek için kullanılan bir süreçtir. Önce veriler toplanır sonra da soruları cevaplamak, hipotezleri test etmek veya teorileri reddetmek için analiz edilir.

Veri analizinin çeşitli aşamaları vardır. Aşamalar yinelemelidir.

Veri Gereksinimleri 

Analizin girdisi olarak gerekli olan veriler, analizi yapanların gereklerine veya analizin sonucunu kullanacak müşterilere dayanılarak seçilir. Veriler sayısal veya kategorik olabilir.

Veri Toplama

Veriler çeşitli kaynaklardan toplanabilir. Veri, trafik kameraları, uydular, kayıt cihazları gibi çevredeki sensörler tarafından toplanabilir. Röportajlar, çevrimiçi kaynaklardan indirme veya dokümantasyonlardan da yararlanmak mümkündür.

Veri İşleme 

Başlangıçta elde edilen veriler analiz için işlenmeli veya düzenlenmelidir. Örneğin, bunlar, bir elektronik tablolama veya istatistiksel yazılım gibi daha ileri analizler için bir tablo formatında satırlara ve sütunlara yerleştirilebilir.

Veri Temizleme

Veriler eksik olabilir, tekrarlayabilir veya hatalar içerebilir. Veri temizleme gereksinimi, verilerin elde edilmesi ve saklanması ile ilgili sorunlardan kaynaklanacaktır. Veri temizleme, bu hataları önleme ve düzeltme işlemidir. Veri temizlemenin görevleri arasında, kayıt eşleştirme, verilerin yanlışlığını belirleme, mevcut verilerin genel kalitesi, tekilleştirme ve sütun bölümlemesi bulunur.  Bu tür veri problemleri, çeşitli analitik teknikler aracılığıyla da tespit edilebilir. Belirli eşik değerlerin üstünde veya altında olağandışı miktarlar incelenebilir. Aykırı değer tespiti için nicel veri yöntemleri yanlış girilen muhtemel verileri kaldırmak için kullanılabilir.

Keşifsel Veri Analizi

Veriler temizlendikten sonra analiz edilebilir. Analistler, verilerin içerdiği mesajları anlamaya başlamak için keşifsel veri analizi olarak adlandırılan çeşitli teknikler uygulayabilir. Araştırma süreci, ilave veri temizleme veya ek veri talepleri ile sonuçlanabilir, bu nedenle bu faaliyetler yinelemeli olabilir. Verilerin anlaşılmasına yardımcı olması için ortalama veya medyan gibi tanımlayıcı istatistikler oluşturulabilir. Veri görselleştirme, verinin içindeki mesajlarla ilgili ek bilgi elde etmek için, verileri grafik formatta incelemek için de kullanılabilir.

Modelleme ve Algoritmalar

Değişkenler arasındaki ilişkileri belirlemek için, korelasyon veya nedensellik gibi, algoritmalar adı verilen çeşitli matematiksel formüller veya modeller verilere uygulanabilir. Çıkarsama istatistikleri belirli değişkenler arasındaki ilişkileri ölçmek için kullanılan teknikleri içerir.

Analistler, analizin basitleştirilmesi ve sonuçların iletilmesi için veriyi tanımlayan modeller oluşturmaya çalışabilir.

Veri Ürünü

Bir veri ürünü, veri girdileri alan bir bilgisayar uygulamasıdır ve çıktı üretir, onları çevreye geri besler. Bir model veya algoritmaya dayalı olabilir.

İletişim

Veriyi elde ettikten sonra analiz edilirse, analizin kullanıcılarına gereksinimlerini karşılaması için sonuçlar pek çok formatta rapor edilebilir. Kullanıcıların geribildirimleri olabilir, bu da ek analizlerle sonuçlanabilir. Analitik döngünün çoğu tekrarlayıcıdır. Analist, sonucu kitleye açık ve etkili bir şekilde iletmek için veri görselleştirme tekniklerini kullanabilir. Veri görselleştirme, verilerin içerdiği önemli iletileri iletmeye yardımcı olmak için tablolar ve çizelgeler gibi bilgi ekranlarını kullanır. Tablolar, belirli sayıları arayan bir kullanıcıya yardımcı olurken, çizelgeler, verilerin içerdiği sayısal iletileri açıklamaya yardımcı olabilir.

 

Referans:

https://en.wikipedia.org/wiki/Data_analysis

Designed by Freepik