Büyük Veri ve Küçük Veri

Büyük veri, varolan geleneksel yöntemlerle etkili bir şekilde işlenemeyen, analiz edilemeyen çok sayıda veriyi ifade eder. Geleneksel yaklaşımlar ile analiz edilemeyen ve işlenemeyen büyük miktardaki bu veri kullanılabilir değildir. Büyük veri altyapılarının ve teknolojilerinin gelişmesi ile, büyük veri analizleri gerçekleştirilebilir bir hale gelmiştir. Böylece, büyük hacimli bu veri kümelerinden faydalı bilgilerin çıkartılması sağlanabilmektedir. Büyük veri, doğru analiz yöntemleri ile işlendiğinde, karar vericilere yol gösterebilecek içgörüyü sağlayabilir ve şirketlerin doğru stratejik kararlar alması ile risk yönetimi yapmalarına olanak sağlayabilir. Büyük Veri, bazı kaynaklarda 3V (volume, variety, velocity), bazı kaynaklarda 5V (volume, variety, velocity, verification, value) olarak tanımlanmaktadır. Verinin büyük olması (volume), verinin geleneksel veri tabanlarında saklanamayacak kadar çok olduğu ve işlenebilmesi için özelleşmiş hesaplama altyapılarına gerek duyulduğu anlamına gelir. Veri çeşitliliği (variety), verinin farklı yapılarda (yapılandırılmış, yapılandırılmamış), farklı türlerde (nicel, nitel, …) olabileceği anlamı taşımaktadır. Verinin büyüme hızı (velocity) ise verilerin gittikçe artan bir hızda büyüyebileceğine işaret etmektedir.

Makine öğrenmesi algoritmalarının çalışma prensibi düşünüldüğünde, daha fazla veriye sahip olmanın her zaman daha azına sahip olmaktan iyi olacağı söylenebilir. Gerektiğinde, daha küçük bir veri seti elde etmek için verinin bir bölümü örneklem yolu ile elde edilebilir. Basit makine öğrenmesi algoritmaları küçük miktardaki veriler ile düzgün bir şekilde çalışabilmektedir. Buna karşın, derin öğrenme algoritmaları başta olmak üzere bazı makine öğrenmesi algoritmaları da, öğrenebilme işlevini gerçekleştirebilmek için büyük miktarda veriye ihtiyaç duyabilir. Böyle durumlarda, büyük veri ile çalışmanın bazı zorlukları olacaktır. Veri boyutu büyüdükçe analiz döngüsünün süresi yavaşlayacaktır ve verinin grafiksel gösterimleri karmaşıklaşacaktır. Büyük veri analitiklerine ek olarak, makine öğrenmesi sistemlerinin büyük veri ile beslenmesi, işletmelerin verilerinden anlamlı sonuçlar çıkarmasına yardımcı olacaktır.

Technology vector created by vectorjuice – www.freepik.com