Verinin Yapısı

Yapılandırılmış ve Yapılandırılmamış Veri

Geleneksel veriler olarak da bilinen yapılandırılmış veriler çoğunlukla çok iyi organize edilmiş bilgileri içeren metin dosyalarıdır. Yapılandırılmış veriler genelde daha etkili işlemenin sağlanabilmesi ve analizlerin gerçekleştirilebilmesi için biçimlendirilmiş bir veritabanında, veri ambarında saklanan düzenli verilerdir. Büyük veriden önce, yapılandırılmış veriler şirketlerin stratejik iş kararlarını vermek için kullandığı tek şeydi çünkü yapılandırılmış veriler çok iyi organize edilebilmekle beraber işlenmesi de özellikle eski veri madenciliği çözümlerinin kullanımıyla analitiği mümkün kılmaktaydı. Kısaca yapılandırılmış veri, organize edilmiş yani belirli bir yapıya sahip her türlü veriyi ifade etmektedir. Dünyadaki bütün veri odaklı şirketler, yıllardır yapılandırılmış verileri analiz ederken şimdi yeni ortaya çıkan veri kaynaklarını da kullanmaya başlamışlardır.

Yapılandırılmamış veriler, birçok farklı formda bulunan, geleneksel verilere benzemeyen ve dolayısıyla ilişkisel veri tabanlarına uygun olmayan bilgilerdir. Bu verilerin depolanması ve yönetilmesi için alternatif platformların ortaya çıkması sayesinde bilgi teknolojileri sistemlerinde giderek yaygınlaşmaktadır böylece birçok şirket tarafından çeşitli iş zekası ve analitik uygulamalarında kullanılmaktadır. En yaygın ve bilinen yapılandırılmamış veri türleri metin, görüntü, ses ve video dosyalarıdır. Özetle, yapılandırılmamış veriler, önceden tanımlanmış bir veri modeline sahip olmayan veya önceden tanımlanmış bir şekilde organize edilmemiş her türlü bilgidir. Günümüzün büyük veri dünyasında verilerin çoğu yapılandırılmamıştır ve bu yapılandırılmamış verilerin tüm verilerin %95’inden daha fazla olduğu tahmin edilmektedir.

Yapılandırılmış veriler, ilişkisel veritabanlarında veya elektronik tablolarda açıkça tanımlanmış bir biçimde ve yapıda bulunan veriler olarak tanımlanırken yapılandırılmamış veriler, veritabanında saklanamayan ve aynı veri yapısı tanımları ile kurallarına sahip olmayan verilerdir. Hem yapılandırılmış hem de yapılandırılmamış veriler içeren yarı yapılandırılmış veriler de vardır.

Yapılandırılmamış veriler, büyük veri ve analitiği bağlamında çok önemlidir çünkü bireylere ve şirketlere işleri hakkında daha derin, daha zengin ve daha doğru bilgiler vermeyi sağlar. Yapılandırılmamış verileri ele almak için NoSQL olarak bilinen yeni nesil veri tabanları sıkça kullanılmaktadır. Bu veritabanları, ilişkisel veritabanlarında ve veri ambarlarında olduğu gibi, ortak bir veri modeli ve tek bir veritabanı şeması yüklenmeden çok sayıda yapılandırılmamış veriyi işlemek, depolamak ve yönetmek için gereken altyapıyı sağlar. Büyük veri ortamlarında yapılandırılmamış verileri analiz etmek için çeşitli analiz teknikleri ve araçları kullanılır. Yapılandırılmamış veri analitiklerinde rol oynayan önemli teknikler arasında doğal dil işleme, veri madenciliği, makine öğrenmesi ve tahmine dayalı analitikler bulunmaktadır.

Infographic vector created by stories – www.freepik.com