Big Data Nedir?

Son dönemlere kadar kurumlarin karar verme mekanizmalari genellikle iliskisel veri tabanlarinda saklanan yapisal veriye dayaniyordu. Ancak bu verinin disinda çok büyük deger tasiyan ve son döneme kadar çok fazla kullanilmayan ve yapisal olmayan büyük miktarda veri de bulunuyor : Bloglar, Sosyal medaya paylasilan veriler, muhtelif sensörlerden toparlanan veriler, elektronik postalar, fotograflar, videolar, web loglar gibi.

Diger yandan pek çok endüstri trendi geleneksel veri yönetimi, is zekasi platform ve araçlari üzerinde baski meydana getiriyor. Örnegin :

  • Artan veri hacmi : Dünya çapinda yillik veri hacmindeki büyüme %59 ve büyümenin artarak devam etmesi bekleniyor. Bu büyümenin merkezinde hem geleneksel hem de yeni veri kaynaklari yatiyor. IDC dijital kayitlarin bu sene sonunda 1.2M Zetabytes (1021bytes)'a ualasacagini, önümüzdeki on sene içinde de 44 katina çikacagini tahmin ediyor.
  • Artan Veri ve Analiz karmasikligi : Bir önceki paragrafta bahsettigimiz büyümenin asil kaynagiyapisal olmayan verilerden geliyor. Yapisal olmayan verilerin yaklasik %80'nin degersiz olduguna dair mit
    ise gerek arama motorlarinin gerekse de e-ticaret yapan kurumlarin tiklama verisini takip ederek ulastiklari basari sonrasinda çürütülmüs görünüyor. Asil gereksinim ise yapisal ve yapisal olmayan verinin saklanmasi, beraberce analiz edilerek, veri madenciligi islemlerine tabi tutulmasi.
  • Farklilasan Ekonomi ve Gelismekte Olan teknolojiler: Bulut bilisim ve donanim çözümlerinin kolaylikla ulasilabilir, fiyatlari uygun emtia haline dönüsmesi veri islemlerinin ekonomisini temelden ve radikal bir biçimde degistidi. Fiyati uygun donanim çözümleri, Hadoop gibi yeni nesil dagitik paralel islem altyapilari ile tamamlanarak, muazzam büyüklükteki verilerin islenmesinin üstesinden gelinmesini sagliyor.

"Büyük veri" dedigimiz zaman kisaca Petabytlar mertebesine ulasan yapisal ve yapisal olmayan veriden, gerçek içgörü el edecek teknolojileri, egilimleri ve yaklasimlari kastediyoruz.

Yukarda bahsettigimiz noktalardan yola çikarak, kurumlar ve çalisanlar ne bekliyorlar sorusuna yanit arayacak olursak : Yapilandirilmis ve yapilandirilmamis verinin beraberce analiz edilmesi ve veri madenciligi islemlerine tabi tutularak kurum için anlamli sonuçlar ve içgörü elde edilmesi temel beklenti. Örnegin bu sayede kurumlar asagidaki sonuçlara ulasabilirler :

  • Kullanicilarin davranis ve reaksiyonlarini çevirimiçi anlamak
  • Egilimler ve popular konlari sosyal medya analizleri ile anlayabilmek
  • Reklam kampanyalarini dogru hedeflemek ve optimize edilmek

Microsoft olarak  “Büyük Veri” konusuna yaklasimimiz üç temel noktaya odaklaniyor:

  • Ilk hedefimiz  Hadoop yapisini çok daha fazla BT çalisani ve yazilim gelistirici için ulasilabilir konuma getirmek.
  • Ikincisi Hadoop yapisini kurumsallastirmak. Diger bir deyisle Kurumsal ve is kritik beklentileri karsilayacak sekilde güvenlik, tahmin edilebilir ve iyi bir performans,
    kurumlarin seçimine göre kurum içi, bulut ve/veya hibrid senaryolari desteklemek.
  • Üçüncüsü de  bütün kullanicilarin Büyük Verinin üretecegi içgörüden nerede olursa olsun faydalanmasini saglamak.

Bir sonraki yazimda yukardaki temel ilkeleri yerine getirmek üzere Microsoft'un Büyük Veri yol haritasini paylasacagim.