18/01/2019
Big Data (Büyük Veri) Nedir?

BIG DATA NEDİR ?

Big Data (Büyük veri), yapılandırılmış ve yapılandırılmamış çok miktarda veriyi tanımlayan bir terimdir. Ancak önemli olan veri miktarı değil, şirketlerin verilerle ne yaptığıdır. Daha iyi kararlar ve stratejik hareketler için ihtiyaçları olan bilgileri Big Datalardan analiz edilebilir.

Günümüzde Big Data, sermaye haline gelmiştir. Endüstrinin her alanını doğrudan etkilemektedir. Dünyanın en büyük teknoloji şirketlerinin bulundukları konumda olmalarının nedeni, daha fazla verimlilik sağlamak ve yeni ürünler geliştirmek için sürekli Big Datalardan yararlanıp onları analiz etmeleridir. Big Data analizi doğru soruları soran, kalıpları tanıyan, bilinçli varsayımlar yapan ve davranışları öngören yöneticiler gerektiren bir keşif sürecidir.

Big Data kavramı yeni bir kavram olarak nitelendirilse de veri setlerinin kökenleri, ilişkisel veritabanının geliştirilmesiyle 1970'lere dayanır. 2005 yılına doğru insanlar, Facebook, YouTube ve diğer çevrimiçi hizmetler yoluyla kullanıcıların ne kadar veri ürettiğini araştırıp analiz etmeye başladı. Aynı yıl Hadoop yani büyük veri setlerini depolamak ve analiz etmek için oluşturulan açık kaynaklı bir uygulama  geliştirildi. Son teknolojik gelişmeler veri depolama ve hesaplama maliyetlerini ciddi oranda indirgedi. Böylece her zamankinden daha fazla veri depolamayı daha kolay ve daha ucuz hale getirdi. Artık daha büyük ve daha erişilebilir veri hacmi sayesinde doğru ve stratejik kararları verebilirsiniz.

Hadoop gibi açık kaynaklı uygulamaların geliştirilmesi, büyük verilerin derlenmesi için çok önemlidir. Bu uygulamalar geliştirildiğinden beri, büyük verilerin hacmi artmıştır. Kullanıcılar günümüzde hala çok büyük miktarlarda veri oluşturmaktadır.

Big Data’nın 3 önemli V’si Volume, Velocity, Variety ...

Hacim (Volume)

Hacim(Volume) verilerin miktarı ilişkilendirilen V'dir. Büyük veri setleri için yüksek hacimli ve yapılandırılmamış verileri işlemeniz gerekir. Facebook gibi çok fazla kullanıcıya sahip veri yayınlarından üretilen veriler, bir web sayfasındaki tıklama akışları ve benzeri veriler olabilir.Facebook’un Çin nüfusundan daha fazla kullanıcısı olduğunu biliyoruz. Kullanıcıların her biri çok sayıda fotoğraf paylaştığı göz önünde bulundurulduğunda yaklaşık 250 milyar fotoğraf depolandığını söyleyebiliriz. Bu onlarca terabayt veri demektir.

Hız (Velocity)

verilerin ne kadar hızlı geldiğinin ölçüsüdür. Aynı örnek üzerinden devam edersek Facebook her gün atılan miyonlarca fotoğrafı depolar. Hepsini işlemesi, dosyalaması ve bir şekilde daha sonra onu alabilmesi gerekir. Başka bir örnek verecek olursak , internette her saniye dünya çapında geniş miktarda bilgi gönderilir. Kurumsal bir IT ekibi için, veri akışının bir kısmının güvenlik duvarları üzerinden bir şirket ağına geçmesi gerekir. Siber saldırıların, ve siber suçların artmasıyla birlikte güvenlik duvarından geçen bu veri akışı sırasında kötü niyetli  veriler gizlenebilir. Bunu önlemek için, bu veri akışında tespit edilebilen anormalliklerin araştırılması ve analiz edilmesi gerekir. Analizler sonucu gerekli işlemler yapılır. Örneğin şifreleme kullanılarak daha fazla veri korunduğundan, siber saldırılar gittikçe zorlaşmaktadır.

Çeşitlilik (Variety)

Veriler her tür farklı formatlardan derlenir. Veritabanlarındaki sayısal verilerden  metin belgelerine, e-posta, video, ses, hisse senedi verileri ve finansal işlemlere kadar bir çok veri bulunur. Tüm bu veri çeşitliliği, büyük verilerin çeşitlilik vektörünü oluşturur. 

Big Data çeşitliliği, yapılan sorgulamalarda daha eksiksiz cevaplar almanızı mümkün kılar. Örneğin, eksiksiz her verilen cevaplar verilere daha fazla güven duyulması anlamına gelir.Bu da sorunların giderilmesine kolaylık sağlayarak olası çözüm yollarına farklı yaklaşımlar getirir. Bu yaklaşımları inceleyecek olursak:

Veriler sağlık alanında yaygın olarak kullanılabilir, örneğin bir hastalığın erken teşhisinde  ya da yeni tedavi yöntemleri geliştirilmesinde yardımcı olabilecek birçok  tıbbi vaka ve içeriklerinin analizini içerebilir.

Doğal felaketlerin frekansları tespit edilerek oluşabilecek yeni bir doğal afetin analizi yapılabilir. Fırtınaların, depremlerin oluş sıklıkları  göz önünde bulundurularak halk bilinçlendirilebilir.

Emniyet güçleri ihtiyaç duyduğunda kamuya ait veri setlerinden  yararlanarak bu verilere dayanan stratejiler geliştirebilir. Bu sayede artan suç oranlarının tespiti ve önlenmesi alanında çalışmalar yapabilmektedir.

İnternetin geniş kitleler tarafından kullanılması, internet üzerinden bulunan uygulamaların ve yazılımların aracılığı ile hızlı ve kolayca erişebilinir olması hepimizi birer veri üreticisi yapmaktadır. Özellikle  hizmet sektöründe  müşteri memnuniyetinin  tespiti için, kullanıcıların her türlü bilgilerinin saklanmasına ve onlara talepleri doğrultusunda hizmet verilmesine katkı sağlar. Saklanan bu veri setlerinin geniş hacmi ve sürekli artması, Big Data kullanım gerekliliğini arttırarak devam ettirmektedir.