Büyük Veri

Büyük Veri

  • +
  • -

Büyük Veri (Big Data) Nedir?

Veri ile bilgi arasındaki farkı bir kez daha açıklamak konuyu anlamamız için ilk adım olmalı. Veri, elimizdeki veya erişebileceğimiz sonuçlar. Üzerinde bir analiz yapılmadan, işlenmeden bilgi içermiyor.

Peki o zaman büyük veri elimizdeki verilerden bilgi edinmeye çalışmaktan farklı mı, farklı ise ne farkı var.

Amaç farklı değil, yapılmaya çalışılan elimizdeki verileri kullanarak yaptığımız işte daha bilgili olabilmek, başkalarının sahip olmadığı bilgilere sahip olmak. Farklı olan elimizdeki verinin değişmiş olması. Bizim bildiğimiz, alıştığımız bir operasyonda her sistem kendi içinde tanımlı ve tutarlı bir iş yapmak üzere planlanmıştır. İki farklı sistem arasında bir ilişki varsa bu da önceden tanımlanmış bir biçimde gerçekleştirilir. Muhasebe sistemi, muhasebe bilgilerin tutar, finansal durum hakkında raporlar (bilgi) üretir. Personel devam sistemi personelin geliş gidişlerini takip eder, belki de muhasebe sistemi ile bazı bilgileri paylaşır. Mail sistemi ise mail alışverişini sağlar, muhasebe sistemi ile de bağımsızdır.

Şirketin web sayfasının loglarını tutan yazılım da kendi başına çalışır, herkesten bağımsızdır. İşte bizim kullanmaya alıştığımız sistemler böyle birbirlerinden bağımsız adacıklar şeklinde çalışırlar ve hepsi de veri üretirler. Biz bu verilerin bir kısmını kullanır bilgi elde ederiz (muhasebe sistemi gibi), büyük bir kısmını ise kullanmayız bile. Halbuki bu veriler de analiz edilip bilgiye dönüştürülebilir ve bu bilgi bizim için çok yararlı olabilir.

Analiz: Elimizdeki veriler analiz edilip bilgi haline gelmedikleri sürece yapılan işin anlamı kalmıyor.

Yoksa yapısal ve yapısal olmayan verileri bir yerde toplayıp analiz edilebilecek hale getirmek önemli tabii ama sadece asıl amaç olan analize ulaşabilmek için. Bir firmaya/kuruma veri analizi yaparak nasıl bir fayda sağlayacaklarını gösteremezseniz, anlatamazsanız o zaman büyük veri yapısına neden sahip olmaları gerektiği konusunda inandırıcı olamazsınız.

Eldeki verilerin analiz edilerek, örüntülerin (pattern) bulunması, buradan eğilimlerin tespit edilmesi buna bağlı modellerin oluşturulması, test edilmesi gerekiyor. Bunun için de veriye bağlı olarak hem istatistiksel (ortalama, standart sapma, çan eğrisi gibi) hem linear ve non-linear analizlerin yapılması lazım. Numerik verinin yanı sıra resim, yazı (duygu analizi) gibi verilerin de analiz edilebilmesi, bilgiye dönüştürülmesi gerekli.

Ama hepsinden önemlisi bu analizlerin kullanıcıya nasıl faydalar sağlayacağının gösterilebilmesi.

Bunu yapan yazılımlar var tabii ki. Hem değişik kaynaklardan raporlama yapabilen hem de analiz yapabilen yazılımlar genellikle BI (business intelligence) olarak sınıflandırılıyorlar

Top