Büyük veri nedir?

Büyük veri, geleneksel (ilişkisel ve/veya monolit) veritabanı sistemleriyle depolaması, yönetimi ve analizi genellikle çok pahalı olan verilerdir. Bu tür sistemler yapılandırılmamış verileri depolama (görüntü, metin ve video gibi), "yüksek hızlı" (gerçek zamanlı) verileri barındırma veya oldukça büyük ölçekli (petabayt ölçekli) veri hacimlerini destekleyecek şekilde ölçeklenme açısından esnek olmadıkları için genelde maliyet açısından verimsizdir.

Bu nedenle geçtiğimiz birkaç yılda, Apache Hadoop ve NoSQL veritabanı sistemleri gibi büyük verileri yönetme ve işleme alanında yeni yaklaşımlar büyük ölçüde benimsenmeye başladı. Ancak bu seçeneklerin şirket içinde dağıtımı, yönetimi ve kullanımının karmaşık olduğu ortaya çıktı.

Büyük veri nereden geliyor?

Önceden müşteri verileri iyi yapılandırılmış (banka gibi) işlemler olarak sınıflandırılırken günümüzde kuruluşların yapılandırılmamış online müşteri etkileşimi verileri şeklinde günlük olarak ürettiği devasa "yorgunluk", yalnızca birkaç yıl önce üretilen verilerin büyüklüğünü gölgede bırakır. Birbiriyle bağlantılı milyarlarca cihaz ve sensörden oluşan küresel bir ağı tanımlayan, kısa süre önce ortaya çıkan "Nesnelerin İnterneti" terimi metin, video, görüntü ve hatta ses biçimindeki veri hacminde çok ciddi artışa neden olmuştur. Son olarak, bazı yasal düzenlemelere tabi sektörlerde, normalde arşivlenecek verilere artık kanunlara ve kurallara uygunluk amacıyla erişilmesine sıklıkla ihtiyaç duyuluyor.

Büyük veri neden önemli?

Verilerden tutarlı olarak işle ilgili değer elde edebilmek artık her sektördeki ve her ölçekteki başarılı kuruluşların özelliğidir. Perakende, Reklamcılık ve Mali Hizmetler gibi her geçen gün daha da artan bazı sektörlerde bu durum bir ölüm kalım meselesidir.

Veri analizi, yalnızca daha fazla veriye erişiminiz varsa size bir değer sağlar. Bu nedenle birçok sektördeki kuruluşlar, işle ilgili ayrıntılı bilgileri ortaya çıkarmak için büyük verinin zengin bir kaynak olduğunu keşfetti. Ayrıca, makine öğrenimi modelleri daha fazla veriyle "eğitildiğinde" daha etkili olduğu için makine öğrenimi ve büyük veri de birbirini tamamlayıcı niteliktedir.

Verilerimin "büyük" olup olmadığını nasıl anlarım?

Birçok kurumun veri hacmi petabayt ölçeğine erişmemiş olsa da veriler, büyük verinin diğer iki tanımlayıcı özelliğinden birine sahip olabilir. Verilerinizin zaman içinde muhtemelen katlanarak büyüyeceği kesindir. Bu anlamda, tüm "büyük veriler" "küçük veriler" olarak başlar.

Büyük veri için neden bulut en iyi platformdur?

Bulut bilişimi; veri depolama, işleme ve analizine daha ölçeklenebilir, esnek, uygun maliyetli ve hatta şirket içi dağıtımın sunacağından daha güvenli bir temele sahip bir erişim sağlar. Veri hacimleri katlanarak arttığında, gerektiğinde depolama alanı ve işleme kaynaklarının kullanılabilir olmasını sağlama ve bu verilerden değer elde etme açısından bu özellikler müşteriler için çok önemlidir. Ayrıca bulut, büyük veri analizi ve makine öğrenimi yolculuklarına yeni başlamış olan ve şirket içi büyük veri sistemlerinin olası karmaşasından kaçınmak isteyen kuruluşlara, kullandıkça öde fırsatıyla yönetilen hizmetleri (Google BigQuery ve Google Cloud ML Engine) deneme yolu sunar.

Daha fazla bilgi edinin: