Büyük Veri

Büyük Veri, klasik olarak bilgilerin toplanarak ilişkisel veritabanlarında saklanmasından farklı olarak analitik kabiliyetlerin kullanılarak katma değer sağlanması ve bunun için donanımların, ilişkisel olmayan veritabanlarının ve araçların kullanılmasını gerektirir. Paralel veri işleme kabiliyetleri sayesinde gerçek zamanlı veri işleme, kişiselleştirme, müşteriler ile etkileşim, ve hatta planlama, tahmin ve trend analiz görevleri gerçekleştirilebilir.

Sigun, büyük verinin tüm aşamalarında hizmet ve sonuçlar sağlayabilmektedir;

Veri Depolama
Büyük veri ile ilk ve en önemli karalardan bir tanesi verinin nasıl saklanacağıdır. Veri depolama ve sorgulama için sade bir saklamanın dışında veri üzerinde analitik işlem kabiliyetinin olması gerekmektedir. Sigun veri depolama kabiliyetleri arasında Apache Hadoop, Apache Spark, MongoDB, Cassandra gibi çözümler yer almaktadır.
Veri Temizleme
Veri madenciliğine başlamadan once verinin temizlenmesi gerekmektedir. Verinin temizlenmesi ve düzenlenmesi her zaman ve her veri için yapılamayabilir. Özellikle web tabanlı bilgilerin düzensizliği belli ölçüde yeniden yapılandırılır.
Veri Madenciliği
İnternet, sosyal medya ve bunun gibi değişik kaynaklardan toplanan verilerden anlamlı bilgilerin çıkarılması aşamasıdır. Veri madenciliğinin amacı eldeki verilerin kullanılarak ileriye yönelik tahmin ve kestirimlerin yapılmasıdır.
Veri Analizi
Veri madenciliği toplanan verilerin mevcut veri yapılarından farklılığı ortaya konmakla beraber veri analizi ise verinin anlamlı parçalara ayırılarak bu parçaların zaman ile etkileşimi incelenmektedir. Analik, veri ile ilgili özel durumların tespit edilmesini hedeflemektedir. “Yarın ne olacak!” gibi sorunların cevaplanması için kullanılır. Sigun bu aşamada kendi geliştirdiği altyapıların yanı sıra BigML gibi kendini kanıtlamış altyapıları kullanmaktadır.
Veri Görüntüleme
Büyük veri üzerinde gerçekleştirilen analitik fonksiyonların sonuçlarını müşterilere en hızlı ve efektik olarak aktarmak Veri Görüntüleme kapsamında yapılır. Görüntüleme, ortaya konan anlamlı ve karmaşık bilgilerin en kolay şekli ile aktarabilmektir. Sigun bu kapsamda D3 ve Tableau gibi araçları kullanmaktadır.
Veri İşleme Dilleri
Büyük verinin analizi ve araçların entegrasyonu kapsamında Sigun, R, RegEx and Python gibi diller konusunda uzmanlaşmıştır.
Veri Toplama
Verinin saklanması, analizi ve gösteriminden once doğal olarak toplanması gerekmektedir. Verinin toplanması, web sayfası, twitter ve facebook gibi yapısal olmayan verilerin alınması ve bunların yapısal tablo yapısına dönüştürülmesidir. Verilerin yapısal hale dönüştürülmesi ile üzerinde otomatik fonksiyonların gerçekleştirilmesi sağlanır. Sigun özellikle sosyal medya üzerinden verilerin toplanarak yapısal hale dönüştürülmesi konusunda tecrübeye sahiptir.
—
Copyright © 2016 Sigun, Inc.