Giriş
İnternetin giderek daha büyük bir alana etki etmeye başlaması ve veri üretiminin giderek artması ile beraber klasik veri setlerinden farklı olarak big data’lar oluşmaya başlamıştır. Big data’lar “Big data nedir?” adlı yazımızda da bahsettiğimiz gibi klasik veri setlerinden sahip olduğu bazı karakteristik özellikler ile ayrılan veri türüdür. Bu karakteristik özelliklerden birisi de big data’nın çeşitlilik özelliğidir. Klasik veri setleri big data’ların aksine çok fazla veri tipi bulundurmamakta ve genelde tek tip veri setlerinden oluşmaktadır. Big data’lar ise yazılı, görsel, işitsel gibi birden çok veri tipini aynı anda içerisinde bulunduran ve çok büyük boyutlara ulaşan bir veri türüdür. Bugünkü yazımızda big data’nın bu çeşitlilik özelliği sayesinde sahip olduğu türleri inceleyeceğiz.
Big data türleri nelerdir?
Big data türleri yapılandırılmış (structured), yarı yapılandırılmış (semi-structured) ve yapılandırılmamış (unstructured) olmak üzere üçe ayrılmaktadır. Big data’nın türü ve yapısı onun nasıl analiz edilmesi gerektiği konusunda çok önemli bir yere sahip olduğu gibi o big data’dan hangi bilgilerin alınabileceği konusunda da çok önemlidir. Şirketler big data’larının türüne göre farklı analiz metotları ve uygulamaları kullanmak zorundadırlar.
Tüm big data’lar analize hazır gelmeden önce ETL denen bir işleme maruz tutulurlar. “Extract, transform, load” kelimelerinin baş harflerinden oluşan ETL kısaca bilgileri topla, bilgileri düzenle ve bilgileri sakla anlamına gelmektedir. ETL işlemi big data’dan big data’ya farklılık gösterebilmektedir.
Yapılandırılmış (structured) big data nedir?
Yapılandırılmış big data, big data türleri arasında analiz edilmeye en hazır olanıdır. Yapılandırılmış big data’lar belirli parametrelerle bölümlere ayrılmış ve belli bir yapıya sahip veri setleridir.
Yapılandırılmış big data’yı özenle hazırlanmış ve işçilerin kaydının tutulduğu bir tablo gibi düşünebilirsiniz. İşçinin adı, aldığı maaş, işe giriş tarihi gibi bilgilerin her biri farklı sütunlarla ayrılmıştır ve her işçinin kendisine ait sütununa bakarak tüm bu bilgilere kolaylıkla ulaşılabilmektedir. Yapılandırılmış big data da tam olarak böyledir. Bilgiler belirli parametreler ile bölümlere ayrılmış, analiz edilmeye hazır bir haldedir.
Big data uygulamaları, yapılandırılmış big data’ları kolaylıkla analiz edebilirler. Big data uygulamalarının gerekli bilgiye ulaşmak için yapması gereken tek şey aradığı bilginin bulunduğu sütun ve satırı bulmaktır. Diğer big data türlerinde olduğu gibi tek bir bilgi için tüm bilgi havuzuna dalması ve orada bir arama işlemi gerçekleştirmesi gerekmemektedir.
Ne yazık ki dünyada bulunan yapılandırılmış big data’ların sayısı oldukça sınırlıdır ve dünyadaki verilerin yalnızca çok küçük bir kısmını oluştururlar. Uzmanlar dünyadaki verilerin sadece %20’sinden küçük bir kısmının yapılandırılmış olduğu konusunda uzlaşıya varmışlardır.
Yapılandırılmamış (unstructured) big data nedir?
Dünyadaki verilerin geri kalan %80’lik kısmı ise yapılandırılmamış halde bulunmaktadır. Verilerin neden bu kadar çok yapılandırılmamış halde olduğunu anlamak için basitçe internette gerçekleştirdiğiniz eylemleri düşünebilirsiniz. Verilerin çok büyük çoğunluğu insanların internette gerçekleştirdiği eylemler ile meydana gelmektedir ve kimse gerçekleştirdiği eylemleri belli parametrelere göre sınıflandırmamaktadır. Örneğin kimse attıkları tweet’leri belli konu başlıklarına göre ayırmamakta veya paylaştıkları fotoğrafları kategorize etmemektedir.
Yapılandırılmış big data’ların analize hazır ve çok kolay analiz edilebilir bir yapıda olmasına karşılık yapılandırılmamış big data’larda durum böyle değildir. Yapılandırılmamış big data’ların analize hazır hale gelmesi ve belli bir düzene sokulması oldukça zahmetli bir iştir ve uzun zamanlar alabilmektedir. Örneğin yapılandırılmış big data için gerçekleştirilen ETL işlemi sadece basit bir gereksiz bilgileri ayıklama yönteminden ibaretken yapılandırılmamış big data için bu durum mümkün değildir.
Yarı yapılandırılmış (semi structured) big data nedir?
Yarı yapılandırılmış big data adından da anlaşılabileceği üzere yapılandırılmış ile yapılandırılmamış big data arasında kalan bir big data türüdür. Yarı yapılandırılmış big data’da veriler genellikle yapılandırılmamış halde bulunsalar da üzerlerinde onların kategorize edilerek belli bir düzene sokulmasına yardımcı olan metadata’lar bulunmaktadır. Bu metadata zaman, konum, cihaz, email adresi gibi bilgiler olabilir.
Yarı yapılandırılmış data’yı daha iyi anlayabilmek için bir email gönderdiğinizi düşünün. Email’inizin içeriği yapılandırılmamış bir halde bulunsa da gönderenin email adresi, gönderen cihazın IP adresi gibi pek çok farklı bilgi sayesinde gönderdiğiniz email’ler kategorize edilebilmektedir. Bu yarı yapılandırılmış big data’ya bir örnektir.
Yarı yapılandırılmış data’ya farklı bir örnek olması açısından da telefonunuzla çektiğiniz bir fotoğrafı düşünebilirsiniz. Bu fotoğrafı oluşturan pixeller düzensiz bir yapıda olsa da fotoğrafı çektiğiniz yer, çektiğiniz cihaz, çektiğiniz saat gibi detaylar bellidir. Bu detaylar sayesinde telefonunuzla çektiğiniz fotoğraflar da yarı yapılandırılmış data’ya örnek oluşturmaktadır.
İki senaryoda da gerçekleştirilen ana eylem yapılandırılmamış olsa da bu iki işlemi kategorize edebileceğiniz farklı detaylar, metadata’lar mevcuttur. Bu yüzden bu iki senaryo yarı yapılandırılmış big data’ya örnek oluşturmaktadır.
Sonuç
Big data, günümüzde sektörlerde çoktan belirleyici bir rol oynamaya başlamış durumdadır. Karar mekanizmalarına big data’dan elde ettikleri bilgileri ekleyen şirketlerin çok daha başarılı kararlar alarak gelirlerini arttırdığı ve giderlerini azalttığı yapılan araştırmalarla ortaya konmuştur.
İnternet kullanımının giderek artması ve üretilen verilerin miktarının giderek çoğalması ile önemi daha da çok artacak olan big data sektörünün ileride kilit sektörlerden biri haline gelmesi bekleniyor. Siz de big data’yı kullanarak ilgilendiğiniz alandaki kullanıcı trendlerini takip edebilir, gelecek trendler hakkında tahminde bulunabilirsiniz.
Doğuş Elektronik olarak bizler ne yapıyoruz?
Doğuş Elektronik olarak bizler, 34 yılı aşkın tecrübemizin de verdiği yetkinlikle sizler için en doğru veri merkezi ürünlerini seçiyor ve sizler için veri merkezinizi kuruyor veya geliştiriyoruz. Alanında uzman kadromuz ile gerçekleştirdiğimiz bu işlem sonucunda sizler için en uygun maliyet ve en yüksek verim ilişkisini en yüksek seviyede tutuyoruz. Veri merkezinizin kurulumu bittikten sonra özel olarak getirdiğimiz cihazlarla son testlerini de yaparak sizlere teslim ediyoruz.
Veri merkezi çözümlerimiz konusunda daha detaylı bilgiye sahip olmak için bu bağlantıyı takip edebilirsiniz.
Sıfırdan bir veri merkezi kurulumunda ya da mevcut veri merkeziniz üzerinde yapılacak olan iyileştirmelerde sizlerle birlikte çalışmaktan mutluluk duyarız. Eğer siz de bizlerle çalışmak isterseniz bize ulaşabilirsiniz.
Bize ulaşın
İhtiyacınız olan çözüm doğrultusunda uzman ekibimizden daha detaylı bilgi almak için bir tanışma ve proje toplantısını hemen sizler için ayarlayabiliriz.
Bizlere ulaşmak için info@dogus.com.tr email adresini, 0212 222 8989 telefon numarasını ve sitemizin iletişim bölümünü kullanabilirsiniz.