Büyük miktardaki yapılandırılmış, yarı yapılandırılmış veya yapılandırılmamış verilerin depolandığı depolama havuzuna data lake ( veri gölü ) denilmektedir.
Veri gölü sayesinde her türlü veri, boyut sınırı olmaksızın bulut üzerinde depolanabilmektedir. Data lake özellikle büyük verilerin depolanabilmesi ve işlenebilmesini sağlamaktadır. Tüm bu verilerin depolandığı veri göllerinin ise güvenliği çok önemlidir. Bütün verilerin tek bir yerde bulunması bilişim teknolojileri altyapısını ve süreçlerini basitleştirir. Kolaylaştırılmış ve verimli bir veri gölü ise analizden raporlamaya kadar her şeyi daha hızlı ve daha kolay bir hale getirmektedir. Burada en önemli nokta ve sorun ise tüm verilerin tek bir veri gölünde bulunmasıdır. Bütün verilerin tek bir yerde bulunması birçok riski de beraberinde getirmektedir.
Günümüzde bilişim teknolojileri dünyasında BT departmanlarının tüm verileri tek bir yerde bulundurması nadirdir. Yedeklemeler ve arıza güvenliği gibi teknikleri uygulamalarıyla kurumsal verileri gerçek bir felaket hatasından koruma eğilimindedirler. Kurumsal verileriniz yerelde değil bulut üzerinde bulunduğunda tüm işleri verilerinizi güvende tutmak amacı taşıyan satıcılar için büyük bir avantaj söz konusudur. Çünkü verileri güvende tutmak için ek avantajlar sunmaları onları bir adım öne çıkarmaktadır. Veriler bir veri gölünde bulundurulduğu durumlarda verilerin tamamen korunduğu anlamına gelmez. Bu nedenle bu teknolojilerin kullanılması durumunda güvenlik risklerinin tamamen değerlendirilmesi ve ve durumun 360 derecelik bir açıdan incelenmesi gerekmektedir. Çünkü veri gölleri hassas bilgilerle doludur ve bu bilgilerin güvenliğini sağlamak birinci önceliktir.
Bu nedenle siber güvenlik konusu veri gölü platformları için çok önem arz eden bir konudur. Düzenli olarak yapılan sızma testleri, güvenlik açığı taramaları ve yapılan denetimlerin tümü veri gölü güvenlik planlarının olmazsa olmaz uygulamaları arasındadır. Yapılan bu taramaların amacı ise var olan güvenlik açıklarını tespit ederek bu güvenlik sorunlarını ortadan kaldırmaktır. Data lake güvenliğini sağlamak için belirtilen bu siber güvenlik çalışmalarının düzenli olarak yapılması gerektiğini belirtmek gerekmektedir. Yapılan sızma testleri analistlerin var olan açıkları belirlemelerine olanak tanımaktadır. Kuruluşlar, güvenlik açığı taramaları, sızma testleri ve yapılan denetimler sonucu elde edilen çıktıları kullanarak yapılması gereken düzenlemeleri gerçekleştirmektedirler.
Veri gölleri kurumlar için en önemli şeylerden biri olan bu bilgileri bilgisayar korsanlarından korumak için en iyi uygulamalardır. Ama veri gölünü daha güvenli hale getirmek için aşağıdaki 5 yöntem dikkate alınırsa data lake çok daha güvenli bir hale gelmiş olacaktır.
1.Yönetim Oluşturma ve Erişim
Seçim yapabileceğiniz birçok veri gölü platformu bulunmaktadır. İyi veri gölü platformlarında temel şeyler aynı olsa bile her platformun kendine has hesap oluşturma, erişim hakları tanımlama gibi özellikler için farklı mekanizma ve süreçleri bulunabilmektedir. Veri güvenliğini iyi bir şekilde sağlayabilmek amacıyla kullanıcılara işlerini gerçekleştirebilmeleri için minimum yetkilerin verilmesi gerekmektedir. Aynı zamanda data lake platformunun güvenliğini sağlamak için iki faktörlü kimlik doğrulama ve kurumsal kimlik doğrulama mekanizmaları da kullanılmalıdır.
2.Makine Öğrenimi Kullanın
Bazı veri gölü platformları makine öğrenmesi(Machine Learning) yeteneklerine sahip olmaktadır. Makine öğrenimi kullanılması veri kataloglama aracı ile kullanıldığında ham veri işleme ve sınıflandırmayı hızlandırmakta ve güvenlik risklerini önemli ölçüde azaltmaktadır.
3.Bölümlendirme ve Hiyerarşi
Veriler veri gölüne alındığında uygun bir bölümde bulundurmak önemlidir. Ortak görüş, veri göllerinin ne kadar güvenilir ve ne kadar kullanıma hazır olmasına bağlı olarak verileri barındırmak için belirli bölge oluşturulmasıdır. Bu bölgeler aşağıdaki şekilde olabilir.
- Geçici yer: Kopya gibi geçici verilerin silinmeden önce bulunduğu bir yerdir.
- Ham: Ham verilerin işlenmeden önce bulunduğu yer kastedilmektedir. Eğer bu bölgede bulunan veriler hassas ise ayrıca şifreleme işlemi yapılması tavsiye edilmektedir.
- Güvenilir: Veri bilimci veya analistlerin kolay bir şekilde ulaşabilmesi için güvenilir verilerin bulunduğu yerdir.
- İyileştirilmiş: Zenginleştirilmiş verilerin nihai çıktıların bulunduğu yerdir.
Bunun gibi bölgelerin kullanılması rol tabanlı erişim modelinin de kullanılması ile birleştiğinde kişilerin hassas ve yetki alanı dışındaki verilere erişme olasılığı en aza indirilmiş olunur.
4.Veri Yaşam Döngüsü Yönetimi
Veri yaşam döngüsü yönetimi, Kurumunuz tarafından hangi verilerin en fazla kullanıldığı ve hangi verilerin uzun yıllardır kullanılmadığının belirlendiği ve aşamalı bir şekilde bu kullanılmayan verilerin kullanımdan kaldırılması sürecidir. Data lake ortamında verimli depolama için tasarlanmış bir katmana eski veriler taşınabilir ve bu sayede bu verilere ihtiyaç duyulduğunda kullanılması sağlanmış olunur ve gerekli kaynaklar da tüketilmemiş olunur.
5.Veri Şifreleme
Verilerin güvenliği için çok önemli olan şifreleme yeni bir fikir değildir ve ayrıca birçok veri gölü platformunun verileri şifreleyebilmek için kendi metodları bulunmakta ve bu metodları kullanmaktadırlar. Hangi data lake platformu tercih edilirse edilsin dikkat edilmesi önemli olan nokta mevcut yapıda kullanılması için çok iyi bir şifreleme stratejisine sahip olunması gerekmekte ve tavsiye edilmektedir. Bütün verilerinizin özellikle hassas verilerinizin korunabilmesi için iyi bir şifreleme stratejisine sahip olunması hayati önem taşımaktadır.
Günümüzde en önemli konuların başında gelen veriler artık hayatın her alanında karşımıza çıkmaktadır. Tüm bu verilerin anlamlandırılarak bilgilere dönüştürülmesi ile hayatımız şekillenmektedir. Doğuş Elektronik olarak verilerin ne kadar önemli olduğunu biliyor ve sizlere sunmuş olduğumuz Veri Merkezi Çözümleri ile ilgili hayata geçirdiğimiz projelerimizde uyguluyoruz.