Bi Technology | Lakehouse Nedir Bi Technology | Lakehouse Nedir
TR

Data Lakehouse

Nedir, temel özellikleri ve faydaları. Bu kılavuz, Lakehouse hakkında kapsamlı bir bakış açısı sunar; temel yapı taşlarını, üst düzey mimarisini ve kendi açık veri göl evinizi oluştururken dikkate almanız gereken önemli noktaları ele alır.

Bi Technology | Lakehouse Nedir

Iceberg Lakehouse’lara Giriş

Bi Technology | Lakehouse Nedir
Apache Iceberg Nedir?

Apache Iceberg, büyük ölçekli veri lakehouse’larını yönetmek ve açık veri formatları üzerinde yüksek performanslı analitik işlemleri mümkün kılmak için tasarlanmış bir açık tablo formatıdır. Dosyaların mantıksal tablo varlıkları olarak işlenmesine olanak tanıyarak, lakehouse mimarileri için oldukça uygun bir çözüm sunar.

Iceberg ile kullanıcılar, verilerini bulut nesne depolarında saklayabilir ve birden fazla farklı motor kullanarak işleyebilir/sorgulayabilir; bu da platformlar arasında esneklik ve birlikte çalışabilirlik sağlar.

Iceberg, ACID uyumluluğu, dinamik bölümleme, zaman yolculuğu ve şema evrimi gibi temel özellikleri destekleyerek yüksek performans ve veri bütünlüğünü garanti eder.

Ayrıca, Apache Iceberg güçlü bir açık kaynak topluluğu tarafından desteklenir ve bu da onu modern veri yönetimi ihtiyaçları için güvenilir, çok yönlü ve açık bir çözüm haline getirir.

Bi Technology | Lakehouse Nedir

Iceberg Data Lakehouse Yığını

Doğru Yapı Taşlarını Seçmek

Bi Technology | Lakehouse Nedir

Data Lakehouse vs Data Warehouse vs Data Lake

Geçmişte, büyük veri depolama için iki ana seçeneğiniz vardı: data lake veya data warehouse. Analitik, AI, veri bilimi ve makine öğrenimini desteklemek için muhtemelen bu iki seçeneği aynı anda sürdürmek ve sistemleri birbirine bağlamak zorunda kalmışsınızdır. Bu genellikle veri çoğaltılmasına, güvenlik zorluklarına ve ek altyapı maliyetlerine yol açar. Data lakehouse’lar bu sorunların üstesinden gelmenize yardımcı olabilir.

Bi Technology | Lakehouse Nedir
Data Lakehouse Mimarisi

Bir data lakehouse tipik olarak aşağıda gösterildiği gibi altı ana katmandan oluşur: besleme katmanı (ingestion), depolama katmanı (storage), fiziksel veri katmanı (physical data), metadata katmanı (metadata), yönetişim/katalog katmanı (governance/catalog) ve bir sorgu/işleme katmanı (query/processing).

Bir Lakehouse Mimarisinin Bileşenleri

Bi Technology | Lakehouse Nedir
Cloud Data Lake Karşılaştırma Rehberi AWS, Azure, Google, Cloudera, Databricks ve Snowflake dahil olmak üzere tüm önemli bulut data lake satıcılarına tarafsız, yan yana bir bakış edinin.