Data Lakehouse Nedir?
Bir Lakehouse, Data Lakes ve data warehouse’lar temel yeteneklerini tek bir platformda birleştiren bir veri yönetim mimarisidir. Düşük maliyetli depolama ve geniş veri erişimi gibi Data Lake avantajları ile veri yapısı, performans ve yönetim özellikleri gibi veri ambarının faydalarını bir araya getirir. Lakehouse’lar, esneklik ve birlikte çalışabilirlik sağlamak için Apache Iceberg, Hudi ve Delta tabloları gibi açık veri ve açık tablo formatları kullanılarak giderek daha fazla inşa edilmektedir.
Apache Iceberg üzerine kurulu Qlik Open Lakehouse hakkında daha fazla bilgi edinin
Data Lakehouse Özellikler Ve Faydalar
Lakehouse veri platformu, veri analistlerinin ve AI mühendislerinin en güncel ve en kapsamlı veri kümelerini business intelligence, analitik, Gen AI ve makine öğrenimi için kullanabilmesini sağlar. Ayrıca, yönetmek için tek bir sisteme sahip olmak, kurumsal veri altyapısını basitleştirir ve analistlerle veri bilimcilerin daha verimli çalışmasına olanak tanır.
Burada, data lakehouse’ların temel özelliklerini ve kuruluşunuza sağladığı faydaları sunuyoruz.
Özellik |
Fayda |
Birçok Uygulama için Tek DepoLakehouse’lar, AI ve makine öğrenimi, veri bilimi, SQL ve gelişmiş analitik için temiz, entegre kaynak verilerin bulunduğu tek bir depodan doğrudan veri erişimi sağlar. |
Bu, operasyonel verimliliği artırır ve yalnızca tek bir veri deposunu sürdürmeniz gerektiğinden, business intelligence, raporlama, AI, ML ve diğer iş yükleri için kaliteli veriler üzerinde birden fazla kullanım senaryosunu destekler. |
Çeşitli Veri Tiplerini DesteklemeData lakehouse’lar, yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış dahil tüm veri tiplerini işleme erişimi sağlar. |
Bu, IoT verileri, metin, görüntü, ses, video, sistem logları ve ilişkisel veriler gibi geniş bir veri tipi ve uygulama yelpazesini beslemenize, depolamanıza, işlemenize, rafine etmenize ve analiz etmenize olanak tanır. |
Açık ve Standart FormatlarLakehouse’lar, Parquet, Avro veya ORC gibi açık, standart veri formatlarını kullanır. Ayrıca Apache Iceberg, Hudi veya Delta Table gibi açık tablo formatlarını da desteklerler. |
Açık formatlar, Python ve R gibi çeşitli sorgu ve işleme motorları ile programlama dilleri arasında geniş, esnek ve verimli veri tüketimini kolaylaştırır. Çoğu SQL’i de destekler. |
Depolama ve İşlemenin AyrıştırılmasıVeri ambarlarının aksine, lakehouse’lar veriyi depolamak ve işlemek için ayrı motor ve kaynaklar kullanma yeteneği sağlayarak depolama ve işlemeyi gerçek anlamda birbirinden ayırır. |
Apache Iceberg gibi açık tablo formatları kullanarak, açık lakehouse’lar verilerinizi uygun maliyetli bulut tabanlı nesne depolarında saklamanıza ve tüm verilerinizi işlemek ve sorgulamak için çeşitli Iceberg uyumlu motorlar kullanmanıza olanak tanır. |
Uçtan Uca Akış Desteği
|
Daha büyük veri kümelerine ölçeklenebilir ve daha fazla eşzamanlı kullanıcıya sahip olabilirsiniz. Artı, bu kümeler uygun maliyetli donanımlarda çalışır, bu da size tasarruf sağlar. |
Çeşitli Veri Tiplerini Destekleme
|
Kuruluşların hem toplu hem de akış kullanım senaryolarını desteklemek için aynı temel altyapıyı kullanmasını sağlar. Örneğin, Qlik Open Lakehouse, hem toplu hem de akış kaynaklarından veri getirmek için yüksek verimli bir besleme seçeneği sunar. |
Eşzamanlı Okuma ve Yazma İşlemleri
|
Birden fazla kullanıcı, veri bütünlüğünden ödün vermeden eşzamanlı olarak ACID uyumlu işlemleri okuyabilir ve yazabilir. |
Yönetişim Mekanizmaları
|
Tek bir kontrol noktasına sahip olmak, verilerin yayınlanması, paylaşılması ve kullanıcı erişimi üzerinde daha iyi kontrol sağlar. |
Iceberg Data Lakehouse Yığını
Doğru Yapı Taşlarını Seçmek
Data Lakehouse vs Data Warehouse vs Data Lake
Geçmişte, büyük veri depolama için iki ana seçeneğiniz vardı: data lake veya data warehouse. Analitik, AI, veri bilimi ve makine öğrenimini desteklemek için muhtemelen bu iki seçeneği aynı anda sürdürmek ve sistemleri birbirine bağlamak zorunda kalmışsınızdır. Bu genellikle veri çoğaltılmasına, güvenlik zorluklarına ve ek altyapı maliyetlerine yol açar. Data lakehouse’lar bu sorunların üstesinden gelmenize yardımcı olabilir.