1. Giriş
BigQuery, sunucusuz, yüksek düzeyde ölçeklenebilir ve uygun maliyetli bir veri ambarıdır. Verilerinizi BigQuery'ye taşıyın ve zorlu işleri bize bırakın. Siz de işletmenizi yönetmeye, gerçekten önemli olan şeylere odaklanabilirsiniz. İş ihtiyaçlarınıza (ör. başka kullanıcılara verilerinizi görüntüleme veya sorgulama yetkisi verme) göre hem projeye hem verilerinize erişimi kontrol edebilirsiniz.
Bu laboratuvarda, BigQuery'nin analiz olanaklarını keşfedeceksiniz. Google Cloud Storage paketinden veri kümesi içe aktarmayı ve Perakende bankacılığı veri kümesiyle çalışarak BigQuery kullanıcı arayüzü hakkında bilgi edinmeyi öğreneceksiniz. Ayrıca bu laboratuvarda; sorgu sonuçlarını e-tabloda dışa aktarma, sorgu geçmişinizdeki sorguları görüntüleme ve çalıştırma, sorgu performansını görüntüleme, diğer ekipler ve departmanlar tarafından kullanılması için tablo görünümleri oluşturma gibi günlük analizlerinizi çok daha kolaylaştıran BigQuery'deki temel özellikleri nasıl keşfedeceğinizi öğreneceksiniz.
Öğrenecekleriniz
Bu laboratuvarda, aşağıdaki görevleri nasıl gerçekleştireceğinizi öğreneceksiniz:
- BigQuery'ye yeni veriler yükleme
- BigQuery kullanıcı arayüzüne aşinalık kazanın
- BigQuery'de Sorgu Çalıştırma
- Sorgu Performansını Görüntüle
- BigQuery'de Görünüm Oluşturma
- Veri kümelerini başkalarıyla güvenli bir şekilde paylaşın
2. Giriş: BigQuery Kullanıcı Arayüzünü Anlama
Bu bölümde BigQuery kullanıcı arayüzünde gezinmeyi, mevcut veri kümelerini görüntülemeyi ve basit bir sorgu çalıştırmayı öğreneceksiniz.
BQ kullanıcı arayüzü yükleniyor
- "BigQuery" yazın Google Cloud Platform Console'un üst kısmında yer alır.
- Seçenek listesinden BigQuery'yi seçin. BigQuery logosunu (büyüteç) içeren seçeneği belirlediğinizden emin olun.
Veri Kümelerini Görüntüleme ve Sorguları Çalıştırma
- Kaynak bölümünün solundaki bölmeden BigQuery projenizi tıklayın.
- Söz konusu veri kümesindeki tabloları görüntülemek için
bq_demo
simgesini tıklayın - Aramak için yazın kutusuna "card" yazın "card" kelimesini içeren tabloların ve veri kümelerinin listesini görmek için yazarsınız.
- "card_transactions" seçeneğini belirleyin arama sonuçları listesinden tablo
- Bu tablonun meta verilerini görüntülemek için
card_transactions
bölmesinin altındaki Ayrıntılar sekmesini tıklayın. - Tablonun önizlemesini görmek için Önizleme sekmesini tıklayın
[Rekabetçi Konuşma Noktası]: Google Veri Kataloğu ile entegrasyon, BigQuery meta verilerinin, veri gölleri veya operasyonel veri kaynakları gibi diğer veri kaynaklarıyla birlikte yönetilebileceği anlamına gelir. Bu örnek, Google Cloud'un sadece ilişkisel bir veri ambarı olmadığını, aynı zamanda baştan sona bir Analitik Veri platformu olduğunu gösteriyor.
- "card_transactions" sorgusunu sorgulamak için büyüteç simgesini tıklayın. tablosunu oluşturalım. Otomatik oluşturulan bir metin, BigQuery sorgu düzenleyiciyi doldurur.
- Card_Transaction tablosundan farklı satıcıları göstermek için kodu aşağıya girin
SELECT distinct (merchant) FROM bq_demo.card_transactions LIMIT 1000
- Sorguyu çalıştırmak için Çalıştır düğmesini tıklayın.
3. Veri kümeleri oluşturma ve görünümleri paylaşma
Verilerin ve yönetimin paylaşılması son derece önemlidir. Bu işlem, BQ kullanıcı arayüzünde sezgisel olarak yapılabilir. Bu bölümde yeni bir veri kümesi oluşturmayı, bu veri kümesini bir görünümle doldurmayı ve bu veri kümesini paylaşmayı öğreneceksiniz.
Sorgu Geçmişini Görüntüleme
- "Sorgu Geçmişi"ni tıklayın GCP Console'un sol bölmesinde
- Sorgu Geçmişi bölmesinde yenile'yi tıklayın
- Sorgunun sonuçlarını görüntülemek için sorgunun en sağındaki indirme resmini/oku tıklayın.
Yeni bir veri kümesi oluşturma
- BigQuery kullanıcı arayüzünün kaynaklar bölmesinde [projenizin adı] öğesini seçin.
- "Yeni veri kümesi oluştur"u seçin proje bilgi penceresinden
- Veri Kümesi Kimliği için:
bq_demo_shared
- Diğer tüm alanları varsayılan değerlerde bırakın
- "Veri Kümesi Oluştur"u tıklayın
Görünüm Oluşturma
[Rekabetçi Konuşma Noktası]: BigQuery, ANSI SQL ile tamamen uyumludur. Ayrıca, hem basit hem de karmaşık, çok tablolu birleştirmeleri ve zengin analiz işlevlerini destekler. Taşıma sürecini kolaylaştırmak amacıyla, geleneksel veri ambarlarında kullanılan yaygın SQL veri türleri ve işlevleri için sürekli olarak gelişmiş desteği kullanıma sunduk.
- "Yeni Sorgu Oluştur"u seçin düğmesini tıklayın.
- Sorgu düzenleyiciye aşağıdaki kodu ekleyin
WITH revenue_by_month AS (
SELECT
card.type AS card_type,
FORMAT_DATE('%Y-%m', trans_date) as revenue_date,
SUM(amount) as revenue
FROM bq_demo.card_transactions
JOIN bq_demo.card ON card_transactions.cc_number = card.card_number
WHERE trans_date DATE_ADD(CURRENT_DATE, INTERVAL -1 YEAR)
GROUP BY card_type, revenue_date
)
SELECT
card_type,
revenue_date,
revenue as monthly_rev,
revenue - LAG(revenue) OVER (ORDER BY card_type, revenue_date ASC) as rev_change
FROM revenue_by_month
ORDER BY card_type, revenue_date ASC;
- "Görünümü Kaydet"i tıklayın
- Proje Adı için mevcut projenizi seçin
- Yeni oluşturulan veri kümesini seçin:
bq_demo_shared
- Tablo Adı için:
rev_change_by_card_type
- Kaydet'i tıklayın.
Görünümleri ve Veri Kümelerini Paylaşma
- "bq_demo_shared"i seçin veri kümesini sol kaynak bölmesinden kaldırabilirsiniz.
- "Veri Kümesini Paylaş"ı tıklayın. Veri kümesi bilgi bölmesinden
- E-posta adresi girin
- "BigQuery Veri Görüntüleyici"yi seçin Rol açılır menüsünden
- "Ekle"yi tıklayın
- Bitti'yi tıklayın
E-Tablolar'da Verileri Keşfedin
[Rekabetçi Konuşma Noktası]: BigQuery'nin rakiplerine kıyasla diğer bir avantajı BI Engine'dir. BI Engine, BI türü özet sorgularının bellek içi önbelleğe alma motoru aracılığıyla bir saniyeden daha kısa sürede döndürülmesini sağlamak için kullanılabilir. Bu özellik, şu anda Google Data Studio tarafından desteklenmektedir ancak yakında BigQuery'deki tüm sorguları hızlandırmak için kullanıma sunulacaktır.
Örneğin:
Snowflake, kontrol panelleri ve veri görselleştirme için 3. taraf BI araçlarından yararlanırken GCP; Bağlı Sayfalar, Data Studio ve Looker gibi birçok entegre BI aracı sunar.
- "rev_change_by_card_type" öğesini seçin. görünümünü BigQuery kullanıcı arayüzündeki sol kaynak bölmesinden görüntüleyebilirsiniz.
- Görünümü sorgulamak için büyüteci tıklayın
- Tür:
SEÇ *
bq_demo_shared.rev_change_by_card_type BAŞLANGICI
- Çalıştır'ı tıklayın.
- "Dışa aktar"ı tıklayın. Sonuçlar Bölmesi simgesi
- "E-Tablolar ile Verileri Keşfedin"i seçin
- "Analizi Başlat"ı tıklayın
- "Pivot Tablo"yu seçin
- "Yeni Sayfa"yı seçin.
- "Oluştur"u tıklayın
- "Gelir_tarihi" değerini ekleyin E-Tablolar penceresinin sağ tarafında bulunan Pivot Tablo Düzenleyici'nin Satır bölümünde
- "card_type" ifadesini ekleyin Pivot Tablo Düzenleyici'nin Sütun bölümünde
- "monthly_rev" ekle Pivot Tablo Düzenleyici'nin Sütun bölümünde
- Uygula'yı tıklayın
- E-Tablolar kullanıcı arayüzünün en üst sırasına gidin ve Grafik Ekle'yi seçin.
4. Kurulum: Veri Entegrasyonu
Bu bölümde yeni bir tablo oluşturmayı ve Google Cloud'un sunduğu çok sayıda herkese açık veri kümesinden birinde bir JOINS gerçekleştirmeyi öğreneceksiniz.
[Rekabetçi Konuşma Konusu]:
BigQuery, paylaşılan veri kümelerini yıllardır destekliyor. Herhangi bir projedeki müşteriler hem herkese açık veri kümelerini hem de kendileriyle paylaşılan diğer projelerdeki veri kümelerini sorgulayabilir.
BigQuery, harici tablolar kullanarak GCS'deki veri göllerini destekleyebilir. Toplu yüklemenin yanı sıra BigQuery, saniyede yüzlerce MB'a varan hızlarda veritabanına veri akışı sağlama özelliğini destekler. Snowflake'te veri akışı desteği yoktur.
Yeni bir tabloya veri aktarma
- Kaynaklar bölmesinde bq_demo veri kümesini seçin
- Veri kümesi bilgi bölmesinde "Tablo Oluştur"u seçin
- Kaynak için Google Cloud Storage seçin
- Dosya yolu metin kutusunda:
gs://retail-banking-looker/district
- Dosya Biçimi için CSV seçin
- "Bölge" yazın Tablo Adı için
- Şemayı Otomatik Algıla onay kutusunu seçin
- Tablo Oluştur'u tıklayın.
Herkese Açık Veri Kümesini Sorgulama
- Sorgu düzenleyicide aşağıdaki sorguyu girin:
SELECT
CAST(geo_id as STRING) AS zip_code,
total_pop,
median_age,
households,
income_per_capita,
housing_units,
vacant_housing_units_for_sale,
ROUND(SAFE_DIVIDE(employed_pop, pop_16_over),4) AS rate_employment,
ROUND(SAFE_DIVIDE(bachelors_degree_or_higher_25_64, pop_25_64),4) AS rate_bachelors_degree_or_higher_25_64
FROM
`bigquery-public-data.census_bureau_acs.zip_codes_2017_5yr`;
- Çalıştır'ı tıklayın.
- Sonuçları görüntüleyin
- Şimdi bu herkese açık verileri başka bir sorguyla birleştireceğiz. Sorgu Düzenleyici'ye aşağıdaki SQL Kodunu girin:
WITH customer_counts AS (
select regexp_extract(address, "[0-9][0-9][0-9][0-9][0-9]") as zip_code,
count(*) as num_clients
FROM bq_demo.client
GROUP BY zip_code
)
SELECT
CAST(geo_id as STRING) AS zip_code,
total_pop,
median_age,
households,
income_per_capita,
ROUND(SAFE_DIVIDE(employed_pop, pop_16_over),4) AS rate_employment,
num_clients
FROM
`bigquery-public-data.census_bureau_acs.zip_codes_2017_5yr`
JOIN customer_counts on zip_code = geo_id
ORDER BY num_clients DESC
- Çalıştır'ı tıklayın.
- Sonuçları görüntüleyin
5. Kapasite Yönetimi
Slotlar ve rezervasyonlarla çalışma
BQ, ihtiyaçlarınızı karşılamak için birden çok fiyatlandırma modeli sunar. Büyük müşterilerin çoğu, ayrılmış kapasiteyle tahmin edilebilir fiyatlandırma için temel olarak sabit ücretten yararlanır. Bu temel kapasitenin üzerine çıkan patlamalar için BQ, çalışırken ek kapasiteye ulaşmanıza ve ardından çalıştırma sorguları üzerinde hiçbir etki olmadan otomatik olarak küçülmenize olanak tanıyan esnek slotlar sunar. BQ, yalnızca çalıştırdığınız sorgular için ödeme yapmanıza olanak tanıyan bir bayt tarama modeline de sahiptir.
[Rekabetçi Konuşma Konusu: Bazı rakipler yalnızca, müşterilerin kuruluşlarındaki her iş yükü için sanal bir depo tahsis etmesi gereken sabit kapasite modeli üzerinde çalışıyor. BigQuery'yi kullanmaya başlamayı kolaylaştıran sorgu başına düşük maliyetli bir modelin yanı sıra boşta kalma kapasitesinin bir dizi iş yükü arasında paylaşılabileceği sabit ücretli bir kapasite fiyatlandırma modelini de destekliyoruz.]
- Rezervasyonlar sekmesine gidin.
- "Slot Satın Al"ı tıklayın
- "Flex"i seçin olarak belirleyin.
- 500 slot seçin.
- Satın alma işlemini onaylayın.
- Slot Taahhütlerini Görüntüle'yi tıklayın.
- "Rezervasyon Oluştur"u tıklayın
- Kullanıcı "demo" rezervasyon adı olarak
- Konum olarak ABD'yi seçin
- Slotlar için 500 yazın (tümü kullanılabilir)
- Atamalar'ı tıklayın.
- Kuruluş projesi için mevcut projeyi seçin
- "Demo"yu seçin rezervasyon kimliği için
- Oluştur'u tıklayın."