Self Paced
Pengolahan Data Menggunakan SQL Pada Hadoop
Pelatihan ini dirancang khusus untuk Data Analyst, Business Intelligence Analyst, dan Data Professional yang sudah familiar dengan SQL dan ingin meningkatkan kemampuan dalam mengolah data dalam skala besar (big data).
Peserta akan mempelajari konsep dasar Hadoop dan Hive, memahami arsitektur dan cara kerja Hive di ekosistem big data, serta melakukan praktik langsung menjalankan query terhadap dataset berskala besar.
Pelatihan ini membantu peserta memahami perbedaan fundamental antara SQL tradisional dan HiveQL, mengoptimalkan query agar efisien di lingkungan distributed computing, dan menerapkan teknik seperti partitioning, bucketing, dan file format kolumnar (ORC/Parquet).
Silabus
Pengenalan Apache Hive▼
Hive Data Model▼
Hive Query Languange (HQL)▼
Operasi JOIN▼
Format File▼
Schema Design – Partitioning & Bucketing▼

