Jul 08, 2025 | 12 views
A. Data yang mudah diolah oleh komputer.
B. Data yang memiliki volume, kecepatan, variasi, dan nilai yang sangat besar.
C. Data yang hanya terdiri dari angka-angka.
D. Data yang sudah diurutkan dan diorganisasikan secara ketat.
Pembahasan :
Big Data didefinisikan berdasarkan 4V: Volume, Velocity, Variety, dan Veracity. Volume merujuk pada jumlah data yang besar, Velocity pada kecepatan data masuk, Variety pada beragamnya jenis data, dan Veracity pada kualitas dan keandalan data.
A. Data Mining
B. Data Compression
C. Data Aggregation
D. Data Normalization
Pembahasan :
Data Aggregation adalah proses menggabungkan data dari berbagai sumber untuk menghasilkan data yang lebih ringkas dan mudah dikelola. Ini sangat penting dalam Big Data untuk mengurangi biaya penyimpanan dan pemrosesan.
A. Microsoft Excel
B. Adobe Photoshop
C. Hadoop
D. Microsoft Word
Pembahasan :
Hadoop adalah sebuah kerangka kerja sumber terbuka untuk memproses data terdistribusi yang sangat cocok untuk Big Data. Ia membagi data besar menjadi pecahan yang lebih kecil dan memprosesnya secara paralel.
A. Menyimpan data secara terstruktur.
B. Membagi data menjadi pecahan kecil untuk diproses secara paralel.
C. Menggabungkan data dari berbagai sumber.
D. Mengurutkan data berdasarkan nilai.
Pembahasan :
MapReduce adalah pola pemrograman yang digunakan untuk memproses data besar di Hadoop. MapReduce membagi tugas pemrosesan data menjadi tugas-tugas kecil yang dapat diproses secara paralel oleh berbagai mesin.
A. Sebuah database terdistribusi.
B. Sebuah kerangka kerja pemrosesan data yang cepat dan serbaguna.
C. Sebuah alat untuk visualisasi data.
D. Sebuah sistem operasi untuk Big Data.
Pembahasan :
Spark adalah kerangka kerja pemrosesan data yang dibangun di atas Apache Hadoop. Spark menawarkan kinerja yang lebih cepat daripada MapReduce, terutama untuk tugas-tugas analisis data dan machine learning.
A. MapReduce lebih cepat dalam menangani data yang sangat besar.
B. Spark memiliki overhead yang lebih rendah.
C. Spark mendukung berbagai bahasa pemrograman seperti Python, R, dan Scala.
D. MapReduce lebih mudah digunakan untuk pemrosesan data sederhana.
Pembahasan :
Spark mendukung berbagai bahasa pemrograman seperti Python, R, dan Scala, sehingga lebih fleksibel dan mudah digunakan untuk berbagai jenis analisis data dibandingkan MapReduce yang lebih terbatas.
A. Penyimpanan data terstruktur yang terorganisir dengan baik.
B. Penyimpanan data mentah dalam format apa adanya, tanpa perlu pemrosesan awal.
C. Sistem database yang hanya menyimpan data transaksi.
D. Platform untuk menjalankan machine learning.
Pembahasan :
Data Lake adalah repositori penyimpanan data yang menyimpan data dalam format mentah, terstruktur, semi-terstruktur, dan tidak terstruktur. Ini memungkinkan fleksibilitas dalam pengolahan data.
A. Data Visualization
B. Data Compression
C. Data Mining
D. Data Filtering
Pembahasan :
Data Mining adalah proses menemukan pola, tren, dan wawasan yang bermakna dalam kumpulan data besar. Ini sering digunakan untuk membuat prediksi, mengidentifikasi anomali, dan meningkatkan pengambilan keputusan.
A. Kecepatan pemrosesan data.
B. Volume data yang disimpan.
C. Kualitas dan keandalan data.
D. Jenis data yang disimpan.
Pembahasan :
Veracity merujuk pada kualitas, keandalan, dan akurasi data. Data dalam Big Data seringkali mengandung noise, inkonsistensi, dan kesalahan yang perlu dikelola.
A. Penyimpanan data yang aman dan terjangkau.
B. Pemrosesan data yang cepat dan efisien.
C. Memastikan data berkualitas tinggi dan dapat diandalkan.
D. Memahami dan menginterpretasikan data kompleks.
Pembahasan :
Memahami dan menginterpretasikan data kompleks adalah tantangan yang berkelanjutan. Tantangan lainnya seperti penyimpanan yang aman, pemrosesan yang cepat, dan memastikan kualitas data sangat krusial dalam Big Data.