Pendidikan Kelas Home Pelajaran Materi

Belajar Soal Informatika Kelas 11 SMA Tentang Data Science Pengantar

Materi :

Data Science Pengantar

Deskripsi :

Pengenalan konsep data science, pengumpulan data, pembersihan data, dan visualisasi data menggunakan Python (Pandas, Matplotlib).

Jenjang Pendidikan : SMA
Mata Pelajaran : Informatika
Kelas : SMA Kelas 11
Waktu :15 Menit

Jul 08, 2025   |   13 views

Apa yang dimaksud dengan Data Science?

A. Ilmu tentang analisis data secara statistik.
B. Ilmu tentang pembuatan database yang efisien.
C. Ilmu tentang transformasi data menjadi wawasan yang bermakna.
D. Ilmu tentang optimasi algoritma pencarian data.

Pembahasan :
Data Science adalah ilmu yang menggabungkan statistik, ilmu komputer, dan pengetahuan domain untuk mengekstrak wawasan dan pengetahuan dari data. Pilihan C secara akurat menggambarkan tujuan utama Data Science yaitu menghasilkan wawasan bermakna.

Tahap awal dalam proses Data Science adalah...

A. Pembuatan model Machine Learning.
B. Pembersihan dan persiapan data.
C. Visualisasi data untuk presentasi.
D. Pengumpulan data dari berbagai sumber.

Pembahasan :
Pengumpulan data merupakan langkah pertama dalam Data Science. Data harus dikumpulkan dari berbagai sumber dan kemudian diproses sebelum dapat dianalisis atau dimodelkan. Pilihan D adalah tahapan yang logis sebelum tahap lainnya.

Teknik apa yang umumnya digunakan untuk menangani nilai yang hilang (missing values) dalam data?

A. Menghapus seluruh data yang berisi nilai yang hilang.
B. Menggunakan teknik imputasi seperti rata-rata, median, atau modus.
C. Mengubah seluruh kolom yang berisi nilai yang hilang menjadi nol.
D. Menggunakan teknik smoothing untuk mengestimasi nilai yang hilang.

Pembahasan :
Imputasi adalah teknik yang umum digunakan untuk mengganti nilai yang hilang dengan nilai yang sesuai (rata-rata, median, modus, dll.) agar data tetap dapat dianalisis. Pilihan B adalah metode yang paling umum dan efektif.

Library Python apa yang sering digunakan untuk manipulasi dan analisis data?

A. TensorFlow
B. Keras
C. Pandas
D. Scikit-learn

Pembahasan :
Pandas adalah library Python yang sangat populer untuk manipulasi dan analisis data. Pandas menyediakan struktur data seperti DataFrame yang memudahkan untuk melakukan operasi seperti filtering, grouping, dan aggregations.

Apa fungsi utama dari fungsi `groupby()` di Pandas?

A. Menggabungkan beberapa DataFrame menjadi satu.
B. Mengelompokkan data berdasarkan nilai dalam satu atau lebih kolom.
C. Memfilter data berdasarkan kriteria tertentu.
D. Melakukan operasi matematika pada data.

Pembahasan :
Fungsi `groupby()` digunakan untuk mengelompokkan data berdasarkan nilai dalam kolom tertentu. Data yang dikelompokkan kemudian dapat dianalisis lebih lanjut.

Apa yang dimaksud dengan visualisasi data?

A. Membuat kode untuk analisis data.
B. Menampilkan data dalam bentuk grafik atau diagram.
C. Membuat model Machine Learning.
D. Menulis laporan analisis data.

Pembahasan :
Visualisasi data adalah proses menampilkan data dalam bentuk grafik, diagram, atau visualisasi lain agar lebih mudah dipahami dan diinterpretasikan.

Library Python apa yang paling sering digunakan untuk membuat visualisasi data di Python?

A. NumPy
B. Matplotlib
C. Requests
D. Beautiful Soup

Pembahasan :
Matplotlib adalah library Python yang sangat populer dan serbaguna untuk membuat berbagai jenis grafik dan diagram, seperti scatter plots, bar charts, dan line graphs.

Apa yang dimaksud dengan 'scatter plot'?

A. Grafik batang yang menunjukkan frekuensi data.
B. Grafik garis yang menunjukkan tren data dari waktu ke waktu.
C. Grafik yang memplot dua variabel numerik terhadap satu sama lain.
D. Grafik lingkaran yang menunjukkan proporsi data.

Pembahasan :
Scatter plot digunakan untuk memvisualisasikan hubungan antara dua variabel numerik.

Apa tujuan utama dari pembersihan data?

A. Mempercepat proses analisis data.
B. Memastikan data berkualitas tinggi dengan menghilangkan kesalahan dan inkonsistensi.
C. Menambah ukuran data untuk meningkatkan kinerja model Machine Learning.
D. Mengubah format data menjadi format yang lebih kompleks.

Pembahasan :
Pembersihan data bertujuan untuk memastikan data yang digunakan dalam analisis dan pemodelan adalah akurat, lengkap, dan konsisten.

Setelah melakukan analisis data, apa langkah selanjutnya yang biasanya dilakukan?

A. Menulis laporan analisis.
B. Mengubah data menjadi format yang lebih kompleks.
C. Menghapus data yang tidak relevan.
D. Membuat model Machine Learning.

Pembahasan :
Langkah selanjutnya setelah analisis data adalah menyajikan hasil analisis dalam bentuk laporan atau presentasi.