5. Data Wrangling & Cleaning

Quiz
•
Other
•
Professional Development
•
Hard
Bayu Prasetya
FREE Resource
9 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa menangani missing values penting dalam analisis data?
Karena NaN otomatis dianggap error
Karena model/analisis bisa bias jika banyak data kosong
Karena NaN selalu berarti data salah
Karena NaN hanya muncul di data numerik
NaN tidak mempengaruhi analisis
2.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Sebuah dataset transaksi memiliki 2 baris identik untuk customer yang sama di tanggal yang sama. Apa implikasi jika duplicate tidak dihapus?
Analisis total transaksi bisa lebih kecil
Analisis tetap benar karena datanya sama
Analisis total transaksi bisa lebih besar dari kenyataan
Tidak ada dampak karena duplikat tidak dihitung
Duplikat hanya berpengaruh pada visualisasi
3.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa outlier perlu diperhatikan?
Selalu dihapus karena salah
Bisa mempengaruhi rata-rata dan hasil model
Hanya memengaruhi data kategorikal
Hanya relevan di data teks
Tidak berpengaruh pada analisis
4.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Dataset karyawan memiliki kolom "Departemen": HR, hr, Human Resource, HUM-RES. Apa yang sebaiknya dilakukan?
Hapus semua data tersebut
Biarkan karena tetap bermakna
Standarisasi menjadi satu kategori konsisten
Ubah menjadi NaN
5.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa tipe data kolom penting dalam wrangling?
Tipe data tidak berpengaruh
Tipe data untuk efisiensi penyimpanan
Tipe data memengaruhi operasi, agregasi, dan perhitungan
Tipe data hanya penting di SQL, bukan Pandas
Tipe data hanya relevan di machine learning
6.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa teks " Indonesia " (ada spasi di awal/akhir) bisa menjadi masalah dalam analisis?
Karena Python tidak bisa membaca string dengan spasi
Karena dianggap berbeda dari "Indonesia"
Karena string dengan spasi tidak bisa difilter
Karena semua string otomatis dipotong
Karena teks dengan spasi dianggap NaN
7.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Anda memiliki dataset penjualan dengan 10% data harga hilang. Strategi yang tepat?
Hapus semua baris kosong
Isi dengan 0
Pertimbangkan mengisi dengan rata-rata/median atau hapus jika proporsi kecil
Ubah semua ke NaN
Biarkan kosong karena tidak mempengaruhi
8.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Untuk menghitung jumlah nilai null di setiap kolom:
df.isnull()
df.isnull().sum()
df.isnull().sum().sum()
df.isnull().count()
df.dropna()
9.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Outputnya adalah?
Tetap ada spasi
Spasi di awal/akhir hilang
Semua jadi huruf kecil
Semua jadi huruf besar
Semua jadi NaN
Similar Resources on Wayground
10 questions
Training QA (GDocP & Stabilita - PQR)

Quiz
•
Professional Development
10 questions
Test Awal Supak dan PKG

Quiz
•
Professional Development
7 questions
Ice Breaking Day 08 DE - ETL

Quiz
•
Professional Development
12 questions
Post Test PTPS SIWASLU

Quiz
•
Professional Development
10 questions
Introduction to Python -Soal Serius

Quiz
•
Professional Development
14 questions
Tugas 8. quizizz

Quiz
•
Professional Development
10 questions
Topik 5 - Personaliti dan Konsep Kendiri

Quiz
•
Professional Development
10 questions
Visitasi

Quiz
•
Professional Development
Popular Resources on Wayground
10 questions
Video Games

Quiz
•
6th - 12th Grade
20 questions
Brand Labels

Quiz
•
5th - 12th Grade
15 questions
Core 4 of Customer Service - Student Edition

Quiz
•
6th - 8th Grade
15 questions
What is Bullying?- Bullying Lesson Series 6-12

Lesson
•
11th Grade
25 questions
Multiplication Facts

Quiz
•
5th Grade
15 questions
Subtracting Integers

Quiz
•
7th Grade
22 questions
Adding Integers

Quiz
•
6th Grade
10 questions
Exploring Digital Citizenship Essentials

Interactive video
•
6th - 10th Grade