Quiz Chapter 9 BD

Quiz Chapter 9 BD

University

10 Qs

quiz-placeholder

Similar activities

machine learning

machine learning

University

15 Qs

Analitika data perpajakan

Analitika data perpajakan

University

10 Qs

data science pertemuan 2

data science pertemuan 2

University

10 Qs

Quis Data Analyst Camp 9

Quis Data Analyst Camp 9

University

10 Qs

Pembelajaran Mesin

Pembelajaran Mesin

University

15 Qs

Materi 1 Data Mining

Materi 1 Data Mining

University

10 Qs

Clustering_Pertemuan2_Quiz_Ceria

Clustering_Pertemuan2_Quiz_Ceria

University

10 Qs

Machine Learning Final Quiz

Machine Learning Final Quiz

University

10 Qs

Quiz Chapter 9 BD

Quiz Chapter 9 BD

Assessment

Quiz

Computers

University

Easy

Created by

Utomo Pujianto

Used 1+ times

FREE Resource

10 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa tujuan dari Expectation Maximization (EM) Clustering Algorithm?
Mengklasifikasikan data berdasarkan kategori yang sudah ada
Menyempurnakan model clustering dengan probabilitas
Mengurangi dimensi data untuk mempercepat analisis
Mengelompokkan data dengan cara menentukan batasan yang jelas

Answer explanation

Penjelasan: Expectation Maximization (EM) adalah algoritma yang digunakan dalam clustering untuk mengoptimalkan model probabilistik yang berfungsi untuk mengidentifikasi distribusi data dan menyempurnakan pemisahan cluster.

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Bagaimana Hierarchical Clustering bekerja dalam analisis clustering?
Menggunakan algoritma untuk menggabungkan data yang serupa menjadi satu cluster
Mengelompokkan data berdasarkan model regresi
Membagi data ke dalam jumlah cluster yang tetap
Menghasilkan cluster berdasarkan klasifikasi biner

Answer explanation

Penjelasan: Hierarchical clustering adalah metode clustering yang membangun struktur hierarki dengan menggabungkan atau memisahkan data berdasarkan kesamaan atau jarak antar data.

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa kelemahan utama dari K-Means Algorithm?
Memerlukan banyak waktu untuk menghitung jarak antar data
Hasilnya sangat bergantung pada pemilihan titik pusat (centroid) awal
Tidak bisa digunakan untuk dataset besar
Tidak dapat menangani data yang memiliki noise

Answer explanation

Penjelasan: K-Means sangat sensitif terhadap pemilihan titik pusat (centroid) awal, yang dapat menyebabkan hasil clustering yang buruk jika titik pusat tidak dipilih dengan hati-hati.

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa yang dimaksud dengan Outlier dalam analisis data?
Data yang memiliki kesamaan dengan sebagian besar data lainnya
Data yang terletak jauh dari pola umum atau distribusi mayoritas data
Data yang memiliki label tertentu
Data yang digunakan untuk mengelompokkan informasi

Answer explanation

Penjelasan: Outlier adalah data yang terpisah atau berbeda secara signifikan dari mayoritas data dalam dataset, yang dapat menunjukkan kejadian langka atau kesalahan pengukuran.

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Teknik pengukuran jarak manakah yang paling cocok digunakan dalam analisis teks atau data berdimensi tinggi?
Euclidean Distance
Manhattan Distance
Cosine Similarity
Squared Euclidean Distance

Answer explanation

Cosine Similarity digunakan untuk mengukur sudut antara vektor, sehingga sangat cocok untuk data berdimensi tinggi seperti analisis teks.

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa yang terjadi jika jumlah klaster yang dipilih dalam partitional clustering lebih besar daripada yang sebenarnya diperlukan oleh dataset?
Klaster yang dihasilkan akan tumpang tindih satu sama lain
Algoritma akan gagal mengelompokkan data
Data akan terlalu terfragmentasi, menghasilkan klaster yang tidak bermakna
Semua data akan dikelompokkan ke dalam satu klaster besar

Answer explanation

Jika jumlah klaster yang dipilih terlalu besar, dataset akan dibagi menjadi terlalu banyak klaster kecil yang tidak mencerminkan pola atau hubungan bermakna dalam data, sehingga hasil klasterisasi menjadi tidak relevan.

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Bagaimana kernel trick pada Kernel K-Means meningkatkan kemampuan algoritma dibandingkan K-Means biasa?
Dengan memisahkan data non-linear secara langsung di ruang input
Dengan mengurangi jumlah iterasi yang diperlukan untuk klasterisasi
Dengan memetakan data ke ruang dimensi tinggi tanpa perhitungan eksplisit
Dengan menggantikan centroid dengan fungsi probabilistik

Answer explanation

Kernel trick memungkinkan pemetaan data dari ruang input ke ruang dimensi tinggi (feature space) tanpa melakukan perhitungan eksplisit. Hal ini dilakukan dengan menghitung jarak antar data menggunakan fungsi kernel, sehingga memungkinkan data yang tidak linear di ruang input dapat dipisahkan dengan lebih baik dalam feature space. Pendekatan ini meningkatkan fleksibilitas algoritma dalam menangani data yang lebih kompleks.

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?