Data Mining Chapter 3-2

Data Mining Chapter 3-2

University

8 Qs

quiz-placeholder

Similar activities

แบบทดสอบ ความรู้เบื้องต้นเกี่ยวกับเว็บไซต์เพื่อการศึกษา2

แบบทดสอบ ความรู้เบื้องต้นเกี่ยวกับเว็บไซต์เพื่อการศึกษา2

University

10 Qs

Generative AI และ ChatGPT

Generative AI และ ChatGPT

University

10 Qs

ข้อสอบ Pretest: การวิเคราะห์ข้อมูล

ข้อสอบ Pretest: การวิเคราะห์ข้อมูล

University

10 Qs

แบบจำลองฐานข้อมูล

แบบจำลองฐานข้อมูล

University

10 Qs

บทที่1 ข้อมูลมีคุณค่า

บทที่1 ข้อมูลมีคุณค่า

10th Grade - University

10 Qs

แบบทดสอบ

แบบทดสอบ

University

10 Qs

หน่วยที่ 2 เทคนิคการค้นหาข้อมูล (ก่อนเรียน)

หน่วยที่ 2 เทคนิคการค้นหาข้อมูล (ก่อนเรียน)

University

12 Qs

ความเป็นส่วนตัว

ความเป็นส่วนตัว

University

10 Qs

Data Mining Chapter 3-2

Data Mining Chapter 3-2

Assessment

Quiz

Computers

University

Hard

Created by

วัชรศักดิ์ ศิริเสรีวรรณ

Used 5+ times

FREE Resource

8 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Attribute subset selection คืออะไร

กระบวนการคัดเลือกเซตย่อยของ Attribute เพื่อใช้ในการสร้างตัวแบบ

การแปลงข้อมูลจากมิติสูงๆ ให้มีจำนวนมิติน้อยลง โดยใช้ linear combination

กระบวนการคัดเลือก Attribute เพื่อใช้แบ่งกลุ่มของข้อมูล

กระบวนการเลือกเซตย่อยของข้อมูลที่มี attribute เดียวกัน

2.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

ข้อใดเป็นวัตถุประสงค์ของ Principal Component Analysis (PCA)

ใช้เลือกคุณลักษณะที่อิสระต่อกัน

หมุนข้อมูลไปอยู่ในแกนที่มีความแปรปรวนสูงสุดก่อน

ช่วยให้การทำ scatter plot 3D เห็นการกระจายชัดเจนขึ้น

เปลี่ยนข้อมูลให้อยู่ในมิติที่น้อยลง

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

แกน principle component แกนที่ 1 หาได้จากอะไร

Unit eigen vector จาก Eigen valueที่มีค่ามากสุดของ Covarience matrix

Unit eigen vector จาก Eigen valueที่มีค่าน้อยสุดของ Covarience matrix

Unit eigen vector จาก Eigen valueที่มีค่ามากสุดของ Distance matrix

Unit eigen vector จาก Eigen valueที่มีค่าน้อยสุดของ Distance matrix

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

สมมติให้ ข้อมูลหนึ่ง มี 3 คุณลักษณะ ที่มีค่าเฉลี่ย 3, 5, 2 ตามลำดับ

และมีแกน Principal component ที่ 1 เป็น [a, b, c]

จุดข้อมูล (3, 6, 1) จะถูกโปรเจคที่จุดอะไร

3a + 6b + c

b - c

3a + 5b +2c

(0, 1, -1)

(3a, 6b, c)

5.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

ข้อใดจริงเกี่ยวกับ Sampling

SRSWOR สุ่มเลือกข้อมูลซ้ำไม่ได้

SRSWR ต้องสุ่มได้ข้อมูลซ้ำกัน

Cluster sampling จะแบ่งกลุ่มตามความคล้ายแล้วจึงสุ่มตัวแทนจากแต่ละกลุ่ม

Stratified sampling เป็นการสุ่มข้อมูลโดยรักษาอัตราส่วนของข้อมูลในแต่ละคลาส

6.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

ข้อใดเป็นวิธีการ normalization ข้อมูล

min-max

standardized

equal-length binning

equal-width binning

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

กำหนด x = 24 จงทำการแปลงค่าด้วย z-score เมื่อกำหนดให้ μ = 30 และ σ = 12

0.5

-0.5

2

0

8.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

ความกว้างของแต่ละ bin เมื่อกำหนดข้อมูลกลุ่มหนึ่งมีค่า min, Q1, median, Q3, max = 10, 25, 40, 52, 90 และจำนวน bin = 10

8

10

5

4