Big data 1

Big data 1

University

10 Qs

quiz-placeholder

Similar activities

Bài 3.1: Trắc nghiệm phần 2

Bài 3.1: Trắc nghiệm phần 2

University

10 Qs

Kiểm tra kiến thức về SQL

Kiểm tra kiến thức về SQL

11th Grade - University

15 Qs

Khám Phá Nghề Nghiệp Trong Tin Học

Khám Phá Nghề Nghiệp Trong Tin Học

8th Grade - University

10 Qs

Câu hỏi bài: Ngôn ngữ lập trình bậc cao và Python

Câu hỏi bài: Ngôn ngữ lập trình bậc cao và Python

University

10 Qs

Kiểm tra môn Tin học

Kiểm tra môn Tin học

University

10 Qs

Trắc Nghiệm Hồi Quy

Trắc Nghiệm Hồi Quy

University

13 Qs

IT vs IS

IT vs IS

University

10 Qs

câu hỏi cá nhân đào tạo FTU

câu hỏi cá nhân đào tạo FTU

University

13 Qs

Big data 1

Big data 1

Assessment

Quiz

Information Technology (IT)

University

Easy

Created by

Cường Nam

Used 1+ times

FREE Resource

10 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Đầu vào dữ liệu cho chương trình Spark có thể là:

Local file

HDFS, NFS

Amazon S3, Elasticsearch

Cả 3 phương án trên

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Đâu là lệnh lưu dữ liệu ra ngoài chương trình Spark:

input.saveAsTextFile('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile('/usr/zeppelin/notebook/dataset/new.txt')

input.saveAs('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile:'file:///usr/zeppelin/notebook/dataset/new.txt'

3.

MULTIPLE SELECT QUESTION

30 sec • 1 pt

Đâu là cách submit đúng một job lên Spark cluster hoặc chế độ local:

./spark-submit wordcount.py README.md

./spark-submit README.md wordcount.py

spark-submit README.md wordcount.py

Phương án A và C

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Câu lệnh MapReduce trong Spark dưới đây, chia mỗi dòng thành từ dựa vào delimiter nào.

input.flatMap(lambda x: x.split('\t')).map(lambda x: (x, 1)).reduceByKey(add)

Tab

Dấu cách

Dấu hai chấm

Dấu phẩy

5.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

Data Pipeline nào sau đây là đúng trên Spark

Spark→RabbitMQ→Elasticsearch→Hiển thị

Dữ liệu sensor → RabbitMQ →Elasticsearch→Spark→Hiển thị

Dữ liệu sensor → Elasticserach→RabbitMQ→Spark→Hiển thị

Spark→Elasticsearch→Hiển thị

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Mục đích của sử dụng RabbitMQ là gì?

Lưu trữ dữ liệu

Tránh dữ liệu bị mất mát

Hiển thị dữ liệu

Phân tích dữ liệu

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Spark có thể chạy ở chế độ nào khi chạy trên nhiều máy?

Chạy trên YARN

Chạy trên ZooKeeper

Phương án A và B đều sai

Cả 2 phương án A và B

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?