PREGUNTAS dbfs-spark SESION4

PREGUNTAS dbfs-spark SESION4

Professional Development

12 Qs

quiz-placeholder

Similar activities

Ordenar y filtrar en excel

Ordenar y filtrar en excel

Professional Development

10 Qs

Information Management Quiz

Information Management Quiz

Professional Development

10 Qs

Plataforma Thinking City

Plataforma Thinking City

Professional Development

15 Qs

UNIDAD 5

UNIDAD 5

Professional Development

10 Qs

claro hogar

claro hogar

Professional Development

10 Qs

Gamificación de TICS UNID - Claudia Méndez Morales

Gamificación de TICS UNID - Claudia Méndez Morales

Professional Development

10 Qs

BASES DE DATOS

BASES DE DATOS

Professional Development

10 Qs

Análisis e interpretación de la información

Análisis e interpretación de la información

Professional Development

12 Qs

PREGUNTAS dbfs-spark SESION4

PREGUNTAS dbfs-spark SESION4

Assessment

Quiz

Other

Professional Development

Medium

Created by

licibeth delacruz

Used 2+ times

FREE Resource

AI

Enhance your content

Add similar questions
Adjust reading levels
Convert to real-world scenario
Translate activity
More...

12 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

20 sec • 1 pt

¿Cómo maneja Apache Spark los fallos de nodo durante el procesamiento de datos?

a. Reiniciando todo el clúster.

b. Ignorando los datos perdidos

c. Recomputando los datos perdidos usando el linaje del RDD.

d. Solicitando una copia de seguridad del nodo caído.

2.

MULTIPLE CHOICE QUESTION

20 sec • 1 pt

¿Qué método se utiliza para aumentar el número de particiones de un RDD en Spark?

a. repartition()

b. coalesce()

c. broadcast()

d. reduceByKey()

3.

MULTIPLE CHOICE QUESTION

20 sec • 1 pt

¿Qué describe mejor una operación de acción en Spark?

a. Una operación que devuelve y transforma un nuevo RDD.

b. Una operación que modifica el RDD original y lo transforma a Dataframe.

c. Una operación que gatilla un proceso o escribe datos en un almacenamiento externo.

d. Una operación que solo se realiza en el driver, y devuelve un valor.

4.

MULTIPLE CHOICE QUESTION

20 sec • 1 pt

¿Qué característica de Apache Spark mejora el rendimiento de las operaciones repetitivas en el mismo dataset?

a. La transmisión de datos en tiempo real.

b. El almacenamiento en memoria (caching).

c. La serialización eficiente de datos.

d. La distribución automática de la carga de trabajo.

5.

MULTIPLE CHOICE QUESTION

20 sec • 1 pt

En el contexto de Spark, ¿qué es un DataFrame?

a. Una colección distribuida y estructurada de datos organizados en columnas.

b. Un tipo especial de RDD optimizado para operaciones de agregación.

c. Un conjunto de datos almacenado en HDFS que no puede ser modificado.

d. Una estructura de datos que solo permite operaciones de transformación.

6.

MULTIPLE CHOICE QUESTION

20 sec • 1 pt

¿Qué afirmación es verdadera respecto a la operación coalesce() en Spark?

a. Incrementa el número de particiones de un RDD.

b. Disminuye el número de particiones de un RDD de manera eficiente.

c. Realiza una operación de shuffle completo en los datos.

d. Se utiliza para distribuir datos a través de diferentes nodos.

7.

MULTIPLE CHOICE QUESTION

20 sec • 1 pt

¿Qué componente de Spark es responsable de la planificación de tareas y la gestión de recursos?

a. Worker

b. Driver

c. Executor

d. YARN

Create a free account and access millions of resources

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

By signing up, you agree to our Terms of Service & Privacy Policy

Already have an account?