¿Cómo maneja Apache Spark los fallos de nodo durante el procesamiento de datos?

Databricks SESION 3

Quiz
•
Other
•
Professional Development
•
Medium
licibeth delacruz
Used 5+ times
FREE Resource
12 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
20 sec • 1 pt
Reiniciando todo el clúster.
Ignorando los datos perdidos.
Recomputando los datos perdidos usando el linaje del RDD.
Solicitando una copia de seguridad del nodo caído.
2.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
¿Qué método se utiliza para aumentar el número de particiones de un RDD en Spark?
repartition()
coalesce()
broadcast()
reduceByKey()
3.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
¿Qué describe mejor una operación de acción en Spark?
Una operación que devuelve y transforma un nuevo RDD.
Una operación que modifica el RDD original y lo transforma a Dataframe.
Una operación que gatilla un proceso o escribe datos en un almacenamiento externo.
Una operación que solo se realiza en el driver, y devuelve un valor.
4.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
¿Qué característica de Apache Spark mejora el rendimiento de las operaciones repetitivas en el mismo dataset?
La transmisión de datos en tiempo real.
El almacenamiento en memoria (caching).
La serialización eficiente de datos.
La distribución automática de la carga de trabajo.
5.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
En el contexto de Spark, ¿qué es un DataFrame?
Una colección distribuida y estructurada de datos organizados en columnas.
Un tipo especial de RDD optimizado para operaciones de agregación.
Un conjunto de datos almacenado en HDFS que no puede ser modificado.
Una estructura de datos que solo permite operaciones de transformación.
6.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
¿Qué afirmación es verdadera respecto a la operación coalesce() en Spark?
Incrementa el número de particiones de un RDD.
Disminuye el número de particiones de un RDD de manera eficiente.
Realiza una operación de shuffle completo en los datos.
Se utiliza para distribuir datos a través de diferentes nodos.
7.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
¿Qué componente de Spark es responsable de la planificación de tareas y la gestión de recursos?
Worker
Driver
Executor
YARN
Create a free account and access millions of resources
Similar Resources on Wayground
10 questions
RECOMENDACIÓN DIRIGIDA A LOS CENTROS EDUCTIVOS PARA NO PUBLICAR

Quiz
•
Professional Development
14 questions
Etnografía

Quiz
•
Professional Development
12 questions
INICIAL WORD AVANZADO

Quiz
•
Professional Development
10 questions
Internet en tu Casa

Quiz
•
Professional Development
10 questions
EVALUACIÓN PROCESOS VAS

Quiz
•
Professional Development
10 questions
Gamificación de TICS UNID - Claudia Mendez Morales

Quiz
•
Professional Development
16 questions
Capacitación Refrigeración

Quiz
•
Professional Development
10 questions
Conceptos SQL - Clase 5

Quiz
•
Professional Development
Popular Resources on Wayground
25 questions
Equations of Circles

Quiz
•
10th - 11th Grade
30 questions
Week 5 Memory Builder 1 (Multiplication and Division Facts)

Quiz
•
9th Grade
33 questions
Unit 3 Summative - Summer School: Immune System

Quiz
•
10th Grade
10 questions
Writing and Identifying Ratios Practice

Quiz
•
5th - 6th Grade
36 questions
Prime and Composite Numbers

Quiz
•
5th Grade
14 questions
Exterior and Interior angles of Polygons

Quiz
•
8th Grade
37 questions
Camp Re-cap Week 1 (no regression)

Quiz
•
9th - 12th Grade
46 questions
Biology Semester 1 Review

Quiz
•
10th Grade