
PREGUNTAS dbfs-spark SESION4
Quiz
•
Other
•
Professional Development
•
Medium
licibeth delacruz
Used 2+ times
FREE Resource
Enhance your content
12 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
20 sec • 1 pt
¿Cómo maneja Apache Spark los fallos de nodo durante el procesamiento de datos?
a. Reiniciando todo el clúster.
b. Ignorando los datos perdidos
c. Recomputando los datos perdidos usando el linaje del RDD.
d. Solicitando una copia de seguridad del nodo caído.
2.
MULTIPLE CHOICE QUESTION
20 sec • 1 pt
¿Qué método se utiliza para aumentar el número de particiones de un RDD en Spark?
a. repartition()
b. coalesce()
c. broadcast()
d. reduceByKey()
3.
MULTIPLE CHOICE QUESTION
20 sec • 1 pt
¿Qué describe mejor una operación de acción en Spark?
a. Una operación que devuelve y transforma un nuevo RDD.
b. Una operación que modifica el RDD original y lo transforma a Dataframe.
c. Una operación que gatilla un proceso o escribe datos en un almacenamiento externo.
d. Una operación que solo se realiza en el driver, y devuelve un valor.
4.
MULTIPLE CHOICE QUESTION
20 sec • 1 pt
¿Qué característica de Apache Spark mejora el rendimiento de las operaciones repetitivas en el mismo dataset?
a. La transmisión de datos en tiempo real.
b. El almacenamiento en memoria (caching).
c. La serialización eficiente de datos.
d. La distribución automática de la carga de trabajo.
5.
MULTIPLE CHOICE QUESTION
20 sec • 1 pt
En el contexto de Spark, ¿qué es un DataFrame?
a. Una colección distribuida y estructurada de datos organizados en columnas.
b. Un tipo especial de RDD optimizado para operaciones de agregación.
c. Un conjunto de datos almacenado en HDFS que no puede ser modificado.
d. Una estructura de datos que solo permite operaciones de transformación.
6.
MULTIPLE CHOICE QUESTION
20 sec • 1 pt
¿Qué afirmación es verdadera respecto a la operación coalesce() en Spark?
a. Incrementa el número de particiones de un RDD.
b. Disminuye el número de particiones de un RDD de manera eficiente.
c. Realiza una operación de shuffle completo en los datos.
d. Se utiliza para distribuir datos a través de diferentes nodos.
7.
MULTIPLE CHOICE QUESTION
20 sec • 1 pt
¿Qué componente de Spark es responsable de la planificación de tareas y la gestión de recursos?
a. Worker
b. Driver
c. Executor
d. YARN
Create a free account and access millions of resources
Create resources
Host any resource
Get auto-graded reports

Continue with Google

Continue with Email

Continue with Classlink

Continue with Clever
or continue with

Microsoft
%20(1).png)
Apple

Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?
Similar Resources on Wayground
11 questions
PySpark Quiz Round
Quiz
•
Professional Development
12 questions
Databricks SESION 3
Quiz
•
Professional Development
15 questions
Recogida y tratamiento de datos en centros educativos
Quiz
•
Professional Development
13 questions
Evaluación de proyectos y programas escolares
Quiz
•
Professional Development
16 questions
Unidad I Sistemas de Información Gerencial
Quiz
•
Professional Development
10 questions
UNIDAD 2: LA ACTUACIÓN PERSONAL Y PROFESIONAL
Quiz
•
Professional Development
12 questions
Elaboracion de proyectos de investigacion
Quiz
•
Professional Development
7 questions
Curso Lideres Sesión3-1
Quiz
•
Professional Development
Popular Resources on Wayground
20 questions
Brand Labels
Quiz
•
5th - 12th Grade
10 questions
Ice Breaker Trivia: Food from Around the World
Quiz
•
3rd - 12th Grade
25 questions
Multiplication Facts
Quiz
•
5th Grade
20 questions
ELA Advisory Review
Quiz
•
7th Grade
15 questions
Subtracting Integers
Quiz
•
7th Grade
22 questions
Adding Integers
Quiz
•
6th Grade
10 questions
Multiplication and Division Unknowns
Quiz
•
3rd Grade
10 questions
Exploring Digital Citizenship Essentials
Interactive video
•
6th - 10th Grade