Apache Spark

Apache Spark

Professional Development

11 Qs

quiz-placeholder

Similar activities

SQL - Sintaxis PL/SQL

SQL - Sintaxis PL/SQL

Professional Development

8 Qs

¿Qué es BIG-DATA?

¿Qué es BIG-DATA?

Professional Development

10 Qs

Seguridad informática 2021

Seguridad informática 2021

Professional Development

10 Qs

Aprendizaje Automático

Aprendizaje Automático

Professional Development

10 Qs

Introducción a Sistemas SCADA

Introducción a Sistemas SCADA

Professional Development

10 Qs

SISTEMAS DE ARCHIVOS

SISTEMAS DE ARCHIVOS

Professional Development

10 Qs

Cuestionario sobre IA Generativa

Cuestionario sobre IA Generativa

Professional Development

10 Qs

ADSI

ADSI

Professional Development

16 Qs

Apache Spark

Apache Spark

Assessment

Quiz

Instructional Technology

Professional Development

Hard

Created by

Miguel Sotomayor

Used 5+ times

FREE Resource

11 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Cuál es la diferencia entre un RDD y un DataFrame

Dataframe tiene esquema

Es lo mismo

un RDD contiene datos estructurados

Un RDD no es calculado de manera lazy

2.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

Cuál es la diferencia entre una transformación y una acción para RDD/Dataframe? Selecciona la verdadera

Las transformaciones generan un nuevo Dataframe que es enviado al Driver

Las acciones y transformaciones sólo están disponibles para los DataFrame

Las acciones generan un resultado. Las transformaciones generan un nuevo RDD/Dataframe

Ninguna de las anteriores es correcta

3.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

Los Datasets son...

mucho más eficientes que los Dataframe

no están disponibles en PySpark

estructuras que contienen objetos tipados

exactamente los mismo que los Dataframe

4.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

Una tarea...

Siempre se ejecuta en un core

por defecto, se ejecuta en un core

se ejecuta en el Driver

5.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

El desbalanceo de datos (Data Skew) ocurre cuando...

Cada partición de un Dataframe contiene la misma cantidad de datos

Suele producirse después de un shuffle

Cada partición de un Dataframe contiene diferente cantidad de datos

Ninguna de las anteriores es correcta

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

La operación coalesce siempre genera un shuffle

Verdadero

Falso

7.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

Media Image

Qué es lo que ha ocurrido para que haya cambiado el plan de ejecución?

Adaptative planning

Un sort merge join siempre se transforma en un Broadcast Hash Join

Ha aumentado la cantidad de datos en los DataFrame

Todas son correctas

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?