
Cuestionario 2 - NLP
Authored by Lautaro Perez
Computers
Professional Development
Used 1+ times

AI Actions
Add similar questions
Adjust reading levels
Convert to real-world scenario
Translate activity
More...
Content View
Student View
15 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
45 sec • 1 pt
¿Cuál es la idea central de la metodología Bag-of-Words (BoW)?
Crear vectores que capturen el significado semántico de las palabras.
Representar un documento contando la frecuencia de cada palabra, ignorando el orden.
Agrupar palabras en entidades como "Persona" o "Lugar".
Answer explanation
Justificación: BoW se enfoca únicamente en la frecuencia de las palabras (cuántas veces aparecen), tratando el documento como una "bolsa" donde el orden no importa.
2.
MULTIPLE CHOICE QUESTION
45 sec • 1 pt
¿Cuál es la principal limitación de los modelos basados en frecuencia como BoW y TF-IDF?
Son muy lentos para procesar textos cortos.
Solo funcionan para el idioma inglés.
No entienden el significado (semántica) de las palabras ni su contexto.
Answer explanation
Justificación: Estos modelos no saben que "coche" y "auto" son sinónimos, ya que tratan cada palabra como un token único sin comprender su significado.
3.
MULTIPLE CHOICE QUESTION
45 sec • 1 pt
En el modelo TF-IDF, ¿qué mide el componente IDF (Inverse Document Frequency)?
La frecuencia de una palabra dentro de un único documento.
La importancia de una palabra, dándole más peso a las que son raras en todo el corpus.
El número total de palabras en todo el corpus.
Answer explanation
Justificación: El IDF penaliza las palabras que son muy comunes en todos los documentos (como las stopwords) y premia a las que son raras y distintivas.
4.
MULTIPLE CHOICE QUESTION
45 sec • 1 pt
¿Para qué se utiliza TfidfVectorizer de Scikit-learn?
Para entrenar un modelo de clasificación de texto.
Para realizar el etiquetado gramatical (POS Tagging) de un texto.
Para automatizar la creación de una matriz TF-IDF a partir de un corpus de texto.
Answer explanation
Justificación: TfidfVectorizer encapsula todo el proceso de tokenización, conteo y cálculo de pesos TF-IDF en un solo objeto.
5.
MULTIPLE CHOICE QUESTION
45 sec • 1 pt
¿Cuál es el objetivo principal del Reconocimiento de Entidades Nombradas (NER)?
Reducir las palabras a su raíz o lema.
Identificar y clasificar entidades como personas, lugares y organizaciones en un texto.
Contar la frecuencia de los nombres propios en un documento.
Answer explanation
Justificación: NER se enfoca en extraer información estructurada (entidades con sus categorías) de texto no estructurado.
6.
MULTIPLE CHOICE QUESTION
45 sec • 1 pt
¿Cuál es la principal ventaja de spaCy sobre NLTK para realizar NER en español?
NLTK no puede tokenizar texto.
spaCy ofrece modelos pre-entrenados de alto rendimiento para español, mientras que el NER de NLTK es principalmente para inglés.
El código de spaCy es más difícil de entender que el de NLTK.
Answer explanation
Justificación: La fortaleza de spaCy es su enfoque multilingüe y sus modelos listos para usar en producción para muchos idiomas, incluido el español.
7.
MULTIPLE CHOICE QUESTION
45 sec • 1 pt
En el contexto de NER, ¿qué significa la etiqueta B-ORG?
Que el token está fuera (Outside) de una entidad de tipo Organización.
Que el token está dentro (Inside) de una entidad de tipo Persona.
Que el token es el comienzo (Beginning) de una entidad de tipo Organización.
Answer explanation
Justificación: El esquema BIO utiliza 'B' para el inicio, 'I' para el interior de una entidad, y el sufijo (ORG) para indicar el tipo de entidad.
Access all questions and much more by creating a free account
Create resources
Host any resource
Get auto-graded reports

Continue with Google

Continue with Email

Continue with Classlink

Continue with Clever
or continue with

Microsoft
%20(1).png)
Apple
Others
Already have an account?