Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

University

5 Qs

quiz-placeholder

Similar activities

Vídeo: A Saga dos Computadores e Arquitetura de Von Neumann

Vídeo: A Saga dos Computadores e Arquitetura de Von Neumann

University

10 Qs

SIG02

SIG02

University

5 Qs

BLOCKCHAIN & CRIPTOMOEDAS

BLOCKCHAIN & CRIPTOMOEDAS

University

7 Qs

1_python

1_python

University

5 Qs

SCRUM

SCRUM

University

8 Qs

FECITAC - IFES (VNI)

FECITAC - IFES (VNI)

University

6 Qs

Revisão 01 - Informática Inovação e Tecnologia

Revisão 01 - Informática Inovação e Tecnologia

University

10 Qs

Estrutura de Dados - Grafo

Estrutura de Dados - Grafo

University

9 Qs

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

Assessment

Quiz

Computers

University

Easy

Created by

ADM_CMX ADM_CMX

Used 1+ times

FREE Resource

5 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Um Agente em Aprendizagem por Reforço decide quais ações tomar seguindo uma sequência predeterminada.

Verdadeiro

Falso

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Conforme é previsto pela Cadeia de Markov, o próximo estado em que Mario vai estar apenas depende do estado atual dele.

Verdadeiro

Falso

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Mario saberá quais as melhores Ações para se realizar em cada Estado ao receber uma Recompensa por ela. Recompensas nada mais são que números inteiros ou flutuantes, e o Agente sempre irá tentar coletar o máximo possível de Recompensa.

Verdadeiro

Falso

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

O propósito de uma Matriz de Transição na Aprendizagem por Reforço é calcular a probabilidade de transição de um estado para outro.

Verdadeiro

Falso

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Um Processo de Decisão Markov (MDP) no contexto da Aprendizagem por Reforço é uma fórmula matemática para calcular probabilidades.

Verdadeiro

Falso