Please use this identifier to cite or link to this item:
http://hdl.handle.net/10609/151792
Title: | Aprendizaje por refuerzo, septiembre 2020 |
Author: | Ruiz Dern, Laura ![]() Casas-Roma, Jordi ![]() Esteve Elfau, Luis Dini, Paolo ![]() |
Abstract: | Learning resource of the Universitat Oberta de Catalunya. |
Document type: | info:eu-repo/semantics/lecture |
Issue Date: | Sep-2020 |
Publication license: | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ ![]() |
Appears in Collections: | UOC Learning resources |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
IntroduccionAlAprendizajePorRefuerzo.pdf | Introducción al aprendizaje por refuerzo | 354,13 kB | Adobe PDF | ![]() View/Open |
IntroduccionOpenAIGym.pdf | Introducción a OpenAI Gym | 369,74 kB | Adobe PDF | ![]() View/Open |
GradientesDePoltica.pdf | Gradientes de política | 244,46 kB | Adobe PDF | ![]() View/Open |
ElMetodoActorCritico.pdf | El método actor-crítico | 362,3 kB | Adobe PDF | ![]() View/Open |
DeepQNetworks.pdf | Deep Q-networks | 1,41 MB | Adobe PDF | ![]() View/Open |
ProgramacionDinamica.pdf | Programación dinámica | 419,82 kB | Adobe PDF | ![]() View/Open |
ProcesosDeDecisionDeMarkov.pdf | Procesos de decisión de Márkov | 507,78 kB | Adobe PDF | ![]() View/Open |
MEtodosDeMontecarlo.pdf | Métodos de Montecarlo | 1,03 MB | Adobe PDF | ![]() View/Open |
MetodosDeDiferenciaTemporal.pdf | Métodos de diferencia temporal | 311,06 kB | Adobe PDF | ![]() View/Open |
Share:


This item is licensed under aCreative Commons License