Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10609/151792
Título : | Aprendizaje por refuerzo, septiembre 2020 |
Autoría: | Ruiz Dern, Laura ![]() Casas-Roma, Jordi ![]() Esteve Elfau, Luis Dini, Paolo ![]() |
Resumen : | Recurso de aprendizaje de la Universitat Oberta de Catalunya. |
Tipo de documento: | info:eu-repo/semantics/lecture |
Fecha de publicación : | sep-2020 |
Licencia de publicación: | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ ![]() |
Aparece en las colecciones: | UOC Learning resources |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
IntroduccionAlAprendizajePorRefuerzo.pdf | Introducción al aprendizaje por refuerzo | 354,13 kB | Adobe PDF | ![]() Visualizar/Abrir |
IntroduccionOpenAIGym.pdf | Introducción a OpenAI Gym | 369,74 kB | Adobe PDF | ![]() Visualizar/Abrir |
GradientesDePoltica.pdf | Gradientes de política | 244,46 kB | Adobe PDF | ![]() Visualizar/Abrir |
ElMetodoActorCritico.pdf | El método actor-crítico | 362,3 kB | Adobe PDF | ![]() Visualizar/Abrir |
DeepQNetworks.pdf | Deep Q-networks | 1,41 MB | Adobe PDF | ![]() Visualizar/Abrir |
ProgramacionDinamica.pdf | Programación dinámica | 419,82 kB | Adobe PDF | ![]() Visualizar/Abrir |
ProcesosDeDecisionDeMarkov.pdf | Procesos de decisión de Márkov | 507,78 kB | Adobe PDF | ![]() Visualizar/Abrir |
MEtodosDeMontecarlo.pdf | Métodos de Montecarlo | 1,03 MB | Adobe PDF | ![]() Visualizar/Abrir |
MetodosDeDiferenciaTemporal.pdf | Métodos de diferencia temporal | 311,06 kB | Adobe PDF | ![]() Visualizar/Abrir |
Comparte:


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons