Logo
Unionpedia
Comunicación
Disponible en Google Play
¡Nuevo! ¡Descarga Unionpedia en tu dispositivo Android™!
Gratis
¡Más rápido que el navegador!
 

Aprendizaje automático y Aprendizaje por refuerzo

Accesos rápidos: Diferencias, Similitudes, Coeficiente de Similitud Jaccard, Referencias.

Diferencia entre Aprendizaje automático y Aprendizaje por refuerzo

Aprendizaje automático vs. Aprendizaje por refuerzo

El aprendizaje automático (AA), aprendizaje automatizado, aprendizaje de máquinas o aprendizaje computacional (del inglés, machine learning) es el subcampo de las ciencias de la computación y una rama de la inteligencia artificial, cuyo objetivo es desarrollar técnicas que permitan que las computadoras aprendan. El aprendizaje por refuerzo o aprendizaje reforzado (reinforcement learning) es un área del aprendizaje automático (AA) inspirada en la psicología conductista, cuya ocupación es determinar qué acciones debe escoger un agente de software en un entorno dado con el fin de maximizar alguna noción de "recompensa" o premio acumulado.

Similitudes entre Aprendizaje automático y Aprendizaje por refuerzo

Aprendizaje automático y Aprendizaje por refuerzo tienen 4 cosas en común (en Unionpedia): Estadística, Método de Montecarlo, Proceso de decisión de Márkov, Programación dinámica.

Estadística

La estadística (la forma femenina del término alemán statistik, derivado a su vez del italiano statista, «hombre de Estado») es la disciplina que estudia la variabilidad, así como el proceso aleatorio que la genera siguiendo las leyes de la probabilidad.

Aprendizaje automático y Estadística · Aprendizaje por refuerzo y Estadística · Ver más »

Método de Montecarlo

El método de Montecarlo es un método no determinista o estadístico numérico, usado para aproximar expresiones matemáticas complejas y costosas de evaluar con exactitud.

Aprendizaje automático y Método de Montecarlo · Aprendizaje por refuerzo y Método de Montecarlo · Ver más »

Proceso de decisión de Márkov

En matemáticas, un proceso de decisión de Márkov (en inglés: Márkov decision process, MDP) es un proceso de control estocástico en tiempo discreto.

Aprendizaje automático y Proceso de decisión de Márkov · Aprendizaje por refuerzo y Proceso de decisión de Márkov · Ver más »

Programación dinámica

En informática, la programación dinámica es un método para reducir el tiempo de ejecución de un algoritmo mediante la utilización de subproblemas superpuestos y subestructuras óptimas.

Aprendizaje automático y Programación dinámica · Aprendizaje por refuerzo y Programación dinámica · Ver más »

La lista de arriba responde a las siguientes preguntas

Comparación de Aprendizaje automático y Aprendizaje por refuerzo

Aprendizaje automático tiene 93 relaciones, mientras Aprendizaje por refuerzo tiene 34. Como tienen en común 4, el índice Jaccard es 3.15% = 4 / (93 + 34).

Referencias

En este artículo se encuentra la relación entre Aprendizaje automático y Aprendizaje por refuerzo. Si desea acceder a cada artículo del que se extrajo la información visite:

¡Hey! ¡Ahora tenemos Facebook! »