Logo
Unionpedia
Comunicación
Disponible en Google Play
¡Nuevo! ¡Descarga Unionpedia en tu dispositivo Android™!
Gratis
¡Más rápido que el navegador!
 

Aprendizaje por refuerzo multiagente

Índice Aprendizaje por refuerzo multiagente

El aprendizaje por refuerzo de multiagente es un subcampo del aprendizaje por refuerzo.

15 relaciones: Ajedrez, Aprendizaje por refuerzo, Dilema social, Equilibrio de Nash, Go, Información perfecta, Internet de las cosas, Juego de suma cero, Microgrid, Proceso de decisión de Márkov, Propiedad de Márkov, StarCraft (serie), Telefonía móvil 5G, Teoría de juegos, Vehículo autónomo.

Ajedrez

El ajedrez es un juego de tablero entre dos contrincantes en el que cada uno dispone al inicio de dieciséis piezas móviles, desiguales en importancia y valor, que se desplazan sobre un tablero capturando piezas del jugador contrario, según ciertas reglas.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Ajedrez · Ver más »

Aprendizaje por refuerzo

El aprendizaje por refuerzo o aprendizaje reforzado (reinforcement learning) es un área del aprendizaje automático (AA) inspirada en la psicología conductista, cuya ocupación es determinar qué acciones debe escoger un agente de software en un entorno dado con el fin de maximizar alguna noción de "recompensa" o premio acumulado.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Aprendizaje por refuerzo · Ver más »

Dilema social

Un dilema social o un problema de acción colectiva es una situación en la que todos los agentes estarían mejor cooperando pero no lo hacen debido a intereses en conflicto entre ellos que desalientan la acción conjunta.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Dilema social · Ver más »

Equilibrio de Nash

El equilibrio de Nash, equilibrio de Cournot, equilibrio de Cournot y Nash o equilibrio del miedo es, en la teoría de juegos, un “concepto de solución” para juegos con dos o más jugadores, el cual asume que.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Equilibrio de Nash · Ver más »

Go

El go (围棋 —wéiqí— en chino) (囲碁 —igo— en japonés) (바둑 —baduk— en coreano) (cờ vây en vietnamita) es un juego de tablero de estrategia para dos personas.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Go · Ver más »

Información perfecta

En teoría de juegos, un juego de información perfecta es aquel en que los jugadores conocen todo lo que podrían desear conocer acerca de lo que ha sucedido desde el principio del juego cuando tienen que realizar un movimiento hasta el momento.

¡Nuevo!!: Aprendizaje por refuerzo multiagente e Información perfecta · Ver más »

Internet de las cosas

El Internet de las cosas (IdC) describe objetos físicos (o grupos de estos) con sensores, capacidad de procesamiento, software y otras que se conectan e intercambian datos con otros dispositivos y sistemas a través de internet u otras redes de comunicación.

¡Nuevo!!: Aprendizaje por refuerzo multiagente e Internet de las cosas · Ver más »

Juego de suma cero

En teoría de juegos no cooperativos, un juego de suma cero describe una situación en la que la ganancia o pérdida de un participante se equilibra con exactitud con las pérdidas o ganancias de los otros participantes.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Juego de suma cero · Ver más »

Microgrid

Una microgrid, también llamada microrred, es un grupo descentralizado de fuentes de electricidad y cargas que normalmente funciona conectado y sincrónico con la red síncrona tradicional de área amplia (macrorred), pero que puede desconectarse de la red interconectada y funcionar de forma autónoma en "modo isla", según lo dicten las condiciones técnicas o económicas.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Microgrid · Ver más »

Proceso de decisión de Márkov

En matemáticas, un proceso de decisión de Márkov (en inglés: Márkov decision process, MDP) es un proceso de control estocástico en tiempo discreto.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Proceso de decisión de Márkov · Ver más »

Propiedad de Márkov

En teoría de probabilidad y estadística, la propiedad de Markov se refiere a la propiedad de ciertos procesos estocásticos por la cual "carecen de memoria", lo que significa que la distribución de probabilidad del valor futuro de una variable aleatoria depende únicamente de su valor presente, siendo independiente de la historia de dicha variable.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Propiedad de Márkov · Ver más »

StarCraft (serie)

StarCraft es una serie de videojuegos de estrategia en tiempo real creada por los diseñadores Chris Metzen y Bill Roper y desarrollada por la empresa Blizzard Entertainment, misma que se encarga también de su distribución internacional.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y StarCraft (serie) · Ver más »

Telefonía móvil 5G

En telecomunicaciones, 5G son las siglas utilizadas para referirse a la quinta generación de tecnologías de telefonía móvil.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Telefonía móvil 5G · Ver más »

Teoría de juegos

La teoría de juegos es un área de la matemática aplicada que utiliza modelos para estudiar interacciones en estructuras formalizadas de incentivos (los llamados «juegos»).

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Teoría de juegos · Ver más »

Vehículo autónomo

Un vehículo autónomo, también conocido como robótico, o informalmente como sin conductor o auto conducido, es un vehículo capaz de imitar las capacidades humanas de manejo y control.

¡Nuevo!!: Aprendizaje por refuerzo multiagente y Vehículo autónomo · Ver más »

SalienteEntrante
¡Hey! ¡Ahora tenemos Facebook! »