Mostrar el registro sencillo del ítem

Búsqueda de árbol de Montecarlo para un jugador basada en el modelo de Plackett-Luce

dc.contributor.authorMohr, Félix
dc.contributor.authorBengs, Víctor
dc.contributor.authorHüllermeier, Eyke
dc.date.accessioned2025-04-02T18:02:55Z
dc.date.available2025-04-02T18:02:55Z
dc.date.issued2021-05-21
dc.identifier.citationMohr, F., Bengs, V. y Hüllermeier, E. (2021). Búsqueda de árbol de Montecarlo para un jugador basada en el modelo de Plackett-Luce. Actas de la Conferencia AAAI sobre Inteligencia Artificial , 35 (14), 12373-12381. https://doi.org/10.1609/aaai.v35i14.17468es_CO
dc.identifier.otherhttps://ojs.aaai.org/index.php/AAAI/article/view/17468
dc.identifier.urihttp://hdl.handle.net/10818/64142
dc.description.abstractThe problem of minimal cost path search is especially difficult when no useful heuristics are available. A common solution is roll-out-based search like Monte Carlo Tree Search (MCTS). However, MCTS is mostly used in stochastic or adversarial environments, with the goal to identify an agent's best next move. For this reason, even though single player versions of MCTS exist, most algorithms, including UCT, are not directly tailored to classical minimal cost path search. We present Plackett-Luce MCTS (PL-MCTS), a path search algorithm based on a probabilistic model over the qualities of successor nodes. We empirically show that PL-MCTS is competitive and often superior to the state of the art.en
dc.description.abstractEl problema de la búsqueda de rutas de coste mínimo es especialmente complejo cuando no se dispone de heurísticas útiles. Una solución común es la búsqueda basada en despliegue, como la Búsqueda de Árbol de Monte Carlo (MCTS). Sin embargo, la MCTS se utiliza principalmente en entornos estocásticos o adversarios, con el objetivo de identificar el mejor siguiente movimiento de un agente. Por esta razón, aunque existen versiones de MCTS para un solo jugador, la mayoría de los algoritmos, incluyendo UCT, no están directamente adaptados a la búsqueda clásica de rutas de coste mínimo. Presentamos Plackett-Luce MCTS (PL-MCTS), un algoritmo de búsqueda de rutas basado en un modelo probabilístico sobre las cualidades de los nodos sucesores. Demostramos empíricamente que PL-MCTS es competitivo y, a menudo, superior al estado del arte.es_CO
dc.formatapplication/pdfes_CO
dc.language.isospaes_CO
dc.publisherInteligencia Artificiales_CO
dc.relation.ispartofseriesInteligencia Artificial , 35 (14), 12373-12381
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subject.otherBúsqueda basada en muestreo – simulación
dc.titleSingle player monte-carlo tree search based on the Plackett-Luce modelen
dc.titleBúsqueda de árbol de Montecarlo para un jugador basada en el modelo de Plackett-Lucees_CO
dc.typejournal articlees_CO
dc.type.hasVersionpublishedVersiones_CO
dc.rights.accessRightsopenAccesses_CO
dc.identifier.doi10.1609/aaai.v35i14.17468


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Attribution-NonCommercial-NoDerivatives 4.0 InternacionalExcepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional