NFDI4DS | UHH-SEMS - Publication Details

Puyo Puyo AI Using Deep Reinforcement Learning with Parallel Actors and Prioritized Experience Replay

DOI: 10.3156/jsoft.37.1_501 Publication Date: 2025-02-14T22:17:33Z

Abstract Supplemental Material References Cited by

AUTHORS (2)

Shunsuke MORI

Makoto KOSHINO

ABSTRACT

本研究はパズルゲーム『ぷよぷよ』において深層強化学習を適用したものである.従来のルールベースの手法や関連性行列を用いた手法では,人間のトッププレイヤーが構築するような大きい連鎖を構築することができないという課題があった.また,深層強化学習による先行研究も,複雑な戦略を学習することが難しく,十分な性能を示せていないのが現状である.本研究では,深層強化学習によるぷよぷよAIの性能向上を目的とし,並列Actorと優先度付き経験再生を用いた.提案手法を評価するために,自作のぷよぷよ環境を用いて実験を行った結果,提案手法は平均最大連鎖数6.243,平均スコア33114を達成し,従来の深層強化学習による研究を上回る性能を示した.

SUPPLEMENTAL MATERIAL

Coming soon ....

REFERENCES (10)

CITATIONS (0)

EXTERNAL LINKS

OPENALEX - Publications CROSSREF - Publications OPENAIRE - Products

PlumX Metrics

Puyo Puyo AI Using Deep Reinforcement Learning with Parallel Actors and Prioritized Experience Replay

RECOMMENDATIONS

FAIR ASSESSMENT

Coming soon ....

JUPYTER LAB

Coming soon ....