工程師花5萬小時訓練AI遊玩《寶可夢》紅版 突破第一道館但走不出月見山
在經歷長達 5 萬小時的訓練與學習後,一位工程師成功讓一套 AI 模組學會如何遊玩《寶可夢:紅版》,創造出能夠自行探索遊戲,組成寶可夢隊伍,並成功擊敗第一道館的演算法。然而,這套 AI 一直到計畫結束時依然無法順利走出前往第二道館的月見山,或學會不要花錢買鯉魚王。即使如此,這項實驗依然讓玩家一窺機器學習技術的運作方式。
根據工程師 Peter Whidden 分享的流程影片,這套 AI 能夠在模擬器上以打破常規的輸入方式與遊戲進行互動,那就是能夠像人類一樣先按下一個操作按鍵後才觀察會發生什麼事。在實驗的開頭,Whidden 設置一段長約兩小時遊戲時間的學習流程,並利用模擬器的加速功能將其縮短到現實時間的 6 分鐘左右。在正式展開後,他更進一步讓 40 個測試情境同步進行。
由於機器演算法在本質上並不在乎「全破」一款遊戲,因此 Whidden 為 AI 演算法設計一套在完成特定目標時能夠獲得獎勵的系統。為了鼓勵 AI 在《寶可夢:紅版》中進行探索,只要能夠在地圖上看到一些之前沒有看過的東西,就能夠獲得獎勵點數。最終 AI 順利從真心鎮出發,穿過常盤森林,來到深灰市挑戰第一道館。
在那之前,AI 還需要更加完善的獎懲系統。在學會看到新事物能夠獲得獎勵後,雖然 AI 會開始不斷向前邁進,但完全不在乎收服寶可夢或進行對戰,而是在遇到野生寶可夢時立刻逃走。因此,Whidden 為獎勵系統加入更多內容,依照 AI 寶可夢隊伍的等級總和給予獎勵,讓它開始有動力去練等和捕捉寶可夢。
只不過在某一次的演算中,AI 走進寶可夢中心時意外開啟 PC,並在其中存放幾隻寶可夢。由於 AI 獲得的獎勵點數是依照隊伍等級總和而定,這個行為導致 AI 獲得的分數瞬間驟降。為了避免重蹈覆轍,AI 在那之後的所有演算中都選擇避開寶可夢中心,完全不敢進去為寶可夢補血,這讓 Whidden 不得不再次插手調整。
這套 AI 演算法最基本的運作方式,其實就是隨機在《寶可夢:紅版》中走動與遊戲進行互動,直到發現能夠以最有效率的方式獲得最多獎勵的路徑,並將經驗保留到下一次的演算中。在挑戰的過程中,AI 都只會使用最基本的攻擊招式撞擊來進行對戰,直到該招式的 PP 用完後才會使用其他選擇。某次演算中,AI 終於發現傑泥龜的泡沫攻擊能夠對小剛的寶可夢造成大量的傷害,最終順利擊敗這位道館館主。
即使 AI 在對於遊戲的理解與邏輯上依然比不上人類,但這場實驗發掘了一些更加深層的細節。根據 Whidden 的發現,AI 在經歷一段時間的演算後就開始固定以看似不尋常的路徑從真心鎮出發,直到遇到第一隻野生寶可夢。然而,這一系列的操作其實能夠保證 AI 能夠一球抓到遇見第一隻寶可夢。也就是說,AI 發現一個 Speedrun 玩家可能要花上好幾年的時間研究才有機會注意到的系統漏洞。
這套 AI 演算法在成功突破第一道館時基本上已經達成了 Whidden 最初設定的目標,但 Whidden 決定要讓 AI 的《寶可夢:紅版》冒險繼續下去,看看目前的獎勵機制到底能讓它走多遠。可惜的是,第一和第二道館之間的月見山對於看到新事物就能加分的 AI 來說實在是太過於容易分心,因此一直到 Whidden 決定讓實驗告一段落前都無法順利抵達華藍市。
除此之外,AI 似乎非常喜歡從鯉魚王大叔手中購買鯉魚王,因為這樣的行為能夠讓 AI 寶可夢隊伍的等級總和立刻多出五等,因此到實驗結束前,AI 在其中 1 萬次的演算中都跑去買了鯉魚王。另外值得注意的是,AI 有一次將抓來的小拉達命名為了「AI」,讓人細思極恐。
參考原文:GamesRadar
寶可夢 更多報導
猜你喜歡
同類好文
迷因「菲比拉電線」是什麼?《明日方舟:終末地》梗圖竟出自《鳴潮》
中國小廠推出「盜版FGO」!連《崩壞:星穹鐵道》聯動《Fate》內容也一併抄襲
官方致敬?《葬送的芙莉蓮》動畫重現「仰頭的芙莉蓮」迷因!
VSPO銀城サイネ畫160張圖做動畫嘆未被採用 觀眾看完傻眼:營運英明
女子爆衣足球新作《Fantasia明日翔》交換隊服意義不明但別多管閒事
解放雙手!台V幽李鈴添「3D手」配合Live2D效果卓越
《真‧三國無雙 起源》DLC新增貂蟬、朱和同行!製作人:我本來只想加大叔
美35歲男假扮ICE探員偷PlayStation主機 被17歲少年一拳KO
Coser靠二創大賺?Enako出面澄清並重申收入來源
回來了!北美犽宿實況主「Moe」重返《英雄聯盟》S16打上韓服菁英
Ubisoft近五年股價跌95%以上...宣布重組後再雪崩39%刷單日新高
超噁心...國外詭異網站紀錄VTuber生理期 女V比對後驚覺準到發毛
VTuber外型遭質疑照抄彩虹社設計 負責繪師抄襲劣跡再被翻出
任天堂「閒聊花花」3/12發售 主打自言自語、報時還可能出錯?
LOL/不是AI!韓服勝率93%帳號身份是LCK選手 稱「爬分99%靠運氣」
實況主Asmongold準備提告造謠網友!澄清「目標是勝訴而非刷流量」
Coser扮《葬送的芙莉蓮》費倫嘆「很難還原」但被知名紳士繪師畫成圖
粉絲都大了...《庫洛魔法使》推魔杖造型「肩部按摩棒」解除肩頸封印
VR實況主穿觸覺回饋裝玩《星露谷物語》 每下操作都被電擊瘋狂哀號
不是DEI導致倒閉?日本前Ubisoft員工稱公司患上「大企業通病」
出大包!《明日方舟:終末地》上市首日傳「PayPal隨機盜刷」嚴重災情
父母不管?《魔法公主》IMAX特別場掀孩童吵鬧 影城方迅速祭出補償
TikTok「面癱哥」公司以9.75億美金被收購 預計打造其AI分身開銷售直播
LOL/韓服超離譜「零CD贖罪神石易大師」肆虐鑽石場!全輔助裝17分鐘26殺
台灣VT工作室唐突解散?旗下有藝人出道兩天就轉個人勢
評審玩到哭!IGA 2026得獎名單出爐:《折言》奪最佳遊戲、台灣獲兩獎項
小六腐女讀者的黑歷史滿十週年 《齊木楠雄》作者澄清自己最後沒回信
GOG總監5年後首度回應《還願》下架事件:低估地緣政治的複雜性
VTuber三毛貓「作家」出道!原創小說連載開始、漫畫化計畫啟動
《勝利女神:妮姬》吉祥物Doro模型 結合衍伸迷因「歐潤吉」
火熱排行
AI生成日本異世界輕小說獲得大賞!被抓包後遭撤銷出版、漫畫化資格
台文館「阿龍」抄襲中國繪師...委外廠商蹦世界違反著作權法遭起訴
迷因「菲比拉電線」是什麼?《明日方舟:終末地》梗圖竟出自《鳴潮》
推特Grok「比基尼改圖」騷擾亂象頻傳!Coser怒斥:平台助長了這種行為
中國小廠推出「盜版FGO」!連《崩壞:星穹鐵道》聯動《Fate》內容也一併抄襲
日酸民畫「冷炸雞事件」諷兔田佩克拉外出約會 遭COVER求償150萬日圓
火力全開!動畫《輝夜姬想讓人告白》片尾白銀圭原畫張數突破天際
Neuro前繪師Anny無辜被罵拖延新衣裝 澄清從未被委託:不在意的是Vedal
曾經的Xbox神主牌!《最後一戰》新作「戰役進化」預計2026登陸PS5平台
官方致敬?《葬送的芙莉蓮》動畫重現「仰頭的芙莉蓮」迷因!
VSPO銀城サイネ畫160張圖做動畫嘆未被採用 觀眾看完傻眼:營運英明
Coser扮《葬送的芙莉蓮》費倫嘆「很難還原」但被知名紳士繪師畫成圖
Steam遊戲女角爬梯子出現「四足跪姿」掀議!意外形成紳士良好互動
Steam年初七款免費獨立遊戲整理!多人同樂、單人模擬器小品嚐鮮
玩家打造《動物森友會》「成人島」存活5年 近期才被官方刪除
日本推特掀「紳士版」節奏挑戰!擦邊帳號集體吟聲響應
VTuber花數萬買斷Live2D模型 竟被以300元價格當公用模型盜賣
羅傑、峰哥一起被告!網友被Threads反串帳號激怒 卻決定提告羅傑本人
台V真理果澄清三視圖商用質疑 繪師媽媽力挺:是很好的甲方
Coser照片遭用grok改少布料?不雅留言多到申訴不完
LOL/韓服超離譜「零CD贖罪神石易大師」肆虐鑽石場!全輔助裝17分鐘26殺
LOL/上路玩家要不到尾選「秒鎖悠咪」揚言開戳!還在選角就吃到系統懲罰
《英雄聯盟》前PCS戰隊負責人詐騙熟女800萬 前選手被列共犯起訴
《真‧三國無雙 起源》DLC新增貂蟬、朱和同行!製作人:我本來只想加大叔
Ubisoft員工稱《刺客教條:暗影者》為「4A級遊戲」!遭嘲諷後迅速刪除
推特比基尼亂象落幕?Grok禁止以「標註」功能修改真人照片
LOL/不是AI!韓服勝率93%帳號身份是LCK選手 稱「爬分99%靠運氣」
台灣VT工作室唐突解散?旗下有藝人出道兩天就轉個人勢
證據只抹一半?紳士繪師Rouka遭質疑描AI圖 本人僅聲明「沒使用AI」
日本漫畫家以AI「換比基尼」篡改偶像照片 炎上後致歉並終止STU48合作
贊助廣告