AI產物過度激增!研究發現「用AI內容訓練AI」會導致模型崩潰 錯誤不可回溯

圖/gigazine
圖/gigazine

AI(人工智慧)的時代已經來臨,在非營利組織 OpenAI 的聊天機器人 ChatGPT 開放使用 6 個月內,許多跨國頂尖企業已將 AI 相關技術導入工作中,藝術創作者也爭先恐後訓練深度學習模型

本站曾報導 AI繪圖在動漫二創圈的爭議,遊戲公司也開始用 AI 開發新作,然而隨著越來越多人使用 AI 製作媒體內容,電腦作品也在網路上激增,且被後續的使用者拿來訓練自己的 AI。來自英國和加拿大的研究人員發現,這樣會產生「模型崩潰」的現象,成果公開在 arXiv 期刊網站,「我們發現在 AI 訓練過程,使用 AI 生成的內容來訓練模型,結果會導致不可逆轉的缺陷。」

研究人員聚焦「文字訓練文字」「圖像到圖像」兩類 AI 生成模型,得出結論:「若深度學習的資料來源是其他模型的生成內容,會導致訓練中的模型崩潰、進入退化的過程,隨著時間進展,訓練中的 AI 會忘記原初的基層資料設置……整個過程不可逆,即使就近乎理想的長期學習條件來看也是如此。」

簡單來說,長期下來,用 AI 產物訓練 AI,原本資料當中的錯誤成分會重複合併,導致深度學習模型進一步透過「錯誤的」方式感知現實,該論文的主要作者之一 Ilia Shumailov 表示,「我們驚訝地觀察到,模型崩潰發生的速度有多快,可以迅速忘記他們最初學習的大部分原始資料。」

該論文的另一位作者,劍橋大學與愛丁堡大學安全工程學系教授 Ross Anderson,在一篇討論該研究的部落格文章寫到,「就如同人類散佈在海洋中的塑膠垃圾,或是大氣中的二氧化碳,我們用『廢話』(blah)填滿網際網路,這使得那些透過網路抓取資料,訓練新模型的過程更加困難。」

他還提醒,這個現象會成為那些投入訓練 AI 的先行公司,或掌控大規模人機互動機會(如 ChatGPT)的企業的優勢,因為它們能掌控用來訓練或輸出的資料庫,「事實上,我們已經看到 AI 新創公司在 Internet Archive 尋找訓練資料庫。」

該論文研究者 Ilia Shumailov 表示,人們去感受及體驗世界所產生的原生內容,可能多少與現實世界有所差異(本質上的偏差),但 AI 更誇張,「電腦生成模型往往過度學習(overfit)流行資料(大宗的數據),時常誤解或扭曲較少的資料。」

他向外媒 VentureBeat 解釋,舉機器學習模型在 100 隻貓的圖庫進行訓練的案例,「其中 10 隻貓是藍毛,90 隻貓是黃毛,該模型意識到黃貓更普遍,但也理解成藍貓比實際上更黃,當被要求產出新內容時,結果就會提供一些綠貓來。」

「長時間下來,藍毛貓的原始特徵會在連續的訓練週期中逐漸消失,從藍色變成綠色,最後變成黃色。這種漸進的扭曲,和較為少數的數據特徵丟失,就是一種模型崩潰。為防止這種情況發生,重點是要確保少數群體在資料庫中的公平性與代表性,無論是在數量上,還是針對獨特特徵的準確描述。」

當 AI 模型生成的內容,最終污染了後續模型的訓練庫時,發生模型崩潰的情況,這聽起來滿合理的,但還會有更嚴重的影響,例如基於性別、種族或其他敏感屬性的歧視,AI 會逐步丟失之前學的到資料,根據它們強化的「信念」來曲解現實。

研究人員還發現,即使訓練模型的過程中,以「減少訓練週期的多次迭代」來避免這種情況,模型崩潰仍然會發生,因為 AI 開始產生錯誤反應,以避免資料頻繁訓練。

作為對策,該論文指出,「保留原始資料庫或人類生成資料的副本,並根據這些資料定期重新訓練,以避免與 AI 生成內容混淆。」或者,從頭開始用原始數據刷新 AI 的腦袋。

為防止 AI 模型崩潰,Shumailov 補充關鍵做法:保證 AI 訓練時準確描述出原始資料的特徵,在資料庫中區隔少數樣本並強調其代表性,「即使用 10% 的人類原生數據來訓練後面產出的模型(subsequent generations),模型崩潰仍然會發生,只是不會那麼快。」

模型 更多報導

猜你喜歡

同類好文

挑戰重現中之人!青桐高校VT小丸參考自身照片玩《魔物獵人 荒野》捏角系統

挑戰重現中之人!青桐高校VT小丸參考自身照片玩《魔物獵人 荒野》捏角系統

嚇鼠...VTuber茸茸鼠為工作來台 元宵節放天燈卻目睹燒毀瞬間

嚇鼠...VTuber茸茸鼠為工作來台 元宵節放天燈卻目睹燒毀瞬間

不能說很像...新人VTuber「 猫宮るな」形象撞臉潤羽露西婭

不能說很像...新人VTuber「 猫宮るな」形象撞臉潤羽露西婭

四度宣導...holo大神澪為誤用AI圖做封面道歉 呼籲詠唱師勿用官方標籤發圖

四度宣導...holo大神澪為誤用AI圖做封面道歉 呼籲詠唱師勿用官方標籤發圖

子午獎募集開始!「最佳小丑獎」煌Kirali被禁賽?粉絲:不歡迎職業人士

子午獎募集開始!「最佳小丑獎」煌Kirali被禁賽?粉絲:不歡迎職業人士

一億戒尼亂丟?台北動漫節發布失物招領公告...今年又有獵人遺失執照了

一億戒尼亂丟?台北動漫節發布失物招領公告...今年又有獵人遺失執照了

吉伊卡哇台北快閃店爆民眾偷藏「哥布林」?官方宣布禁賣:擇日釋出

吉伊卡哇台北快閃店爆民眾偷藏「哥布林」?官方宣布禁賣:擇日釋出

Ubisoft財報揭《刺客教條:暗影者》預購量令人滿意!玩法也獲正面評價

Ubisoft財報揭《刺客教條:暗影者》預購量令人滿意!玩法也獲正面評價

芙阿嬤吃鼎泰豐!小編發文「豆苗的芙莉蓮」卻遭日網質疑:不是空心菜嗎?

芙阿嬤吃鼎泰豐!小編發文「豆苗的芙莉蓮」卻遭日網質疑:不是空心菜嗎?

LOL/剛普朗克實況主「浪D」30歲62%勝率上韓服菁英!但帳號馬上不見

LOL/剛普朗克實況主「浪D」30歲62%勝率上韓服菁英!但帳號馬上不見

日本事務所為合約到期VTuber發畢業告知 本人看公告才得知困惑發聲:嗯?

日本事務所為合約到期VTuber發畢業告知 本人看公告才得知困惑發聲:嗯?

神人惡搞《底特律:變人》和《荒唐分局》氛圍荒謬卻毫無違和

神人惡搞《底特律:變人》和《荒唐分局》氛圍荒謬卻毫無違和

西川貴教來台喝「津津蘆筍汁」還撞見啤酒版本?Kson一看整個人都不好了...

西川貴教來台喝「津津蘆筍汁」還撞見啤酒版本?Kson一看整個人都不好了...

「日本哈利波特周邊專賣店」海外首店插旗台北!3月南港LaLaport開幕

「日本哈利波特周邊專賣店」海外首店插旗台北!3月南港LaLaport開幕

《天久鷹央的推理病歷表》揭佐倉綾音睡眠音企劃!近9小時剪出30分精華

《天久鷹央的推理病歷表》揭佐倉綾音睡眠音企劃!近9小時剪出30分精華

石油把拔出手!沙國戰隊AlQadsiah宣布成立《聯盟戰棋》職業隊 選手全是台灣人

石油把拔出手!沙國戰隊AlQadsiah宣布成立《聯盟戰棋》職業隊 選手全是台灣人

狹路相逢?Dokibird訪日驚見官方Selen玩偶仍在販售:都一年了還有全新的

狹路相逢?Dokibird訪日驚見官方Selen玩偶仍在販售:都一年了還有全新的

代購收、自用不收?「750元之亂」 NCC揭收費新方向

代購收、自用不收?「750元之亂」 NCC揭收費新方向

LOL/沒T1流量少一半...HLE vs GEN週日全球觀賽人數遠低於平日

LOL/沒T1流量少一半...HLE vs GEN週日全球觀賽人數遠低於平日

Steam 2025所有特賣日期一次看!秋季特賣終於提早2個月舉辦

Steam 2025所有特賣日期一次看!秋季特賣終於提早2個月舉辦

多國情勒鳥傳死訊 日本Duolingo闢謠不合群猜疑:日本Duo最強!不會死

多國情勒鳥傳死訊 日本Duolingo闢謠不合群猜疑:日本Duo最強!不會死

該飛了!hololive Meet香港場「死神」Mori Calliope將登台

該飛了!hololive Meet香港場「死神」Mori Calliope將登台

知名解壓縮軟體WinRAR推出側背包周邊!官方示範收納近800張寶可夢卡牌

知名解壓縮軟體WinRAR推出側背包周邊!官方示範收納近800張寶可夢卡牌

新VTuber出道?知名海豚練字帳ルカ掛「準備中」!分享手術後聲線好轉喜訊

新VTuber出道?知名海豚練字帳ルカ掛「準備中」!分享手術後聲線好轉喜訊

玩哏請適度...台V真理果嚴肅表明將禁言「越線骨科哏」:現實中超噁心

玩哏請適度...台V真理果嚴肅表明將禁言「越線骨科哏」:現實中超噁心

如何將《魔物獵人 荒野》測試版捏臉數據繼承到正式版?開局創角記得選

如何將《魔物獵人 荒野》測試版捏臉數據繼承到正式版?開局創角記得選

花宮莉歌玩《HoloCure》配櫻桃汁抽到「天才吸血鬼梅露」 笑稱:我更天才!

花宮莉歌玩《HoloCure》配櫻桃汁抽到「天才吸血鬼梅露」 笑稱:我更天才!

hololive Biboo日本住處養幼貓曬照 雙子:我們這周去你家「吃晚餐」

hololive Biboo日本住處養幼貓曬照 雙子:我們這周去你家「吃晚餐」

任天堂正式宣佈成立「台灣任天堂股份有限公司」4/1起開始營運業務

任天堂正式宣佈成立「台灣任天堂股份有限公司」4/1起開始營運業務

入手芙阿嬤同款!《葬送的芙莉蓮》芙莉蓮大衣開放預購

入手芙阿嬤同款!《葬送的芙莉蓮》芙莉蓮大衣開放預購

火熱排行

hololive沙花叉克蘿伊練字小帳突然更新 曝手術順利完成

hololive沙花叉克蘿伊練字小帳突然更新 曝手術順利完成

挑戰重現中之人!青桐高校VT小丸參考自身照片玩《魔物獵人 荒野》捏角系統

挑戰重現中之人!青桐高校VT小丸參考自身照片玩《魔物獵人 荒野》捏角系統

繪師「DISH」畫蛇年賀圖!角色身上只剩紅包意圖使人「紅包拿來」

繪師「DISH」畫蛇年賀圖!角色身上只剩紅包意圖使人「紅包拿來」

駕駛員換人!台V真理果直播期間遭果哥「奪舍」 切表情、Wink運用自如

駕駛員換人!台V真理果直播期間遭果哥「奪舍」 切表情、Wink運用自如

2月撞慘了!台北國際動漫節、書展、FF44、CWT69全擠在同一週舉行

2月撞慘了!台北國際動漫節、書展、FF44、CWT69全擠在同一週舉行

歐派啪沒了!德國實況主Inis直播中以剪刀「物理自爆」

歐派啪沒了!德國實況主Inis直播中以剪刀「物理自爆」

雌小鬼初音創作者「ぬ老師」親自翻唱釋出!採3DSLL麥克風精心錄製

雌小鬼初音創作者「ぬ老師」親自翻唱釋出!採3DSLL麥克風精心錄製

擦亮無雙招牌!《真.三國無雙 起源》評測:一款真正的歷史模擬戀愛遊戲?

擦亮無雙招牌!《真.三國無雙 起源》評測:一款真正的歷史模擬戀愛遊戲?

嚇鼠...VTuber茸茸鼠為工作來台 元宵節放天燈卻目睹燒毀瞬間

嚇鼠...VTuber茸茸鼠為工作來台 元宵節放天燈卻目睹燒毀瞬間

不能說很像...新人VTuber「 猫宮るな」形象撞臉潤羽露西婭

不能說很像...新人VTuber「 猫宮るな」形象撞臉潤羽露西婭

MapleStar推出《惡魔高校D×D》紳士動畫!莉雅絲先出手卻反被推倒

MapleStar推出《惡魔高校D×D》紳士動畫!莉雅絲先出手卻反被推倒

免加水加濕器用魔法開發失敗!夏普帶羊羹登COVER門向holo櫻巫女謝罪

免加水加濕器用魔法開發失敗!夏普帶羊羹登COVER門向holo櫻巫女謝罪

繪師DISH推出《蔚藍檔案》浦和花子紳士動畫!為師與學生好好「溝通」

繪師DISH推出《蔚藍檔案》浦和花子紳士動畫!為師與學生好好「溝通」

四度宣導...holo大神澪為誤用AI圖做封面道歉 呼籲詠唱師勿用官方標籤發圖

四度宣導...holo大神澪為誤用AI圖做封面道歉 呼籲詠唱師勿用官方標籤發圖

人妻紳士漫《未亡人雪女》第三集預計畫100頁!作者親揭製作進度

人妻紳士漫《未亡人雪女》第三集預計畫100頁!作者親揭製作進度

過年9天玩什麼?精選5款「精神時光屋」遊戲 怎麼一不小心就天亮了

過年9天玩什麼?精選5款「精神時光屋」遊戲 怎麼一不小心就天亮了

子午獎募集開始!「最佳小丑獎」煌Kirali被禁賽?粉絲:不歡迎職業人士

子午獎募集開始!「最佳小丑獎」煌Kirali被禁賽?粉絲:不歡迎職業人士

一億戒尼亂丟?台北動漫節發布失物招領公告...今年又有獵人遺失執照了

一億戒尼亂丟?台北動漫節發布失物招領公告...今年又有獵人遺失執照了

太「股」達人!Steam節奏遊戲《MOMO Crash》少女大腿打節拍 把靈魂夾升天

太「股」達人!Steam節奏遊戲《MOMO Crash》少女大腿打節拍 把靈魂夾升天

新VTuber出道?知名海豚練字帳ルカ掛「準備中」!分享手術後聲線好轉喜訊

新VTuber出道?知名海豚練字帳ルカ掛「準備中」!分享手術後聲線好轉喜訊

玩到停不下來!《天國降臨:救贖2》評測:是波希米亞劍聖 也可以是種馬傳奇

玩到停不下來!《天國降臨:救贖2》評測:是波希米亞劍聖 也可以是種馬傳奇

吉伊卡哇台北快閃店爆民眾偷藏「哥布林」?官方宣布禁賣:擇日釋出

吉伊卡哇台北快閃店爆民眾偷藏「哥布林」?官方宣布禁賣:擇日釋出

Steam壓倒性好評《惡魔輪盤》銅板價就能獲得「殺人誅心」的絕交體驗

Steam壓倒性好評《惡魔輪盤》銅板價就能獲得「殺人誅心」的絕交體驗

紳士漫《對常來我家的辣妹為所欲為》第四集2月推出!新辣妹「花音」加入戰局

紳士漫《對常來我家的辣妹為所欲為》第四集2月推出!新辣妹「花音」加入戰局

Ubisoft財報揭《刺客教條:暗影者》預購量令人滿意!玩法也獲正面評價

Ubisoft財報揭《刺客教條:暗影者》預購量令人滿意!玩法也獲正面評價

LOL/世界賽謎之韓文歌曲終於揭曉!出自網飛浪漫喜劇《愛你的凱蒂》

LOL/世界賽謎之韓文歌曲終於揭曉!出自網飛浪漫喜劇《愛你的凱蒂》

芙阿嬤吃鼎泰豐!小編發文「豆苗的芙莉蓮」卻遭日網質疑:不是空心菜嗎?

芙阿嬤吃鼎泰豐!小編發文「豆苗的芙莉蓮」卻遭日網質疑:不是空心菜嗎?

LOL/剛普朗克實況主「浪D」30歲62%勝率上韓服菁英!但帳號馬上不見

LOL/剛普朗克實況主「浪D」30歲62%勝率上韓服菁英!但帳號馬上不見

hololive寶鐘瑪琳、兔田佩克拉聊畢業話題 對於社內「四人詛咒」感驚訝

hololive寶鐘瑪琳、兔田佩克拉聊畢業話題 對於社內「四人詛咒」感驚訝

性感聖亞真抱歉!《蔚藍檔案》狼師製作8倍速記憶大廳 謎之抖動狼師大喜

性感聖亞真抱歉!《蔚藍檔案》狼師製作8倍速記憶大廳 謎之抖動狼師大喜