人工智能會(huì)談判合作嗎？國(guó)際最新研究稱可代理談判和形成協(xié)議

2022年12月07日 11:18　來(lái)源：中國(guó)新聞網(wǎng)

大字體

小字體

分享到：

　　中新網(wǎng)北京12月7日電 (記者孫自法)施普林格·自然旗下學(xué)術(shù)期刊《自然-通訊》最新發(fā)表一篇人工智能(AI)論文報(bào)告稱，人工智能代理可談判和形成協(xié)議，使其在桌面游戲《外交》中勝過(guò)其他無(wú)此能力的代理。這項(xiàng)研究展示了一種深度強(qiáng)化學(xué)習(xí)方法，用其建模的代理可以與其他人工代理溝通和合作，在玩游戲時(shí)共同制定計(jì)劃。

　　該論文介紹，開(kāi)發(fā)能展現(xiàn)出代理間合作和溝通的人工智能十分重要。《外交》是一個(gè)流行桌面游戲，為此類行為提供了有用的測(cè)試平臺(tái)，它包含玩家之間復(fù)雜的溝通、談判和形成同盟，而人工智能一直很難達(dá)成這些。要贏得游戲，《外交》需要推斷在場(chǎng)玩家的未來(lái)計(jì)劃、玩家間的承諾，和他們的誠(chéng)實(shí)合作。過(guò)去的人工智能代理在單個(gè)玩家或兩個(gè)競(jìng)爭(zhēng)性玩家的游戲中取得過(guò)成功，其中玩家之間沒(méi)有交流。

　　來(lái)自英國(guó)人工智能企業(yè)DeepMind的論文第一作者加諾斯·克拉馬爾(János Kramár)、通訊作者約拉姆·巴赫拉奇(Yoram Bachrach)和同事設(shè)計(jì)了一個(gè)深度強(qiáng)化學(xué)習(xí)方法，讓代理可以協(xié)商同盟、共同制定計(jì)劃。他們創(chuàng)造出了模擬玩家的代理，形成團(tuán)隊(duì)，嘗試勝過(guò)其他隊(duì)伍的策略。通過(guò)預(yù)測(cè)可能的未來(lái)游戲狀態(tài)，這一學(xué)習(xí)算法允許代理對(duì)未來(lái)行動(dòng)達(dá)成一致，識(shí)別有益交易。為接近人類水平的表現(xiàn)，論文作者還通過(guò)檢驗(yàn)一些代理間承諾破裂的場(chǎng)景(代理背離了過(guò)去的協(xié)議)，調(diào)查了誠(chéng)實(shí)合作的條件。

　　論文作者總結(jié)說(shuō)，他們的研究發(fā)現(xiàn)有助于人工智能代理形成靈活溝通機(jī)制的基礎(chǔ)，使其能根據(jù)環(huán)境調(diào)整策略。此外，這些發(fā)現(xiàn)還表明，對(duì)違反協(xié)議的同伴的制裁傾向如何大為降低了這類違反者的優(yōu)勢(shì)，有助于形成大多可信的交流，盡管情況最初更有利于違反協(xié)議者。(完)

【編輯:陳彩霞】

更多精彩內(nèi)容請(qǐng)進(jìn)入國(guó)際頻道

發(fā)表評(píng)論文明上網(wǎng)理性發(fā)言，請(qǐng)遵守新聞評(píng)論服務(wù)協(xié)議

國(guó)際新聞精選：

日本民調(diào)顯示石破內(nèi)閣支持率下降至41%

2024年12月22日 21:07:41
無(wú)差別射殺平民、“殺人比賽”……以軍在加沙暴行被曝光！

2024年12月22日 21:00:19
巴勒斯坦官員稱加沙停火談判已完成90%

2024年12月22日 16:48:32
上任僅一周韓國(guó)代總統(tǒng)被查！首爾爆發(fā)大規(guī)模示威

2024年12月22日 16:44:52
韓媒：韓最大在野黨吁韓德洙盡快頒布涉總統(tǒng)夫婦獨(dú)檢法

2024年12月22日 14:39:16
巴西東南部三車相撞已致39死

2024年12月22日 08:53:37
巴西東南部發(fā)生嚴(yán)重車禍已致至少39人遇難

2024年12月22日 08:46:40
突發(fā)！美軍對(duì)也門薩那胡塞武裝關(guān)鍵設(shè)施進(jìn)行空襲

2024年12月22日 08:46:02
2024年馬來(lái)西亞—中國(guó)峰會(huì)舉行

2024年12月21日 09:24:32
突尼斯發(fā)生沉船事故致20名非法移民身亡

2024年12月20日 21:49:46

換一批