• <table id="4yyaw"><kbd id="4yyaw"></kbd></table>
  • <td id="4yyaw"></td>
  • 發布時間:2022-12-07 10:46 原文鏈接: 人工智能再次戰勝人類玩家

     

    下棋、玩游戲,在與人類的博弈中,人工智能(AI)正在不斷成長。近日,英國DeepMind公司的AI智能體DeepNash,就在西洋陸軍棋(Stratego)中達到了專業級人類玩家的水平。該成果12月1日發表于《科學》。

    事實上,在DeepNash攻克Stratego前,就有報道稱AI能夠玩“強權外交”這款類似的經典桌游。這是一款具有外交深度的游戲,玩家間存在合作與競爭關系,必要時須通過談判結交盟友。

    “近年來,AI掌握本質不同的游戲的速度相當驚人。”美國密歇根大學計算機科學家Michael Wellman表示,Stratego和“強權外交”這兩款游戲大不相同,但它們都極具挑戰性,與此前AI已經掌握的游戲也截然不同。

    Stratego是一款需在信息缺失情況下進行戰略思考的棋盤游戲,類似于中國的軍棋。它要比此前AI掌握的國際象棋、圍棋或撲克復雜得多。

    在游戲中,雙方各有40枚棋子,且彼此看不到棋子的真實“身份”。雙方輪流移動棋子,來消滅對手的棋子,最終奪得對方軍旗或消滅所有能動的棋子的一方獲勝。因此,玩家需要進行戰略部署、收集信息,并與對方博弈。

    一局Stratego游戲中會有10535種可能的布局。相比之下,圍棋的布局有10360種可能。此外,在Stratego中,AI需要推理對手超過1066種部署策略,這使德州撲克中初始的106種可能情況相形見絀。

    “Stratego中可能出現的結果數量之多及其復雜性,意味著在信息完全的游戲中表現出色的算法,甚至在撲克游戲中表現良好的算法,在這款游戲中都不起作用。”DeepMind研究員Julien Perolat說。

    所以Perolat和同事開發了DeepNash,該命名致敬了提出納什均衡的美國數學家約翰·納什。

    納什均衡是博弈論中一種解的概念,指滿足以下條件的策略組合:任何一位玩家在此策略組合下單方面改變自己的策略(其他玩家策略不變),都不會提高自身的收益。

    DeepNash將強化學習算法與深度神經網絡相結合,以找到納什均衡。強化學習包括為游戲的每個狀態找到最佳策略。為了學習最佳策略,DeepNash已經與自己進行了55億次博弈。

    今年4月,DeepNash在網絡游戲平臺Gravon上與人類Stratego玩家進行了兩周的比賽。在50場比賽后,DeepNash目前在所有Gravon Stratego玩家中排名第三。

    “我們的研究表明,像Stratego這樣復雜的涉及不完善信息的游戲,不需要通過搜索技術來解決。”團隊成員、DeepMind研究員Karl Tuyls表示,“這是AI邁出的一大步。”

    而曾于2019年報告了玩撲克的AI——Pluribus的Meta AI研究員Noam Brown團隊,則將目光投向了一個不同的挑戰:建立一個可以玩“強權外交”的AI。

    “強權外交”是一個最多可由7位玩家參與的游戲,每位玩家代表第一次世界大戰前歐洲的主要力量,游戲目標是通過移動部隊控制供應中心。重要的是,該游戲需要玩家間進行私人交流和合作,而不是像圍棋或Stratego那樣進行雙人博弈。

    “當進行超過兩人的零和博弈時,納什均衡思想對游戲就不再有用了。”Brown說,他們成功訓練出了AI——Cicero。在11月22日發表于《科學》的論文中,該團隊報告稱,在40場游戲中,“Cicero的平均得分是人類玩家的兩倍多,在玩過一場以上游戲的參與者中排名前10%”。

    Brown認為,可以與人類互動并解釋次優甚至非理性人類行為的游戲AI,可以為其在現實世界的應用鋪平道路。

    相關論文信息:

    相關文章

    工信部等八部門啟動“人工智能+制造”專項行動

    中國工信部、中央網信辦、國家發改委等八部門7日對外發布《“人工智能+制造”專項行動實施意見》,明確到2027年,中國人工智能關鍵核心技術實現安全可靠供給,產業規模和賦能水平穩居世界前列,建成全球領先的......

    研究提出一種基于人工智能技術的冰湖制圖框架

    興都庫什—喀喇昆侖—喜馬拉雅(HKH)地區的冰湖變化,是氣候變化的重要指示器。由于該地區地形極為復雜,加之常年受到云層遮擋、地形陰影以及季節性積雪覆蓋的影響,這些因素顯著制約了冰湖自動制圖的精度,使得......

    AI工具使用導致科研成果數量驟增質量下滑

    一項近日發表于《科學》的研究指出,像ChatGPT 這樣的人工智能(AI)寫作工具正在大幅提升科研生產力。研究人員借助AI工具使論文發表數量最多增加了50%。但這也有不利的一面,AI生成的文......

    24家科技AI巨頭已加入美國“創世紀計劃”

    由美國特朗普政府主導“創世紀計劃”(GenesisMission)近日新增24家人工智能領域企業為合作方,包括英偉達、AMD、OpenAI、微軟、亞馬遜AWS及谷歌母公司Alphabet等。目前“創世......

    教育部辦公廳關于公布第二批中小學人工智能教育基地名單的通知

    教育部辦公廳關于公布第二批中小學人工智能教育基地名單的通知教基廳函〔2025〕32號各省、自治區、直轄市教育廳(教委),新疆生產建設兵團教育局:根據《教育部辦公廳關于開展第二批中小學人工智能教育基地推......

    中央廣播電視總臺發布2025年度國內、國際十大科技新聞

    中央廣播電視總臺12月24日發布2025年度國內、國際十大科技新聞。2025年度國內十大科技新聞是:1.我國建設三大世界級科技創新中心;2.國務院印發《關于深入實施“人工智能+”行動的意見》;3.天問......

    科大訊飛新設子公司含AI及集成電路業務

    近日,山東沂訊信息科技有限公司成立,法定代表人為柳升華,注冊資本5000萬元,經營范圍包括人工智能公共服務平臺技術咨詢服務、集成電路設計、人工智能基礎軟件開發等。企查查股權穿透顯示,該公司由科大訊飛全......

    “人工智能+”知識產權公共服務應用場景建設名單發布

    國家知識產權局辦公室關于發布“人工智能+”知識產權公共服務應用場景建設名單的通知國知辦函服字〔2025〕1040號各省、自治區、直轄市和新疆生產建設兵團知識產權局:為貫徹落實《國務院關于深入實施“人工......

    北京市“人工智能+”能源高價值應用場景評審結果

    北京市發展和改革委員會發布關于北京市“人工智能+”能源高價值應用場景評審結果公示。根據《國家能源局綜合司關于組織開展“人工智能+”能源試點工作的通知》(國能綜通科技〔2025〕168號)相關要求,我委......

    全國中小學人工智能教育聯盟成立

    近日,“AI向未來·AI育創新——2025青少年學生AI+科技教育展示暨中小學人工智能教育聯盟成立活動”在廣東省深圳市福田區舉辦。這是國務院今年8月印發《關于深入實施“人工智能+”行動的意見》后,教育......

  • <table id="4yyaw"><kbd id="4yyaw"></kbd></table>
  • <td id="4yyaw"></td>
  • 调性视频