一名化學博士發現,自己需要花費一年做的實驗研究,Claude 3(Anthropic公司發布的通用大語言模型)僅用兩個小時便可給出方案,且比原方案更簡潔、成本更低;一名研究量子物理學方向的博士手握一篇還未發表的論文,結果Claude 3僅憑兩個提示詞,便直接將論文中的算法“發明”了出來……
“當不同學科的科研難題不斷被大模型定向‘爆破’,未來,科研還存在嗎?”在日前舉行的2024第十屆WWEC教育者大會·中歐智慧論壇上,中國科學院院士、國際歐亞科學院院士陳潤生提出的問題,引起不少人深思。
時下,大語言模型的出現為數據分析帶來革命性影響。放眼未來,大模型的下一步該怎么走?人工智能能否超過人腦智能?面對人工智能新浪潮,我們又該做些什么?
計算機不可能出現“頓悟”,但大模型會
人工智能帶來的變化是無可比擬的。不久前,ChatGPT的主要競爭對手之一Claude將語境窗口token(注:為計量大模型輸入、輸出的基本單位,有翻譯為“詞元”)數擴展到10萬,相當于7.5萬個單詞,大大超越了GPT-4語境窗口的8192tokens。這意味著,用戶可以將高達500頁的文檔上傳到Claude,它可以在1分鐘之內理解、消化這些信息,并基于上傳的信息回答用戶的問題。
“大模型的學習速度比我們想象中快得多。”陳潤生指出,大模型帶來兩大變化:一是突破了自然語言的識別問題,“計算機可以讀書了”;二是實現多模態的融合,從原來只會下棋的“專家”變成了“雜家”。
簡言之,人工智能已能逐漸吸收人類創作的所有東西,這是大模型當下正在做的事情,而未來,隨著大模型成體系、規模化地增長,勢必會出現諸如涌現、頓悟、幻覺等三種現象。
“頓悟”是大模型在數據訓練量較少的情況下突然學會了其中的規律。“就像小孩學習一樣,學一兩遍不會,但學到了第五遍一下就會了。這是人腦學習的一種模式,人學到某個時間,突然開竅了。”陳潤生進一步解釋說,在傳統的印象中,計算機不可能出現“頓悟”,但大模型可能會。此外,“幻覺”與“涌現”是相對應的概念。大模型給出的結果如果是訓練中沒有提供的,但合乎邏輯且客觀存在,那就是“涌現”;“幻覺”則是指大模型出現的錯誤或“胡說八道”的東西。
“這些現象或許預示,未來,人工智能可能具備超越人腦智能的能力。”但陳潤生同時指出,就目前而言,大模型僅能在某些專業領域達到人類的智能水平,尚未達到人類的智慧水平。對于研究人員來說,如何與大模型合作、共生,提升科研效率,也成為值得研究的重要議題。“大模型可以成為科研人員的好助手,比如幫忙整理文獻等。但最后如何處置一堆數據,還是離不開人的把關。”
發展大模型,仍要向人腦學習
如今,大模型正加快走進人們的生產、生活。國家互聯網信息辦公室數據顯示,截至今年3月,我國已有117個大模型成功備案。最新統計表明,我國已完成備案并上線能為公眾提供服務的生成式人工智能服務大模型180多個。
一方面,大模型行業正呈現出蓬勃發展態勢。但另一方面,也有不少學者認為,不能忽視大模型在耗能、倫理對齊等方面存在的明顯短板。據斯坦福人工智能研究所發布的《2023年AI指數報告》顯示,GPT-3一次訓練的耗電量為1287兆瓦時,大概相當于3000輛特斯拉電動汽車共同開跑、每輛車跑20萬英里所耗電量的總和。而擁有約860億神經元的人腦,功率僅為20瓦。
“有人認為,未來,人工智能領域的競爭實則是能源競爭,但我不這么認為。”作為佐證,陳潤生援引了一組照片,分別為新生兒、三月齡幼兒和兩歲兒童的腦部影像片。“可以看到,隨著知識的快速增長,人腦中樞系統結構悄然變化,神經系統及神經網絡的復雜性大大增加。”
“人類的神經網絡結構遠比目前大模型復雜得多,未來的智能計算還將參考‘人類智能’,也就是模擬人腦的運行機制。”他表示,大模型的發展絕非靠芯片越堆越多來實現,像人腦一般提高認知系統的時空復雜度,或許能進一步提高大模型的智能程度和應用范圍。
隨著人工智能的蓬勃發展,人類的角色正在發生轉變。“未來的工作環境將要求人們具備更強的創新能力、溝通技巧和跨學科知識背景。”中歐國際工商學院經濟學與決策科學教授、中歐AI與管理創新研究中心主任方躍舉例談到,在商業領域,成功的企業將是那些能夠有效地結合人工智能與人類智慧的企業。這就要求人類學會與機器協作,而不僅僅將其看作競爭對手。“我們也需要重新思考現有的教育體系和社會結構,培養出更多適合未來社會需求的人才。”
一名化學博士發現,自己需要花費一年做的實驗研究,Claude3(Anthropic公司發布的通用大語言模型)僅用兩個小時便可給出方案,且比原方案更簡潔、成本更低;一名研究量子物理學方向的博士手握一篇還......
一名化學博士發現,自己需要花費一年做的實驗研究,Claude3(Anthropic公司發布的通用大語言模型)僅用兩個小時便可給出方案,且比原方案更簡潔、成本更低;一名研究量子物理學方向的博士手握一篇還......
一名化學博士發現,自己需要花費一年做的實驗研究,Claude3(Anthropic公司發布的通用大語言模型)僅用兩個小時便可給出方案,且比原方案更簡潔、成本更低;一名研究量子物理學方向的博士手握一篇還......
一名化學博士發現,自己需要花費一年做的實驗研究,Claude3(Anthropic公司發布的通用大語言模型)僅用兩個小時便可給出方案,且比原方案更簡潔、成本更低;一名研究量子物理學方向的博士手握一篇還......
科大訊飛正積極布局人形機器人賽道。8月21日,2024世界機器人大會在北京開幕。本次大會上,科大訊飛帶來了“訊飛超腦2030計劃”的最新進展和大模型加持下、“腦力”再升級的訊飛人形機器人。當前人形機器......
“大模型不是萬能的,不能過度神話它。”這句話,《中國科學報》記者今年在不同場合聽到多次。最近一次,是在“CCF太原大模型賦能文物古建保護與傳承論壇”上。自2022年底OpenAI推出大語言模型產品Ch......
OpenAI內部仍動蕩不安,ChatGPT的兩位重要負責人選擇離開。8月6日,AI(人工智能)巨頭OpenAI聯合創始人約翰·舒爾曼(JohnSchulman)在X(推特)發文表示,將離開OpenAI......
論及當下計算技術的發展方向和趨勢,“超智融合”當仁不讓——在今年6月發布的2024年全球“最節能超算”榜單(Green500)上,位列榜單前三的超算都采用了“超智融合”的技術理念。超智融合,顧名思義,......
30日,“諦聽”地震波大模型日前在國家超級計算成都中心發布,將于2024年底公測。據介紹,這是全球首個億級參數量的專業地震數據處理大模型。2023年9月,由成都產業集團、成都天投集團聯合運營的國家超級......
對罕見病患者而言,越早確診越有治愈希望。國際罕見病研究聯盟第二個十年計劃(2017-2027)的首要目標就是“讓所有罕見病患者在就診后的一年內獲得精準診斷”。在大語言模型快速發展的今天,這一理想正在照......