近期,ChatGPT頻上熱搜,大家紛紛通過各種渠道體驗,中國計算機學會常務理事、之江實驗室副主任鮑虎軍就是其中之一。
跟ChatGPT“聊”下來,鮑虎軍感受到其強大,甚至覺得它有些“圓滑”:它不僅能多輪對話,拒絕回答不恰當的提問,還“懂得承認錯誤”,調整后續答案。
“這說明它背后的信息學習和整合機制是非常完善的。”鮑虎軍說。
對話機器人早已不是新鮮事物,ChatGPT何以能一騎絕塵?這恐怕要從其給人“絲滑”的對話體驗及其超常表現說起。
這類機器人的本質是人工智能機器學習模型。在開發之初,開發者通常會輸入大量貼有“標簽”的數據,對模型系統進行訓練,讓系統通過算法自動輸出結果。
如果只靠自動輸出結果,ChatGPT也許和其他聊天機器人無異。它的橫空出世,離不開至少兩樣東西:大型語言模型(LLM)和一種名為“人在回路”的強化學習機制。
眾所周知ChatGPT 脫胎于OpenAI的 GPT3(升級后為GPT3.5),但 OpenAI的開發團隊對它的訓練才是更動人心魄的:在系統訓練過程中,團隊先用少量的問答標注數據,微調預訓練大模型GPT3.5;然后讓訓練者接入系統不斷提出大量問題,由GPT3.5模型對每個問題給出若干答案,人工對答案滿意度進行打分排序,并建立獎懲模型;最后不斷循環、強化學習,才得到了最終的問答模型。
這種訓練機制又被稱為人類反饋強化學習(RLHF)。鮑虎軍表示,這種訓練機制解決了大模型回答問題與人類認知和需求“對齊”的問題,在工程實現上實現了重要的創新。
這就是ChatGPT 的答案常常能夠“引人舒適”的關鍵因素之一。“這讓系統給出的答案和人類的常識、認知、需求、價值觀更加貼合。”鮑虎軍說,正是引入人工反饋這一步,讓系統預測能力實現了“對齊”。
在過去,人們對大模型的使用,往往更關注于面向專業領域進行開發,這也催動著基礎大模型逐漸形成面向專業的行業大模型。但是,基礎模型在不同專業領域應用過程中,開發者需要用它對該領域標記的關鍵數據進行微調訓練,而此后模型的使用并不開放,這導致模型的應用效能并不高。
ChatGPT與此不同。它的參數部署之后,模型不再變改,而是通過廣泛的用戶使用,不斷匯聚相關信息、不斷進行新的內容學習和整合,讓優化也在“回路”。按照ChatGPT 目前月活躍用戶一億計,它的變化與日俱增。
“一億用戶不斷為它提供數據采集,讓它不斷變得強大。” 鮑虎軍認為,ChatGPT從能力和模式上,解決了多年來人機對話交流難以逾越的重大挑戰,正是這種大規模模型預訓練和擬人問答“對齊”技術的變革,它才引發了各界的共鳴。
ChatGPT的爆火,攪動了人們對AI產業實現期望的一池春水。在不斷加碼 OpenAI 之后,微軟發布全新“必應”(Bing)搜索工具,讓人們可以在Edge瀏覽器上上體驗ChatGPT。感受到危機的谷歌也動作頻頻,并在2月7日發布了下一代對話AI系統Bard,只是首戰“出師不利”。
國內也一派奮起直追的景象。2月7日,百度宣布推出生成式對話產品“文心一言”(英文名 ERNIE Bot),并約定“3月和大家正式見面”;2月10日,美團聯合創始人王慧文高調宣布自帶5000萬美元入局AI,目前已成再創業之勢,放言希望“打造中國OpenAI”;360集團也稱有200多億的資金能夠支持360進行類ChatGPT 技術的研究和投入,創始人周鴻祎更直言“不會放棄對ChatGPT相關技術的研究和跟蹤”……
ChatGPT引發的這波熱潮,讓人直呼“有點夢回2016的意思”。那一年的AI頭條是:李世石大戰 AlphaGo。
這一切的發生,鮑虎軍認為,ChatGPT等AI工具的進一步廣泛應用,有望極大提升內容創作和人機交互的能力,它們也會成為像互聯網平臺一樣的基礎設施,給人類帶來生產能力的提升。隨著圖像、文本、聲音等多模態類型計算的互通轉換的引入,還將帶來更大的想象空間。
不過,要在中國復刻OpenAI、打造國產化的ChatGPT絕非易事。鮑虎軍認為,機器學習模型開發者很多,要做好ChatGPT類項目,工程實現是“重頭戲”。
“一個好的機器學習模型,并不是開發完成就結束了,而是要真正找到一種便捷的使用模式,讓人工智能為更多人解決實際問題。” 鮑虎軍說。
他表示,當業界對ChatGPT奮起直追時,也要看到,ChatGPT的誕生不是一蹴而就的。ChatGPT的成功,離不開強大的技術創新、工程實現能力以及投資人的勇氣。
而要闖這“三關”之前,還要看自身技術和資源的積累。公開數據顯示,OpenAI于2018年 6 月發布GPT1,迄今迭代至GPT3.5,已經歷了多年的技術積累。ChatGPT模型的前身語言模型GPT3,其參數規模達到了1750億,使用超45TB數據進行訓練;后期研發不僅引入了微軟的資本加持,還投入了大量時間與精力……
“做好一個成果,需要構想、研發、商業等多方力量投入,無論從哪個層面,都不能浮躁,而是需要更多的耐心與堅持。” 鮑虎軍說。
近日,一項公布于預印本服務器arXiv的研究發現,使用ChatGPT寫論文的人,其大腦活躍度低于被禁止使用任何在線工具寫論文的人。這項調查是評估人工智能(AI)是否正使人們變得“認知懶惰”的更廣泛研究......
ChatGPT的誕生加速了生成式人工智能領域的融資,但這一趨勢的引領者OpenAI卻因版權問題和轉向營利性公司導致“官司纏身”,兩周年生日過得似乎并不順心。美媒《商業內幕》12月1日報道,據CBIns......
一名化學博士發現,自己需要花費一年做的實驗研究,Claude3(Anthropic公司發布的通用大語言模型)僅用兩個小時便可給出方案,且比原方案更簡潔、成本更低;一名研究量子物理學方向的博士手握一篇還......
OpenAI內部仍動蕩不安,ChatGPT的兩位重要負責人選擇離開。8月6日,AI(人工智能)巨頭OpenAI聯合創始人約翰·舒爾曼(JohnSchulman)在X(推特)發文表示,將離開OpenAI......
近年來,教育領域,特別是高等教育領域的人工智能趨勢日益明顯,并在世界范圍內形成一股熱潮。這其中,澳大利亞大學的數字化及人工智能教育一直以其卓越的研究能力、學習者滿意度和就業成果享譽全球,由此帶動了澳大......
美國開放人工智能研究中心(OpenAI)開發的聊天機器人產品ChatGPT繼本月4日發生故障后,17日再次出現宕機事故,無法回答用戶提問。ChatGPT半個月內接連宕機,引發用戶和業內人士對其穩定性與......
多家美國人工智能(AI)領域企業的在職和離職員工當地時間4日發表公開信,對這項新興技術帶來的風險表示擔憂。據路透社5日報道,公開信的簽署者包括美國AI初創企業OpenAI以及谷歌旗下“深層思維”公司的......
中新網5月29日電(中新財經記者吳濤)“OpenAI最近開始訓練其下一個前沿模型,我們預計最終的系統將使我們在通往AGI的道路上更上一層樓。”近日,OpenAI對外公布,OpenAI董事會成立了安全與......
北京時間5月14日凌晨,美國開放人工智能研究中心(OpenAI)發布了其下一代大型語言模型GPT-4o,人工智能(AI)領域再起硝煙。盡管AI一詞已很普及,但其內部運作方式仍像黑箱操作一樣,是一個謎。......
新品發布在即,奧特曼的最新表態或暗示OpenAI意在人工智能語音助手。當地時間5月11日,人工智能(AI)巨頭OpenAICEO山姆·奧特曼(SamAltman)在一檔播客節目中稱,OpenAI將繼續......