ChatGPT有重要創新，不可能一蹴而就

發布時間：2023-02-14 09:45 原文鏈接： ChatGPT有重要創新，不可能一蹴而就

近期，ChatGPT頻上熱搜，大家紛紛通過各種渠道體驗，中國計算機學會常務理事、之江實驗室副主任鮑虎軍就是其中之一。

跟ChatGPT“聊”下來，鮑虎軍感受到其強大，甚至覺得它有些“圓滑”：它不僅能多輪對話，拒絕回答不恰當的提問，還“懂得承認錯誤”，調整后續答案。

“這說明它背后的信息學習和整合機制是非常完善的。”鮑虎軍說。

解決“對齊”問題，ChatGPT更“絲滑”

對話機器人早已不是新鮮事物，ChatGPT何以能一騎絕塵？這恐怕要從其給人“絲滑”的對話體驗及其超常表現說起。

這類機器人的本質是人工智能機器學習模型。在開發之初，開發者通常會輸入大量貼有“標簽”的數據，對模型系統進行訓練，讓系統通過算法自動輸出結果。

如果只靠自動輸出結果，ChatGPT也許和其他聊天機器人無異。它的橫空出世，離不開至少兩樣東西：大型語言模型（LLM）和一種名為“人在回路”的強化學習機制。

眾所周知ChatGPT 脫胎于OpenAI的 GPT3（升級后為GPT3.5），但 OpenAI的開發團隊對它的訓練才是更動人心魄的：在系統訓練過程中，團隊先用少量的問答標注數據，微調預訓練大模型GPT3.5；然后讓訓練者接入系統不斷提出大量問題，由GPT3.5模型對每個問題給出若干答案，人工對答案滿意度進行打分排序，并建立獎懲模型；最后不斷循環、強化學習，才得到了最終的問答模型。

這種訓練機制又被稱為人類反饋強化學習（RLHF）。鮑虎軍表示，這種訓練機制解決了大模型回答問題與人類認知和需求“對齊”的問題，在工程實現上實現了重要的創新。

這就是ChatGPT 的答案常常能夠“引人舒適”的關鍵因素之一。“這讓系統給出的答案和人類的常識、認知、需求、價值觀更加貼合。”鮑虎軍說，正是引入人工反饋這一步，讓系統預測能力實現了“對齊”。

在過去，人們對大模型的使用，往往更關注于面向專業領域進行開發，這也催動著基礎大模型逐漸形成面向專業的行業大模型。但是，基礎模型在不同專業領域應用過程中，開發者需要用它對該領域標記的關鍵數據進行微調訓練，而此后模型的使用并不開放，這導致模型的應用效能并不高。

ChatGPT與此不同。它的參數部署之后，模型不再變改，而是通過廣泛的用戶使用，不斷匯聚相關信息、不斷進行新的內容學習和整合，讓優化也在“回路”。按照ChatGPT 目前月活躍用戶一億計，它的變化與日俱增。

“一億用戶不斷為它提供數據采集，讓它不斷變得強大。” 鮑虎軍認為，ChatGPT從能力和模式上，解決了多年來人機對話交流難以逾越的重大挑戰，正是這種大規模模型預訓練和擬人問答“對齊”技術的變革，它才引發了各界的共鳴。

要復刻ChatGPT，先闖三關

ChatGPT的爆火，攪動了人們對AI產業實現期望的一池春水。在不斷加碼 OpenAI 之后，微軟發布全新“必應”（Bing）搜索工具，讓人們可以在Edge瀏覽器上上體驗ChatGPT。感受到危機的谷歌也動作頻頻，并在2月7日發布了下一代對話AI系統Bard，只是首戰“出師不利”。

國內也一派奮起直追的景象。2月7日，百度宣布推出生成式對話產品“文心一言”（英文名 ERNIE Bot），并約定“3月和大家正式見面”；2月10日，美團聯合創始人王慧文高調宣布自帶5000萬美元入局AI，目前已成再創業之勢，放言希望“打造中國OpenAI”；360集團也稱有200多億的資金能夠支持360進行類ChatGPT 技術的研究和投入，創始人周鴻祎更直言“不會放棄對ChatGPT相關技術的研究和跟蹤”……

ChatGPT引發的這波熱潮，讓人直呼“有點夢回2016的意思”。那一年的AI頭條是：李世石大戰 AlphaGo。

這一切的發生，鮑虎軍認為，ChatGPT等AI工具的進一步廣泛應用，有望極大提升內容創作和人機交互的能力，它們也會成為像互聯網平臺一樣的基礎設施，給人類帶來生產能力的提升。隨著圖像、文本、聲音等多模態類型計算的互通轉換的引入，還將帶來更大的想象空間。

不過，要在中國復刻OpenAI、打造國產化的ChatGPT絕非易事。鮑虎軍認為，機器學習模型開發者很多，要做好ChatGPT類項目，工程實現是“重頭戲”。

“一個好的機器學習模型，并不是開發完成就結束了，而是要真正找到一種便捷的使用模式，讓人工智能為更多人解決實際問題。” 鮑虎軍說。

他表示，當業界對ChatGPT奮起直追時，也要看到，ChatGPT的誕生不是一蹴而就的。ChatGPT的成功，離不開強大的技術創新、工程實現能力以及投資人的勇氣。

而要闖這“三關”之前，還要看自身技術和資源的積累。公開數據顯示，OpenAI于2018年 6 月發布GPT1，迄今迭代至GPT3.5，已經歷了多年的技術積累。ChatGPT模型的前身語言模型GPT3，其參數規模達到了1750億，使用超45TB數據進行訓練；后期研發不僅引入了微軟的資本加持，還投入了大量時間與精力……

“做好一個成果，需要構想、研發、商業等多方力量投入，無論從哪個層面，都不能浮躁，而是需要更多的耐心與堅持。” 鮑虎軍說。

更多與 ChatGPT有重要創新，不可能一蹴而就相關的新聞

ChatGPT有重要創新，不可能一蹴而就

解決“對齊”問題，ChatGPT更“絲滑”

要復刻ChatGPT，先闖三關

其他網友還關注過

AI讓大腦變懶變笨了嗎？

ChatGPT發布兩周年，OpenAI“官司纏身”

數年心血被輕松實現，科研如何與大模型合作共生

OpenAI又地震：ChatGPT負責人離職

澳高校如何應對人工智能挑戰

半個月內兩次宕機，ChatGPT安全性引擔憂

OpenAI員工發公開信警告AI風險，認為可能導致“人類滅絕”

GPT5在路上了？OpenAI透露開始訓練下一個前沿模型

ChatGPT如何“思考”

ChatGPT將變身AI語音助手？挑戰Siri和谷歌語音助手