《自然》封面：以AI生成數據訓練AI，模型變傻？

大模型有許多“崩”的時候，但有一種崩潰叫做“自毀前程”—— 近日，《自然》發表在封面的一篇論文指出，用AI生成的數據集訓練未來幾代機器學習模型，可能會“污染”它們的輸出。這項由英國牛津大學、劍橋大學、帝國理工學院、加拿大多倫多大學等多所高校聯合開展的研究顯示，原始內容會在數代內變成不相關的“胡言亂語”，彰顯出使用可靠數據訓練AI模型的重要性。該論文被放在《自然》封面介紹，配圖為“Garbage Out”（垃圾出）。圖源：Nature 研究團隊給出一個例子。他們測試了Meta的OPT-125m模型，詢問了關于中世紀建筑的相關信息，并且每一次微調都是由上一次生成的數據來訓練。結果，前面幾輪的回答還算過關，但隨著生成內容的迭代，模型逐漸語無倫次；到第九次，模型居然開始“胡說八道”，回答從討論建筑跳躍到一串“野兔”的名字…… 該論文主要作者表示，他們曾考慮過合成數據可能對大模型造成誤差，但未曾預料到模型的惡化速度會如此迅速......閱讀全文

用AI數據訓練AI可能最終導致崩潰

《自然》7月24日發表的一篇論文指出，用人工智能（AI）生成的數據集訓練未來幾代機器學習模型可能會污染它們的輸出，這個概念稱為“模型崩潰”（model collapse）。該研究顯示，原始內容會在數代內變成不相關的胡言亂語，顯示出使用可靠數據訓練AI模型的重要性。生成式AI工具越來越受歡迎，如大語言

2024-07-28 21:12 News WIKI 相關搜索

用AI數據訓練AI可能最終導致崩潰

　　《自然》7月24日發表的一篇論文指出，用人工智能（AI）生成的數據集訓練未來幾代機器學習模型可能會污染它們的輸出，這個概念稱為“模型崩潰”（model collapse）。該研究顯示，原始內容會在數代內變成不相關的胡言亂語，顯示出使用可靠數據訓練AI模型的重要性。　　生成式AI工具越來越受歡迎，

2024-07-30 16:53 News WIKI 相關搜索

用AI生成數據訓練AI或導致模型崩潰

科技日報北京7月25日電?（記者張夢然）《自然》24日正式發表的一篇研究論文指出了一個人工智能（AI）嚴重問題：用AI生成的數據集訓練未來幾代機器學習模型，可能會嚴重“污染”它們的輸出，這被稱為“模型崩潰”。研究顯示，原始內容會在9次迭代以后，變成不相關的“胡言亂語”（演示中一個建筑文本最終變成了野

2024-07-26 08:55 News WIKI 相關搜索

用AI生成數據訓練AI或導致模型崩潰

　　《自然》24日正式發表的一篇研究論文指出了一個人工智能（AI）嚴重問題：用AI生成的數據集訓練未來幾代機器學習模型，可能會嚴重“污染”它們的輸出，這被稱為“模型崩潰”。研究顯示，原始內容會在9次迭代以后，變成不相關的“胡言亂語”（演示中一個建筑文本最終變成了野兔的名字），這凸顯出使用可靠數據訓練

2024-07-26 14:07 News WIKI 相關搜索

《自然》封面：以AI生成數據訓練AI，模型變傻？

　　大模型有許多“崩”的時候，但有一種崩潰叫做“自毀前程”——　　近日，《自然》發表在封面的一篇論文指出，用AI生成的數據集訓練未來幾代機器學習模型，可能會“污染”它們的輸出。這項由英國牛津大學、劍橋大學、帝國理工學院、加拿大多倫多大學等多所高校聯合開展的研究顯示，原始內容會在數代內變成不相關的“胡

2024-07-30 16:53 News WIKI 相關搜索

《自然》封面：以AI生成數據訓練AI，模型變傻？

大模型有許多“崩”的時候，但有一種崩潰叫做“自毀前程”——近日，《自然》發表在封面的一篇論文指出，用AI生成的數據集訓練未來幾代機器學習模型，可能會“污染”它們的輸出。這項由英國牛津大學、劍橋大學、帝國理工學院、加拿大多倫多大學等多所高校聯合開展的研究顯示，原始內容會在數代內變成不相關的“胡言亂語”

2024-07-28 17:29 News WIKI 相關搜索

美AI巨頭被控秘密“侵吞”數據

人工智能（AI）迅速發展離不開對模型的訓練。然而，高質量數據短缺以及部分領域封閉式的數據生態似乎成為AI發展的掣肘。據多家外媒報道，OpenAI、谷歌和Meta等公司正尋求在線信息來訓練最新的AI系統。但他們無視既定政策，蓄意改變規則，并試圖規避版權法。收集數據“走捷徑”英國《泰晤士報》近日刊文指出

2024-04-17 10:56 News WIKI 相關搜索

數據“中毒”會讓AI“自己學壞”

　　在一個繁忙的火車站，監控攝像頭正全方位追蹤站臺的情況，乘客流量、軌道占用、衛生狀況……所有信息實時傳輸給中央人工智能（AI）系統。這個系統的任務是幫助調度列車，讓它們安全準點進站。然而，一旦有人惡意干擾，比如用一束紅色激光模擬列車尾燈，那么攝像頭可能會誤以為軌道上已有列車。久而久之，AI學會了把

2025-08-19 14:24 News WIKI 相關搜索

“AI靶場”讓數據管理更精準

數字經濟時代，數據已成為新型生產要素。通過“數據托管”等形式對數據進行集中管理，有助于保護數據主體權益，促進數據共享和運用效率，對數字經濟的發展具有重要意義。近日，在深圳數據交易所（簡稱“深數所”）的支持下，鵬城實驗室AI靶場與合合信息旗下啟信寶達成合作，雙方成功完成首批數據托管事宜的對接，為中國數

2023-12-10 17:03 News WIKI 相關搜索

AI教育風潮席卷中國高校－學生用AI學AI

　　“What does this machine do(這臺機器是干什么的)？”4日下午，西南交通大學孟加拉國留學生Zahidul Alam拍下身前吊弦疲勞試驗儀器的照片。收到他的語音提問后，手機中的24小時在線“AI學伴”瞬間給出如論文般詳細的英文回答。　　這是西南交大首門人工智能通識課的第一課

2024-09-06 10:15 News WIKI 相關搜索

用AI識別AI：西湖大學研究可檢測AI生成文本

虛假新聞、惡意產品評論、剽竊……ChatGPT、 GPT-4等AI大語言模型的應用帶來便利，但其誤用也帶來一系列問題。西湖大學工學院張岳教授的“文本智能實驗室”日前發布的一項研究提出一種高準確率、高速、低成本、通用的新文本檢測方法——Fast-DetectGPT，無需訓練即可識別各種AI大語言模型生

2024-06-28 18:22 News WIKI 相關搜索

合成數據能否讓AI模型精確可靠？

人工智能（AI）初創公司xAI創始人埃隆·馬斯克近日表示：“在AI訓練中，我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明，人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺，為滿足AI的“胃口”，科技行業正轉向使用合成數據。澳大利亞“對話”網站在本月稍早時間報道中指出，合成數據

2025-02-08 22:10 News WIKI 相關搜索

合成數據能否讓AI模型精確可靠？

　　人工智能（AI）初創公司xAI創始人埃隆·馬斯克近日表示：“在AI訓練中，我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明，人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺，為滿足AI的“胃口”，科技行業正轉向使用合成數據。　　澳大利亞“對話”網站在本月稍早時間報道中指出，

2025-02-04 21:38 News WIKI 相關搜索

合成數據能否讓AI模型精確可靠？

2025-01-22 14:47 News WIKI 相關搜索

ChatGPT的拷問：何為AI倫理、AI治理

前不久，AI聊天機器人程序ChatGPT席卷全球，完成了AI第一次大規模的自傳播。作為人工智能領域的現象級應用，ChatGPT可能引發的信任、責任、倫理、法律等問題也很快引發各界關注與擔憂。近年來，不少關于人工智能（AI），并和人類生產、生活關系緊密的議題被廣泛討論，諸如“如何應對AI可能對社會產生

2023-03-07 16:21 News WIKI 相關搜索

ChatGPT的拷問：何為AI倫理、AI治理

原文地址：http://news.sciencenet.cn/htmlnews/2023/2/494707.shtm　　前不久，AI聊天機器人程序ChatGPT席卷全球，完成了AI第一次大規模的自傳播。作為人工智能領域的現象級應用，ChatGPT可能引發的信任、責任、倫理、法律等問題也很快引發各

2023-02-26 23:11 News WIKI 相關搜索

“AI+”時代－|－AI“解碼”免疫系統

　　人體免疫系統包含了很多有關身體健康的信息，其中的關鍵部分就包含在血液中。醫學界提出了一個大膽設想：通過創建一個萬能的血液測試，采集免疫系統與病原體之間的反應信息，繪制“免疫圖譜”，從而解碼免疫系統中的信息，及時在疾病惡化前篩查確診。那么，什么樣的平臺能提供足夠的計算力，不斷通過機器學習和精準模型

2020-10-05 23:36 News WIKI 相關搜索

“AI+大數據”推動數據挖掘走向數智化治理

??5月20日，阿里巴巴副總裁、阿里云計算平臺負責人賈揚清在媒體溝通會上表示，經過近20年的發展，人們對大數據的利用已從早期的數據挖掘進化為集數據分析、數據管理、數據協同為一體的綜合治理，在這一進程中，大數據與人工智能（AI）技術的融合居功甚偉。賈揚清提到，數字經濟迅猛發展，不斷豐富、增長的數

2021-05-21 14:38 News WIKI 相關搜索

啟信慧眼發布商業大數據領域AI大模型應用，降低“AI幻覺”概率

7月17日，上海合合信息科技股份有限公司旗下啟信慧眼宣布完成品牌升級，定位為“商業數據智能決策企業級AI產品”。同時，啟信慧眼首次發布中國商業大數據領域AI大模型應用，聚焦企業營銷、盡調、風控等核心場景，賦能企業數智化轉型。“慧眼”寓意洞察本質、明辨真偽的能力。合合信息數據事業部副總經理沈東輝表示，

2025-07-18 09:57 News WIKI 相關搜索

AI“參謀”來了！中關村AI新藥研發平臺落成

　　 12月19日，由中關村生命科學園與角井（北京）生物技術有限公司共同發起建設的中關村AI新藥研發平臺在北京中關村生命科學園舉行落成典禮。該平臺于2020年12月開始籌建，旨在利用人工智能技術幫助制藥企業快速進行藥物靶點發現和篩選、藥物作用機制探索、特異性抗體優化等工作，成為生物醫藥企業新藥研發的

2021-12-21 11:53 News WIKI 相關搜索

為什么越使用AI，越活得像個AI

生成式人工智能（AIGC）在重塑生產力的同時，也給高等教育領域帶來了顛覆性變革。然而，它所具有的“技術雙面性”很可能引發“流利但不真實”“道德偏見”“技術依賴”等問題，這將影響高等教育場景。2023年初，全球多所高校陸續出臺政策禁止學生使用生成式AI，但越來越多的大學開始意識到生成式AI勢不可擋，單

2024-05-09 11:09 News WIKI 相關搜索

利用“數據+知識+AI”實現新靶標藥物虛擬篩選

　　6月6日，中國科學院上海藥物研究所鄭明月課題組在《自然-機器智能》（Nature Machine Intelligence）上發表了題為Generic protein–ligand interaction scoring by integrating physical prior knowled

2024-06-18 13:49 News WIKI 相關搜索

生成式AI時代，大模型數據安全如何保障？

在生成式AI（人工智能）時代，數據安全的出路可能會是“用魔法打敗魔法”，知識產權保護也可能要提前到token（字符串）層面。4月26日，在2024中關村論壇上，人工智能企業與學者就AI大模型的數據安全問題進行了討論。中關村論壇數據安全治理與發展論壇現場? 澎湃新聞記者秦盛攝“在生成式人工智能時代

2024-04-27 07:56 News WIKI 相關搜索

亞馬遜云推出AI代理功能，讓AI成為助理

　　Amazon Bedrock的Agents（代理）功能將使公司能夠構建可以自動執行特定任務的AI應用程序，例如預訂餐廳，而不僅僅是得到去哪里吃飯的建議。　　“很多人都如此聚焦于這些模型和模型的大小，但我認為真正重要的是如何利用它們構建應用，這也是今天發布代理（Agents）功能的一個重要原因。”

2023-07-27 16:21 News WIKI 相關搜索

“AI成龍”遇冷，AI數字人在影視業不靈？

影視業成為“粗制濫造”的標簽?近日，影視巨星成龍主演、大量使用了人工智能（AI）數字人技術的電影《傳說》登陸大熒幕，卻遭遇了票房與口碑的雙失利。截至7月20日，豆瓣評分5.3，上映10天累計票房不到8000萬元。顯然，“AI成龍”遭到了冷遇。“AI成龍”本是《傳說》這部電影的賣點。據介紹，為了劇情需

2024-07-21 09:57 News WIKI 相關搜索

“氏無界·AI無疆”醫療AI成果轉化行動啟動

原文地址：http://news.sciencenet.cn/htmlnews/2024/1/516109.shtm

2024-01-16 15:50 News WIKI 相關搜索

鐘南山：大數據和AI提高新冠肺炎診斷

　　“大數據和人工智能極大提高了我們對新冠肺炎的診斷、預測和治療水平。”于12日上午在福州舉辦的第三屆數字中國建設峰會開幕式上，“共和國勛章”獲得者、中國工程院院士鐘南山在視頻致辭中向在抗疫斗爭中作出貢獻的數字技術領域工作者表示感謝。　　1936年10月出生的鐘南山是福建廈門人。他說，“歡迎嘉賓們來

2020-10-12 15:00 News WIKI 相關搜索

熱界面新材料有望降低AI數據中心能耗

為了降低人工智能（AI）數據中心冷卻成本，美國卡內基梅隆大學研究團隊研制出一種創新性熱界面材料。這種材料不僅實現了超低熱阻，還通過改進散熱大幅提升了冷卻效率，降低了成本，性能超越了當前最先進的解決方案。相關論文發表于最新一期《自然·通訊》雜志。美國能源部的數據顯示，目前，AI數據中心40%的用電量被

2025-02-07 17:21 News WIKI 相關搜索

AI數據存儲設備選型的6個關鍵要素

人工智能（AI）和機器學習將成為幫助企業利用其核心數字資產創造競爭優勢的很重要工具之一。但在選購AI數據存儲設備之前，企業必須考慮機器學習平臺在獲取、處理和保留數據時的一系列需求。我們首先需要研究一下機器學習軟件使用的數據的生命周期，因為這有助于企業理解在為AI選擇存儲時應該考慮哪些因素。最

2020-09-29 13:13 News WIKI 相關搜索

AI－耗電超出預期，未來－AI－進展或依賴能源突破

據 technews 報道，由于 AI 消耗電力將遠遠超出人們預期，OpenAI 執行長 Sam Altman 認為，未來 AI 發展需要尋求能源突破。Sam Altman在彭博社于達沃斯世界經濟論壇（World Economic Forum）期間舉行的座談活動中談道，對氣候友善的能源，特別是核融合

2024-01-18 17:19 News WIKI 相關搜索

儀器

島津GCMS-QP2050氣相色譜質譜聯用儀布魯克 SPR #64 表面等離子共振儀譜育科技 MOST 8000 水環境巡航監測系統多功能水質走航溯源無人船賽默飛100 kV冷凍透射電鏡Tundra Cryo-TEM Etaluma LS850活細胞監控系統基恩士 SV系列 AC伺服系統在線視覺跟蹤儀（安全監測）Countstar Mira FL Pro 微生物細胞分析儀 WIGGENS TCSS-1程控型智能溫度控制器

下載

MaXFlow 基于人工智能技術的材料設計平臺