訊飛聯手華為攻克全國產算力下推理模型訓練難關
1月15日,科大訊飛發布了我國“全國產”算力平臺第一個深度推理大模型——訊飛星火X1。據公開測試,該模型中文數學能力表現突出,目前已應用于教育、醫療等場景。在大模型研發領域,訊飛星火堅持走全國產化路線。據科大訊飛研究院副院長殷兵介紹,盡管在全國產算力平臺上訓練深度推理模型遭遇了諸多挑戰,但科大訊飛攜手華為,成功攻克了訓練推理強交互、高吞吐推理優化以及國產算子優化等一系列難題,最終成功訓練出我國首個基于全國產算力訓練的、具備深度思考和推理能力的大模型——訊飛星火X1。發布會上,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、美國數學邀請賽(AIME)賽題以及高中奧賽題的表現。訊飛星火X1對解題思路和步驟進行了詳細拆解,準確給出了這些題目的答案。與通用大模型相比,其解題過程更接近人類的“慢思考”方式。“訊飛星火X1充分展現深度推理模型的三大典型特征:化繁為簡,將復雜問題分步拆解簡化;進行自我探索和反思驗證;基于答案正確與否......閱讀全文
智譜發布推理模型初代版本
12月31日,國內明星大模型創業公司北京智譜華章科技有限公司推出基于擴展強化學習技術訓練的推理模型GLM-Zero-Preview,擅長處理數理邏輯、代碼和需要深度推理的復雜問題。GLM-Zero-Preview是GLM-Zero的初代版本。智譜表示,目前的GLM-Zero-Preview與Open
訊飛聯手華為攻克全國產算力下推理模型訓練難關
1月15日,科大訊飛發布了我國“全國產”算力平臺第一個深度推理大模型——訊飛星火X1。據公開測試,該模型中文數學能力表現突出,目前已應用于教育、醫療等場景。在大模型研發領域,訊飛星火堅持走全國產化路線。據科大訊飛研究院副院長殷兵介紹,盡管在全國產算力平臺上訓練深度推理模型遭遇了諸多挑戰,但科大訊飛攜
科大訊飛全國產深度推理模型星火X1實現升級
3月3日,記者從科大訊飛獲悉,其自主研發的全國產深度推理大模型“星火X1”完成全面升級,并在醫療、教育等領域推出系列創新應用。科大訊飛表示,此次升級“充分證明基于國產算力訓練的全棧自主可控大模型具備登頂業界最高水平的強大實力和持續創新的巨大潛力”。 在升級后的星火X1加持下,科大訊飛旗下訊飛曉
我國科學家提出高效推理策略-可避免大模型“過度思考”
隨著人工智能大模型的不斷發展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學院自動化研究所獲悉,該所聯合鵬城實驗室提出了一種高效推理策略AutoThink,可讓大模型實現自主切換思考模式,避免“過度思考”。 “當前,越來越多的大模型開始具備‘深度思考能
7所師范院校已部署上海師大教育大模型
截至1月10日,安徽師范大學、內蒙古師范大學等7所師范院校已完成“智·元課堂(MetaClass)”系統的部署,并正式進入試用階段,另有21所境內外高校已簽署或正在簽署試用協議,目前正處于等候部署狀態。MetaClass融合了符合學生認知特點的大語言推理模型、契合學生性格的行為模型以及適用于開放場景
手機就能跑!騰訊推出4款可端側部署的開源模型
8月4日,騰訊混元宣布開源4款小尺寸模型,參數規模分別為0.5B、1.8B、4B、7B,消費級顯卡即可運行,適用于筆記本電腦、手機、智能座艙、智能家居等低功耗端側場景,且支持垂直領域低成本微調。據介紹,新開源的4個模型屬于融合推理模型,具備推理速度快、性價比高的特點,用戶可根據使用場景靈活選擇模型思
智譜發布AutoGLM-2.0,給手機免費裝上AI助理
去年10月,北京智譜華章科技有限公司(以下簡稱智譜)發布了首個手機應用產品——沉思(AutoGLM),開啟人工智能助理(AI Agent)應用新時代。8月18日,智譜再次升級產品,發布AutoGLM 2.0。 AutoGLM 2.0 智譜供圖 “每個人都可以免費使用AutoGLM 2.0。同
類腦信息處理研究取得進展
近期,中國科學院自動化研究所類腦智能研究中心類腦信息處理(BRAVE)研究組,在研究員張兆翔的帶領下,在借鑒生物神經結構、認知機制與學習特性的神經網絡建模與類人學習研究中取得了一系列突破性進展。該研究組在“視聽模態的生成、融合”以及“智能體之間的知識遷移”取得了重大突破,系列成果發表在AAAI
OpenAI最新模型o3展現強大推理能力
12月20日,美國開放人工智能研究中心(OpenAI)介紹了其最新的人工智能(AI)推理模型——o3及其輕量版o3-mini。該公司宣稱,o3具備更先進、近似人類的推理能力,在代碼編寫、數學競賽和掌握人類博士級別的科學知識等方面,均超越了其“前輩”o1。 不過,英國《新科學家》網站在12月22
天氣“哨兵”背后的新型機構,正在用AI驅動科研范式變革
近日,由上海科學智能研究院(下稱上智院)與上海市氣象局等聯合研發的國內首個聚焦超大城市安全的AI氣象預報模型“扶搖”正式亮相。 “扶搖”的空間分辨率達1公里,較傳統模式提升3倍,推理速度從10分鐘壓縮至3秒,猶如為城市裝上精準感知天氣脈動的“數字神經”,更好地扮演起短時強降水、雷雨大風等中小尺
《自然》發文盛贊中國開源AI模型DeepSeek
最近,由來自杭州的“深度求索”初創團隊開發的DeepSeek系列AI模型,引發了全球范圍的關注。1月24日,知名學術期刊《自然》也發文關注該模型及相應產品,稱“中國開發的大語言模型DeepSeek-R1以親民價格和開放性挑戰了OpenAI的推理模型GPT-o1的地位,令科學家們感到興奮”。《中國科學
AI技術創新迎來新一輪機遇期
??今年的政府工作報告提出,深化拓展“人工智能+”,促進新一代智能終端和智能體加快推廣,推動重點行業領域人工智能商業化規模化應用,培育智能原生新業態新模式。專家表示,隨著國內AI技術的不斷升級和落地,中國AI技術創新正迎來新一輪機遇期。??政策力助AI技術規模化落地??工業和信息化部部長李樂成在兩會
“具身智能已成為人工智能的下一個浪潮”
“具身智能旨在發展基于數據驅動的軟硬件結合智能體,以不同形態的機器人在真實物理環境下執行任務為主要方式,來實現人工智能的進化,具備自感知、自認知、自決策、自執行、自學習等智能特征。”2024松山湖科學會議執行主席、中國工程院外籍院士張建偉表示,具身智能已成為人工智能的下一個浪潮。5月25日至26日,
推動生成式人工智能賦能產業發展
當前,我國生成式人工智能產業發展迅速,相關企業數量已經超過4500家。然而,生成式人工智能與實體經濟融合的深度和廣度仍有待提升,其巨大潛力尚未充分釋放。究其原因,一方面在于生成式人工智能技術本身仍處于快速發展期,成熟度有待提高;另一方面,不同產業因其自身特性和發展階段的差異,對生成式人工智能技術
TPU將成深度學習的未來?(二)
能夠進行數據推理的第二代TPU第一代的TPU只能用于深度學習的第一階段,而新版則能讓神經網絡對數據做出推論。谷歌大腦研究團隊主管Jeff Dean表示:“我預計我們將更多的使用這些TPU來進行人工智能培訓,讓我們的實驗周期變得更加快速。”“在設計第一代TPU產品的時候,我們已經建立了一個相對
可解釋、可通用的下一代人工智能方法重大研究計劃2025年度項目指南
可解釋、可通用的下一代人工智能方法重大研究計劃2025年度項目指南 可解釋、可通用的下一代人工智能方法重大研究計劃面向人工智能發展國家重大戰略需求,以人工智能的基礎科學問題為核心,發展人工智能新方法體系,促進我國人工智能基礎研究和人才培養,支撐我國在新一輪國際科技競爭中的主導地位。 一、科學目標
2025國際十大科技新聞解讀
2025年,人類在探索未知的征程中留下了堅實的足跡。從“深度求索”用算法點亮AI效率革命,到谷歌量子計算首次實現可驗證的算力超越;從魯賓天文臺以巨眸凝視宇宙起源,到跨物種腦圖譜揭開神經發育的奧秘……科技的力量既指向星辰大海,也照進生命精微深處。 在本報評選的十大國際科技新聞展示的圖景中,有深沉
啟動!河南省2025年人工智能產業及賦能新型工業化創新任務揭榜掛帥
(二)電子信息20.芯片研發智能工具揭榜任務:面向高可靠、高質量、高效率的芯片研發設計需求,研發基于人工智能的芯片設計或仿真驗證工具,實現芯片智能化設計分析、仿真優化等功能,通過智能算法提升芯片性能、優化布局布線、加速電路仿真和功能驗證等,提高芯片研發效率。預期目標:到2027年,智能工具在不少于2
《麻省理工科技評論》35位中國科技青年入選英雄榜!
《麻省理工科技評論》于 2016 年正式落地中國,次年,“35 歲以下科技創新 35 人” (Innovators Under 35)中國榜單正式發布!四年成長、四屆榜單,我們持續關注和發掘中國科技發展中不斷崛起的新興力量。從實驗室里最新的技術研發成果,到各前沿領域的科技創業者們所取得的里程碑式