小型語(yǔ)言模型(SLM)的設(shè)計(jì)工作主要集中于減少參數(shù)數(shù)量以實(shí)現(xiàn)參數(shù)最優(yōu)的 SLM,但參數(shù)效率并不一定能轉(zhuǎn)化為實(shí)際設(shè)備上的相應(yīng)加速。 英偉達(dá)近日發(fā)表的論文解決了這一難題。該論文旨在識(shí)別 SLM 實(shí)際設(shè)備延
人工智能 | 2025-12-04 18:02 評(píng)論剛剛,DeepSeek 一口氣推出兩個(gè)新模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 前者專注平衡推理能力與模型長(zhǎng)度,可達(dá)到GPT-5 級(jí)別的性能,適用于日常問
人工智能 | 2025-12-04 17:55 評(píng)論智能假肢如何通過傳感器和AI,讓殘疾人實(shí)現(xiàn)“隨心而動(dòng)”?這篇技術(shù)解析將告訴你答案
醫(yī)療科技 | 2025-12-04 10:03 評(píng)論剛剛,DeepSeek 開源了全新的數(shù)學(xué)模型 DeepSeekMath-V2,專注可自驗(yàn)證的數(shù)學(xué)推理框架。 DeepSeek-Math-V2 在 IMO-ProofBench 和 IMO 2025(6
人工智能 | 2025-12-01 17:40 評(píng)論近日,月之暗面和清華大學(xué)聯(lián)合發(fā)表了一篇論文,詳細(xì)介紹了一個(gè)強(qiáng)化學(xué)習(xí)訓(xùn)練系統(tǒng) Seer——在不改變核心訓(xùn)練算法的前提下,大幅度提升大模型的強(qiáng)化學(xué)習(xí)訓(xùn)練速度。 在生產(chǎn)級(jí) RL 工作負(fù)載上的評(píng)估表明,See
人工智能 | 2025-12-01 17:31 評(píng)論阿里最新開源的項(xiàng)目 ROCK,瞄準(zhǔn)了智能體訓(xùn)練中最棘手的問題——缺乏可擴(kuò)展、可標(biāo)準(zhǔn)化的真實(shí)交互環(huán)境。 過去,開發(fā)者在訓(xùn)練復(fù)雜任務(wù)時(shí)常常需要手工搭建環(huán)境:配置依賴、調(diào)試狀態(tài)、處理兼容性等,一系列工程工作
人工智能 | 2025-12-01 17:29 評(píng)論塔拉格蘭卷積猜想,困擾數(shù)學(xué)界 30 多年的問題,在近日被一名 90 后的華人副教授攻破。 1989 年,法國(guó)數(shù)學(xué)家 Michel Talagrand 提出了一個(gè)關(guān)于卷積應(yīng)用于布爾超立方體上的 L 函數(shù)
人工智能 | 2025-12-01 17:26 評(píng)論今日,Claude Opus 4.5 正式發(fā)布。 它在編碼、智能 Agent 和計(jì)算機(jī)應(yīng)用方面表現(xiàn)優(yōu)秀;在深度研究、處理幻燈片和電子表格等日常任務(wù)方面也取得了不錯(cuò)的成績(jī)。 目前,Claude Opus
人工智能 | 2025-12-01 17:21 評(píng)論AI Agent 在未來能夠使模型與成百上千種工具協(xié)同工作。例如,集成 Git 操作、文件處理、包管理器、測(cè)試框架和部署管道的 IDE 助手;以及能夠同時(shí)連接 Slack、GitHub、Google
人工智能 | 2025-12-01 17:20 評(píng)論幾個(gè)月前,Google 發(fā)布了 Nano Banana ,一款基于 Gemini 2.5 閃存圖像處理軟件的產(chǎn)品。 還未等大家反應(yīng)過來,Google 又迅速推出 Nano Banana Pro(Gem
人工智能 | 2025-12-01 17:15 評(píng)論昨日,OpenAI 推出全新的前沿智能編碼模型?GPT-5.1-Codex-Max。 GPT-5.1-Codex-Max 基于 GPT 基礎(chǔ)推理模型的升級(jí)版構(gòu)建而成,該模型已在軟件工程、數(shù)學(xué)、研究等領(lǐng)
人工智能 | 2025-12-01 17:09 評(píng)論就在剛剛,Meta MSL 實(shí)驗(yàn)室發(fā)布三維重建模型 SAM 3D。 “分割一切”現(xiàn)在可以直接生成 3D 模型了。 前不久,Meta 發(fā)表 SAM 3 論文,能夠檢測(cè)、分割和跟蹤圖像和視頻中的對(duì)象,還支
人工智能 | 2025-12-01 17:07 評(píng)論今天,谷歌開發(fā)者關(guān)系負(fù)責(zé)人、Google AI Studio 負(fù)責(zé)人在社交媒體上發(fā)布了一條僅含“Gemini”一詞的推文,引爆話題。 就在昨日,馬斯克剛剛宣布 Grok 4.1 的發(fā)布。Gemini
人工智能 | 2025-12-01 17:03 評(píng)論當(dāng)今的去噪擴(kuò)散模型并非傳統(tǒng)意義上的“去噪”。 它們并不直接預(yù)測(cè)干凈的圖像。相反,神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的是噪聲或帶噪聲的量。 ResNet 之父、麻省理工副教授何愷明新論文發(fā)現(xiàn)了這一問題。 預(yù)測(cè)干凈數(shù)據(jù)和預(yù)測(cè)帶
人工智能 | 2025-12-01 17:01 評(píng)論剛剛,馬斯克在社交平臺(tái)上發(fā)布了 Grok 4.1 新鮮出爐的消息!澳銜(huì)看到速度和質(zhì)量上的提升! 官方表示,Grok 4.1 在創(chuàng)意、情感和協(xié)作互動(dòng)方面表現(xiàn)出色。能夠更敏銳地感知細(xì)微的意圖,更易于溝
人工智能 | 2025-12-01 16:54 評(píng)論今日,美國(guó)具身智能創(chuàng)業(yè)公司 Physical Intelligence(簡(jiǎn)稱 PI )發(fā)布了最新機(jī)器人基礎(chǔ)模型?π*0.6。 官方稱,過去一年,機(jī)器人成功完成一半任務(wù)并不難,但要讓它每次都成功卻非常困
人工智能 | 2025-12-01 16:52 評(píng)論近日,特斯拉在 ICCV 的會(huì)議中就分享了其當(dāng)下面臨的挑戰(zhàn) ——監(jiān)督稀疏。 監(jiān)督信號(hào)是低維、稀疏的駕駛動(dòng)作,和 VLA 高維、稠密的視覺信息流不符。即便使用海量數(shù)據(jù)也無法釋放 VLA 模型的巨大潛力。
人工智能 | 2025-12-01 16:50 評(píng)論今年的 International Conference on Learning Representations(ICLR)2026 審稿階段掀起波瀾。一份流出的數(shù)據(jù)分析顯示,大約?21%?的審稿意見
人工智能 | 2025-12-01 16:49 評(píng)論聯(lián)合嵌入預(yù)測(cè)架構(gòu)(JEPA)由于缺乏實(shí)踐指導(dǎo)和理論,研發(fā)工作大多是臨時(shí)性的。 Facebook 首席人工智能科學(xué)家、圖靈獎(jiǎng)得主 LeCun 提出了一套全面的 JEPA 理論——一個(gè)精簡(jiǎn)、可擴(kuò)展且理論基
人工智能 | 2025-12-01 16:44 評(píng)論11月15日至16日,2025求是緣半導(dǎo)體產(chǎn)業(yè)峰會(huì)暨求是緣半導(dǎo)體聯(lián)盟十周年慶典在上海市漕河涇會(huì)議中心隆重舉行。戰(zhàn)略深耕半導(dǎo)體領(lǐng)域的智能制造工業(yè)軟件與工業(yè)AI解決方案領(lǐng)軍企業(yè)格創(chuàng)東智受邀參會(huì),系統(tǒng)展示了
電子工程 | 2025-11-24 18:02 評(píng)論