英偉達200億押錯了?LPU只是過渡,3D-CIM??才是終局
這兩年消費電子圈,沒點AI功能都不好意思開發布會。IDC最新Q1數據顯示,全球AI手機出貨占比已破45%,同比翻了兩倍多,AI PC年底滲透率更是要沖60%。但剝開營銷話術,真實的用戶體驗完全是冰火兩重天。
你以為手機上的“端側AI”是真本地跑大模型?十臺里八臺都是把你的提問傳到云端算完再發回來,但是你的隱私就得全靠廠商“良心”,更躲不開未來的Token付費——現在免費是廠商燒錢搶市場,等野蠻期過去,一個月AI對話花的錢比話費還貴,是板上釘釘的事。
號稱“真本地AI”的AI PC更尷尬。我同事剛買的新款聯想AI PC,沖著長續航辦公買的,結果開會用電池半天就沒電,最后查到是后臺AI Agent偷偷跑推理吃功耗,一關功能續航直接翻倍。現在能本地跑7B大模型的AI PC,一開AI功能功耗就拉滿,所謂的移動生產力,最后還得插著電源用。
一邊是云端的隱私焦慮和付費壓力,一邊是本地的功耗噩夢和續航崩盤,端側AI始終卡在“魚和熊掌不能兼得”的死局里,端邊云全場景的AI推理,都困在“高性能+低功耗+低成本”的不可能三角里。就在全行業找答案的時候,英偉達甩出200億美元全資收購Groq,一夜之間,全行業都在喊:GPU時代過去了,LPU才是AI推理的未來。
但LPU真的是終局嗎?或者說,有沒有一種技術,比LPU走得更徹底,能從根上破了這個不可能三角?
1. 英偉達200億押注的LPU,到底解決了什么?又沒解決什么?
先給大家打個最通俗的比方:大模型推理就像開餐館炒菜,傳統馮?諾依曼架構里,計算單元是灶臺,存儲單元是10公里外的食材倉庫。炒一道菜,80%的時間和油錢都花在了來回跑腿上,灶臺真正開火的時間連20%都不到——這就是GPU做推理最大的病根,天生適合批量炒菜的訓練場景,面對一個字一個字蹦的串行推理,完全有勁使不出,還得為跑腿付出巨大的功耗和延遲代價。
Groq的LPU,就是把跑腿的問題優化到了極致。它靠超大片上SRAM把倉庫搬到了廚房隔壁,用確定性數據流把食材運輸路線焊成了專用高鐵,再靠靜態調度把炒菜時序提前排得明明白白,最終實現了比頂級GPU快幾十倍的推理速度,功耗卻只有幾分之一,難怪英偉達愿意花200億買單。
但很遺憾,LPU終究沒跳出馮?諾依曼架構的框:倉庫還是倉庫,廚房還是廚房,計算和存儲還是分開的,只是跑腿的路變短了而已。面對十幾B、幾十B的大模型,片上SRAM容量終究有限,大部分參數還是要放外部DRAM里,該跑的長途一趟沒少,存儲墻這堵墻,終究還是沒砸開。包括三星的3D DRAM、HBM-PIM,本質也只是在倉庫門口加了個小切配臺,始終沒解決“在倉庫里直接炒菜”的核心問題。
2. 顛覆性的三維存算一體(3D-CIM??)架構,一家中國公司給出的答案
面對這個死局,杭州微納核芯給出了不一樣的答案:三維存算一體3D-CIM??。
如果說LPU是把倉庫搬到了廚房隔壁,那3D-CIM??就是直接把灶臺建在了倉庫的每一層貨架旁,伸手拿到食材轉身就能炒,徹底把“數據搬運”這個動作從根上抹掉了。技術層面,它不是簡單把存儲和計算芯片摞在一起,而是通過三維鍵合技術,把SRAM存算一體計算內核和DRAM存儲單元做了垂直堆疊融合,真正在存儲器里完成AI計算,還能靠超大容量DRAM裝下大模型的海量參數。
很多人問,這么厲害的技術,為什么英偉達、三星不搶著做?因為它要過三道地獄級的坎:架構設計要把計算和存儲從根上揉在一起,沒有任何成熟經驗可參考;三維鍵合是半導體頂尖工藝,納米級對準稍有不慎,一次流片就燒掉幾千萬;非馮?諾依曼架構的生態適配,更是難住了全球無數廠商。
也正因如此,3D-CIM??長期停留在實驗室概念里,而微納核芯的團隊,早在2018年就一頭扎進了這條無人區。那時候ChatGPT還沒影,大模型還沒火,全行業都在盯著GPU和先進制程,沒人覺得存算一體能成。這支從北大信息技術高等研究院走出來的團隊,一扎就是7年,連續6年在芯片設計“奧林匹克”ISSCC上發表十余項破世界紀錄的成果,還拿下了中國企業首個ISSCC最佳技術論文獎,2023年正式落地了全球首創的3D-CIM??架構。。
3. 三維存算一體(3D-CIM??)的核心是什么?為什么能成為大模型AI推理的終極方案?
全球巨頭都沒走通的路,微納核芯憑什么做成了?答案很簡單:他們不是單點技術突破,而是把從架構到落地的全鏈條徹底走通了,靠三根核心支柱,破解了行業的不可能三角。
第一根支柱,是SRAM存算一體核心架構,從根上破解了算力密度與能效瓶頸。直接在存儲單元里完成計算,抹掉了數據搬運的功耗開銷,不用依賴3nm、2nm先進制程,在成熟工藝上就能實現遠超傳統架構的能效比,同等算力下芯片面積只有GPU的1/2到1/3,用更便宜的工藝做出了更好的效果。
第二根支柱,是三維鍵合技術,徹底打通了大模型推理的帶寬與容量任督二脈。大模型推理生成階段,最大的瓶頸從來不是算力,而是帶寬。三維堆疊讓單芯片能承載數十GB參數,內核和DRAM的互連帶寬提升數十倍,完美破解了帶寬卡脖子問題,讓大模型端側本地流暢運行從理論變成了現實。
第三根支柱,是基于RISC-V的RV-CIM?異構融合架構,兼顧了AI計算完備性與全棧生態易用性。行業里絕大多數存算一體芯片,都要開發者重新學一套工具鏈,而微納核芯自研的全棧軟件工具鏈,能自動完成主流大模型到芯片指令的映射,開發者不用學任何新東西就能零門檻調用算力,徹底擺脫了對CUDA閉源生態的依賴。也正因這套體系,他們被工信部任命為RISC-V存算一體應用組組長單位,牽頭制定全球首個RV-CIM?行業標準。
7年深耕,他們打通了從指令集到算法適配的全鏈條,布局了120余項核心專利,推出的兩款核心芯片,不到4W功耗就能讓7B大模型跑出150tokens/s的速度,不到2W功耗就能流暢運行3B大模型,完美解決了端側AI的核心痛點,也拿下了國內頭部存儲廠商、終端龍頭的深度合作,獲得了紅杉中國、小米、聯想等頂級機構的投資認可。
結尾:換一條賽道,才能跑在前面
AI大模型的爆發,把全球半導體行業推到了全新的十字路口。摩爾定律逼近物理極限,靠制程堆算力的老路已經走不通,下一代AI芯片的競爭,核心早已變成了架構創新。
英偉達花200億收購Groq,恰恰證明了傳統GPU架構撐不起AI推理的未來,而微納核芯的3D-CIM??,比LPU走得更遠、更徹底,是更接近終局的解決方案。
過去幾十年,我們一直在海外巨頭的體系里跟跑,而在存算一體這條新賽道上,中國企業已經跑在了前面。3D-CIM??這條路才剛剛開始,但可以確定的是,端側AI的普惠時代,一定會因為這項技術提前到來,而在這場后摩爾時代的算力革命里,一定會有中國公司,站在全球舞臺的最中央。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
關鍵詞:
責任編輯:孫知兵
免責聲明:本文僅代表作者個人觀點,與太平洋財富網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯系我們!
- 廣東望京卡牌:以印刷之力,引領2026年卡牌游戲新浪潮2026-04-29
- 英偉達200億押錯了?LPU只是過渡,3D-CIM??才是終局2026-04-29
- 立刻資訊攜手東南基金,共筑南京產融協同投資新生態2026-04-29
- 望京卡牌發布卡牌生產制版指南,規避OEM重印風險2026-04-29
- 廣東望京卡牌發布品牌服務白皮書:讓每一張卡牌,都成為創意的專業呈現2026-04-29
- 哪個平臺能炒倫敦金?盤點五個合規開戶渠道及倫敦金交易費用分析2026-04-29
- 2026十大專業的倫敦金交易平臺排名介紹2026-04-29
- 2026十大知名的倫敦金平臺排名榜單一覽2026-04-29
- 恒小花:如何抓住AI人工智能職業新機遇2026-04-29
- 跨境支付賦能外貿新格局,助力市場多元化發展2026-04-29
- 從Agent到數字人:SentiPulse推出SentiCat探索長期交互路徑2026-04-29
- 汾陽市鄉村e鎮組團亮相杭州食品電商博覽會——晉味優品闖全國市場2026-04-29
- 春聚馬陵 鳶舞花廳——2026年江蘇省風箏邀請賽(新沂站)點燃春天_快資訊2026-04-29
- 每日觀察!智通港股早知道 | 兩部門發文推動人工智能高水平賦能新型工業化 商米科技(06810)暗盤收漲276%2026-04-29
- 東莞莞南皮膚病醫院治療效果好嗎?正規可靠規范行醫效果好2026-04-29
- 衛浴新物種自潔魔方D30:一泡一沖一次凈,開啟智能馬桶自潔新時代2026-04-29
- 第九屆數字中國建設峰會開啟“數智”盛宴2026-04-29
- 武漢地鐵12號線一期開通在即 記者試乘57分鐘跑完2026-04-29
- 天鵝股份(603029.SH)一季度凈利潤740.47萬元,同比增長0.57% 消息2026-04-29
- 唯捷創芯跌13.21%?2022年上市募資26.7億元2026-04-29
- 500MW!三峽集團海拔4000米以上單體規模最大光伏項目實現全容量并網 焦點熱聞2026-04-29
- 黃金交易平臺選金盛貴金屬:2026 新手友好型平臺榜單更新,金盛貴金屬位列適配榜第一2026-04-29
- 從跑腿到指尖:企業車險批改步入提效快車道2026-04-29
- 勤哲Excel服務器:助力網絡數據運營企業,實現高效數字化轉型2026-04-29
- 第九屆玉猴獎揭曉 52TOYS榮獲“年度十佳文旅消費創新獎”2026-04-29
- 喜報丨雷允上集團榮獲2026年全國五一勞動獎狀2026-04-29
- 東方鉭業2026年一季度營收增長41.08%,募投項目加速夯實高端材料優勢2026-04-29
- 跨越山海敘情誼 共赴清涼謀發展 固原市農文旅宣傳推介大會走進深圳2026-04-29
- 世澤拾光引領中國福祉車產業破局2026-04-29
- 玄景AI眼鏡X2050大會:與全球年青人共話模塊化AI眼鏡的更多可能2026-04-29
精彩推薦
- “熊貓專列·錦繡天府號”在蓉首發 精彩看點
- 網易有道云筆記推出“LLM Wiki”技能套件
- 生意社:4月27日河南地區螢石市場行情暫穩|消息
- 自2020/21賽季以來,阿森納首次實現聯賽雙殺紐卡
- 大摩:維持上海醫藥(02607)“增持”評級 目標價降至15.8港元_每日速遞
- 微頭條丨快閃|湖南“引才專列”開往重慶,超多心動offer等你來!
- PriceSeek重點提醒:利華益維遠上調丙酮價格|觀速訊
- 德國DAX指數連續四日收跌 地緣緊張與通脹壓力拖累歐元區經濟
- 隊史首次闖進季后賽!寧波男籃官宣:與NBL場均20+8內線完成簽約-視焦點訊
- 焦點快播:A股午評:創業板指跌1.83%,超4300股下跌,CPO概念股普遍回調
- 廈門金租2025年營收同比增長48% 實現凈利1.64億元 今日快看
- 鎮江市首例主動脈瓣關閉不全 TAVR 手術在市一院成功開展-當前熱訊
- 銀河資本等在鹽城成立股權投資基金 出資額4.5億
- 八億時空:折疊屏手機業務增長對公司業務將有積極促進作用_熱門
- 實時:[快訊]人工智能LOF公布第一季報
閱讀排行
- 廣東望京卡牌:以印刷之力,引領2026年卡牌游戲新浪潮
- 英偉達200億押錯了?LPU只是過渡,3D-CIM??才是終局
- 望京卡牌發布卡牌生產制版指南,規避OEM重印風險
- 廣東望京卡牌發布品牌服務白皮書:讓每一張卡牌,都成為創意的專業呈現
- 跨境支付賦能外貿新格局,助力市場多元化發展
- 從Agent到數字人:SentiPulse推出SentiCat探索長期交互路徑
- 汾陽市鄉村e鎮組團亮相杭州食品電商博覽會——晉味優品闖全國市場
- 每日觀察!智通港股早知道 | 兩部門發文推動人工智能高水平賦能新型工業化 商米科技(06810)暗盤...
- 衛浴新物種自潔魔方D30:一泡一沖一次凈,開啟智能馬桶自潔新時代
- 武漢地鐵12號線一期開通在即 記者試乘57分鐘跑完

中國互聯網違法和不良信息舉報中心