亚洲成av人片在www色猫咪_精品剧情在线观看_国产欧美一区二区在线_欧美一卡2卡3卡4卡

首頁 > 財經 > 正文

英偉達200億押錯了?LPU只是過渡,3D-CIM??才是終局

2026-04-29 17:36:29來源:太陽信息網

這兩年消費電子圈,沒點AI功能都不好意思開發布會。IDC最新Q1數據顯示,全球AI手機出貨占比已破45%,同比翻了兩倍多,AI PC年底滲透率更是要沖60%。但剝開營銷話術,真實的用戶體驗完全是冰火兩重天。

你以為手機上的“端側AI”是真本地跑大模型?十臺里八臺都是把你的提問傳到云端算完再發回來,但是你的隱私就得全靠廠商“良心”,更躲不開未來的Token付費——現在免費是廠商燒錢搶市場,等野蠻期過去,一個月AI對話花的錢比話費還貴,是板上釘釘的事。

號稱“真本地AI”的AI PC更尷尬。我同事剛買的新款聯想AI PC,沖著長續航辦公買的,結果開會用電池半天就沒電,最后查到是后臺AI Agent偷偷跑推理吃功耗,一關功能續航直接翻倍。現在能本地跑7B大模型的AI PC,一開AI功能功耗就拉滿,所謂的移動生產力,最后還得插著電源用。

一邊是云端的隱私焦慮和付費壓力,一邊是本地的功耗噩夢和續航崩盤,端側AI始終卡在“魚和熊掌不能兼得”的死局里,端邊云全場景的AI推理,都困在“高性能+低功耗+低成本”的不可能三角里。就在全行業找答案的時候,英偉達甩出200億美元全資收購Groq,一夜之間,全行業都在喊:GPU時代過去了,LPU才是AI推理的未來。

但LPU真的是終局嗎?或者說,有沒有一種技術,比LPU走得更徹底,能從根上破了這個不可能三角?

1. 英偉達200億押注的LPU,到底解決了什么?又沒解決什么?

先給大家打個最通俗的比方:大模型推理就像開餐館炒菜,傳統馮?諾依曼架構里,計算單元是灶臺,存儲單元是10公里外的食材倉庫。炒一道菜,80%的時間和油錢都花在了來回跑腿上,灶臺真正開火的時間連20%都不到——這就是GPU做推理最大的病根,天生適合批量炒菜的訓練場景,面對一個字一個字蹦的串行推理,完全有勁使不出,還得為跑腿付出巨大的功耗和延遲代價。

Groq的LPU,就是把跑腿的問題優化到了極致。它靠超大片上SRAM把倉庫搬到了廚房隔壁,用確定性數據流把食材運輸路線焊成了專用高鐵,再靠靜態調度把炒菜時序提前排得明明白白,最終實現了比頂級GPU快幾十倍的推理速度,功耗卻只有幾分之一,難怪英偉達愿意花200億買單。

但很遺憾,LPU終究沒跳出馮?諾依曼架構的框:倉庫還是倉庫,廚房還是廚房,計算和存儲還是分開的,只是跑腿的路變短了而已。面對十幾B、幾十B的大模型,片上SRAM容量終究有限,大部分參數還是要放外部DRAM里,該跑的長途一趟沒少,存儲墻這堵墻,終究還是沒砸開。包括三星的3D DRAM、HBM-PIM,本質也只是在倉庫門口加了個小切配臺,始終沒解決“在倉庫里直接炒菜”的核心問題。

2. 顛覆性的三維存算一體3D-CIM??架構一家中國公司給出的答案

面對這個死局,杭州微納核芯給出了不一樣的答案:三維存算一體3D-CIM??。

如果說LPU是把倉庫搬到了廚房隔壁,那3D-CIM??就是直接把灶臺建在了倉庫的每一層貨架旁,伸手拿到食材轉身就能炒,徹底把“數據搬運”這個動作從根上抹掉了。技術層面,它不是簡單把存儲和計算芯片摞在一起,而是通過三維鍵合技術,把SRAM存算一體計算內核和DRAM存儲單元做了垂直堆疊融合,真正在存儲器里完成AI計算,還能靠超大容量DRAM裝下大模型的海量參數。

很多人問,這么厲害的技術,為什么英偉達、三星不搶著做?因為它要過三道地獄級的坎:架構設計要把計算和存儲從根上揉在一起,沒有任何成熟經驗可參考;三維鍵合是半導體頂尖工藝,納米級對準稍有不慎,一次流片就燒掉幾千萬;非馮?諾依曼架構的生態適配,更是難住了全球無數廠商。

也正因如此,3D-CIM??長期停留在實驗室概念里,而微納核芯的團隊,早在2018年就一頭扎進了這條無人區。那時候ChatGPT還沒影,大模型還沒火,全行業都在盯著GPU和先進制程,沒人覺得存算一體能成。這支從北大信息技術高等研究院走出來的團隊,一扎就是7年,連續6年在芯片設計“奧林匹克”ISSCC上發表十余項破世界紀錄的成果,還拿下了中國企業首個ISSCC最佳技術論文獎,2023年正式落地了全球首創的3D-CIM??架構。。

3. 三維存算一體3D-CIM??)的核心是什么為什么能成為大模型AI推理的終極方案?

全球巨頭都沒走通的路,微納核芯憑什么做成了?答案很簡單:他們不是單點技術突破,而是把從架構到落地的全鏈條徹底走通了,靠三根核心支柱,破解了行業的不可能三角。

第一根支柱,是SRAM存算一體核心架構,從根上破解了算力密度與能效瓶頸。直接在存儲單元里完成計算,抹掉了數據搬運的功耗開銷,不用依賴3nm、2nm先進制程,在成熟工藝上就能實現遠超傳統架構的能效比,同等算力下芯片面積只有GPU的1/2到1/3,用更便宜的工藝做出了更好的效果。

第二根支柱,是三維鍵合技術,徹底打通了大模型推理的帶寬與容量任督二脈。大模型推理生成階段,最大的瓶頸從來不是算力,而是帶寬。三維堆疊讓單芯片能承載數十GB參數,內核和DRAM的互連帶寬提升數十倍,完美破解了帶寬卡脖子問題,讓大模型端側本地流暢運行從理論變成了現實。

第三根支柱,是基于RISC-V的RV-CIM?異構融合架構,兼顧了AI計算完備性與全棧生態易用性。行業里絕大多數存算一體芯片,都要開發者重新學一套工具鏈,而微納核芯自研的全棧軟件工具鏈,能自動完成主流大模型到芯片指令的映射,開發者不用學任何新東西就能零門檻調用算力,徹底擺脫了對CUDA閉源生態的依賴。也正因這套體系,他們被工信部任命為RISC-V存算一體應用組組長單位,牽頭制定全球首個RV-CIM?行業標準。

7年深耕,他們打通了從指令集到算法適配的全鏈條,布局了120余項核心專利,推出的兩款核心芯片,不到4W功耗就能讓7B大模型跑出150tokens/s的速度,不到2W功耗就能流暢運行3B大模型,完美解決了端側AI的核心痛點,也拿下了國內頭部存儲廠商、終端龍頭的深度合作,獲得了紅杉中國、小米、聯想等頂級機構的投資認可。

結尾:換一條賽道,才能跑在前面

AI大模型的爆發,把全球半導體行業推到了全新的十字路口。摩爾定律逼近物理極限,靠制程堆算力的老路已經走不通,下一代AI芯片的競爭,核心早已變成了架構創新。

英偉達花200億收購Groq,恰恰證明了傳統GPU架構撐不起AI推理的未來,而微納核芯的3D-CIM??,比LPU走得更遠、更徹底,是更接近終局的解決方案。

過去幾十年,我們一直在海外巨頭的體系里跟跑,而在存算一體這條新賽道上,中國企業已經跑在了前面。3D-CIM??這條路才剛剛開始,但可以確定的是,端側AI的普惠時代,一定會因為這項技術提前到來,而在這場后摩爾時代的算力革命里,一定會有中國公司,站在全球舞臺的最中央。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

關鍵詞:

責任編輯:孫知兵

免責聲明:本文僅代表作者個人觀點,與太平洋財富網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯系我們!

關于我們 - 聯系方式 - 版權聲明 - 招聘信息 - 友鏈交換 - 網站統計
 

太平洋財富主辦 版權所有:太平洋財富網

?中國互聯網違法和不良信息舉報中心中國互聯網違法和不良信息舉報中心

Copyright© 2012-2020 太平洋財富網(www.avav001.com) All rights reserved.

未經過本站允許 請勿將本站內容傳播或復制 業務QQ:302 369 7155

 

主站蜘蛛池模板: 亚洲综合日韩中文字幕v在线| 国产精品网红直播| 欧美日产一区二区三区在线观看| 日韩视频免费在线| 国产精品美女av| 久久精品99无色码中文字幕 | 国产亚洲精品美女久久久m| 日本不卡一区二区三区四区| 福利视频久久| 久久久久久国产免费| 欧美一级免费看| 午夜精品免费视频| 尤物一区二区三区| 午夜精品一区二区三区在线观看| 久久99导航| 国产中文字幕免费观看| 欧美一级免费看| 97久久精品视频| 国产精品露脸av在线| 国产一区视频在线播放| 久久久91精品国产| 欧美精品一区在线| 久久亚洲国产成人| 久久躁狠狠躁夜夜爽| 秋霞无码一区二区| 久久资源免费视频| 精品无码av无码免费专区| 久久精品久久久久| 国产在线视频91| 国产极品精品在线观看| 超碰97国产在线| 久久国产色av| 国产日韩中文字幕| 69精品小视频| 中文字幕一区综合| 日本免费高清一区| 久久在线精品视频| 国产精品欧美日韩一区二区| 精品一区二区不卡| 国产mv免费观看入口亚洲| 国产精品欧美在线|