亚洲成av人片在www色猫咪_精品剧情在线观看_国产欧美一区二区在线_欧美一卡2卡3卡4卡

首頁 > 財經 > 正文

極致性價比!華為云柔性智算FlexNPU讓算力不再“摸魚”

2026-03-21 20:23:19來源:財訊網

3月20日,華為云中小企業AI解決方案發布會上推出了一項算力黑科技——柔智算操作系統FlexNPU,將Token消耗“吞金獸”有效控制在企業預算范圍內,打造面向Agentic時代的極致Token價比,為企業級智能體的普及突破算力瓶頸。

華為云中國區銷售伙伴發展部部長、華為云中國區Marketing與解決方案銷售部部長郭婷在致辭中表示,2026年華為云將構建AI時代更加肥沃的“黑土地”,讓算力服務更柔、更適配中小企業的輕量化需求,實現從“調度靠拍板”到“成本算到精”的轉變,解決“用不起、用不好”算力的核心難題。

圖片1.png

(華為云中國區銷售伙伴發展部部長、華為云中國區Marketing與解決方案銷售部部長郭婷)

企業AI應用現狀:一半是海水,一半是火焰

當下,“養龍蝦”成為全民熱點話題,為千行萬業尤其是中小企業提供了建設智能化工作流程的清晰思路。會上,華為云SMB解決方案與持續運營部部長劉杰用“一半是海水,一半是火焰”生動形容了目前企業智能化轉型的現狀:以OpenClaw為代表的先進生產力工具層出不窮,但AI實際應用往往面臨著成本高山、技術壁壘、場景錯位等挑戰。

圖片2.png

(華為云SMB解決方案與持續運營部部長劉杰)

對此,華為云發布中小企業AI解決方案,涵蓋AI基礎設施層、模型服務層、智能體層、智能體應用層,幫助企業打造能對接ERP、能調用API、能閉環業務流程的“數字員工”。目前,華為云已深入2600多家企業、30多個行業,解決500多個AI場景化問題,成為企業AI創新路上的可靠伙伴。

劉杰介紹,在AI基礎設施層,華為云提供昇騰多代系產品,以及自研的AI Infra OS,尤其是FlexNPU柔智算技術,一方面滿足中小企業小模型訓練場景,另一方面通過彈調度能夠大幅提升資源利用率;在模型服務層,華為云支持業界主流開源模型,讓企業既能根據業務需求靈活選擇,也能結合自有數據低成本調專屬模型;在智能體層,華為云提供易用高效的Agent開發環境,助力開發者和中小企業面向行業結合場景打造企業級智能體;在智能體應用層,華為云聯合伙伴深入場景,覆蓋洞察分析、營銷運營、協同辦公、開發運維、內容制作等高頻需求。

劉杰還表示,華為云致力于提供AI解決方案,做好基礎設施和底座,伙伴則提供AI行業解決方案、AI行業場景應用、AI專業服務交付,實現深度共創。會上,華為云發布“加速智能化 企業快成長行動2026”,為中小企業、開發者提供從品牌、商業、技術等全方位的支持,共贏AI市場,共同加速企業智能升級。

打造算力“金箍棒”,大幅降低算力成本

“我們的推理池均利用率竟然不足30%,我們花費重金建設、動輒數萬、數十萬卡的AI硬件算力池,竟有超過一半以上的算力在‘摸魚,吃空餉’。”華為云首席架構師、華為公司Fellow顧炯炯在現場拋出了一組驚人數據。他指出,Agent時代企業普遍面臨算力痛點:Agent自主規劃、多輪迭代、長上下文導致Token消耗量呈指數級增長,如何有效降低Token成本,成為最核心和迫切的挑戰。

為此,華為云發布了黑科技——柔智算FlexNPU,通過構筑強大而靈活的AI Infra層算力調度技術,大幅提升推理池的有效算力利用率,從而以相同AI硬件算力投入,提供更大的Token吞吐輸出。

圖片3.png

(華為云首席架構師、華為公司Fellow顧炯炯)

對于柔智算FlexNPU,顧炯炯以可大可小、變化隨心的“如意金箍棒”生動形容,表示FlexNPU賦予NPU/GPU算力“柔或液態化”供給與伸縮的能力,可依據任意業務需求動態變化隨需而動,如同金箍棒一般“可大可小、變化隨心”,通過最大化AI算力投入的利用率,最終實現Token價比的最優化。

具體而言,柔智算FlexNPU具備極致共享、極致彈和極致高可用3大屬

大模型推理方面,FlexNPU通過引入基于柔算力的PD動態混部、在離線推理混部等創新技術,完美解決了傳統PD分離架構下Prefill和Decode集群不均衡的AI Core與顯存利用率,以及推理業務潮汐變化規律所導致的大量AI算力空轉浪費難題,將帶來至少40%的Token價比提升空間

小模型推理方面,FlexNPU通過實現最小粒度達1% NPU卡及128MB顯存的顆粒度的AI Core時分復用,以及顯存空分復用,為小模型提供真正完美匹配其算力訴求、量體裁衣的虛擬NPU資源,將小模型的均算力成本降低2-3倍以上;

推理高可用保障方面,FlexNPU通過軟硬解耦及Token級KV Cache的實時快照,使得上層推理框架不再需要感知底層的硬件故障,即可實現故障秒級快速恢復及斷點續推,大大減少了Agent推理會話重計算開銷,提升了用戶的推理體驗

顧炯炯最后結到,FlexNPU的核心價值體現在:無需再為大模型推理的閑置算力,以及小模型推理的獨占算力浪費買單,更不再需要為昂貴的故障重算買單,真正實現了AI算力分配供給從“資源模式”到“效率模式”的范式轉變,“讓每分AI算力投入迸發最大價值,讓智能體的海量Token人人消費得起。”

深入千行萬業,做好伙伴AI創新的“黑土地”

華為云領先的智能化基礎設施,正在成為千行萬業伙伴進行技術創新、產品研發和商業拓展的重要支撐。發布會現場,華為云伙伴代表分享了多個真實案例。

天寬科技有限公司CTO龔徐建介紹,天寬科技基于昇騰算力打造制造業Agent解決方案,可實現智能知識問答、合同智能審核、風險識別等功能,合同審核準確率達90%,審核效率提升3倍,生產數據查詢時間從1小時縮短到2分鐘,將企業人力從繁瑣重復的工作中解放,雙方后續將在市場洞察、能力共建、成單路徑等方面進行拓展合作。

圖片4.png

(天寬科技有限公司CTO龔徐建)

天津宏達瑞信科技有限公司CEO丁照祥則從零售物流行業角度,探討AI落地帶來的巨大價值,表示宏達瑞信基于華為云天籌求解能力,打造AI智能路徑規劃方案,助力商家獲得商品從倉庫到經銷商的運輸最優解,并且可以根據復雜的交通條件靈活配置,排線效率提升60倍以上,減少冗余出車次數20%,物流成本降低5.8%。

圖片5.png

(天津宏達瑞信科技有限公司CEO丁照祥)

人工智能底層技術發展,牽引Al Infra算力基礎設施、開閉源大小模型、Agent使能框架與工具等快速演進,激發更多AI創新。面向未來,華為云將秉持“用AI解行業難題”的理念,在應用層、模型層、算力層耕耘AI算力黑土地,攜手伙伴共進共贏,抓住AI時代的機遇。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

關鍵詞: 極致 性價比 華為 柔性 智算 FlexNPU 算力 不再 摸魚

責任編輯:孫知兵

免責聲明:本文僅代表作者個人觀點,與太平洋財富網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯系我們!

關于我們 - 聯系方式 - 版權聲明 - 招聘信息 - 友鏈交換 - 網站統計
 

太平洋財富主辦 版權所有:太平洋財富網

?中國互聯網違法和不良信息舉報中心中國互聯網違法和不良信息舉報中心

Copyright© 2012-2020 太平洋財富網(www.avav001.com) All rights reserved.

未經過本站允許 請勿將本站內容傳播或復制 業務QQ:302 369 7155

 

主站蜘蛛池模板: 久久久这里只有精品视频| 日韩在线精品视频| 国产欧美日韩精品在线观看| 久久久久成人网| 亚洲国产日韩欧美| 97成人在线免费视频| 日韩精品视频久久| 亚洲精品在线免费看| 久久6免费高清热精品| 久久亚洲高清| 日本欧美一二三区V| 一区二区在线高清视频| 国产a∨精品一区二区三区不卡 | 一区二区三区在线视频看| 国产乱子夫妻xx黑人xyx真爽| 日韩中文在线不卡| 亚洲一区精品电影| 国产一区二区在线视频播放| 久久精品国产成人| 久久国产精彩视频| 日韩中文字幕在线| 日韩欧美一区二区在线观看| 国产精品手机播放| 一区二区欧美日韩| 三级三级久久三级久久18| 韩国福利视频一区| 欧美日韩精品不卡| 久久久久国产精品视频| 久久久久久欧美| 国产在线视频不卡| 国产精品久久久久久久久久久久 | 岛国一区二区三区高清视频| 日本一区高清不卡| 欧美日韩精品不卡| 久久的精品视频| 国产精品视频免费在线观看| 国产精品久久久久久av| 色综合天天综合网国产成人网| 日韩欧美一级在线| 久久久中精品2020中文| 国产欧美欧洲|