亚洲成av人片在www色猫咪_精品剧情在线观看_国产欧美一区二区在线_欧美一卡2卡3卡4卡

聚焦:剛剛,DeepSeek發(fā)了“終極版”!

2025-09-23 12:00:27來源:智東西

智東西

作者 | 陳駿達


【資料圖】

編輯 | 李水青

DeepSeek又更新了!

智東西9月22日報道,今天晚間,DeepSeek在其官方API平臺發(fā)布了最新升級的DeepSeek-V3.1-Terminus模型(Terminus拉丁語意為終點、界限),并在不久后宣布模型開源。

官方文檔中稱,DeepSeek-V3.1-Terminus在保持模型原有能力的情況下,改進了語言一致性、偶發(fā)異常字符等DeepSeek-V3.1上線后出現(xiàn)的Bug,還進一步優(yōu)化了編程和搜索智能體的表現(xiàn)。

DeepSeek官方在微信公眾號放出了新舊DeepSeek-V3.1的基準測試對比??梢钥吹剑诜茿gent類的基準測試中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1實現(xiàn)了0.2%-36.5%不等的表現(xiàn)提升,不過也有些測試成績出現(xiàn)小幅度下滑。

DeepSeek-V3.1-Terminus在HLE(人類終極測試)上的性能提升最為明顯,這一測試主要考察專家級的高難度知識和模型的多模態(tài)、深度推理等能力。

而在Agent測評中,DeepSeek-V3.1-Terminus網(wǎng)頁瀏覽、簡單問答和多項編程測試中的表現(xiàn)出現(xiàn)小幅提升。

DeepSeek官方App、網(wǎng)頁端、小程序與DeepSeek API模型均已同步更新為DeepSeek-V3.1-Terminus。智東西第一時間調用DeepSeek-V3.1-Terminus的API進行了體驗,嘗試復現(xiàn)此前的多個Bug,并體驗模型的最新性能。

開源地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

一、兩大神秘Bug消失,DeepSeek-V3.1終于不犯糊涂了

今年8月,DeepSeek-V3.1上線后,有用戶反饋在用API調用模型時,會偶爾出現(xiàn)一個嚴重Bug:模型會不受控地隨機輸出“極”、“極”、“extreme”等字樣,嚴重影響日常使用,如果未經(jīng)仔細檢查就使用含有這一Bug的代碼,很可能導致編譯失敗。

▲DeepSeek-V3.1的“極”字Bug(圖源:知乎@Fun10165)

智東西調用了最新的DeepSeek-V3.1-Terminus API,嘗試復現(xiàn)上述問題。網(wǎng)傳能復現(xiàn)這一問題的“高危”提示詞包括要求模型寫Go語言、完成版本號相關任務、處理時間等。

不過,DeepSeek-V3.1-Terminus在測試中并未因上述提示詞而出現(xiàn)Bug,也就是說,這一問題應該已經(jīng)被修復了。

▲DeepSeek-V3-Terminus沒有因“高?!碧崾驹~而產生Bug

也有海外用戶反映,此前的DeepSeek-V3.1存在多語言的問題,尤其是在翻譯小語種時。這位Reddit網(wǎng)友分享,DeepSeek會把中、英、俄三種語言混用,問題文本的比例有時能達到5%。

▲網(wǎng)友分享DeepSeek-V3.1多語言混用問題(圖源:Reddit @Kitano_o)

智東西嘗試著讓DeepSeek-V3-Terminus將這句話翻譯為7種小語種:“人工智能正在改變我們的世界,它帶來了巨大的機遇,也需要我們認真思考其挑戰(zhàn)?!?/p>

DeepSeek-V3-Terminus的回答沒有出現(xiàn)語言混雜問題,看來這一Bug也被修復了。

二、小球彈跳效果驚艷,還能快速交叉搜索信息

除了Bug的修復之外,DeepSeek-V3.1-Terminus還有一大值得關注的地方是其編程和搜索智能體能力的提升。

編程任務上,智東西讓DeepSeek-V3.1-Terminus嘗試了小球彈跳,結果如下。模型輸出的網(wǎng)頁采用了簡約風格,不過,模擬的重力、摩擦力效果十分逼真。要打造這樣的效果,模型不僅需要有很強的編程能力,也需擁有對物理學的理解能力。

這一模型打造的動畫效果也不錯,軌跡和碰撞都比較自然:

在搜索智能體能力方面,我們讓DeepSeek-V3.1-Terminus推薦了幾款適合新手陽臺盆栽的植物。這一測試考察模型能否找出完全符合“陽臺盆栽”、“生長快”、“可生食”、“對兒童安全”所有條件的植物。此外,模型也要交叉驗證信息的可靠性,并進行整合提煉和風險提示。

可以看到,DeepSeek-V3.1-Terminus給出的答案考慮十分周全,經(jīng)人工核查事實無誤,可讀性也不錯。

結語:DeepSeek-V3.1,迎來終極版?

DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁語里是“終點”或“界限”的意思,我們試著讓DeepSeek自己對這一命名給出了解讀。DeepSeek稱,這一命名可能象征著DeepSeek-V3.1是這個系列架構的終極版本,代表了當前技術路徑的成熟和完善。

也有網(wǎng)友認為,Terminus可能意味著模型在編程終端里的表現(xiàn)更好了。不過,正如DeepSeek所言,具體的命名寓意最好還是官方來解釋更為準確。

此前,外網(wǎng)有媒體報道稱,DeepSeek今年年底即將推出Agent模型?;蛟S,DeepSeek的下一次重大更新,已經(jīng)不遠了。

關鍵詞: Agent 能力 語言 DeepSeek Bug 模型 測試 問題 官方 編程 智能體 Bug 提示詞 模型

責任編輯:孫知兵

免責聲明:本文僅代表作者個人觀點,與太平洋財富網(wǎng)無關。其原創(chuàng)性以及文中陳述文字和內容未經(jīng)本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯(lián)系我們!

關于我們 - 聯(lián)系方式 - 版權聲明 - 招聘信息 - 友鏈交換 - 網(wǎng)站統(tǒng)計
 

太平洋財富主辦 版權所有:太平洋財富網(wǎng)

?中國互聯(lián)網(wǎng)違法和不良信息舉報中心中國互聯(lián)網(wǎng)違法和不良信息舉報中心

Copyright© 2012-2020 太平洋財富網(wǎng)(www.avav001.com) All rights reserved.

未經(jīng)過本站允許 請勿將本站內容傳播或復制 業(yè)務QQ:3 31 986 683

 

主站蜘蛛池模板: 美女精品久久久| 91久久久久久久久久| 91精品久久久久久久久久另类| 欧美一区二区三区精品电影| 国产精品国产三级国产专播精品人 | 国产在线观看91精品一区| 亚洲a中文字幕| 岛国视频一区免费观看| 国产精品久久久久久久久久| 日韩欧美在线一区二区| 91精品国产乱码久久久久久蜜臀| 国产一区视频免费观看| 激情五月六月婷婷| 久久久精品视频在线观看| 欧洲精品在线视频| 日日夜夜精品网站| 亚洲尤物视频网| 午夜精品一区二区三区视频免费看 | 色播五月综合| 日本一区免费在线观看| 日本一区高清不卡| 日韩av高清| 日韩欧美一级在线| 日韩av高清不卡| 欧美日韩精品免费在线观看视频| 日本精品va在线观看| 欧美日韩精品久久久免费观看| 欧美极品欧美精品欧美视频| 久久亚洲私人国产精品va| 免费观看国产精品视频| 欧美国产激情视频| 久久av在线播放| 国内精品久久国产| 国产精品无av码在线观看| 国产精品久久久久久久久久久久 | 国产精品自产拍在线观看| 日韩av一区二区三区在线| 欧美在线日韩在线| 久久99久久99精品免观看粉嫩 | 亚洲免费视频一区| 日韩精品成人一区二区在线观看|