日本三级网站在线观看_97视频免费在线_最近中文字幕精彩视频_亚洲天天做夜夜做天天欢人人

大量靚號轉(zhuǎn)讓、求購信息,盡在集號吧!
  • 搜號碼
當前位置:新聞頻道>綜合信息>行業(yè)新聞

硅基流動大模型走通國產(chǎn)芯片部署DeepSeek模型

集號吧丨發(fā)表時間:2025-02-18丨訪問量:227
[摘要]硅基流動大模型云服務(wù)平臺SiliconCloud首 發(fā)上線了基于昇騰算力的滿血版DeepSeek R1/V3模型,率先走通了在國產(chǎn)芯片部署DeepSeek模型的

2月14日,大模型云服務(wù)商硅基流動(SilliconFlow)宣布聯(lián)合北京昇騰人工智能計算中.心,全面支持基于昇騰算力的DeepSeek系列模型的私有化集群部署。

DeepSeek模型

此前,硅基流動大模型云服務(wù)平臺SiliconCloud首 發(fā)上線了基于昇騰算力的滿血版DeepSeek R1/V3模型,率先走通了在國產(chǎn)芯片部署DeepSeek模型的路徑。

時間倒回至春節(jié)假期的2月1日,華為云宣布聯(lián)合硅基流動推出基于昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)。彼時,華為云、硅基流動的官方公眾號相隔一分鐘官宣,標題均突出“首 發(fā)”二字,內(nèi)文用“連日攻堅”概括了團隊的努力。

硅基流動創(chuàng)始人袁進輝曾總結(jié),硅基流動的技術(shù)核心是提供一個推理引擎,主要向企業(yè)提供高性能LLM推理和訓練解決方案,幫助企業(yè)高效地部署AI應(yīng)用。DeepSeek V3是震驚全球科技圈的開源、推理大模型,硅基流動與之適配提供服務(wù)尤其對口。

在DeepSeek V3大模型發(fā)布前,DeepSeek創(chuàng)始人梁文鋒就曾問袁進輝,硅基流動要不要部署?彼時,梁文鋒甚至給出了建議:zui少20臺H800(英偉達GPU芯片),80臺zui好,10臺也可以,就是有點慢。

袁進輝算了一筆賬:一個月80臺服務(wù)器的凈花費就得五六百萬,“還不一定能用滿,風險太大了”。他沒有下注。

看到DeepSeek創(chuàng)造一個又一個奇跡,袁進輝焦急且苦于沒有充沛的算力資源,直到一位同事突發(fā)奇想,“國產(chǎn)卡多,用國產(chǎn)卡吧”。

硅基流動向華為云主動提出了合作想法。

華為采用自研的達芬奇架構(gòu),開發(fā)了昇騰910和昇騰310兩款AI處理器芯片,而華為云又上線了昇騰AI云服務(wù),至今約一年半時間,面向企業(yè)提供一鍵接入獲取AI算力的服務(wù)。

華為昇騰AI云服務(wù)有一個“百模千態(tài)”專區(qū),其中除了華為自家的盤古大模型外,還能適配業(yè)界主流的上百個開源大模型,從而支撐企業(yè)和開發(fā)者更快速地創(chuàng)建自己的大模型應(yīng)用。

開源的DeepSeek何其火爆,接入想法讓硅基流動和華為云一拍即合。華為云負責調(diào)配算力資源,硅基流動負責讓模型在GPU上可以運行并具備問答能力,同時確保模型運行穩(wěn)定、不損失精度,且運行速度盡可能快。

2025年春節(jié),硅基流動團隊和華為云各業(yè)務(wù)團隊幾乎無休,DeepSeek團隊也在全程提供了很多經(jīng)驗。

2月1日凌晨1點多,距離官宣基于華為昇騰的DeepSeek R1/V3推理服務(wù)上線還有10個多小時,硅基流動的一位高管發(fā)了一條朋友圈:平臺接入了DeepSeek系列模型,且API服務(wù)價格與DeepSeek官網(wǎng)同價。

2月1日當天,“硅基流動”的微信指數(shù)從過去的幾乎為0環(huán)比飆升了8831.35%。當時,硅基流動是DeepSeek官方之外,第 一個提供基于國產(chǎn)芯片的671B滿血模型MaaS云服務(wù)的平臺。

趁著熱度,硅基流動也發(fā)布了一波招聘計劃,其中開放的視覺生成推理引擎工程師、異構(gòu)硬件適配工程師、交付研發(fā)工程師等全職崗位有15個,還有與生成式AI相關(guān)的算法、平臺前端、平臺后端等方向的實習工程師職位8個。

API服務(wù)競爭暗涌

“要考慮并發(fā),以及后續(xù)并發(fā)是否有限制。”一位與華為云合作接入DeepSeek-R1的AI應(yīng)用廠商負責人稱,這是所有要接入的平臺企業(yè)或者應(yīng)用產(chǎn)品都會考慮的事情,背后的難題主要由華為云方面在解決。

布局DeepSeek API服務(wù),不只是騰訊、阿里、百度等巨頭爭搶的生意,不少模型創(chuàng)新企業(yè)也參與其中。

提供模型云服務(wù)的供應(yīng)商雖多,但上述硅基流動高管看到,已經(jīng)有模型測試相關(guān)人士給用戶提供了一些判斷的依據(jù),比如供應(yīng)商提供的是否為原版的671B參數(shù)規(guī)模?供應(yīng)商提供服務(wù)的上下文窗口(語言模型在進行預測或生成文本時,所考慮的前一個詞元即Token或文本片段的大小范圍)大小是否為正常的64K+?zui后還有AI輔助編程請求的通過情況,供應(yīng)商對AI模型技術(shù)的應(yīng)用是否受TPM(設(shè)備管理,一般在10W臺以上)的限制。

陳天楚在浙江大學ARClab負責大模型相關(guān)研究,他看到,接入DeepSeek的各個云廠商,面向的客戶、官宣的成本控制和定價計劃有區(qū)別。例如,有的廠商提供滿血版,有的則是量化壓縮版,還有提供蒸餾后的小模型。

陳天楚認為,除了提供標準化的模型API服務(wù)外,云廠商間的較量主要集中在能否提供個性化服務(wù)。像硅基流動就在上線671B的DeepSeek V3/R1旗艦模型后,又上線了6款DeepSeek R1蒸餾版模型,其中的8B、7B、1.5B模型免 費,企業(yè)或個人用戶、開發(fā)者使用模型或基于模型開發(fā)AI應(yīng)用時,能直接調(diào)用硅基流動的SiliconCloud平臺上的API,簡單易用。

截至2月13日,有來自模型測試人士的結(jié)果反饋,在提供DeepSeek API服務(wù)的主流供應(yīng)商中,和華為云深度合作的硅基流動,其AI服務(wù)響應(yīng)的推理、生成以及平均速度,不僅優(yōu)于承載壓力過大的DeepSeek官方,更與騰訊云、阿里云等廠商拉開了距離。

“+DeepSeek”效果待定

得益于春節(jié)假期的突擊作戰(zhàn),年后上班第 一天(2月5日),華為推出了基于原生鴻蒙操作系統(tǒng)的小藝助手App,既接入了DeepSeek模型推理能力,還在“智能體”選項中上架了DeepSeek-R1的Beta版。

短短5天后,華為智能手機純血鴻蒙版小藝App的DeepSeek-R1智能體升級為正式版,新增“聯(lián)網(wǎng)搜索”功能,知識庫變得更豐富,時效性也更強。

2月13日,記者在廣州一家華為手機線下銷售門店體驗。所有更新為純血鴻蒙系統(tǒng)的手機上,小藝從過去在系統(tǒng)內(nèi)可被喚醒的智慧語音助手服務(wù),變成一個獨立的應(yīng)用產(chǎn)品。進入小藝App,便可以與“她”問答對話,也能在第三方智能體中直接點擊DeepSeek-R1,進入深度思考對話,不用下載第三方App。

華為擁有自研的盤古AI大模型,小藝就是通過盤古大模型訓練出來的。純血鴻蒙中的小藝,在成為一個獨立應(yīng)用后,其使用界面中有突出DeepSeek的方面。

記者看到,門店銷售人員手中的參考資料上,除了有“怎么說”“怎么做”來體驗小藝,還有盤古大模型區(qū)別普通數(shù)據(jù)模型的一些對比,會強調(diào)盤古大模型擁有扎根中文的獨特優(yōu)勢。對DeepSeek,材料并未提及。

上述AI應(yīng)用廠商負責人在接受經(jīng)濟觀察網(wǎng)記者采訪時,給出了產(chǎn)品接入DeepSeek模型能力后關(guān)鍵指標的變化。

“大模型幻覺變少,任務(wù)成功率變高。”該負責人透露,其團隊在用DeepSeek的模型執(zhí)行某項任務(wù)時,失敗率基本為0。接入這一明星大模型后,模型幻覺有所減少,但他指出,大模型幻覺作為共性問題,仍有待解決。

其實,該負責人所在的AI企業(yè)也有巨額投入創(chuàng)新自研的通用大模型以及針對行業(yè)應(yīng)用的專屬大模型。他告訴記者,目前業(yè)內(nèi)集體涌向DeepSeek,普遍做法并非是用DeepSeek系列模型與自身現(xiàn)有模型融合,而是用DeepSeek的模型來開拓新的應(yīng)用場景。

這位負責人與陳天楚有共識,DeepSeek是推理模型,實效性并非其的優(yōu)勢,但卻可以通過模型云服務(wù)商等AI基礎(chǔ)設(shè)施賦能。

一位平臺高管跟很多主流大模型廠商討論過智能體在各個硬件終端上打通的問題,在她看來,這也是DeepSeek未來技術(shù)落地以及當前業(yè)內(nèi)“+DeepSeek”風潮后的發(fā)展方向,“每個硬件都可能成為智能體的入口,通過執(zhí)行人類的任務(wù)來訓練專屬個人的智能體”。

為什么是硅基流動

硅基流動創(chuàng)始人袁進輝是一名連續(xù)創(chuàng)業(yè)者,他在2017年成立的一 流科技(OneFlow),在國內(nèi)2023年涌起AI大模型風潮后,估值一度超數(shù)億美元。

同年,美團聯(lián)合創(chuàng)始人王慧文創(chuàng)業(yè)了大模型公司光年之外,他提出通過并購OneFlow的方式,邀請袁進輝加入光年之外成為聯(lián)合創(chuàng)始人。光年之外后被美團收購,袁進輝在2023年8月宣布回歸到AI基礎(chǔ)設(shè)施領(lǐng)域繼續(xù)創(chuàng)業(yè),創(chuàng)立了硅基流動。

硅基即芯片,而流動有軟件之意,這一名稱也與袁進輝此前創(chuàng)立的一 流科技形成呼應(yīng),讓芯片的算力在軟件基礎(chǔ)上跑起來。

加速AGI普惠人類,是硅基流動官方公眾號上的簡介,袁進輝不止一次在公開場合表示,其目標是為廣大的開發(fā)者提供基于AI模型進行應(yīng)用創(chuàng)新的關(guān)鍵“鏟子”,讓開發(fā)者實現(xiàn)Token自由。

硅基流動去年年中推出SiliconCloud后,不僅日均調(diào)用量超千億Token,針對多個主流模型的服務(wù)還提出了永 久免 費。

“面向C端用戶的大模型App,以后都全面免 費了。”袁進輝2月14日表示,國內(nèi)模型廠商很難對C端用戶收取訂閱費,多是廠商自己負擔算力成本。

在袁進輝看來,模型廠商只有獲取用戶后才有辦法去變現(xiàn)。

數(shù)據(jù)顯示,DeepSeek的應(yīng)用訪問使用量正呈現(xiàn)指數(shù)級上升,成為目前zui快突破3000萬日活躍用戶量的應(yīng)用程序。


版權(quán)聲明:本文僅代表作者觀點,不代表集號吧立場。本文系網(wǎng)絡(luò)編輯發(fā)表,如有不實請聯(lián)系集號吧官方客服。
靚號經(jīng)紀人 閆蘭軍
集號吧靚號經(jīng)紀人,熟知靚號市場 ,能夠為客戶提供專業(yè)的靚號買賣指導 電話/微信:13041264111
認證級別
口碑值 7604
好評率 97%
熱門文章
手機靚號
常用工具
熱點專題
熱門標簽
客服熱線

4008-915-925

投訴/建議

4008-915-925

(AM 8:00-12:00 PM 14:00-18:00)

找到我們
Top