CNMO了解到,華為公司將發布一款直接對標ChatGPT的多模態千億級大模型產品,名為“盤古Chat”。預計華為盤古Chat將于今年7月7日舉行的華為云開發者大會(HDC.Cloud 2023)上對外發布并內測,產品主要面向ToB/G政企端客戶。
盤古大模型于2020年11月在華為云內部立項成功。對于盤古大模型定位,華為內部團隊確立了三項關鍵的核心設計原則:一是模型要大,可以吸收海量數據;二是網絡結構要強,能夠真正發揮出模型的性能;三是要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。
CNMO了解到,與其他廠商相比,華為的優勢或在于擁有完整的產業鏈和較強的算力調配能力。據浙商證券此前披露,在訓練千億參數的盤古大模型時,華為團隊調用了超過2000塊的昇騰910芯片,進行了超2個月的數據訓練能力。華為內部稱,每年大模型訓練調用GPU/TPU卡超過4000片,3年的大模型算力成本高達9.6億元人民幣。
由于盤古大模型擁有超大規模的參數,因此訓練成本較高,但在中文語言的處理方面具有很高的準確度和質量。