中興通訊自研研發大模型全景展示

清風與雨 2024-06-28 16:12:53
中興通訊自研研發大模型全景展示

中興通訊的風格先自用再外溢,如果連自己人都用不好,丟到市場上也是丟人。不成熟的産品,就快速推向市場,要麽默默無名,要麽罵聲一片!在技術領域,可以完全相信中興,其保守的風格,值得信賴!

中興的大模型架構和市場主流的大同小異,都是基座大模型1(語言大模型+多模態大模型)加上N(行業(領域)模型)再加X(x個場景應用)!

視頻中主要講的就是中興目前自用的研發模型:基于中興的實際情況,最終形成五大類主要場景:AI輔助需求分析、AI輔助文檔、AI輔助開發、AI輔助測試和AI輔助CICD

中興作爲一家科技公司,最終將AI輔助開發作爲重中之重!

大模型的建立是比較複雜的系統工程,各個維度都要涉及,最原始的語料庫,中興采用了中興自己的大數據平台,目前大概有幾個PB的語料(1PB=1024TB),韓介紹這個語料處理大概用了100台機器,處理完的語料才能成爲訓練語料,進行大模型的訓練!

其次就是AI雲部分,這裏主要是管理中心的GPU集群(之前好像提過,濱江基地訓推加起來是萬卡級別吧),中心目前的集群是多地的分布式的多雲的一個系統,在這些GPU之上,中興所有的大模型都是這個集群上訓練出來的,並且把其部署在平台上。

應用開發平台就略過了。。。。只提一點:通過中興的應用開發平台使用自研大模型和第三方模型都會被平台屏蔽差異,上終端用戶可以一鍵切換各種模型,這裏面也有信息安全的管理功能,可以有效的保障和防範公司的內部機密及信息的泄露。

最後,就是應用了,基于大模型賦能研發雲應用,這裏略過。

從研發大模型來說,去年4月份就開始研發了,然後23年7月份發布第一個版本,然後基本上每月叠代一次,截止五月初發布了4.3版本。從實際使用情況看,每個版本的能力都有提升,也也中興推動整個AI的智能化化研發是一個互相配合的!截止5月的版本,中興的研發大模型在中文編程上差不多已經達到了GPT4的水平了,韓專門強調了,中興比較重視的編寫單元測試等一些場景是超過了GPT4的水平,也承認了通用能力是不如GPT4的。

下面就是細節了,例如基礎大模型訓練的數據是幾萬億或者十幾萬億token數,人出生到死亡接觸到的token數就是10億左右,人力又窮時真的可以充分體現在這裏。這些要訓練的數據,是不可能人力去篩選的,只能相信其是“好的”、‘沒問題’的。。。實際如何呢?ChatGPT都會經常給出錯誤的答案,何況其它呢?如何把海量的黑盒數據白盒化,可能都是各家主要的努力方向。

中興的數據分級到後面的高價值數據以及5級的精確數據就略過了!這麽說起來,中興通訊是否有資格納入“數據要素”概念呢?這麽強悍的數據處理能力,各家交易軟件商一家沒有納入過,雖然納入了也不會漲。。呵呵!

下圖是在有了基礎大模型後,打造領域大模型的過程,這種專業的東西,還是繼續略過!

增強預訓練:只提一點,中興作爲算力公司,在算力的優化上,韓認爲做的還可以。

精調訓練:太過專業了,略過。。

這裏只提一點,好的量化算法可以讓精度不降低!都是專業東東,相信也沒有誰會看,主要是看了也看不懂[捂臉]

韓提到了,我們使用的大模型包括GPT可能底層都是多模型組成!

最後,韓提到了10%的整體研發效率提升是估的(沒有辦法具體量化),30%AI代碼生成行數占比這個真正統計出來的!大多數企業都是各種吹噓自家的,這種實事求是的企業還是少見!

最後還有一些1+N+X中,X中的應用展示了!

說實在的,我聽得都有點頭疼了。哎。。中興也不爭氣,我是越努力越來氣壓呀![流淚]

$中興通訊(SZ000063)$

0 阅读:8

清風與雨

簡介:感謝大家的關注