中興通訊自研研發大模型全景展示

中興通訊的風格先自用再外溢，如果連自己人都用不好，丟到市場上也是丟人。不成熟的産品，就快速推向市場，要麽默默無名，要麽罵聲一片！在技術領域，可以完全相信中興，其保守的風格，值得信賴！

中興的大模型架構和市場主流的大同小異，都是基座大模型1（語言大模型+多模態大模型）加上N（行業（領域）模型）再加X（x個場景應用）！

視頻中主要講的就是中興目前自用的研發模型：基于中興的實際情況，最終形成五大類主要場景：AI輔助需求分析、AI輔助文檔、AI輔助開發、AI輔助測試和AI輔助CICD

中興作爲一家科技公司，最終將AI輔助開發作爲重中之重！

大模型的建立是比較複雜的系統工程，各個維度都要涉及，最原始的語料庫，中興采用了中興自己的大數據平台，目前大概有幾個PB的語料（1PB=1024TB），韓介紹這個語料處理大概用了100台機器，處理完的語料才能成爲訓練語料，進行大模型的訓練！

其次就是AI雲部分，這裏主要是管理中心的GPU集群（之前好像提過，濱江基地訓推加起來是萬卡級別吧），中心目前的集群是多地的分布式的多雲的一個系統，在這些GPU之上，中興所有的大模型都是這個集群上訓練出來的，並且把其部署在平台上。

應用開發平台就略過了。。。。只提一點：通過中興的應用開發平台使用自研大模型和第三方模型都會被平台屏蔽差異，上終端用戶可以一鍵切換各種模型，這裏面也有信息安全的管理功能，可以有效的保障和防範公司的內部機密及信息的泄露。

最後，就是應用了，基于大模型賦能研發雲應用，這裏略過。

從研發大模型來說，去年4月份就開始研發了，然後23年7月份發布第一個版本，然後基本上每月叠代一次，截止五月初發布了4.3版本。從實際使用情況看，每個版本的能力都有提升，也也中興推動整個AI的智能化化研發是一個互相配合的！截止5月的版本，中興的研發大模型在中文編程上差不多已經達到了GPT4的水平了，韓專門強調了，中興比較重視的編寫單元測試等一些場景是超過了GPT4的水平，也承認了通用能力是不如GPT4的。

下面就是細節了，例如基礎大模型訓練的數據是幾萬億或者十幾萬億token數，人出生到死亡接觸到的token數就是10億左右，人力又窮時真的可以充分體現在這裏。這些要訓練的數據，是不可能人力去篩選的，只能相信其是“好的”、‘沒問題’的。。。實際如何呢？ChatGPT都會經常給出錯誤的答案，何況其它呢？如何把海量的黑盒數據白盒化，可能都是各家主要的努力方向。