國産最強大模型發布,訊飛星火V4.0整體超越GPT-4Turbo

牛刀財經 2024-06-28 14:20:53

文丨周超然

出品丨牛刀財經(niudaocaijing)

國內大模型正在面臨尖峰時刻。

矛盾沖突來看,OpenAI的斷連,將直接攪動大模型格局的座次變化;行業大環境來看,從通用大模型到垂直落地的加速,這也帶來生態位的競爭加劇。

沿著這兩個方向我們看觀察國內大模型的發展,訊飛星火大模型表現突出。

尤其是,訊飛星火V4.0的發布,以整體超越GPT-4 Turbo的成績,表明了國內大模型格局正在發生變化。

1、國産最強大模型發布

訊飛星火V4.0來了!

6月27日,科大訊飛在北京發布訊飛星火大模型V4.0及相關落地應用。訊飛星火V4.0七大核心能力全面提升,整體超越GPT-4 Turbo,在8個國際主流測試集中排名第一,國內大模型全面領先。

現場基于全國首個國産萬卡算力集群“飛星一號”,訊飛星火大模型V4.0正式發布。訊飛星火V4.0 七大核心能力全面升級,全面對標GPT-4 Turbo,並實現在文本生成、語言理解、知識問答、邏輯推理、數學能力等方面的整體超越。

訊飛星火V4.0在圖文識別能力上進一步升級,在科研、金融、醫療、司法、辦公等場景的應用效果已領先GPT-4o。

值得關注的是,關于市場較爲關注的長文本處理能力,星火也全新升級,並針對長文檔知識問答的幻覺問題,業界首發溯源功能。

有意思的是,今年中高考成爲了檢測大模型的試金石。今年中高考真題實測中,訊飛星火語數外各科“成績”均排名第一,被評爲“更會做題的大模型”。

外部權威測試集也體現出訊飛星火V4.0的領先性。

在國內外12項大模型主流測試集中,訊飛星火在8個測試集中排名第一,超越GPT-4 Turbo等國際大模型,國內大模型全面領先。

現場,科大訊飛董事長劉慶峰展示了訊飛星火V4.0在複雜指令、複雜邏輯推理、空間推理、高中數學等方面的效果,星火“智商”再度進化。

以空間推理爲例,現場演示提問中,“Bob在客廳裏。他拿著一個杯子走到廚房。他把球放進杯子裏,然後拿著杯子走到臥室。他把杯子倒過來,然後走到花園。他把杯子放在花園裏,然後走到車庫。問題:球在什麽地方?”訊飛星火可以基于空間和常識推斷出球在臥室的地面上,這些能力的進步對于以後的具身智能、家庭機器人都具有意義。

2、垂直落地加速

正如上文所說,國産大模型現在正在朝著兩個方向加速發展,一個是通用大模型的整體性能,一個是大模型的落地能力。

在應用場景上,訊飛星火V4.0也接連給市場帶來了驚喜。

發布會上,訊飛星火進行了多款産品的發布和升級。

訊飛星火APP/Desk全新升級,發布“個人空間”,打造更懂你的AI助手;面向專業領域的個性化應用,科大訊飛升級訊飛曉醫APP,上線個人數字健康空間,打造每個人的健康助手;業界首發星火智能批閱機,“AI助教”助力老師減負增效、因材施教;訊飛AI學習機升級1對1答疑輔導功能,打造每個孩子的AI學習助手。

訊飛星火APP率先發布“個人空間”,用戶可以上傳自己的工作、學習、生活、健康等各類資料,形成每個人的專屬知識庫,再結合人設,讓大模型生成更個性化內容。此外,訊飛星火首批上線14 個智能體,面向特定場景打造專屬助手。

訊飛曉醫APP各項能力持續升級,覆蓋1600種常見疾病、2800種常見藥品、6000種常見檢查檢驗,滿足用戶在看病前、用藥時、檢查後的核心場景健康需求。當前,訊飛曉醫APP累計下載量1200萬,用戶好評率98.8%,主動推薦率42%。

星火智能批閱機集智能批改、精准學情、個性學習于一體,它支持自由排版,不限紙張大小的作業,在支持多學科多題型智能批改的同時,還能即時生成多維學情報告,還爲老師作業講評和面批輔導提供了素材。

在現場,演示了星火智能批閱機批改作業的全流程,15份學生作業半分鍾就能批改完成,批改模擬了真人筆迹,和老師平時批改作業幾乎一樣。

此外,星火大模型還打通了全系訊飛C端軟硬件産品生態,數百萬智能硬件用戶一鍵擁有“星火全家桶”。

比如訊飛智能辦公本、智能錄音筆的文件可以一鍵同步到星火個人空間中,通過數據互通、操作聯動,把一篇辦公本裏會議記錄同步到星火中,就可以讓星火進行公文寫作,還可以做PPT,以及生成待辦事項等,帶來更高效的辦公體驗。

3、商業化加速

衆所周知,科大訊飛從AI語音處理起家,經過多年的發展,在智能語音處理上處于國際頂尖級別。

近期科大訊飛作爲第一完成單位的《多語種智能語音關鍵技術及産業化》項目,獲得國家科學技術進步獎一等獎。發布會現場國獎得主再出“王炸”,星火語音大模型迎來新突破。

當然,科大訊飛不僅有著長期的技術積累,還在商業化應用上早已成熟。

首先是人機交互領域。

在大模型加持下,星火汽車智能座艙全新升級,不但具備了多語種多方言的“自由交互”,還具備多情感多模態的超擬人交互,讓人車交互更有溫度。當前,訊飛語音交互産品國內市占率穩居第一,同時廣泛出口到世界各地。星火大模型爲一汽、奇瑞、廣汽、江淮、長城等車企的衆多車型,賦予了高度智能的交互體驗。

爲了讓大模型更好落地,科大訊飛還打造了雲邊端一體化和軟硬件一體化的解決方案,賦能家電、運營商、機器人等更多行業場景。面向具身智能和人形機器人企業需求,本次科大訊飛正式發布機器人超腦平台2.0,業內首個支持多模態交互。目前,400+機器人企業已經采用訊飛機器人超腦平台。

其次是訊飛星火大模型發布後,給企業生産帶來的高效受到市場認可。

自去年5月6日發布以來,訊飛星火大模型正成爲國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、奇瑞汽車、中國一汽、大衆汽車、江汽集團、海爾集團、美的集團等多領域頭部企業的首選。

訊飛星火已經在代碼、合規審查、客服、評標、智能交互等多個典型場景産生應用成效,以交通銀行爲例,基于星火大模型能力的産品iFlyCode覆蓋6000+研發人員,代碼采納率達38%,工作效率顯著提升。

此次發布會,星火企業智能體平台正式發布,圍繞搭建智能體的三大關鍵能力,當前企業智能體平台已覆蓋400+AI原子能力,集成90+外部信源,打通100+內部IT系統,可供企業結合業務場景快速構建可落地的智能體應用。平台還圍繞生産域、科創域、辦公域、管理域上線32個企業智能體,供企業即插即用。

比如在代碼智能體iFlyCode中,它集成了代碼生成助手、架構設計助手、代碼問答助手、測試助手、數據庫優化助手、代碼審核助手等六大場景智能體,將采納率由30%提升至52%,大幅度提升企業智能體的實用性。

訊飛星火大模型在給産業帶來效率提升的同時,也爲大模型生態帶來助力。

自今年1月30日訊飛星火V3.5發布以來,短短5個月,星火開發者生態加速增長,開發者數從598萬增長到702萬,新增超104萬;海外開發者數超40萬;大模型開發者達57萬。越來越多開發者正加入星火生態,釋放更多剛需場景的應用價值。

劉慶峰表示,只有自主可控的繁榮生態,才有中國通用人工智能的大未來。

面向未來的人工智能新生態,他強調要關注源頭技術生態、智能體生態、應用生態和行業生態,實現自主可控和軟硬一體,才能實現大模型的深度落地;既要科學理性地認識中美在大模型上的綜合差距,也要有信心快速追趕,給出從源頭技術、到産業生態、再到應用落地的一整套的打法,以長期主義來打造真正自主可控的AI産業生態。

1 阅读:319
评论列表
  • 2024-06-29 07:24

    我看看去

牛刀財經

簡介:刀刀解剖新商業真相