科大訊飛:大模型進校,批改作業進入AI時代

科技多知人 2024-06-30 13:26:47

“讓我們的通用人工智能從通用助手變成更懂你的AI助手。”

來源|多知

作者|馮玮

上個月,星火大模型推出剛滿一周年。

經曆了從無到有的拓荒,科大訊飛董事長劉慶峰認爲當前訊飛在做的事情無外乎以下兩個方面:國內的大模型底座能力到底怎麽樣?大模型究竟如何應用落地?

訊飛的答案也出現在昨天下午,科大訊飛在北京發布訊飛星火大模型V4.0及相關落地應用,其中:

訊飛星火V4.0七個核心能力全面提升、全面對標GPT-4 Turbo、星火APP/Desk升級並發布“個人空間”、首次推出星火智能批閱機、AI學習機升級1對1答疑輔導功能、語音大模型發布74個語種/方言免切換對話……

首次出現的智能批閱機意味著批改作業已真正進入AI時代,而AI學習機中全新的AI 1對1 答疑輔導功能,被官方強調已“實現了超擬人效果”。

此刻的訊飛,更像是一個縮影。

大模型軟硬結合、端側落地的賽程,已經開始。

01

七個核心能力提升:對標GPT-4 Turbo

在劉慶峰看來,從去年5月6日的訊飛星火V1.0到此刻的訊飛星火V4.0的發布,星火最令團隊自豪的,是訊飛星火大模型基于全國産算力平台訓練得出。

據了解,訊飛已與華爲聯合軟硬件一體化,科大訊飛提供了大量的算子庫和算法資源,聯合在安徽發布了中國首個國産萬卡算力集群。

這是中國第一個能訓千億以上浮點參數大模型的硬件平台。在這個硬件平台上,訊飛星火是中國第一個基于國産算力訓練出來的全民開放的大模型。

基于此,此次的訊飛星火V4.0已經可以對標GPT-4 Turbo。

具體數據來說,訊飛星火V4.0在文本生成(80.2%)、語言理解(82.3%)、知識問答(85.7%)、邏輯推理(82.2%)、數學能力(86.5%)這五項能力上已經超越了GPT-4.0 Turbo,在代碼能力(81.2%)、多模態能力(78.4%)上仍然有進步空間。

“代碼能力是我們非常關注的能力之一,因爲它涉及未來的産業信息化和信息産業化的核心,而ChatGPT去年2月份通過谷歌二級程序員測試,當時的GPT-3.5用這個測試集只獲得了60多分,GPT-4 Turbo今年1月份測試大概在80分,現在到86分,也在快速叠代和進步。”

“我們預計在今年8月份,訊飛星火會達到現在86分以上的水平。”劉慶峰表示。

現場的演示中對“複雜指令”、“空間推理”、“多模理解”等進行了展示,劉慶峰在現場同時介紹了星火大模型在學習和獲取知識方面以及長文本能力方面的提升。

例如,訊飛研究院院長劉聰在現場爲星火展示了四張圖片,並要求星火Desk就這4張圖片編寫一段兒童故事。

訊飛星火V4.0可以按照圖片內容的條理清晰地編寫出一段流暢自然的兒童故事。

故事裏包含了圖片中的各種元素,生成的故事也有著不錯的可讀性,讓人可以直觀清晰地獲取到想要了解的內容。

星火此次還了推出內容溯源功能,當用戶向星火提問並得到回答後,還會得到這樣回答的原因及參考了什麽文獻的哪段內容。

在劉聰詢問“西遊記中,悟空一共被念了幾次緊箍咒”的問題,星火就會在給出答案的同時、羅列對應文本的摘要以及原著中的對應內容。

“這樣當我們沒有時間看全文的時候,只要去核實它的溯源就行了,這使得大模型的’幻覺’得到極大的降低。”劉慶峰強調。

而在大模型落地到教育場景來看,此次有兩個重要的更新。

02

批改作業進入AI時代

“我們一方面提升大模型底座能力,一方面進一步提升多模態能力,尤其是面向教育複雜場景的圖文識別效果,使我們能夠給學校的老師和孩子們做得更多。”

劉慶峰介紹了其進校最新産品“星火智能批閱機”。

據介紹,智能批閱機具有智能批改、學情分析、個性作業三個特質。可以幫助老師進行批改減負、減少對學生學情的統計的分析,方便老師在作業講評時進行分層輔導等等。

“這個批閱機可以自動批改,把老師批改消耗的精力釋放出來,讓老師只看那些他應該看的錯誤點,批閱機通過批改自動地找出全班學習情況,給出分析,給出每個孩子學習路徑的規劃,而且能夠軟硬件一體化。”劉慶峰解讀。

現場演示環節,劉聰介紹整個機型包含了掃描、打印、觸屏操作等等配置。

老師拿到學生作業後放到掃描機進行整體逐張掃描,一分鍾可以掃描90份作業,適合老師在課間快速操作。

掃描後屏幕上會顯示已批閱和批閱中、以及不同學科的內容。

老師隨時可以打開已經批閱完成的作業內容,正錯誤的部分會進行畫圈的批改痕迹。劉聰表示,一份比較亂的作業,包括很多塗改痕迹、草稿痕迹等,目前均不會影響批改效果。

系統中內置了中高考同樣的批閱技術和數據,因此批改語文作文也將得到與學習機等産品同樣的批改痕迹,包括批注、錯誤字詞句的批注,點評、好詞好句劃線等等。

同時結尾有整體的教師評語和提升建議。

這些批改結果可以直接打印到作業之中,老師只需要選擇“留痕打印”即可——“這些批改模擬了真人筆記,基本上和老師平時的批改效果一模一樣。”劉聰表示。

除了對學生端的智能批改外,智能批閱機還可以對批改數據進行整合分析,自動生成班級共性問題和個性輔導建議,同時爲老師提供講評建議,如重點講評哪幾道題目等等。

之前在C端學生機上會出現的知識圖譜,也出現在了智能批閱機上,更好地呈現了學生的知識薄弱項。

智能批閱機會根據薄弱項內容給老師推送適合的內容,涉及到錯因分析、知識鞏固和變式拓展,以及每個個體學生的學情報告和個性化作業等等。

老師只需要打印出來就可以給學生以更個性化的幫助。

“我們爲老師節省了批改過程中的無效、低效、重複時間,就可以有時間分析孩子的狀態,老師就可以騰出時間來關注孩子的心理健康,關注人的全面成長。”劉慶峰表示。

據介紹,星火智能批閱機試題解析准確率>99%,支持語文、數學、英語多學科多題型智能批改,支持塗改液、便利貼、褶皺的作業原卷留痕、亂序打印。

數據顯示,使用星火智能批閱機後,每班人工批改時間可從90分鍾縮短至5分鍾,學情統計分析從每班60分鍾縮短至1分鍾。

批改減負,科大訊飛通過AI技術邁出了全新一步。

03

AI學習機升級,上線超擬人答題輔導

去年5月6號科大訊飛推出星火大模型1.0版本後,大模型的各個能力都在快速提升,“每個月都會有一項重要升級”,以文本寫作中的高考作文來看,今天星火大模型寫出來的東西,已經從最初的不錯到給人以觸動,再到驚喜和感動的水平,劉慶峰表示。

AI學習機同樣在快速升級中。

此次基于星火V4.0在語義理解、多輪交互、圖文能力的升級,學習機的學習流程也有了四個更新:

首先,采用多模態啓發式講解方式,結合講解、試題信息圈畫和重點內容板書等手段,直觀地引導孩子一步步解答問題。

其次,該功能支持自由問個性化解答,孩子們可以通過畫線、語音、寫字或公式等多種方式進行回答和提問,

0 阅读:0

科技多知人

簡介:感謝大家的關注