洋蔥學園首次披露“智能學伴”:自適應學習、AI答疑,還有情感陪伴

科技多知人 2024-06-26 13:14:50

“一邊做,一邊等風來。”

來源|多知OpenTalk

整理|徐晶晶

攝|張蔚斐

近日,在多知OpenTalk第45期“AI如何引領教育走向新紀元”活動上,洋蔥學園App的産品負責人林健分享了産品與AI結合的思考與探索。

這是洋蔥學園第一次系統性地對外披露其打造“AI智能學伴”的底層思考邏輯。

林健表示,關于AI賦能教育,洋蔥學園有兩個基礎認知:

1.“匹配用戶真實使用場景和核心痛點的體驗設計” 是1,“疾速發展的AI技術”是將價值放大的0。

2.優質的內容永遠是洋蔥學園最重要的核心資産。

基于上述兩個基礎認知,洋蔥在服務學生和家長時,在自適應學習、學習規劃、答疑、判主觀題等環節都進行了AI探索。

在學習場景外,洋蔥學園還關注到孩子的心理健康場景——推出了“暖暖AI”産品功能,使洋蔥學園App成爲也能提供情緒價值的“成長夥伴”。

以下爲林健分享原文(經多知編輯):

大家好!我是洋蔥學園App的産品負責人林健,是一名設計師背景的産品經理,也是重度的AI應用愛好者,有比較豐富的服務設計和産品設計的經曆。首先我來簡單介紹下洋蔥學園這家公司。

洋蔥學園創建于2013年,創始團隊的核心成員大多來自“陽光書屋”,這是一個聚焦鄉村信息化教育的公益組織。成立之初,公司推出了“洋蔥數學App”,結合優質課程內容與人機交互能力爲學生提供更好的學習體驗。

之後,洋蔥快速發展,推出不同學段、不同學科的課程,學習場景也不斷拓寬,更名爲“洋蔥學園”。到今天,洋蔥學園已經成爲一家教育科技集團化公司,涉足8條業務線:數字資源、智能學伴、智能硬件、基礎教育數字化、職業教育數字化、教育公益、融合出版和研學實踐教育。

洋蔥學園集團旗下運營5個子品牌,分別是洋蔥學園App、洋蔥學園教師版、洋蔥星球、洋蔥智課和洋蔥助教行動。

過去10年,洋蔥學園累計的學生用戶超過1.1億名,全國已經有三分之一的中小學生成爲了洋蔥學園的“蔥粉”;公立校教師用戶超過336萬名。目前,洋蔥自主研發了超過8000部數字課程,學生的自主學習時長超過1.6億小時,學習行爲數據超過4343億條。洋蔥學園積累的用戶數據,是做AI賦能教育時非常關鍵的因素。

01

兩個基礎認知:“先教育,後AI”

隨著AIGC浪潮的到來,我們做産品時也會有些焦慮:一定要快速地把AI用在産品上、讓用戶和場景都被AI賦能嗎?如果是,具體應該怎麽做?

我們希望把洋蔥學園打造爲學生的AI智能學伴,給用戶提供更具夥伴感的使用體驗。對于AI賦能教育,洋蔥學園有兩個基礎認知。洋蔥後續的決策和動作,都會基于這兩個基礎認知進行拆解。

第一個基礎認知是,“匹配用戶真實使用場景和核心痛點的體驗設計” 是1,“疾速發展的AI技術”是將價值放大的0。

我們希望盡可能簡單和專注,讓新技術自然地和用戶學習場景以及最真實的需求相結合。在我們看來,新的技術出現時會讓用戶感到非常新鮮,但要想讓用戶堅持使用並且獲得個人成長,就一定得找出精准的目標用戶是誰,並識別出他們的真實訴求。

第二個基礎認知是,優質的內容本身永遠是洋蔥學園最重要的核心資産。

洋蔥學園的課程內容生産成本很高。一節5到8分鍾的數字課程,平均研發和打磨曆時至少2個月。高質量的內容也是洋蔥學園創立至今被用戶高度認可的基石。

基于這兩個基礎認知,洋蔥學園目前都做了哪些結合AI的探索和嘗試?在C端,我們服務的對象包括學生和家長,從服務對象出發,洋蔥學園分別能做什麽?

02

一個目標:AI,讓孩子學會“自主學習”

面向學生,我們致力于將洋蔥學園打造爲AI智能學伴。

我們思考的問題是,是用AI能力爲學生創造新的學習場景或學習能力,還是將AI能力嵌入學生已有的學習流程、助力現有的學習場景?

市場上很多産品都提供了幫助學生總結課程重點、生産學科素材、進行作文批改等能力。類似的功能,洋蔥也在做,因爲這些功能幫助學生以更便捷的方式、更低廉的成本獲得學習內容。

但,這類功能是不是AI賦能教育裏最有價值的探索?

我們認爲,類似的功能和場景一定很有價值,但仍是“授人以魚”,我們想在這個基礎上做更多的探索。爲學生創造新的學習場景或者學習能力,並不是最能夠彰顯AI能力價值的點。因爲AI工具其實是一種“新”的交付方式,但是否是“更好”的交付方式則完全取決于背後將技術産品化的教育者。例如當涉及到文章批改、總結等,AI在經過精心設計的prompt和工作流的基礎上,可能可以做到以較高的水平給到用戶一些建議,但是要提升交付的質量和可用性,背後少不了有經驗的教育者參與。

那麽,在嵌入學生已有的學習流程、助力現有的學習場景方面,洋蔥學園有哪些嘗試?

洋蔥學園App內的AI精准學模塊

首先,洋蔥學園將AI能力嵌入已有的核心學習流程的重要探索之一是自適應學習。這個功能叫“洋蔥AI精准學”,通過將用戶真實的學情和知識圖譜融合呈現,幫助不知如何學的用戶快速上手,並取得較好的學習效果。

早在2017年,洋蔥學園就已經開始對自適應學習進行探索了,對洋蔥的課程做了細致的切片,在課程中加入一些交互分支,讓學生可以反複學習薄弱的知識點片段,或者匹配到更適合自己當前學習難度的片段等。

今天,洋蔥學園已經能夠非常精准地爲每位用戶推送適合的學習內容。基于龐大的用戶基數和學習行爲數據,我們爲所有課程內容、習題和講義打了科學系統的標簽,再加上AI能力的加持,確保用戶學到的是適合他的內容。

當前,我們已經能夠在用戶學習數據比較少的情況下,評估某一道題用戶做對做錯的概率,准確率已超過70%。對于用戶來說,整個學習體驗就會非常好,能夠讓他集中精力學習相對薄弱的地方。

學生在學習這些內容時,既能夠感受到挑戰,激發思考,又不會感覺過難、産生挫敗感。這樣的學習體驗可以不斷調動學習積極性,讓學生更容易堅持下去。

與此同時,我們的學習數據不斷積累,基于數據反饋,課程研發也能不斷優化,給習題和講義打的標簽更加精准,進而算法也更加精准,最終形成正向的循環。

其次,我們還做了很多關于學習規劃的探索。

通過對用戶的調研,我們發現,很多學生的學習效果不理想,是因爲他們不知道如何開始學習。

爲了解決這個問題,洋蔥學園基于不同的用戶分層、真實需求痛點,爲他們制定各種學習計劃。比如針對中高考備考,我們會采集真實性的訴求,比如學生當下的能力水平是怎樣的、希望最終達到什麽樣的水平以及能投入多長時間學習,然後結合課程研發能力、AI能力,給用戶制定學習規劃。

第三,洋蔥學園還做了用AI賦能答疑、判主觀題的探索。

洋蔥學園有一個功能板塊叫“去答疑”。基于課程內容的答疑和追問,也是一個AI可以大有所爲的方向。

在這個方面,通過將完整的課程內容、學生原本的提問和提問所關聯課程的具體時間點等信息結合,再加上專業的教研老師和産品共同討論設計prompt,以適當的工作流進行處理,我們可以爲用戶提供更加及時的答疑服務。

還有很多用戶聽完一節課之後,會問到沒有出現在課程中的相關題目,我們也會在答疑環節進行講解。

洋蔥學園課程設計的思路一直是,當用戶提出一個問題後,我們並不會直接給他答案,而是引導他思考題目中可能會用到哪些知識點,以什麽樣的思路一步步把題目解出來。這方面,我們也對AI進行了大量的預訓練和調校,讓它能夠給到用戶相對可靠的講解,尤其在偏文科或者低年級理科上都取得了不錯的效果。這也在很大程度上節省了洋蔥在答疑方面的人力投入。

學生使用在線教育産品學習的過程中還有一個常見痛點,就是有很多“主觀題”,這些題目沒有標准答案,往往是通過判斷學生的作答中是否包含了一些“得分點”或符合題目要求的表達等來進行給分。因此在類似刷題練習或模擬測試場景中,用戶的體驗並不理想。經常是在完成作答後,將標准答案和題目解析給到用戶,需要用戶自行判斷是否作答正確。

而這個場景下需要的正好是大語言模型比較擅長的能力,通過合適的prompt工程和工作流設計,洋蔥學園研發了AI判主觀題的功能。用戶在主觀題作答場景可以節省寶貴的學習時間,學習體驗也會得到顯著的提升。

自適應學習、做學習規劃、給用戶答疑以及主觀題判題包括進一步講解,這些是洋蔥學園産品團隊在進行産品叠代時,把AI能力嵌入學生現有學習場景並爲之賦能的一些探索。通過融入這些場景,可以讓用戶更加沒有感知、更加自然地受益于AI能力的發展,在學習過程中取得更好的效果。這也是洋蔥學園願意投入更多精力做的板塊。

03

新場景:AI智能規劃,輔助家庭教育

面向家長,洋蔥學園思考的是如何幫家長更好地融入學生的學習場景中。

我們經常會收到學生的反饋,比如“自己平時的學習壓力大多數來自于父母,他們根本不知道怎麽能讓我學習更好,只會跟自己要結果”。

另一方面,我們也面訪了不同年齡段學生的家長。結果發現,相比我們,很多家長可能不懂科學的教育方式,但是他們對孩子傾注的心血和愛一定是超過我們的。我們更應該做的,不是以一種說教的姿態去設計産品,而是考慮如何幫助他們更好地參與到孩子的學習場景中。

家長的第一個痛點就是不知道怎麽輔導孩子學習,由此産生了很多焦慮。

針對這一問題,在沒有AI參與之前,我們做了家長課堂,來告訴家長如何解決孩子會遇到的常見問題。

如今,我們可以借助AI能力,結合洋蔥學園課程研發團隊的輸出,設計了能夠匹配不同學生情況的學習規劃,讓這些學習規劃以更加個性化、有溫度的方式提供給孩子和家長。讓家長和學生都可以根據規劃盡量高效地利用自己的時間和精力。

家長的第二個痛點是,很多家長完全不了解孩子的學習情況,沒有時間關心孩子。

爲此,洋蔥學園盡可能多維度地呈現學情,除了讓學生了解自己的學習情況,還將學情以適當的方式和頻率同步給家長。目的是做到學生心裏有數、家長心裏有譜。

其中,給學生的學情報告很豐富,包含很多細節。比如他錯的題爲什麽錯了、應該如何進一步提升等等。

而給家長的學情分析是更凝練的。家長不再僅是通過孩子每次測試才了解學習情況,而是一份長期的數據跟蹤,讓家長能夠花最小的精力,真正地參與到孩子的學習中。這樣家長會比較放心,同時也會對孩子多一些理解。

家長的第三個痛點是,他們擔心報了這些課程,孩子卻學不下去。

我們的方案是多管齊下,用一套相對科學的激勵體系,讓學生感受到自己內化的成長和正反饋,讓他盡可能地堅持學下去。

我們對激勵體系做了詳細拆解,包括怎麽讓學生感知到學習目標;當學生做不同的學習行爲時,我們給到他什麽樣的激勵反饋;以及這些激勵最終有什麽出口。

進一步拆解來看,用戶在App內有各種各樣的行爲,指向各種等價的成長值數值,把這些數值對標到不同的成就等激勵指標,再進而這些指標會反向催生用戶完成更多的學習行爲。在完成這些行爲後,用戶會得到潛移默化的提升,並且會真正愛上學習。

在家長看來,他們的孩子就像愛玩遊戲一樣逐漸愛上了使用洋蔥學園進行學習。

上圖是洋蔥學園的遊戲化激勵場景之一,App內有答題PK場,學生會像打競技場一樣跟其他同學PK做題。

這其中也應用了AI能力。比如匹配答題競爭對手時,爲了減少匹配時間(並不一定每時每刻都有跟用戶同學段、學同學科、學習成果相似的用戶在線),我們會通過曆史上真實用戶的答題記錄形成一個Bot,讓Bot跟真實用戶在線PK,後者對PK的過程也更具真實感。

用戶完成PK後,會獲得各種各樣的學習成就——作業獵人、備考磚家等。這些成就的名稱會讓學生覺得有趣,也願意搜集。

我們還做了遊戲化的等級體系和各種升級任務,也通過虛擬資産讓用戶學習時得到一些量化的反饋,比如用戶能通過學習積累各種道具豐富自己的個人形象。

04

新功能:“暖暖”,基于AI 大語言模型的成長夥伴

學習場景外,還有哪些AI可以發揮效能,爲學生和家長提供支持,並提升學生學習能力或狀態的場景?

洋蔥學園希望打造的AI智能學伴,是更有夥伴感、更有信任感的。

爲此,洋蔥學園孵化了“暖暖”。

這是洋蔥學園基于大量用戶咨詢的數據和問題,投入了具有專業資質的人力資源,結合生成式人工智能打造的GPT,目標是爲學生提供健康成長的陪伴和關懷。

洋蔥學園App內有個名爲“洋蔥樹洞”的功能,收到過大量用戶的反饋,其中不乏情緒低落的反饋。這種負面情緒,有些來自于家庭關系,有些來自于人際交往,有些則是來自于學業壓力,在學生的現實生活中也難以排解。

因此,“暖暖”誕生了。

洋蔥學園基于大量數據提煉出典型的心理健康痛點問題,並整理成音視頻課程,放在“暖暖”的功能頁裏,可以讓用戶快速找到這些課程。

當用戶的問題並不是這些典型問題時,“暖暖”裏還有結合洋蔥的世界觀構建的虛擬人物Bot暖暖老師(虛擬的心理咨詢老師)和同學IP。基于大語言模型,這些人物會跟用戶溝通,解答疑惑。

爲確保內容的准確,我們在這方面也投入了具備執業資質的專業人力資源一起調校,並且有非常嚴格的審核機制,在經過大量測試和可行性驗證後,我們才把這個功能推向用戶。

如果識別到用戶的問題需要真人介入,我們會把這類用戶流轉給洋蔥的心理咨詢老師,讓心理咨詢老師介入,提供更加專業的支持。

在這個過程中,我們將長期收集的各種用戶典型問題,結合prompt工程和科學的工作流設計,借助專業的心理咨詢師支持,將大量的用戶咨詢分層處理,最終構建了目前版本的“暖暖”。

在我看來,“暖暖”最有價值的地方在于,真的有那麽多的孩子願意信任洋蔥來傾訴他們心裏的疑惑和問題,並且這些問題和困惑能夠被洋蔥學園看到和重視起來,真正投入各種資源去著手解決。

這是我們在學習場景外,一個更有“夥伴感”的重要嘗試。

05

未來産品規劃

洋蔥學園未來産品規劃中,還會有哪些與AI相結合的可能?

其一,堅持從基礎認知出發,發揮洋蔥的優勢,做能夠爲用戶提供“內化成長”的事。

其二,對技術的快速發展和叠代保持足夠的重視和關注,在質變到來時做好准備。

我對洋蔥學園産品團隊的要求是日常都要盡可能多地了解和接觸最前沿的AI技術發展,並且多進行嘗試,只有這樣,我們才能對新技術的能力邊界有相對清晰的感知,進而對産品未來的發展和叠代方向有想象力。

06

Q&A

提問:您好,我是一名設計師,目前在一家在線互聯網教育公司搬磚。我有三個問題請教。

第一個問題,您講到一個具體落地的場景答疑和判主觀題,設計AI工具的時候,我們怎麽考慮平衡工具的引導性和學習動力?

第二個問題,在整體AI互動過程中,許多地方做不到那麽精准,那麽有什麽兜底措施?

第三個問題,現在洋蔥學園改版的風格,從産品設計角度是希望用戶在使用過程中獲得怎樣的情感體驗?這背後的支撐理論是什麽?

林健:第一個問題更像是在問基于不同的用戶分層如何更好地滿足他們不同的訴求。

洋蔥學園的用戶分層是非常複雜的:覆蓋了小初高中職所有的學段年級,這些不同的年級裏,學生情況也不同,比如有擅長學習的和不擅長學習的,有有目標和沒目標的。這些不同用戶的客觀屬性和當下學習情況可以做非常多的分層,每一個用戶都有不同的訴求。

要爲不同用戶提供匹配他們目標預期的産品,我們先要做的是識別用戶的需求:有些用戶可能需要的是工具,那我們就要足夠清晰地呈現工具讓他能比較快地找到這個工具立刻使用;另外一些用戶來了之後,我們要先給他安全感,告訴他放松,跟著我們來就可以搞定。

這也是我們一直努力的方向。

第二個問題是關于學習規劃的。目前絕大多數學生的學習問題或者他需要的學習規劃還是有共性的。難免有特別個例的情況,但絕大多數是可以歸類分層的。基于這些分層,我們盡可能多地做顆粒度,以一個比較合理的成本和可用性服務好絕大多數的用戶。

對于比較特例的用戶,我們會借助AI能力去識別。比如我們做的AI精准學功能,當用戶開始學習,他有了一些前置輸入之後,我們對他進行最初的學情采集,也有一些糾正,他先給我們輸入,我們再給他相對精准的內容推送,幫助他學到更適合自己的內容。這算是一個兜底。

第三個問題就是洋蔥的設計風格是不是有意爲之以及效果怎麽樣。截止到三年前,洋蔥學園最大占比的用戶群體還是初中學生。隨著這幾年洋蔥學園的課程在多學科多學段多場景的拓展,我們的用戶也逐漸變得更加豐富和多元化。

對于洋蔥之前最核心的初中用戶群體來說,經過大量調研和測試發現,我們現在的風格真正受到用戶的喜歡。因爲二次元的國漫美術風格也非常火,很多學生非常喜歡。我們在這個基礎上對洋蔥學園整個視覺設計進行了一個完整的大改版。

當然,實事求是地說,單一的風格肯定不能滿足所有用戶的真實學習訴求。比如有些希望來了以後就純想學習的用戶會認爲這種風格偏遊戲化了。我們現在的風格可能需要進行針對性調整。我們也在努力保證不同喜好的用戶都能在我們的産品內獲得符合預期的學習體驗。

提問2:我來自北京外國語大學兒童語研究中心。沒有測量就沒有進步,AI在助力教育,目前咱們所出的相關題目如何保證它的信效度?我看到洋蔥學園上的練習的內容,質量高與低決定學生學習時間的效率高與低。與此同時,這個題目的信度和效度決定A學生、B學生和C學生同樣做一道題精准度,以及這道題出的可信度高不高。AI如何賦能考試和測評能達到更高的信度和效度?

林健:洋蔥學園有“老中青”三代組成的專業教研團隊,其中既包括有30多年教齡的學科帶頭人、教研員,退休後被我們聘爲課程顧問,也包括有多年公立校教學經驗的教育者。他們在教研時會考慮怎麽做學生學習能力的分層,並且針對不同的分層提供更適合的學習內容。

其次,洋蔥學園的習題很多取自于全國各地各種考試的真題。我們會做的一件事情是,由專業的教研團隊爲這些題打上科學的標簽。基于這些標簽和大量用戶學習真實情況,我們能夠從數據維度識別到某種學習水平或者某種學習習慣的某類用戶,他們在答具備某些標簽的題時正確率如何,他們的成長或者學習提升情況如何。結合這些真實數據和教研團隊判斷,我們會進一步完善標簽設計和內容推薦的策略,進一步提升整體的學習效果。

提問3:洋蔥學園也做了數學的AI答疑輔導,一個特別普遍的問題是,國內外數學AI答疑輔導裏都可能有大模型幻覺帶來的不准確的問題。您怎麽看這個問題?

林健:這個問題特別好。

首先這是一個工程問題,同時也是一個一邊做、一邊等風來的問題。

答疑場景怎麽解決大模型幻覺,我們也做了非常多的測試。落地層面,首先,我們需要確保大語言模型給用戶的回答是基于一個可選的回答框架下的,我們把給用戶答疑的過程拆解成一個個的中間環節,讓每個環節盡可能可控,每個環節裏讓大模型解決它能力範圍內做得比較好的一個點,確保最終輸出的結果可用度比較高。

舉個例子,比如我們肯定不能完全借助大模型給到一個題的正確答案。這種情況下,我們會從許多方面嘗試控制它。比如我們要確保這道題在我們的題庫裏有正確答案,有標准解析。我們讓大模型基于標准解析,符合洋蔥講述標准和課程設計邏輯思路,把這個課程一步步地用適合學生學習和理解的方式潤色拆解,再一點點地給到學生。比如第一步該如何分析思考這個問題,第二步要得到這個結論應該具備哪些能力,一步步地拆解給到用戶。

我們要做的,第一個是工程設計,讓這個事情盡量可控,第二個是盡量不讓大模型做它做不好的事。這也是爲什麽今天大家打開洋蔥學園會發現,AI智能答疑還不是所有學段都有的功能。它也在逐漸叠代優化測試,讓其可用度一步步變得更高。

所以我們要先做,同時等風來,此時此刻我們能做的就是盡可能地控制這個風險。

END

本文整理:徐晶晶

《教育科技這一年·2022》+《培訓行業這一年·2021》+《教育科技行業圖譜2022-2023》,重磅發售!
0 阅读:0

科技多知人

簡介:感謝大家的關注