緩解字節AI焦慮的超級應用:剪映or豆包?

新莓daybreak 2024-05-31 15:29:43

“「Sora殺死剪映」是流量時代的吸睛說法,卻可能講出一些人的期望。”

撰文|李歡

編輯|翟文婷

張一鳴把抖音最重要的兩個人物,都放在AI相關的核心位置。

今年2月,OpenAI發布視頻生成模型Sora過去9天後,張楠放下抖音CEO的位置,聚焦剪映。看上去這是一個舍大取小的舉動,甚至有被流放之嫌。事實是,和陳林當初負責教育業務一樣,張楠在爲字節攻克新高地。

一位剪映內部人士告訴新莓daybreak,其實張楠一直在負責剪映,只是現在全人力投入,在組織架構層面做出了不小的調整,包括精簡組織,高管調動。

差不多三個月後,朱駿現身豆包大模型發布會。他跟張楠的軌迹類似,都是創立的公司被字節收購,本人加入,而且倆人都是抖音和TikTok崛起的關鍵人物,現在又都投身大模型。朱駿現在是字節AI主力部門Flow的産品線負責人。

其實今年4月份,字節還晉升了一位重要人物朱文佳,他曾擔任過今日頭條CEO,現在直接向CEO梁汝波彙報,常年base在新加坡。朱文佳領導的AI團隊在內部被稱爲「Seed」,社交平台曝出來的組織架構中,他還是Flow的業務負責人。

一目了然。字節正在把曾經「打贏過硬仗」的核心高管,以重火力的形式布局在AI。

張一鳴應該很早就預感到這場生産力變革的沖擊波。

AI生成視頻的探測早已開始,作爲全球短視頻最大平台,字節最具危機意識。梁汝波在內部信中警覺所有人,「AI技術對于內容創作會有很大的顛覆,甚至會産生新的創作平台」。

字節可能不是反應最早的,但現在看來是押注最多的。

字節需要自己的Sora。也許這是從0起步的新産品,比如新推出的「即夢」;也可能是快速響應趨勢,給出理想解決方案的剪映。

但是,假如AI 生成視頻新的創作平台不是出自字節……這會是個麻煩,而且是大麻煩。

「Sora殺死剪映」是流量時代的吸睛說法,卻可能講出了一些人的期望。那些摩拳擦掌的大模型公司,觊觎這樣的視頻發布入口,靜靜等待形勢劇變的機會,一擊而中。

一、抖音與剪映深度綁定

理解字節AI變革的承載是在剪映,需要先厘清剪映與抖音之間的關系。

國內中短視頻平台都有自己的視頻編輯工具。抖音對應的是剪映,快手推出快影,微信有秒剪,B站則是必剪。

這些剪輯工具基本功能大同小異,如果是出于運營一個賬號的動機和想法,這些低門檻、傻瓜式工具足矣。專業級選手在編輯大制作的時候,也許會需要PR或是Final cut。

爲什麽各家平台都要推出自己的剪輯工具?這有降低視頻創作門檻的動機,貢獻靈感,增加普通用戶的「投稿率」,最重要的是跟各個平台運營機制有強關聯性。

比如必剪的內容素材,各方面會更貼近適配B站社區用戶的喜好。最近大火的貓meme就是典型例證。

對剪映而言,它存在的意義和價值,也是更多服務抖音的內容生態。

晚點LatePost援引一位字節跳動人士曾說,沒有剪映,抖音裏的作品更多地會偏向 PGC (專業機構生産的內容),剪映提升了用戶創作的視頻的整體質量,讓 UGC (用戶生産的內容) 更統一、美觀。

剪映天生具備AIGC的場景優勢,尤其特效功能,跟抖音內容生態運營深度綁定。

前不久抖音遍地「掉入莫奈花園」的特效視頻,本質上就是AI創作的一種。剪映底部tab「剪同款」一鍵操作産生類似效果,大大降低普通用戶創作視頻的門檻,全民效仿,海量同款視頻充斥抖音,形成爆款效應。

抖音特效團隊前研發負責人王國晖在作客潘亂播客時解釋,字節內部,很長一段時把特效叫做道具。這種創作工具是抖音、TikTok的重要抓手,幫助普通人克服心理障礙,放松表達自己,此外特效也具備更強的跟拍和示範效應,而抖音是很強調跟拍心智的。

與此同時,字節有強大的團隊支撐,做精細化運營。在一些重大節日關鍵節點,涉及到用戶增長需求的時候,産品和運營團隊會前置參與到特效功能的設計,吸引用戶參與創作,增加投稿率,更多人被看見,被激發,參與跟拍,以此形成正循環。

但是假如,這個AI特效不是出自剪映,而是其他創作平台呢?並且這樣的事情一而再再而三的發生呢?

後果是,抖音就會失去視頻創作入口。久而久之,更是可能失去發布入口。

這個路徑字節太熟悉了。TikTok在海外起步的時候,在衆多創作者眼中,就是一款好用的編輯視頻軟件。活躍在Instagram的網紅,一開始被TikTok眼花缭亂又傻瓜式的特效吸引,先是剪輯編輯完成,上傳到Ins或Youtube,後來慢慢就留存在TikTok。

字節能做到,理論上其他人也能做到。大模型狂飙,Sora橫空出世,這個變數就大大增加了。

一位剪映內部人士告訴新莓daybreak,「公司從戰略層面肯定重視,而且不僅限于AI一鍵成片,包括AI處理素材、AI提效編輯這類功能也在發力。」他的觀點是,畢竟距離AI一鍵生成的實際落地還有很長路要走,就像GPT也沒從根本層面改變文字工作者的從業現狀。

火山引擎CEO譚待在接受媒體采訪時,針對字節在文生視頻領域是否有布局實現彎道超車的問題時回答,「沒有彎道超車,模型訓練要一步步技術紮實,如果基礎都做不好,那文生圖就是一個『人工智障』——因爲它連文字都不能理解,視頻能好到哪兒去?」

二、張楠的新使命

張巧是一家媒體視頻業務的負責人,有一天他們准備發布一個新聞熱點的分析視頻,但是負責配音的同事臨時有事,沒法及時響應。

她有留意到剪映之前推出過一些AI功能,嘗試找一下解決辦法。確實有款「克隆音色」的功能,只要真人輸入幾段話,AI就能仿真輸出。她試了一下,只要把速度調快,效果似乎不錯,氣口不如真人自然,但比預期要好。

但是在她把成片分享給同事後,大部分人反饋,沒有什麽情感,AI味道還是很重。最後只好放棄。

張巧告訴新莓daybreak,「最後那位同事花了一個多小時才錄好,文稿不是她寫的,需要時間熟悉。AI生成就很快,文字丟進去就好,我看重的就是效率。」

她甚至期望更早使用AI生成視頻,現在她團隊內人工剪輯一條2分鍾的視頻要耗費4個小時,還不算前期素材收集整理,單人一天最多剪輯兩條。限制産出的核心因素就在人工。

張楠必然了解這些創作者的心理。在全身心投入剪映之前,她曾花幾個月時間做大量用戶訪談,聽到了期待和不滿的聲音。帶著曆史包袱的剪映,轉型壓力更大。

這個2019年由字節收購公司臉萌團隊做出的産品,已經是國內用戶規模最大的視頻編輯工具。雖然各個中短視頻平台都有自己的剪輯工具,但剪映的使用率最高。最後一次公開數據顯示,2021年剪映月活爲1億。

與TikTok相匹配的CapCut,上線近4年,調研機構data.ai的報告顯示,2023年1月,這款産品的月活超過了2億,一度超越Instagram和YouTube成爲美國下載次數最多的免費App。

林洋日常制作的短視頻,會投放到淘寶的短視頻專區——逛逛,也會發布在抖音和B站。剛開始,他會使用pr,後來改用剪映,因爲效率高。他告訴新莓daybreak,「如果對短視頻質量要求不高,更看重數量,剪映很適合,每天能有産出10個左右」。

甚至新媒體從業者也在廣泛使用這款編輯工具。張巧說,她熟悉的一些官媒朋友都在使用剪映。

梁汝波在字節內部信中對張楠的描述是,她從0到1推出了抖音、剪映等備受用戶喜歡的産品。是的,從一開始張楠就是剪映的核心領導人物。而且據說,剪映從立項到上線,只花了三個月時間。抖音對剪映用戶的快速增長,也做出了巨大貢獻。

2019年,字節在收購FaceU的基礎上,建立了影像中台,包括相機特效中台等。有段時間這是張楠關注的重心之一。剪映就是從影像中台演化出來的一個獨立業務。郭列曾經的副手劉佳彬做過影像中台的負責人。

後來,這個中台孵化出包括剪映的輕顔、醒圖等産品和業務,他們與抖音、TikTok、西瓜視頻、今日頭條等字節系生態深度綁定。

張楠重掌剪映,剪映對于字節的重要性又拔高了一個層次。在張楠職務變動的正式消息公布前後,一些變化已經顯現。

2023年年底,剪映開始測試一個名爲「Dreamina」的文成圖AIGC工具。5月9日,這款産品被更名爲「即夢」,功能不再局限于文生圖。

目前來看,字節並未對這款産品過多曝光,産品也只有網頁版,並未出現在手機應用商店。

新莓daybreak登錄網頁版試用後發現,這款産品有圖片生視頻和文本生視頻兩個功能。最長可生成6秒的短視頻。我們輸入一段文字,産出一段3秒的視頻大概所需2-3分鍾,但視頻顯示的人物細節還與Sora差距較大。

除此之外,剪映也在做著AI主題的各種小動作——智能字幕、文字成片、視頻翻譯、音色克隆等功能。

這是對外用戶感知到的變化。對內她更是雷厲風行的做出諸多調整。

精簡組織的同時,人員調整,北京和深圳的團隊往來頻繁。有媒體引用一位剪映員工的表述,過去一年,他的直系領導更換了 5 個,負責的業務也不斷調整。張楠注重戰略工作,也關注競爭對手的動態,要求團隊「甚至比競爭對手自己還要了解産品」,包括但不限于核心功能、盈利點以及具體到某月某日發生的更新等。

三、字節趕場AGI競賽

剪映不是字節的唯一一張牌。前不久豆包大模型發布會,超過2600萬月活躍用戶的應用豆包,也可能承載文生視頻的使命。

朱駿在現場講解,如果你是一個自媒體的從業者,可以在豆包桌面版本上點擊「文案創作」這個「AI技能按鈕」,選擇「抖音文案」,然後填入主題「介紹建築師安藤忠雄」,一個分鏡頭的抖音視頻腳本就生成好了。

按照官方講述,豆包Pro模型能廣泛應用在問答、總結、創作、對話、分類等諸多場景。我們理解爲,視頻創作應該不會被排除在外。這分明就是內部賽馬的節奏。

現場譚待披露,過去一年,字節內部50多個業務開始大量使用豆包大模型嫁接AI,包括抖音、頭條、番茄小說等。不過在他的對外講述中,這個名單沒有提及剪映。

實際上,字節這個成績單似乎交得有點晚。

今日頭條是國內最早的人工智能信息分發平台,字節熟稔于算法、智能分發。但在去年,GPT爆發,公司高層批評對此敏感度不夠,AI由此被提升至字節戰略高點。

梁汝波在年初內部會議上反思,公司層面直到2023年才開始討論GPT,而業內做得比較好的大模型創業公司,都是在2018年至2021年創立的。

張一鳴也釋放出很多高度關注ChatGPT的信息。

去年4月,他在公開信中表示,「字節跳動無法錯過AGI。如同任何中國互聯網公司都無法錯過AGI。AGI可以解決組織的第二曲線增長困境。」公開信發布後的一個月,《中國企業家》雜志報道,張一鳴正在廢寢忘食地研讀OpenAI的系列論文。

早年間,字節在AI上傾注了大量心血,2016年成立的AI Lab,聚焦于自然語言處理、機器學習、數據挖掘等方面的研究。遺憾的是,AI lab並未堅持到最後,大概四年後核心人員離職,研究也放緩了腳步。

直到2023年ChatGPT問世,字節開始全力追趕AI。當年2月,字節部署了代號爲「Seed」的團隊,專注于模型層,由朱文佳帶隊。年底,又正式組建了一個新的AI部門——Flow部門,專注于AI大模型的應用研發層。字節産品與戰略副總裁朱駿和字節技術副總裁洪定坤,二人分別負責部門的産品線和技術線。

到了今年,字節還在不斷抽調體系內優秀高管人才至Flow部門。3月,有消息稱,飛書産品副總裁齊俊元也調至Flow部門,主要負責豆包的PC端業務。

最近,鳳凰網科技采訪到豆包的産品人士提到,今年以來,字節的AI業務,尤其是Flow,可以說是整個字節內部強度最大的部門,「基本上都是單休,但有幾個産品的數據表現還不錯,特別是豆包,內部士氣正旺」。

這一輪AGI競賽,字節雖然也在基礎大模型、面向開發者的中間連接層有産品響應,但外界更關注,或者決定字節命脈的還在于應用層。

去年中旬,字節在海內外分別推出豆包和Cici兩款AI對話産品。數據顯示,目前豆包/Cici的全球總DAU在300萬左右。今年4月,Flow部門又上線了一款名爲「星繪」的AI相機類APP,在國外也有一款功能相似的APP「Picpic」上線。

受益于豆包模型的剪映正在加速AI轉型。比如,在視頻內容的智能分析、自動標注、剪輯建議等方面,豆包大模型的算法能力可以極大提升剪映的智能化水平;又或者,在視頻編輯過程中,豆包大模型可以提供智能剪輯、自動配樂、特效生成等功能,幫助用戶更高效地完成視頻創作。

在所有字節系産品中,剪映被視爲是字節當下最有希望承接AI大模型落地的産品。

界面新聞曾報道一位知情人士分析稱,剪映是一個視頻創作工具,處于內容創作的上遊,往AI方向走即文生視頻。此外,剪映創作的視頻內容有抖音承接,創作者後續使用字節系的文生視頻、多模態數字人産品創作內容,都有較大的想象空間。

文生視頻的挑戰是顛覆性的,即使手握生態、數據和用戶,對于挑戰,字節仍需做足准備。

(應采訪對象要求,文中林洋,張巧爲化名)

0 阅读:16

新莓daybreak

簡介:理解人,發現變化