分析師觀點:Sora正式發布前,多模態大模型爆發前夜的10個思考
OpenAI發布使用Sora大模型生成的1分鐘短視頻后,正式全面打開了生成式AI的想象空間。盡管目前尚未正式對外開放使用,也無法了解到更多技術細節,但可以確定的是這一波技術迭代將為AI行業參與者帶來可觀的機遇。
本文引用地址:http://www.ex-cimer.com/article/202402/455590.htmSora對于生成式AI的影響:在文生視頻領域真正邁出了第一步,真正做到生成式AI驅動生成短視頻。接下來也將刺激其他科技巨頭加快在該領域的技術攻關力度以及產品發布速度。
不可預測的未來:具體哪些公司能在什么時間點推出與Sora類似的產品,不可預測。當前Sora生成的是1分鐘的視頻,對于行業已經是重大突破,下一步何時能生成2分鐘5分鐘以上的視頻,不可預測。
最先應用的領域:將最先應用于短視頻、廣告、互娛、影視、媒體等領域。在這些領域采用多模態大模型能力,輔助人類員工生成視頻,既可以提高生產速度又可以提高生產數量,還可以創造全新的視覺感受,能夠幫助企業真正實現降本增效、提升用戶體驗。
哪些公司有潛力快速推出類似產品:幾個最有潛力的群體——在大模型以及AI領域投入最為領先的科技巨頭,如BAT、科大訊飛等;在計算機視覺領域擁有深厚積累的公司,比如商湯、??狄活惖墓?;以及短視頻類公司;更可大膽想象,也或許會培訓出多模態大模型的全新創企。
對于AI產業的影響:大語言模型為AI產業帶來新的生機,然而語言模型的應用場景有限。要全面打開生成式AI的想象力,還是要依托多模態大模型。Sora的發布,以及后續科技巨頭的跟進,有望對AI產業帶來再一輪爆發式的增長。
對于個體的影響:不管您是否感受得到,于個人而言,生成式AI產品已經在潛移默化的改變我們的生活方式,每一個人都可以認真考慮該類產品如何能夠助力我們的生活與工作。
生成式AI對于全球數據空間的改變:未來5年,生成式AI生成的文本類文件、圖像類文件、視頻類文件、軟件代碼類文件數量將會越來越平均。而這其中,與圖像文件相關的數據量可能是文本文件的 100 倍,視頻文件是圖像文件的 10 倍。整體來看,由于 GenAI 的采用和使用日益增多,近期和遠期所創建數據的增長速度都將快于近幾年。
行業發展的挑戰:
● 高質量數據的稀缺:圖像、視頻類數據掌握在少數公司手中。這些數據也需要標注,甚至重新采集,才能用于大模型的訓練。
● 多模態大模型對算力的消耗更高,算力的可獲取性以及成本將是挑戰之一。
● 頂尖的大模型研發人才,也是行業發展的稀缺資源。
值得關注的事項:多模態大模型將帶來更嚴峻的安全方面的挑戰。一方面多模態大模型將讀取更多的圖像、視頻類數據,這些圖像視頻數據是否合規是否安全,需要得到保障;另一方面,生成的視頻與真實世界之間的差異,是否會影響到人身安全、社會穩定、企業安全等,也需要注意。
做好準備:大語言模型的研發歷程已經能夠看到數據的重要性。在多模態大模型領域,有數據資源的企業可以考慮如何將這些數據開發成可供模型訓練的數據產品,缺乏數據資源的企業也需要盡早收集能夠獲取到的數據源。
免責聲明
本文中的內容和數據均來源于IDC所發布的報告,所有內容及數據均為我公司所有。未經IDC書面許可,任何機構和個人不得以任何形式翻版、復制、刊登、發表或引用。
評論