全民圍觀生成式AI,十問GPT與AIGC真實(shí)現(xiàn)狀與未來發(fā)展
——近日OpenAI陸續(xù)發(fā)布ChatGPT,GPT-4,引發(fā)了AI界的全民狂歡,文生圖類應(yīng)用如StableDiffusion、Midjourney以及DALL·E2也開始快速流行。百度則于3月16日召開文心一言發(fā)布會,展示了中國廠商的大模型以及生成式AI能力。
本文引用地址:http://www.ex-cimer.com/article/202303/444553.htm至此,人工智能市場正式開啟了全新的時代——大模型驅(qū)動的AI時代。
IDC定義的AI應(yīng)用均是指基于機(jī)器學(xué)習(xí)算法的AI決策系統(tǒng)。大模型則是指讀取海量數(shù)據(jù)、參數(shù)規(guī)模巨大的算法模型。業(yè)界一般認(rèn)為超過千億級參數(shù)即為大模型,其訓(xùn)練過程中可能使用了上千張以上的GPU/CPU芯片。ChatGPT與AIGC均為大模型的應(yīng)用場景之一。ChatGPT可以類比原有的對話式AI應(yīng)用、AI賦能的搜索類應(yīng)用。AIGC則可以分為生成文本、生成圖像、生成視頻,也可以歸為大模型的應(yīng)用場景之一。
GPT-4為代表的大模型的變革所在
OpenAI自發(fā)布GPT1.0模型之后,一直在持續(xù)迭代,陸續(xù)發(fā)布GPT2.0、GPT3.0和GPT 3.5,本次發(fā)布GPT4.0是其持續(xù)投入AI大模型的必然階段。相比前幾個模型,GPT-4的參數(shù)量更大,模型迭代時間更長,也能夠給出更準(zhǔn)確的結(jié)果。IDC認(rèn)為,新版本的發(fā)布是大模型循序漸進(jìn)發(fā)展的必然成果。正如百度集團(tuán)首席執(zhí)行官李彥宏所說:“公司每一年都會發(fā)布大模型的新版本,是多年努力的自然延續(xù)”。
ChatGPT可能帶來的產(chǎn)業(yè)影響
ChatGPT實(shí)質(zhì)是對話式AI的應(yīng)用,對話式AI的落地已經(jīng)非常廣泛。根據(jù)IDC追蹤的人工智能市場規(guī)模數(shù)據(jù),對話式AI市場規(guī)模在2022年達(dá)到54.6億元人民幣,其市場滲透率相對已經(jīng)飽和。ChatGPT引發(fā)的浪潮促使主流廠商在其對話式AI應(yīng)用中引入大模型,將帶動對話AI相關(guān)市場新一輪增長。此外,在搜索、營銷場景中,ChatGPT類型的應(yīng)用則可能衍生出全新的產(chǎn)品形態(tài)。
市面上可用的產(chǎn)品
關(guān)于AIGC,除了大眾所熟知的StableDiffusion, Midjourney以及DALL·E2之外,也有些商業(yè)公司對此提供云端支持。目前亞馬遜云科技通過IndustryAI以及SageMaker提供了Stable Diffusion的支持。百度的文心一言已于3月16日開啟邀測,提供文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯的推算、自然語言理解以及多模態(tài)生成五大功能。此外,還有很多數(shù)字人的公司也采用了AIGC相關(guān)技術(shù)。從技術(shù)的角度,當(dāng)前市面上的產(chǎn)品大多只能做到文生圖,文生視頻類產(chǎn)品的發(fā)布則還需要時間,值得期待。
關(guān)于大模型,在開源社區(qū)已經(jīng)發(fā)布的大模型之外,目前提供商用的大模型包括微軟Azure上整合的GPT大模型、百度智能云以及百度飛槳支持的文心大模型、華為云盤古大模型、阿里云M6大模型。由本土廠商研發(fā)的大模型,大多支持本地化部署。
引發(fā)的AI行業(yè)變革
過去幾年部署的AI應(yīng)用,接下來幾年都有可能被基于大模型的AI所替代。升級迭代可能會從優(yōu)先具備海量數(shù)據(jù)的場景開始。當(dāng)大模型支撐的AI應(yīng)用成為主流,不能利用大模型能力的廠商將失去競爭優(yōu)勢。
未來的工作中,AI助理將替代更多人類的工作。諸如文生圖的應(yīng)用,諸如各領(lǐng)域初級內(nèi)容的搜索,均可以借助AI生成的內(nèi)容。
可能的投資規(guī)模
目前已經(jīng)公開的大模型諸如GPT系列、Bert系列所耗費(fèi)的算力根據(jù)公開資料可以查到。而真正落地到產(chǎn)業(yè)界,具體的投資規(guī)模要視應(yīng)用場景決定。投資成本與所需的算力,是否部署完整的大模型,以及要推理的數(shù)據(jù)流量相關(guān)。
帶動的市場機(jī)會
純AI算力市場:在這一波AI熱潮中最先最直接受益的即AI算力提供商,包括芯片廠商、AI服務(wù)器廠商,以及支撐大模型訓(xùn)練和推理的AI算力云服務(wù)商。
大模型與算力的結(jié)合:即AIaaS+AIPaaS。為市場提供大模型與算力結(jié)合后高度優(yōu)化的方案,以幫助用戶降低硬件使用門檻、提高開發(fā)效率、降低整體投資成本。典型的解決方案如百度的“AI大底座”,商湯的“AI大裝置”。
大模型即服務(wù):開放大模型開發(fā)平臺供外部用戶使用。這一市場屬于高度創(chuàng)新的市場,但仍存在較高的進(jìn)入壁壘。
從何處著手跟隨本次AI浪潮
大模型廠商都在著手將現(xiàn)有的AI軟件升級為大模型支撐的AI應(yīng)用??梢愿鶕?jù)應(yīng)用場景優(yōu)先級與合作伙伴聯(lián)系引入大模型支持的AI。而在MaaS(模型即服務(wù))產(chǎn)品層面,市場上可選的成熟產(chǎn)品并不多,預(yù)計今年下半年會有數(shù)十家廠商的產(chǎn)品上線。可以率先選擇數(shù)據(jù)隱私要求不高的領(lǐng)域在公有云上測試大模型能力。
新一代AI需要注意的問題
生成式AI生成內(nèi)容的版權(quán)需提前規(guī)劃。生成式AI讀取海量數(shù)據(jù)后生成的圖片等內(nèi)容有可能會引起版權(quán)問題,需要提前從規(guī)則上加以控制。
對原有流程的改變:一方面生成式AI生成的內(nèi)容還需要人類審核才能發(fā)布,另一方面可能會要求工作流程上做出改變以適配AIGC的加入。
鑒于其仍處于技術(shù)成熟度的早期階段,在傳統(tǒng)行業(yè)應(yīng)用場景不十分清晰,投入產(chǎn)出比目前也難以評估。
跳出今天的AIGC看未來AI應(yīng)用
借鑒今天的文生圖、文生視頻類應(yīng)用,其實(shí)大多是基于過去幾年已有的小模型通過各種技術(shù)路線實(shí)現(xiàn)的AI應(yīng)用。類似的、各行各業(yè)的應(yīng)用場景,都可以基于現(xiàn)有的AI模型,以低代碼的形式拼接出人人可上手的AI應(yīng)用,甚至未來的AI應(yīng)用,都可能是輸入自然語言直接輸出結(jié)果的形式。
IDC中國研究總監(jiān)盧言霞表示,新一代AI熱度持續(xù)走高,然而由于其較低的技術(shù)成熟度、較高的部署成本,實(shí)際落地還需謹(jǐn)慎。但宏觀趨勢上,以大模型、生成式AI為代表的快速迭代的技術(shù)必然會催生全新的AI時代。
評論