《IDC Innovator:智能文檔處理(IDP),2022》正式發(fā)布
隨著數(shù)字化轉(zhuǎn)型的不斷推進,企業(yè)數(shù)據(jù)量呈現(xiàn)出爆炸式增長。IDC Global DataSphere顯示,2021年,全球數(shù)據(jù)總量達到了84.5ZB,預(yù)計到2026年,全球結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)總量將達到221.2ZB。在快速增長的數(shù)據(jù)中,由于格式復(fù)雜、標準多樣,非結(jié)構(gòu)化數(shù)據(jù)處理起來既困難又耗時。面對海量非結(jié)構(gòu)化數(shù)據(jù),如果沒有自動化解決方案,人工手動處理將面臨巨大挑戰(zhàn)。智能文檔處理可以把關(guān)鍵信息從半結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)中提取出來,形成結(jié)構(gòu)化數(shù)據(jù),進一步實現(xiàn)業(yè)務(wù)流程的端到端自動化。
本文引用地址:http://www.ex-cimer.com/article/202301/442663.htmIDC定義的智能文檔處理(IDP),是指能夠從各種文檔格式中捕捉、提取和處理數(shù)據(jù),它利用自然語言處理 (NLP)、計算機視覺(CV)、深度學(xué)習(DL)和機器學(xué)習 (ML) 等人工智能技術(shù),對相關(guān)信息進行分類、歸類和提取,并對提取數(shù)據(jù)進行驗證。
本次研究IDC對眾多安全廠商和最終用戶進行了深入訪談,發(fā)現(xiàn)最終用戶在其數(shù)據(jù)安全建設(shè)前或建設(shè)過程中普遍面臨數(shù)據(jù)安全建設(shè)無從入手、摸清家底難、分類分級落地難、對于數(shù)據(jù)安全風險和建設(shè)成果的無感知以及缺乏專業(yè)的數(shù)據(jù)安全建設(shè)治理人才等問題。
針對以上痛點,IDC給出以下幾點建議供技術(shù)買家參考:
1.多模態(tài):能夠利用NLP/CV/OCR等多模態(tài)算法對全域非結(jié)構(gòu)化大數(shù)據(jù)進行充分且統(tǒng)一的結(jié)構(gòu)化處理和精準索引;
2.超大規(guī)模預(yù)訓(xùn)練:感知+決策完整智能化流水線閉環(huán),讓模型在專業(yè)領(lǐng)域擁有接近技能專家的性能表現(xiàn)及復(fù)雜工作場景的替代能力;
3.Auto Automation:將遷移學(xué)習和自動機器學(xué)習應(yīng)用到智能文檔領(lǐng)域,大幅降低整體擁有成本和定制化效率,并提供跨組織、跨領(lǐng)域的規(guī)?;瘮U展能力和持續(xù)學(xué)習迭代能力。
智能文檔處理技術(shù)的應(yīng)用價值主要在于:
1.構(gòu)建統(tǒng)一的面向全域非結(jié)構(gòu)化數(shù)據(jù)處理的基礎(chǔ)設(shè)施能力避免重復(fù)投資
2.可帶來直觀的生產(chǎn)力替代與人均產(chǎn)能提升,滿足降本增效剛需;
3.提升部分行業(yè)/業(yè)務(wù)/流程核心生產(chǎn)要素,實現(xiàn)重構(gòu)與智能化升級。目前在金融、政府和大型企業(yè)已獲得技術(shù)驗證并處于業(yè)務(wù)需求爆發(fā)的早期階段,隨著與應(yīng)用和流程自動化的深度整合,潛在的應(yīng)用場景廣泛普及空間較大。
本報告聚焦智能文檔處理領(lǐng)域,介紹目前在技術(shù)、商業(yè)模式等方面有一定創(chuàng)新性的中國公司。本報告提供了北京數(shù)據(jù)項素智能科技有限公司、來也科技(北京)有限公司、全面智能(廈門)科技有限公司三家企業(yè)的研究概述(排名不分先后),體現(xiàn)了各廠商在智能文檔處理方面的差異化特征。
分析師觀點
IDC中國人工智能高級分析師程蔭表示,智能文檔處理(IDP)技術(shù)能夠更高效地將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),幫助企業(yè)解決數(shù)據(jù)方面的挑戰(zhàn),目前已處于業(yè)務(wù)需求爆發(fā)的早期階段,隨著與應(yīng)用和流程自動化的深度整合,潛在的應(yīng)用場景將變得越來越普及,各個行業(yè)用戶應(yīng)當積極關(guān)注。技術(shù)供應(yīng)商也應(yīng)升級多模態(tài)、超大規(guī)模預(yù)訓(xùn)練模型、圖神經(jīng)網(wǎng)絡(luò)、自動化等方面的底層能力,給行業(yè)用戶帶來更具差異化的產(chǎn)品和服務(wù),幫助企業(yè)實現(xiàn)數(shù)據(jù)處理的效率提升和成本節(jié)約?!?/p>
評論