英特爾與星環(huán)科技再攜手,打造大語言模型訓(xùn)練新“利器”
近日,英特爾與星環(huán)科技在2023中國國際進(jìn)口博覽會(huì)上,聯(lián)合發(fā)布了AIGC向量數(shù)據(jù)庫解決方案,旨在支持多樣化機(jī)器學(xué)習(xí)模型生成的海量向量數(shù)據(jù),滿足企業(yè)針對(duì)海量向量數(shù)據(jù)的高實(shí)時(shí)性查詢、檢索、召回等需求,為人工智能時(shí)代多元化應(yīng)用場景提供有力支持,為企業(yè)業(yè)務(wù)加速發(fā)展提供助力。
本文引用地址:http://www.ex-cimer.com/article/202311/452593.htm隨著大語言模型的發(fā)展,生成式AI開始逐漸應(yīng)用于千行百業(yè),企業(yè)對(duì)大語言模型解決方案的時(shí)效性、準(zhǔn)確度等方面的要求逐漸提高。而當(dāng)整個(gè)大模型的參數(shù)在百億級(jí)別的時(shí)候,它具備了初步的自然語言理解能力。但如果希望大模型能夠去做一些文本輸出、編碼輸出,它的整個(gè)參數(shù)量級(jí)至少要到300-500億,但是即使到達(dá)這樣的量級(jí),其準(zhǔn)確率也只有50%左右。如果希望整個(gè)大模型具備比較好的準(zhǔn)確度,它的良好推理能力、計(jì)算能力,具備比較好的邏輯思維能力的話,整個(gè)大模型的參數(shù)量要到5千億的量級(jí)。
除此之外,當(dāng)將大模型應(yīng)用于垂直、專業(yè)領(lǐng)域的時(shí)候,其缺乏專業(yè)的大模型的行業(yè)數(shù)據(jù)、提供的信息具備不確定性等問題均亟待解決。因此,當(dāng)采用文本嵌入的方式,把最新的信息、行業(yè)的信息,全部向量化之后存到數(shù)據(jù)庫里面,則不僅能夠?yàn)榫徑獯竽P蛪毫Γ€可以提供更具時(shí)效性的信息?;诖?,星環(huán)科技推出基于第四代英特爾至強(qiáng)可擴(kuò)展處理器的Transwarp Hippo分布式向量數(shù)據(jù)庫解決方案。得益于第四代英特爾?至強(qiáng)?可擴(kuò)展處理器的高內(nèi)存帶寬優(yōu)勢和多核性能優(yōu)勢,該數(shù)據(jù)庫解決方案的靈活性得到顯著增強(qiáng);而VNNI指令集也進(jìn)一步提升了向量計(jì)算的性能。從測試結(jié)果可以看到,Transwarp Hippo分布式向量數(shù)據(jù)庫解決方案整體性能得到了20%-30%左右的提升。
憑借高可用、高性能、易拓展等特性,Transwarp Hippo在大模型場景中,可以極大地拓展大模型的應(yīng)用邊界,讓大模型保持信息實(shí)時(shí)性,并能夠動(dòng)態(tài)調(diào)整,使大模型擁有“長期記憶”,解決“AI幻覺”的問題。
英特爾中國軟件技術(shù)合作事業(yè)部總經(jīng)理唐炯指出,人工智能技術(shù)的高速發(fā)展,不僅為全球數(shù)字經(jīng)濟(jì)注入全新動(dòng)力,也為企業(yè)在多樣化業(yè)務(wù)場景中帶來更多全新挑戰(zhàn)。深耕人工智能領(lǐng)域多年,英特爾致力于以前瞻性視角,攜手生態(tài)伙伴一道,通過產(chǎn)品技術(shù)創(chuàng)新,打造滿足不同業(yè)務(wù)需求的解決方案,加速大模型應(yīng)用落地。
評(píng)論