SAS將提供基于Hadoop的開(kāi)創(chuàng)性大數(shù)據(jù)分析技術(shù)
全球領(lǐng)先的商業(yè)分析軟件與服務(wù)供應(yīng)商SAS公司正在開(kāi)發(fā)一種基于SAS內(nèi)存分析技術(shù),并適用于開(kāi)源框架Hadoop的交互式分析編程環(huán)境。新軟件通過(guò)更快地挖掘大數(shù)據(jù)獲取更精確商業(yè)洞察,幫助企業(yè)提升盈利、降低風(fēng)險(xiǎn)、增進(jìn)對(duì)客戶的了解以及創(chuàng)造更多商業(yè)成功的機(jī)會(huì)。
本文引用地址:http://www.ex-cimer.com/article/233739.htmSAS®In-MemoryStatisticsforHadoop能夠讓多用戶同時(shí)并交互地管理、挖掘和分析數(shù)據(jù),建立和比對(duì)模型,以及對(duì)Hadoop框架內(nèi)的海量數(shù)據(jù)進(jìn)行評(píng)分。Hadoop開(kāi)源框架被廣泛認(rèn)為是大數(shù)據(jù)未來(lái)發(fā)展方向。SAS軟件將在2014年上半年內(nèi)幫助數(shù)據(jù)科學(xué)家大幅提高工作效率。
“SAS®In-MemoryStatisticsforHadoop可單次載入Hadoop數(shù)據(jù)并將其保存到內(nèi)存中供多用戶進(jìn)行一個(gè)會(huì)話內(nèi)的多類型分析,相比之下,其他需要將數(shù)據(jù)寫入磁盤的方式面臨的問(wèn)題是:所有的數(shù)據(jù)傳輸對(duì)于大數(shù)據(jù)處理而言都是極其低效的。”SAS分析服務(wù)器研發(fā)部門高級(jí)總監(jiān)OliverSchabenberger表示,“我們正致力于幫助數(shù)據(jù)科學(xué)家、建模師和統(tǒng)計(jì)員減少使用多種分析編程語(yǔ)言,擺脫各種工具混合使用的繁瑣。SAS®In-MemoryStatisticsforHadoop支持所有類型的數(shù)據(jù)分析,為協(xié)同分析開(kāi)辟一條快速、強(qiáng)勁和綜合的途徑。”
SAS®In-MemoryStatisticsforHadoop支持的統(tǒng)計(jì)和機(jī)器學(xué)習(xí)建模技術(shù)包括:聚類、回歸、廣義線性模型、方差分析、決策樹(shù)、隨機(jī)決策森林、文本分析和推薦系統(tǒng)。SAS可視化分析(SAS®VisualAnalytics)采用的內(nèi)存分析技術(shù)也被應(yīng)用到SAS®In-MemoryStatisticsforHadoop中。SAS內(nèi)存架構(gòu)為數(shù)據(jù)分析提供前所未有的速度—這對(duì)于在海量數(shù)據(jù)中挖掘價(jià)值來(lái)說(shuō)必不可少。
為什么選擇Hadoop?
市場(chǎng)研究機(jī)構(gòu)IDC預(yù)測(cè)到2016年,Hadoop將實(shí)現(xiàn)8.128億美元的銷售額—復(fù)合年增長(zhǎng)率達(dá)到60.2%。SAS期望客戶能夠借助Hadoop繼續(xù)將大數(shù)據(jù)轉(zhuǎn)化為卓越洞察。
“Hadoop對(duì)累積了海量數(shù)據(jù)資產(chǎn)的企業(yè)來(lái)說(shuō)意義非凡。SAS致力于幫助這些部署大數(shù)據(jù)架構(gòu)的企業(yè),運(yùn)用行業(yè)最頂尖的分析技術(shù)實(shí)現(xiàn)大價(jià)值,”SAS首席數(shù)據(jù)科學(xué)家WayneThompson表示,“在大數(shù)據(jù)理念大熱之前,SAS便開(kāi)始著力于服務(wù)大數(shù)據(jù)用戶。隨著技術(shù)的發(fā)展,我們也不斷滿足變化的客戶需求,實(shí)現(xiàn)客戶所想。”
他還提到SAS與Hadoop生態(tài)系統(tǒng)中知名公司Cloudera和Hortonworks進(jìn)行了戰(zhàn)略合作,使客戶在受歡迎的Hadoop分布中有機(jī)會(huì)使用行業(yè)領(lǐng)先的分析技術(shù)。
Hadoop可以在商業(yè)服務(wù)器集群上分布數(shù)據(jù)和執(zhí)行并行處理,還能偵測(cè)和處理對(duì)于分布式處理至關(guān)重要的故障。Hadoop除了具備低成本分布式硬件和數(shù)據(jù)冗余安全模式之外,還擁有以下一系列顯著優(yōu)勢(shì):
?并行處理—Hadoop分布式計(jì)算模型擁有海量數(shù)據(jù)處理能力。
?可擴(kuò)展性—可通過(guò)添加節(jié)點(diǎn)輕松擴(kuò)展Hadoop系統(tǒng)。
?存儲(chǔ)靈活性—與傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)不同,數(shù)據(jù)無(wú)需為存儲(chǔ)進(jìn)行預(yù)處理。Hadoop能夠輕松存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù)。
SAS公司大中華區(qū)總裁吳輔世先生表示:“大數(shù)據(jù)的興起促成了底層開(kāi)源Hadoop技術(shù)的繁榮。我們也看到了Hadoop蘊(yùn)含的潛在商機(jī),它成本更為低廉、部署更為簡(jiǎn)單、能夠存儲(chǔ)文本等非結(jié)構(gòu)化數(shù)據(jù),可滿足企業(yè)所需。目前,Hadoop在國(guó)內(nèi)的應(yīng)用愈加廣泛,尤其是在電信業(yè)和金融業(yè)。SAS希望能夠在Hadoop中引入強(qiáng)大分析技術(shù),幫助企業(yè)從Hadoop部署中獲取價(jià)值。”
評(píng)論