美好世界還得依賴人工智能從技術到產品轉化
近年來,人工智能領域出現了很多新應用、新產品,例如,借助自然語言處理技術,微軟開發(fā)了一款同聲傳譯軟件——Skype Translator(實時語音翻譯技術);借助計算機視覺技術,格靈深瞳開發(fā)了一款能智能識別犯罪的視頻監(jiān)控設備,Face++開發(fā)了人臉識別云服務;借助于知識表示、規(guī)劃和決策技術,反恐秘密武器和認知能力多面手IBM Watson被研發(fā)了出來。
本文引用地址:http://www.ex-cimer.com/article/201809/391666.htm微軟的Skype Translator同聲傳譯產品
2014年5月,在微軟Code代碼發(fā)布大會上,推出了一款名為Skype Translator的同聲傳譯產品。這款產品是Skype(全球免費的語音溝通軟件)聯(lián)合微軟的機器翻譯團隊共同研發(fā)的,其中匯集了機器翻譯技術、語言聊天技術和神經網絡語言識別技術等,能夠實現同聲傳譯。
在Code大會上,相關人員對這款軟件進行了測試,讓兩個不同語種的人借助Skype Translator面對面進行交流,結果二人的交流非常順暢。借助于Skype Translator,當一人說出一句話時,系統(tǒng)就會開始進行翻譯,翻譯結果會傳達到另一個人的耳中,并以字幕的形式在屏幕上顯示出來。借助于這款產品,不同語言、不同口音都能被識別出來,為國際交流提供了極大的便利。
現如今,Skype Translator的開發(fā)還處于早期。未來,隨著Skype Translator研發(fā)的日益深入,世界的交流方式將得以改變。
格靈深瞳的智能視頻監(jiān)控系統(tǒng)
如今,攝像頭在監(jiān)控周邊環(huán)境安全方面發(fā)揮了巨大的作用,但是普通的攝像頭監(jiān)控有兩方面缺陷。
一方面,普通的攝像頭監(jiān)控只能記錄,不能自動識別,且監(jiān)控范圍、監(jiān)控場景都有限。例如,要完完全全地監(jiān)控一個機場,就要安裝幾萬臺攝像頭,另外還需專門安排幾個工作人員負責監(jiān)控視頻。并且,由于監(jiān)控畫面采用輪播機制,視頻監(jiān)控畫面會按一定的時間周期自動切換,使得很多信息被忽略,難以達到有效監(jiān)控的目的。
另一方面,查詢歷史監(jiān)控記錄很困難。監(jiān)控視頻記錄要消耗的硬盤資源非常大,據測算,目前,全球監(jiān)控視頻的存儲已經占據了3/4的硬盤資源。舉個更為形象的例子,某廣場每天的監(jiān)控視頻記錄,如果刻錄在硬盤中,這些硬盤疊加起來的高度甚至能超過埃菲爾鐵塔。面對如此龐大的視頻數據,要想依靠人眼搜尋某個畫面或者某個人,不僅要耗費大量的人力資源,還要消耗大量的時間,效率極低,效果也不佳。
為了解決這個問題,格靈深瞳,一家于2013年成立的致力于計算機視覺開發(fā)的人工智能公司,研發(fā)出了智能視頻監(jiān)控系統(tǒng)。
格靈深瞳對三維視覺感知技術進行了深入研究,使智能視頻監(jiān)控系統(tǒng)能對人、物進行精確的檢測與跟蹤,能對人的動作姿態(tài)和運動軌跡進行精確的檢測和分析,其中動作姿態(tài)包括暴力、跌倒等,人物運動軌跡包括逆行、徘徊等。如果發(fā)現異常,系統(tǒng)就會自動發(fā)出報警信號提醒安保人員,保證安保人員能夠及時發(fā)現異常,這就解決了普通監(jiān)控容易漏掉信息的問題。同時,智能視頻監(jiān)控系統(tǒng)還能借助三維視覺感知技術將人物特征抽離出來,對其進行跟蹤、檢測和搜索,為畫面、人物查詢提供極大的方便。
目前,格靈深瞳的智能視頻監(jiān)控系統(tǒng)已經在銀行進行了測試。未來,如果該系統(tǒng)能在各領域得到廣泛應用,將會有效地改善現存的各種安全問題。
Face++的人臉識別云服務
Face++是一個為用戶提供人臉識別云服務的平臺。開發(fā)者借助于該平臺提供的開放的人臉識別云服務,能將面部識別功能引入自己的產品。
產品的研發(fā)人員借助Face++提供的離線引擎和API(應用程序接口)接入就能享受到免費的人臉檢測、人臉分析及人臉識別服務。首先,借助于人臉檢測服務,用戶能從眾多的圖片中快速地搜尋到目標圖片;其次,借助于人臉分析服務,用戶能通過人臉提取各種信息并進行分析;最后,借助于人臉識別服務,用戶能對給定人臉的相似度進行匹配。
Face++的這種人臉檢測、識別、分析技術用于美圖秀秀等軟件,能對人面部需要美化的部位進行精確定位,實現自動美化。當然,這種應用只是人臉識別云服務的初級應用。在高級應用階段,人臉識別云服務能夠幫助用戶進行圖片搜索。例如,借助于人臉識別云服務,婚介所能夠根據用戶對另一半的描述在其數據庫中進行搜索,找到相匹配的信息,以滿足客戶需求。而且,Face++和360搜索簽訂了合作協(xié)議,在360圖片搜索中用戶可以使用人臉識別云服務來搜尋自己要想的圖片。
另外,在安全領域,借助人臉識別云服務,Face++推出了一個“云臉應用鎖”的應用軟件,只需掃描人臉、設置備用密碼,就能為需要加密的內容提供保護。在打開這些內容的時候,必須進行人臉識別。通過這款應用,用戶的很多隱私信息都能得到有效的保護。
Palantir:CIA(美國中央情報局)的反恐秘密武器
Palantir是一家大數據挖掘分析公司,它將人工智能算法與強大的引擎整合在一起,它能借助引擎對多個數據庫進行掃描,借助人工智能算法對數據庫信息進行處理,并允許用戶對相關信息進行快速瀏覽。目前,其產品已經被CIA、FBI(美國聯(lián)邦調查局)、私人調查機構等多種機構所使用。
FBI、CIA等機構的數據庫非常多,且數據庫中的內容非常豐富,涵蓋了包括財務數據、語音資料、DNA樣本、各地地圖在內的多種信息。要想將這些數據中的信息聯(lián)系到一起,需要消耗巨大的時間成本和人力成本。并且,即便各個數據庫之間建立了聯(lián)系,不同種類數據的開發(fā)應用也面臨著較大困難。Palantir所研發(fā)的產品就很好地解決了這些問題,將數據庫的開發(fā)應用變得更加簡單。除此之外,對于各種安全問題,Palantir也保持著非常高的敏感度。
Palantir公司這種對數據庫的梳理、整合能力,在計算機時代引發(fā)了一場革命?,F如今,Palantir公司開發(fā)的產品成為美國情報機關反恐的必備工具。在“9.11事件”發(fā)生之后,Palantir幫助情報人員解決了很多技術難題——從大量的數據中迅速篩選出有用的線索,為反恐工作提供了有力的支持。
目前,除了安全、反恐,Palantir的業(yè)務范圍也開始向醫(yī)療、生物科技、零售、保險等領域滲透,例如,利用Palantir偵破醫(yī)療保險詐騙案等。在美國,Palantir公司深受歡迎,其年收入早已超過了10億美元,且仍在以每年3倍的速度增長,可謂是人工智能領域的楷模。
IBM Watson:認知能力強勁的多面手
Watson是一個龐大的計算機系統(tǒng),IBM服務器的數量為90臺,計算機芯片有360個,Power 7系列處理器(目前RISC架構中功能最強大的處理器)有2880個,其體積相當于10臺普通冰箱。這個龐大的計算機系統(tǒng),其內存容量達15TB,運算速度達80萬億次每秒。
Watson是IBM公司在深度開放域問答系統(tǒng)工程(DeepQA)技術基礎上開發(fā)的一個計算機系統(tǒng)。借助于DeepQA技術,Watson能讀取百萬級的頁面文本數據,能借助深度自然語言處理技術針對某一問題給出備選答案,能對問題進行有效評估。其系統(tǒng)內部預先設置的100多套算法能在3秒之內給出問題的答案,它能針對某個問題對海量信息進行檢索、篩選,并能將其答案以人類語言輸出。
為了使Watson實現這些功能,其系統(tǒng)中存儲著海量的圖書、劇本、新聞、文選等資料。在對題目進行讀取之后,Watson就會自動對其資料進行檢索,在3秒之內給出答案。
2006年,IBM公司開始致力于Watson系統(tǒng)的研發(fā);2011年2月,Watson系統(tǒng)在危險地帶智力搶答游戲中一戰(zhàn)成名;2011年8月,Watson系統(tǒng)被引入醫(yī)療領域。在醫(yī)療腫瘤學領域,Watson收錄了眾多文本資料,如42種關于腫瘤學的醫(yī)學期刊、60多萬條臨床試驗的醫(yī)療數據、200多萬頁的文本資料等。在癌癥治療領域,Watson能夠在幾秒內完成對150多萬份患者記錄的篩選,其內容包括患者病歷、治療方案和治療結果等,為癌癥治療提供有效的治療方案。目前,全球癌癥治療效果排名前三的醫(yī)院都在使用Watson系統(tǒng)。
2012年3月,Watson系統(tǒng)被引入金融領域,花旗集團是第一位客戶。Watson幫助花旗對其用戶需求進行分析,對金融、經濟和用戶數據進行處理,并幫助其構建了極具個性的數字銀行,還幫助其搜尋可能發(fā)生的金融風險、可能產生的收益以及可能存在的客戶需求。
目前,無論是醫(yī)療信息、金融信息還是其他的信息都在飛速增長,都為Watson系統(tǒng)的開發(fā)應用提供了絕佳的商機。
總之,隨著技術的突破性進展,隨著各IT巨頭在人工智能領域投入的不斷增加,人工智能正在快速發(fā)展,正在以某些領域為切入點改變著世界,推動世界朝著更好的方向發(fā)展。
評論