52個有用的機器學(xué)習(xí)與預(yù)測接口盤點
隨著基于人工智能與機器學(xué)習(xí)的應(yīng)用如雨后春筍般不斷涌現(xiàn),我們也看到有很多提供類似功能的 API 悄悄登上了舞臺。 API 是用于構(gòu)建軟件應(yīng)用的程序、協(xié)議以及工具的組合;本文是對2015 中這個列表的修正與完善,移除了部分被廢棄的 API ;我們也添加了最近由 IBM、Google、Microsoft 這些大廠發(fā)布的 API 。所有的 API 可以根據(jù)應(yīng)用場景進行分組:
本文引用地址:http://www.ex-cimer.com/article/201710/365475.htm人臉與圖片識別。
文本分析,自然語言處理以及情感分析。
語言翻譯。
預(yù)測以及其他的機器學(xué)習(xí)算法。
在具體的每個分組內(nèi),我們根據(jù)首字母順序排序; API 的描述信息源自截止到 2017 年 2 月 3 日對應(yīng)主頁上的描述。如果你發(fā)現(xiàn)存在未被收錄的流行的 API 可以在評論中留言,我們會將其增補到列表中。
人臉與圖片識別
Animetrics Face RecogniTIon:?該 API 能夠用于圖片中的人臉檢測,并且將其與已知的部分人臉進行匹配分析;該 API 還支持從某個待搜索的集合中添加或者移除某個分類,或者從某個分類中添加或者刪除某張人臉圖片。
Betaface: 同樣是提供人臉識別與檢測的在線服務(wù)。它支持多人臉檢測、人臉裁剪、123 個人臉特征點提取、人臉驗證、識別以及大型數(shù)據(jù)庫中的相似性搜索提取。
Eyedea RecogniTIon:?致力于提供高階的計算機視覺解決方案,主要包括對象檢測與識別。其識別服務(wù)提供了常見的眼部、人臉、車輛、版權(quán)以及果盤識別,該 API 主要的價值在于對于對象、用戶以及行為的快速識別。
Face++: 為應(yīng)用提供面部的檢測、識別以及分析服務(wù),用戶可以通過 API 調(diào)用訓(xùn)練模型,進行人臉檢測、人臉識別、人臉分類、圖像修正、創(chuàng)建人臉分組等等服務(wù)。
FaceMark: 提供了能夠在正面照片中檢測 68 個特征點以及側(cè)面照片中檢測 35 個特征點的服務(wù)。
FaceRect: 提供了非常強力與完整的面部檢測的 API ,包括在正面照片與側(cè)面照片中檢測面部以及在單張照片中提取多個面部的功能;它還能將結(jié)果以 JSON 格式輸出,包括檢測到的眼睛、鼻子、嘴等等面部特征。
Google Cloud Vision API: 架構(gòu)于著名的?TensorFlow?之上,能夠高效地學(xué)習(xí)與預(yù)測圖片中的內(nèi)容。它能夠有助于用戶搜索最愛的圖片,并且獲取圖片中豐富的注釋。它還能將圖片按照船、獅子、埃菲爾鐵塔等等不同的類別進行分類,并且對照片中不同表情的面部進行識別,除此之外它還能將圖片中不同國家的語言打印出來。
IBM Watson Visual RecogniTIon: 該 API 能夠輔助理解圖片內(nèi)容,包括圖片標記、人臉識別、年齡估計以及性別判斷,還能根據(jù)人臉相似度進行搜索。開發(fā)者能夠在該服務(wù)的基礎(chǔ)上結(jié)合自身業(yè)務(wù)特點定制出各式各樣奇妙的產(chǎn)品。
Kairos: 該平臺方便開發(fā)者快速添加?情感分析?與?人臉識別?的功能到應(yīng)用與服務(wù)中。
Microsoft CogniTIve Service - Computer Vision: 該 API 能夠根據(jù)用戶輸入與用戶選擇分析可視化內(nèi)容。譬如根據(jù)內(nèi)容來標記圖片、進行圖片分類、人類識別并且返回他們的相似性、進行領(lǐng)域相關(guān)的內(nèi)容識別、創(chuàng)建圖片的內(nèi)容描述、定位圖片中的文本、對圖片內(nèi)容進行成人分級等。
Rekognition: 該 API 能夠根據(jù)社交圖片應(yīng)用的特點提供快速面部識別與場景識別。譬如基于人眼、嘴、面部以及鼻子等等特征進行性別、年齡以及情緒預(yù)測。
Skybiometry Face Detection and Recognition: 該 API 提供人臉檢測與識別服務(wù),新版本的 API 還提供了深色微分功能。
文本分析,自然語言處理,情感分析
提供了目前市場上來說幾乎最準確的基于情感的多主題識別,目前包括四個語義服務(wù):實體與概念抽取、情感分析與文本分類;該 API 總共支持 8 種不同的語言。
Diffbot Analyze: 為開發(fā)者提供了從任何網(wǎng)頁中識別、分析以及提取主要內(nèi)容與區(qū)塊的功能。
Free Natural Language Processing Service: 提供了包括情感分析、內(nèi)容提取以及語言檢測等功能。它同樣是 mashape.com 這個大型云 API 市場中的暢銷產(chǎn)品之一。
Google Cloud Natural Language API: 該 API 提供了對于文檔的架構(gòu)與含義進行分析的功能,包括情感分析、實體識別以及文本標注等。
IBM Watson Alchemy Language: 該 API 能夠輔助電腦學(xué)習(xí)如何閱讀以及進行一些文本分析任務(wù)。譬如將非結(jié)構(gòu)化數(shù)據(jù)按照領(lǐng)域模型轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),使其能夠服務(wù)于社交媒體監(jiān)測、商業(yè)智能、內(nèi)容推薦、商業(yè)交易以及定向廣告等等服務(wù)。
MeaningCloud Text Classification: 該 API 提供了部分預(yù)分類的功能:文本提取、分詞、停用詞設(shè)置以及同義詞提取等等。
Microsoft Azure Text Analytics API?基于 Azure Machine Learning 實現(xiàn)的一系列文本分析服務(wù)。該 API 能夠用于情感分析、關(guān)鍵語句提取、語言檢測以及主題識別這些非結(jié)構(gòu)化文本的處理任務(wù)。該 API 并不需要使用者提供相關(guān)的訓(xùn)練數(shù)據(jù),能夠大大降低使用門檻。
Microsoft Cognitive Service - Text Analytics: 提供了情感檢測、關(guān)鍵語句提取、主題以及語言分析等功能。該分組中其他的 API 還包括?Bing 拼寫檢測、語言理解、文本分析、Web 語言模型等等。
nlpTools: 簡單的采用 JSON 傳輸格式的提供了自然語言處理功能的 HTTP RESTful 服務(wù)。它能夠提供對于在線媒體的情感分析與文本分類等服務(wù)。
Semantic Biomedical Tagger: 能夠利用文本分析技術(shù)提取出文檔中的 133 個生物醫(yī)藥學(xué)相關(guān)的實體詞匯并且將它們鏈接到知識庫中。
Thomson Reuters Open Calais?: Calais 基于自然語言處理與機器學(xué)習(xí)技術(shù),能夠分類與關(guān)聯(lián)文檔中的實體信息(人名、地名、組織名等)、事實信息(員工 x 為公司 y 工作)、事件信息(員工 z 在 x 日被任命為 y 公司的主席) 。
Yactraq Speech2Topics?提供了基于語音識別與自然語言處理技術(shù)的將語音內(nèi)容轉(zhuǎn)化為主題數(shù)據(jù)的云服務(wù)。
語言翻譯
Google Cloud Translation: 能夠在數(shù)以千計的語言之間完成文本翻譯工作。該 API 允許網(wǎng)頁或者程序方便地接入這些翻譯服務(wù)。
IBM Watson Language Translator: 能夠在不同語言之間進行文本翻譯,該服務(wù)允許開發(fā)者基于獨特的領(lǐng)域術(shù)語與語言特性進行自定義模型開發(fā)。
LangId: 能夠快速地從多語言中檢索結(jié)果的服務(wù),并不需要使用者指定哪種語言,并且能夠返回結(jié)果對應(yīng)的語言類型。
Microsoft Cognitive Service - Translator: 能夠自動地在翻譯之前進行語言類型檢測,支持 9 種語言的語音翻譯以及 60 種語言的文本翻譯。
MotaWord: 快速地人工翻譯平臺,提供了超過 70 種語言支持。該 API 同樣允許開發(fā)者查詢翻譯報價、上傳帶有文檔說明與樣式指南的翻譯項目請求、自動追蹤翻譯進度以及進行實時反饋等。
WritePath Translation: API 允許開發(fā)者將 WritePath 功能集成到自定義應(yīng)用中,包括字數(shù)檢索、提交文本翻譯任務(wù)、以及獲取翻譯信息等等。
預(yù)測與其他機器學(xué)習(xí) API
Amazon Machine Learning: 尋找數(shù)據(jù)中的隱藏模式信息,典型的用法包括詐騙檢測、天氣預(yù)報、市場營銷以及點擊預(yù)測等。
BigML: 提供基于云的機器學(xué)習(xí)與數(shù)據(jù)分析服務(wù),允許用戶以 HTTP 請求的方式自己創(chuàng)建數(shù)據(jù)源以及選擇合適的模型來處理有監(jiān)督或者無監(jiān)督的機器學(xué)習(xí)任務(wù)。
Ersatz: 基于 GPU 支持的深度神經(jīng)網(wǎng)絡(luò)提供的預(yù)測服務(wù),允許用戶以 API 方式進行交互。Ersatz 中還利用增強學(xué)習(xí)來合并不同的神經(jīng)網(wǎng)絡(luò)模型來提升整體的效果。
Google Cloud Prediction: 提供了用于構(gòu)建機器學(xué)習(xí)模型的 RESTful API 。這些工具能夠通過分析數(shù)據(jù)來提取出應(yīng)用中數(shù)據(jù)的不同特征,譬如用戶情感、垃圾信息檢測、推薦系統(tǒng)等等。
Google Cloud Speech API: 能夠提供超過 80 種語言的快速與準確的語音識別以及轉(zhuǎn)化服務(wù)。
Guesswork.co: 能夠為電商網(wǎng)站提供產(chǎn)品推薦引擎,Guesswork 可以通過基于 Google 預(yù)測 API 構(gòu)建的語義化引擎來對用戶行為進行預(yù)測。
Hu:toma:?幫助世界各地的開發(fā)者構(gòu)建商用級別的深度學(xué)習(xí)聊天機器人。
IBM Watson Conversation?: 幫助構(gòu)建可以部署在多個消息平臺或者網(wǎng)頁上的,能夠理解自然語言的聊天機器人。其他類似的 API 還包括?Dialog、Natural Language Classifier、Personality Insights、Document Conversion以及?Tone Analyzer.
IBM Watson Speech?: 包含了?語音到文本?以及?文本到語音?之間的轉(zhuǎn)化功能(譬如創(chuàng)建語音控制的應(yīng)用)。
IBM Watson Data Insights: 該系列的服務(wù)包含了三個 API :AlchemyData News、Discovery 以及 Tradeoff Analytics。AlchemyData 提供了對于大量的新聞、博客內(nèi)容的高級別定向搜索與趨勢分析的服務(wù)。Tradeoff Analytics 則是幫助用戶在多目標優(yōu)化時進行有效抉擇。
IBM Watson Retrieve and Rank: 開發(fā)者可以將自定義數(shù)據(jù)導(dǎo)入到服務(wù)中,并且使用相關(guān)的關(guān)聯(lián)發(fā)算法來訓(xùn)練機器學(xué)習(xí)模型。服務(wù)的輸出包括了一系列相關(guān)的文檔與元數(shù)據(jù),譬如某個聯(lián)絡(luò)中心的代理能夠基于該服務(wù)提高呼叫的平均處理時間。
Imagga: 能夠為你的圖片自動打標簽,從而允許你的圖片可以被關(guān)聯(lián)搜索到。
indico: 提供了文本分析(情感分析、Twitter 參與度、表情分析等)以及 圖片分析(面部表情識別、面部定位)。indico 的 API 可以免費試用并且不需要任何的訓(xùn)練數(shù)據(jù)。
Microsoft Azure Cognitive Service?API : 基于預(yù)測分析提供機器學(xué)習(xí)推薦服務(wù),譬如個性化產(chǎn)品推薦等,可以用來代替?zhèn)鹘y(tǒng)的 Azure Machine Learning Recommendations 服務(wù)。新版本提供了批處理支持,更好地 API 檢索服務(wù)、更清晰的 API 使用界面以及更好的注冊與賬單界面等。
Microsoft Azure Anomaly Detection API?: 能夠在序列數(shù)據(jù)中檢測出異常數(shù)據(jù),譬如檢測內(nèi)存使用過程中是否存在內(nèi)存泄露的情況。
Microsoft Cognitive Service - QnA Maker: 將信息提取為會話式的、易于瀏覽的數(shù)據(jù)形式。其他類似的 API 還包括?Academic Knowledge、Entity Linking、Knowledge Exploration以及Recommendations。
Microsoft Cognitive Service - Speaker Recognition: 幫助應(yīng)用來分析檢測出當(dāng)前的發(fā)言者。其他的類似于的 API 還包括Bing Speech?(將語音轉(zhuǎn)化為文本并且理解其大致含義)、?Custom Recognition?等等。
NuPIC: 由 NuPIC 社區(qū)運行與維護的開源項目,其基于 Python/C++ 實現(xiàn)了 Numentas Cortical Learning 算法并對外提供 API 服務(wù)。該 API 允許開發(fā)者能夠使用基本算法或者分層算法,也可以選擇使用其他的平臺功能。
PredicSis: 能夠通過預(yù)測分析與大數(shù)據(jù)技術(shù)提供市場營銷的效用與收益。
PredictionIO: 基于 Apache Spark、HBase 以及 Spray 這些著名的開源項目搭建的開源機器學(xué)習(xí)服務(wù)。典型的 API 包括了創(chuàng)建與管理用戶信息及其行為記錄、檢索項目與內(nèi)容、基于用戶進行個性推薦等等。
RxNLP - Cluster Sentences and Short Texts: 提供了文本挖掘與自然語言處理的服務(wù)。其中語句聚類 API 能夠?qū)⒉煌恼Z句進行分類,譬如將不同新聞文章中的語句或者 Twitter、Facebook 上提取出來的短文本劃分到不同的分組中。
Sightcorp F.A.C.E.: 該 API 能夠幫助第三方應(yīng)用來更好地理解用戶行為,并且根據(jù)年齡、性別、面部表情、頭部姿勢以及種族劃分來進行相似面部的分析與搜索。
評論