<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 你可能對人工智能有什么誤解:人力勞動只是轉(zhuǎn)移了

          你可能對人工智能有什么誤解:人力勞動只是轉(zhuǎn)移了

          作者: 時間:2018-07-17 來源:鎂客網(wǎng) 收藏
          編者按:最需要AI去做的事情,AI反而無能無力,而我們?yōu)榱四茏孉I取代勞動密集型的工作,得先為AI服務,付出密集、辛勤的勞動,這讓數(shù)據(jù)標注工作看上去有點賽博朋克、反烏托邦的“魔幻”感覺。

            一雙眼睛的局部細節(jié)圖出現(xiàn)在電腦屏幕上,小慧對著放大的眼睛,一步步地做好標記點。

          本文引用地址:http://www.ex-cimer.com/article/201807/383363.htm

            一眼望過去,一排排的電腦屏幕上,都是類似的畫面。也許是因為窗簾的遮光效果太好,略顯昏暗的辦公環(huán)境加上電腦屏幕上被放大的各種物體細節(jié),頗為驚悚。

            在某研究院看到這一幕,不覺驚嘆即使是頭部的AI創(chuàng)業(yè)公司,最關鍵的一環(huán)依然是從數(shù)據(jù)標注員開始的。

            而這是一群被稱作第一批被AI累死的人。

            AI的老師:畫框的這些人

            伴隨著AI興起的最關鍵的技術莫過于深度學習,作為深度學習的基礎,神經(jīng)網(wǎng)絡是一種以輸入為導向的算法,其結(jié)果的準確性取決于接近“無窮”量級的數(shù)據(jù)。

            所以摒除那些復雜的中間環(huán)節(jié),深度學習最關鍵的就是需要大量的數(shù)據(jù)訓練,這也是為什么在互聯(lián)網(wǎng)大數(shù)據(jù)的時代,AI可以崛起。而在數(shù)據(jù)訓練之前,又必須先對大量的數(shù)據(jù)進行標注,作為機器學習的先導經(jīng)驗。

            因此,催生了大量數(shù)據(jù)標注員的產(chǎn)生。

            簡單的說,數(shù)據(jù)標注員類似于AI的老師,舉個形象的例子,我們要教機器認識一個蘋果,你直接給它一張?zhí)O果的圖片,它是完全不理解的。我們得先有蘋果的圖片,然后在上面標注著“蘋果”兩個字,機器通過學習了大量的圖片中的特征,這時候再給它任意一張?zhí)O果的圖片,它就能認出來了。

            據(jù)了解,目前標注員的工作內(nèi)容常見的有拉框標點、打標簽、分割、批注等等。其中分類就是最常見的打標簽,比如標注畫面上動物毛發(fā)顏色、動物耳朵等等;框選是將畫面中相對應的對象標框標注;還有一種是描點標注,一般用于更細致的人臉標注:需要在眉毛、眼睛、鼻子、嘴巴等關鍵點做二十多個標記點。

            從他們的基本工作內(nèi)容就可以看出來,數(shù)據(jù)標注是個非??菰锒挚简炄四土Φ墓ぷ?,并且相比較AI所代表的高科技,標注看起來毫無技術含量。

            一條產(chǎn)業(yè)鏈的開始

            但巧婦難為無米之炊,AI算法的訓練離不開這些大量的數(shù)據(jù)標注,與之相伴生的數(shù)據(jù)標注外包業(yè)務也成了熱門的產(chǎn)業(yè)。

            在IT桔子的大數(shù)據(jù)標注公司專輯中,一共收納了6家,其中,有5家都在2017年到2018年這個時間周期內(nèi)獲得千萬的融資:

            2017年7月,BasicFinder完成1000萬人民幣Pre-A輪融資;

            2017年11月,龍貓數(shù)據(jù)獲得A輪3370萬人民幣融資;

            2018年1月,星塵數(shù)據(jù)獲得1000萬人民幣Pre-A輪融資;

            2018年3月,愛數(shù)智慧獲得A輪融資;

            2018年5月,周同科技完成2000萬人民幣A輪融資。

            同時,他們業(yè)務方向也有一定細分區(qū)別,有的以處理圖像見長,有的數(shù)據(jù)標注公司更擅長做一些視頻標注。而這些公司的服務企業(yè)有百度、小米、京東、今日頭條這樣的互聯(lián)網(wǎng)公司,也有出門問問、云從、深鑒等AI公司。

            另外,像京東、百度、騰訊、阿里其實都有自己的標注平臺和工具。

            而在國外方面,亞馬遜有推出眾包數(shù)據(jù)平臺Amazon Mechanical Turk,初創(chuàng)公司方面則有CrowdFlower、Mighty AI等。

            這些已經(jīng)算是這個領域的佼佼者了,在他們的下面,還有成百上千的小的數(shù)據(jù)標注公司。

            據(jù)悉,數(shù)據(jù)標注行業(yè)實行這樣一套分工流程:上游的科技巨頭把任務交給中游的數(shù)據(jù)標注公司,再由中游眾包給下游的小公司、小作坊,有的小作坊還會進一步眾包給“散兵游勇”,比如學生或家庭主婦。

            這條產(chǎn)業(yè)鏈上,分包現(xiàn)象越嚴重,最終落到最底層的數(shù)據(jù)服務公司的價格就越低,一層層的“數(shù)據(jù)黃牛”壓縮了利潤空間,所以一些任務經(jīng)過數(shù)手轉(zhuǎn)包,酬勞已低得驚人。

            目前的數(shù)據(jù)標注工作主要是集中在河北、河南、山東、山西等勞動力密集的地區(qū),這樣的選址也因為能夠以更加低廉的勞動力成本去完成大量的數(shù)據(jù)標注工作。

            在很多數(shù)據(jù)標注的報道中,出現(xiàn)頻率最高的都是那些畢業(yè)于職業(yè)技術學校的學生,他們在三四線城市,只需要會操作電腦,就能做數(shù)據(jù)標注的工作。然而枯燥而又乏味的重復性工作,導致數(shù)據(jù)標注人員的流動性非常之大。此前,在澎湃新聞的一篇視頻采訪中,某數(shù)據(jù)標注公司創(chuàng)始人表示他們有500名左右的在職人員,但是全職的只有11、12個。

            在一些大的數(shù)據(jù)服務公司,他們宣稱平臺用戶(數(shù)據(jù)標注人員)超過20萬人,其中很多都是兼職人員。

            不過,快速的人口流動也依然阻擋不了低門檻數(shù)據(jù)標注生意的紅火。

            有多少智能,就有多少人工

            即使現(xiàn)在有一些數(shù)據(jù)服務平臺開發(fā)了AI工具來輔助人工標注,但依然需要數(shù)據(jù)標注員去檢查和修正其中的錯誤。在一些專業(yè)數(shù)據(jù)標注公司,機器占30%,而人工標注占比達到70%左右。

            梳理數(shù)據(jù)標注員的工作邏輯,就像一個悖論,AI能否進化的更為智能某種程度上取決于這些標注工作的人,而這個工作卻是最不智能、最沒有技術含量的。

            記得在一篇采訪中,管理標注員的負責人用特斯拉(Tesla)的自動駕駛事故給員工“打雞血”,他提到2016年,一輛自動駕駛模式下的特斯拉發(fā)生車禍事故。事后特斯拉公司發(fā)表聲明稱:白色卡車在藍天背景下識別不出來,特斯拉因此沒有啟動剎車。

            “我一直跟他們說:‘你們打磨的每一個數(shù)據(jù)都會為做出巨大貢獻,將來的無人駕駛車能夠識別出藍天下的白色卡車,就是因為你當年把它標出來了?!?/p>

            這種看似無意義的低效率工作應該由AI去做才符合我們對技術的認知,因為我們發(fā)展的初衷,就是為了解放生產(chǎn)力、提高生產(chǎn)效率。

            最需要AI去做的事情,AI反而無能無力,而我們?yōu)榱四茏孉I取代勞動密集型的工作,得先為AI服務,付出密集、辛勤的勞動,這讓數(shù)據(jù)標注工作看上去有點賽博朋克、反烏托邦的“魔幻”感覺。

            然而更令人覺得沮喪的是,人工去訓練AI依然存在很多問題。

            此前,清華大學人工智能學院院長張鈸院士就提到純數(shù)據(jù)驅(qū)動的系統(tǒng)也存在很大問題——魯棒性很差,易受到很大的干擾。即便訓練出的系統(tǒng)模型準確率高達99%,但在實際應用中,仍然會犯很多“弱智”的錯誤。

            這就陷入了死循環(huán),人不可能像AI一樣,在工作中嚴格按照數(shù)據(jù)程序毫無瑕疵地完成工作,紕漏或者技術本身的問題,會導致人工智能的不準確性。最終,就在這個無限循環(huán)中不停地優(yōu)化。

            而且考慮到數(shù)據(jù)的隱私和公司的商業(yè)利益,同類型的數(shù)據(jù)是無法相互打通的,就像一位數(shù)據(jù)標注資深從業(yè)者所說, “以自動駕駛領域的數(shù)據(jù)標注為例,我用A公司的數(shù)據(jù)模型放到 B公司的設備上跑不通,甚至攝像頭換了一個角度、位置或分辨率,都跑不通。”

            “有多少智能,就有多少人工?!边@似乎是AI進化必須經(jīng)歷的過程。

            結(jié)語:

            當然,最完美的情況應該是:AI能夠自己消化大量的數(shù)據(jù)自學成才。目前無需標注數(shù)據(jù)的無監(jiān)督學習已經(jīng)從實驗室走向應用,而類似的遷移學習算法也能減少一定的數(shù)據(jù)標注工作量。

            Facebook人工智能研究部門負責人Yann LeCun曾經(jīng)說過,AI的核心在于預測,AI的下一個變革是無監(jiān)督學習、常識學習。研究人員正努力讓 AI 不依賴人類訓練,自己去觀察世界是如何運轉(zhuǎn)的,并學會預測。

            所以理想環(huán)境下,可能我們探討的悖論過幾年或者十幾年就能完美解決了,這批為AI服務最終會被AI取代的人,也“功成身退”了。



          關鍵詞: 人工智能

          評論


          相關推薦

          技術專區(qū)

          關閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();