<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 機(jī)器學(xué)習(xí)：亟須糾正的4大類“偏差”

機(jī)器學(xué)習(xí)：亟須糾正的4大類“偏差”

作者：時(shí)間：2018-10-31 來源：OFweek人工智能網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

　　偏見是指?jìng)€(gè)人對(duì)他人或其他群體所持有的缺乏充分事實(shí)依據(jù)的認(rèn)識(shí)和態(tài)度，而機(jī)器學(xué)習(xí)中的偏差則是由缺乏足夠的特征和用于訓(xùn)練模型的相關(guān)數(shù)據(jù)集不全面引起的。機(jī)器學(xué)習(xí)算法在訓(xùn)練中嚴(yán)格按照其數(shù)學(xué)構(gòu)造和數(shù)據(jù)執(zhí)行任務(wù)，準(zhǔn)確完成人類所輸入的內(nèi)容，因此，機(jī)器學(xué)習(xí)模型的偏差通常是由設(shè)計(jì)和收集相關(guān)數(shù)據(jù)的人的“偏見”造成的。

本文引用地址：http://www.ex-cimer.com/article/201810/393626.htm

　　數(shù)據(jù)科學(xué)家在構(gòu)建算法并對(duì)機(jī)器學(xué)習(xí)進(jìn)行訓(xùn)練時(shí)，源自其本身某種程度的偏見會(huì)不可避免地蔓延到AI模型中，比較幸運(yùn)的是，機(jī)器學(xué)習(xí)的偏差能夠被檢測(cè)和規(guī)避。不過，相關(guān)的研究人員仍需保持警惕。本文總結(jié)了需要了解和防范的4種不同類型的機(jī)器學(xué)習(xí)偏差以供參考。

　　1. 樣本偏差

　　樣本偏差是訓(xùn)練數(shù)據(jù)的問題。當(dāng)用于訓(xùn)練模型的數(shù)據(jù)不能準(zhǔn)確地表現(xiàn)模型將運(yùn)行的環(huán)境時(shí)，就會(huì)產(chǎn)生樣本偏差。沒有任何一種算法可以與整個(gè)宇宙環(huán)境的數(shù)據(jù)交互，并在這個(gè)宇宙環(huán)境中被訓(xùn)練，所以，選擇一個(gè)足夠大且具備代表性的宇宙子集來減輕樣本的偏差成為一門科學(xué)。盡管這門科學(xué)容易理解，但并非所有的數(shù)據(jù)科學(xué)家都接受過抽樣技術(shù)的訓(xùn)練。

　　舉一個(gè)自動(dòng)駕駛汽車的例子。當(dāng)訓(xùn)練一個(gè)在白天和夜晚都能使汽車自動(dòng)駕駛的算法時(shí)，如果只選取了白天的數(shù)據(jù)進(jìn)行訓(xùn)練，這就等于在模型中引入了樣本偏差，用白天和夜晚的數(shù)據(jù)訓(xùn)練算法才可以消除樣本偏差的來源。

　　2. 偏見偏差

　　偏見偏差是由受文化和刻板印象影響的數(shù)據(jù)所引發(fā)的結(jié)果。可以想象一下，假設(shè)有一個(gè)計(jì)算機(jī)視覺算法正在接受訓(xùn)練來理解工作中的人們，而該算法暴露于數(shù)以千計(jì)的訓(xùn)練數(shù)據(jù)圖，其中許多圖像顯示的是正在寫代碼的男性和在廚房干活的女性，那么，該算法很可能會(huì)將編碼員等同于男性，將家務(wù)員等同于女性。這就是偏見偏差，因?yàn)楹茱@然女性也能夠?qū)懘a，而男人也可以做飯。

　　這里的問題是，被選取的訓(xùn)練數(shù)據(jù)有意識(shí)地或無意識(shí)地反映了社會(huì)的刻板印象。要避免這樣的情況出現(xiàn)，可以忽略性別和職業(yè)之間的統(tǒng)計(jì)關(guān)系，并使算法接觸均衡分布的示例。這顯然需要對(duì)刻板印象和偏見足夠敏感，而這則取決于人類對(duì)模型設(shè)定的表達(dá)行為的預(yù)期，僅靠數(shù)學(xué)無法克服這類偏差。負(fù)責(zé)標(biāo)記和注釋訓(xùn)練數(shù)據(jù)的工作人員必須接受相關(guān)的訓(xùn)練，以避免他們將自己對(duì)社會(huì)的偏見或刻板印象引入到訓(xùn)練數(shù)據(jù)中。

　　3. 計(jì)量偏差

　　如果用于觀察或測(cè)量的設(shè)備存在問題，這會(huì)使系統(tǒng)價(jià)值失真，這種偏差趨向于使數(shù)據(jù)朝某個(gè)特定的方向偏離。例如，用帶有彩色濾光片的相機(jī)拍攝的每幅訓(xùn)練數(shù)據(jù)圖像都會(huì)出現(xiàn)顏色完全失真的情況，如此，用于訓(xùn)練算法的圖像數(shù)據(jù)實(shí)際上也沒有系統(tǒng)地表現(xiàn)出算法將運(yùn)行的環(huán)境。

　　這種偏差無法通過簡單地?cái)U(kuò)大數(shù)據(jù)收集來避免，有效的途徑是，選取多個(gè)測(cè)量裝置并讓接受過訓(xùn)練的人員來比較這些裝置的輸出內(nèi)容。

　　4. 算法偏差

　　最后一種類型的偏差與數(shù)據(jù)無關(guān)，屬于算法的數(shù)學(xué)性質(zhì)。一方面，具備高方差的模型可以很容易擬合到訓(xùn)練數(shù)據(jù)中并能接納復(fù)雜性，然而，這種模型對(duì)雜訊(又稱噪音noise)十分敏感;另一方面，具備高偏差的模型則更加剛硬，對(duì)數(shù)據(jù)和噪聲的變化不那么敏感，但容易丟失復(fù)雜性。因此，數(shù)據(jù)科學(xué)家需要在這兩個(gè)屬性之間達(dá)到適當(dāng)?shù)钠胶狻?/p>

機(jī)器學(xué)習(xí)：亟須糾正的4大類“偏差”

　　數(shù)據(jù)科學(xué)家能通過了解這四種類型的AI偏差構(gòu)建出更好模型和選取更好的訓(xùn)練數(shù)據(jù)。AI算法是由人類構(gòu)建的，訓(xùn)練數(shù)據(jù)也是由人類收集、篩選、標(biāo)記和注釋的，因此，數(shù)據(jù)科學(xué)家需要敏銳地識(shí)別出這些偏差，并使用一種貫徹和迭代的方式來不斷測(cè)試模型，并吸納訓(xùn)練有素的研究員協(xié)助，最終規(guī)避這些機(jī)器學(xué)習(xí)的偏差。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 機(jī)器學(xué)習(xí)

評(píng)論

相關(guān)推薦

美光高性能內(nèi)存與存儲(chǔ)，推動(dòng) AI 豐富殘障人士生活體驗(yàn)

網(wǎng)絡(luò)與存儲(chǔ) 語音識(shí)別生成式AI 機(jī)器學(xué)習(xí) 內(nèi)存 | 2023-12-07

機(jī)器學(xué)習(xí)常用術(shù)語匯總 (中英對(duì)照）

機(jī)器學(xué)習(xí) | 2024-06-04

美光內(nèi)存與存儲(chǔ)是實(shí)現(xiàn)數(shù)字孿生的理想之選

網(wǎng)絡(luò)與存儲(chǔ) 數(shù)字孿生 DRAM 機(jī)器學(xué)習(xí) | 2024-02-06

恩智浦與NVIDIA合作：將TAO工具套件與eIQ開發(fā)環(huán)境無縫集成，加速人工智能部署！

智能計(jì)算機(jī)器學(xué)習(xí) 開發(fā)環(huán)境模型部署 | 2024-07-18

模糊機(jī)器學(xué)習(xí)

資源下載機(jī)器學(xué)習(xí) 模糊數(shù)學(xué) | 2019-06-25

Microchip在人工智能/機(jī)器學(xué)習(xí)方面的對(duì)策

嵌入式系統(tǒng) Microchip 人工智能機(jī)器學(xué)習(xí) | 2023-11-20

【轉(zhuǎn)】淺談量子機(jī)器學(xué)習(xí)(QML)

浮沉1988 | 2022-05-17

機(jī)器學(xué)習(xí)常用術(shù)語匯總

機(jī)器學(xué)習(xí) | 2024-06-04

EEPW2018年5月刊(機(jī)器學(xué)習(xí)＆人工智能)

資源下載機(jī)器學(xué)習(xí) 人工智能 | 2018-05-10

《機(jī)器學(xué)習(xí)算法原理與編程實(shí)踐》電子版

資源下載機(jī)器學(xué)習(xí) 編程實(shí)踐 | 2015-12-04

如何使用機(jī)器學(xué)習(xí)創(chuàng)建連續(xù)色彩控制

big白菜 | 2018-11-14

FPGA學(xué)習(xí)——機(jī)器學(xué)習(xí)的幾種算法總結(jié)

molly931018 | 2014-10-15

英飛凌推出業(yè)界首款 USB 10Gbps 外設(shè)控制器EZ-USB? FX10

智能計(jì)算 EZ-USB 機(jī)器學(xué)習(xí) 數(shù)據(jù)采集高速接口 | 2024-01-17

蘋果發(fā)布DeepPCR機(jī)器學(xué)習(xí)算法：加速神經(jīng)網(wǎng)絡(luò)的推理和訓(xùn)練

蘋果 DeepPCR 機(jī)器學(xué)習(xí) 算法神經(jīng)網(wǎng)絡(luò) | 2023-12-20

基于機(jī)器學(xué)習(xí)的語音驅(qū)動(dòng)人臉動(dòng)畫方法

資源下載機(jī)器學(xué)習(xí) 人臉動(dòng)畫語音驅(qū)動(dòng) | 2007-04-19

JFrog助力開發(fā)者實(shí)現(xiàn)安全AI之旅，與DataBricks的MLflow集成實(shí)現(xiàn)無縫機(jī)器學(xué)習(xí)生命周期

智能計(jì)算 JFrog 安全AI DataBricks MLflow 機(jī)器學(xué)習(xí) | 2024-05-08

從免費(fèi)的物聯(lián)網(wǎng)防火墻hihttps談機(jī)器學(xué)習(xí)之樣本采集

hihttps | 2020-02-09

分享《機(jī)器學(xué)習(xí)算法原理與編程實(shí)踐》電子版

不問舊夢(mèng) | 2015-12-04

英飛凌推出全新PSoC Edge產(chǎn)品系列,擴(kuò)展微控制器產(chǎn)品組合

嵌入式系統(tǒng) 英飛凌 PSoC Edge 微控制器 MCU 機(jī)器學(xué)習(xí) | 2023-11-29

EEPW2019年5月刊(邊緣設(shè)備的機(jī)器學(xué)習(xí))

資源下載邊緣設(shè)備機(jī)器學(xué)習(xí) | 2019-05-23

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();