<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          新聞中心

          EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 這7 個(gè)深度學(xué)習(xí)實(shí)用技巧,你掌握了嗎?

          這7 個(gè)深度學(xué)習(xí)實(shí)用技巧,你掌握了嗎?

          作者: 時(shí)間:2018-02-23 來(lái)源:網(wǎng)絡(luò) 收藏

            ▌ 兩全其美的辦法

          本文引用地址:http://www.ex-cimer.com/article/201802/375972.htm

            最近已經(jīng)證明,可以得到兩全其美的結(jié)果:從 Adam 到SGD的高性能高速訓(xùn)練! 這個(gè)想法是,實(shí)際上由于在訓(xùn)練的早期階段SGD對(duì)參數(shù)調(diào)整和初始化非常敏感。 因此,我們可以通過(guò)使用Adam來(lái)開(kāi)始訓(xùn)練,這將節(jié)省相當(dāng)長(zhǎng)的時(shí)間,而不必?fù)?dān)心初始化和參數(shù)調(diào)整。 那么,一旦Adam獲得較好的參數(shù),我們可以切換到SGD +動(dòng)量?jī)?yōu)化,以達(dá)到最佳性能!

             

           

            Adam vs SGD 性能

            ▌ 3-如何處理不平衡數(shù)據(jù)

            在很多情況下,都要處理不平衡的數(shù)據(jù),特別是實(shí)際應(yīng)用程序中。 一個(gè)簡(jiǎn)單而實(shí)際的例子如下:訓(xùn)練您的深度網(wǎng)絡(luò)以預(yù)測(cè)視頻流中是否有人持有致命武器。 但是在你的訓(xùn)練數(shù)據(jù)中,你只有50個(gè)拿著武器的人的視頻和1000個(gè)沒(méi)有武器的人的視頻! 如果你只是用這些數(shù)據(jù)來(lái)訓(xùn)練你的網(wǎng)絡(luò),那么你的模型肯定會(huì)非常偏向于預(yù)測(cè)沒(méi)有人有武器!

            你可以做用以下的方法來(lái)解決它:

            在損失函數(shù)中使用類(lèi)權(quán)重。 本質(zhì)上就是,讓實(shí)例不足的類(lèi)在損失函數(shù)中獲得較高的權(quán)重,因此任何對(duì)該類(lèi)的錯(cuò)分都將導(dǎo)致?lián)p失函數(shù)中非常高的錯(cuò)誤。

            過(guò)度采樣:重復(fù)一些實(shí)例較少的訓(xùn)練樣例,有助于平衡分配。 如果可用的數(shù)據(jù)很小,這個(gè)方法最好。

            欠采樣:一些類(lèi)的訓(xùn)練實(shí)例過(guò)多,可以簡(jiǎn)單地跳過(guò)一些實(shí)例。 如果可用數(shù)據(jù)非常大,這個(gè)方法最好。

            為少數(shù)類(lèi)增加數(shù)據(jù)??梢詾樯贁?shù)類(lèi)創(chuàng)建更多的訓(xùn)練實(shí)例! 例如,在前面檢測(cè)致命武器的例子中,你可以改變屬于具有致命武器的類(lèi)別的視頻的顏色和光照等。

            ▌ 4-遷移學(xué)習(xí)

            正如我們所看到的,深層網(wǎng)絡(luò)需要大量的數(shù)據(jù)。遺憾的是,對(duì)于許多新的應(yīng)用程序來(lái)說(shuō),這些數(shù)據(jù)可能很難得到并且開(kāi)銷(xiāo)很大。 如果我們希望模型表現(xiàn)良好,可能需要數(shù)萬(wàn)或數(shù)十萬(wàn)個(gè)新的訓(xùn)練樣例來(lái)進(jìn)行訓(xùn)練。 如果數(shù)據(jù)集不易獲取,則必須全部手動(dòng)收集并標(biāo)記。

            這就是遷移學(xué)習(xí)的起點(diǎn)。 通過(guò)遷移學(xué)習(xí),我們不需要太多的數(shù)據(jù)! 這個(gè)想法是從一個(gè)在數(shù)百萬(wàn)圖像上訓(xùn)練過(guò)的網(wǎng)絡(luò)開(kāi)始的,比如在ImageNet上預(yù)訓(xùn)練的ResNet。 然后,我們將“重新調(diào)整ResNet模型,只重新訓(xùn)練最后幾層。

            我們將ResNet從數(shù)百萬(wàn)圖像中學(xué)到的信息(圖像特征)進(jìn)行微調(diào),以便將其應(yīng)用于不同的任務(wù)。 因?yàn)榭缬虻膱D像的特征信息經(jīng)常是非常相似的所以這個(gè)方法是可行的,但是這些特征的分析根據(jù)應(yīng)用而不同。

             

           

            一個(gè)基本的遷移學(xué)習(xí)示例

            ▌ 5 – 用數(shù)據(jù)增強(qiáng)提高性能

            前面已經(jīng)說(shuō)過(guò):更多的數(shù)據(jù)=更好的表現(xiàn)。 除了遷移學(xué)習(xí)之外,另一種快速而簡(jiǎn)單提高模型的性能的方法是數(shù)據(jù)增強(qiáng)。 數(shù)據(jù)增強(qiáng)是使用原始類(lèi)別標(biāo)簽的同時(shí),改變數(shù)據(jù)集的原始圖像以合成一些新的訓(xùn)練示例。例如,用于圖像數(shù)據(jù)增強(qiáng)的常見(jiàn)方式包括:

            水平和/或垂直旋轉(zhuǎn)翻轉(zhuǎn)圖像

            改變圖像的亮度和顏色

            隨機(jī)模糊圖像

            隨機(jī)從圖像裁剪塊

            基本上,你可以進(jìn)行任何改變,改變圖像的外觀但不改變整體內(nèi)容,例如你可以使用藍(lán)色狗的照片,但你仍然應(yīng)該能夠清楚地看到,這是一個(gè)狗的照片。

             

            數(shù)據(jù)增強(qiáng)

            ▌ 6-通過(guò)集成提升模型!

            在機(jī)器學(xué)習(xí)中,集成訓(xùn)練多個(gè)模型,然后將它們組合在一起以獲得更高的性能。 這個(gè)想法是在相同的數(shù)據(jù)集上對(duì)同一任務(wù)訓(xùn)練多個(gè)深度網(wǎng)絡(luò)模型。 然后,模型的結(jié)果可以通過(guò)投票進(jìn)行組合,即具有最高票數(shù)的類(lèi)勝出。

            為了確保所有模型不同,可以使用隨機(jī)權(quán)重初始化和隨機(jī)數(shù)據(jù)增強(qiáng)。眾所周知,由于使用了多個(gè)模型,因此集成通常比單個(gè)模型更精確,從而從不同角度完成任務(wù)。在實(shí)際應(yīng)用中,尤其是競(jìng)賽中,幾乎所有頂級(jí)模型都使用集合方式。

             

            集成模型

            ▌ 7-加快剪枝

            我們知道模型精度隨深度而增加,但速度又如何呢? 更多的層意味著更多的參數(shù),更多的參數(shù)意味著更多的計(jì)算,更多的內(nèi)存消耗和更慢的速度。理想情況下,我們希望在提高速度的同時(shí)保持高精度。我們可以通過(guò)剪枝來(lái)做到這一點(diǎn)。

             

            深度神經(jīng)網(wǎng)絡(luò)剪枝策略

            這個(gè)想法是,網(wǎng)絡(luò)中的許多參數(shù)是多余的,對(duì)輸出沒(méi)有太大貢獻(xiàn)。 如果可以根據(jù)貢獻(xiàn)值對(duì)網(wǎng)絡(luò)中的神經(jīng)元進(jìn)行排名,那么就可以從網(wǎng)絡(luò)中移除低排名的神經(jīng)元,從而形成更小更快的網(wǎng)絡(luò)。 可以根據(jù)神經(jīng)元權(quán)重的L1 / L2均值(平均激活)、一些驗(yàn)證集上神經(jīng)元不為零的次數(shù)以及其他方法來(lái)進(jìn)行排序。 獲得更快/更小的網(wǎng)絡(luò)對(duì)于在移動(dòng)設(shè)備上運(yùn)行網(wǎng)絡(luò)非常重要。

            修剪網(wǎng)絡(luò)的最基本的方法是簡(jiǎn)單地放棄某些卷積濾波器。 最近文章表明,這樣做是相當(dāng)成功的。 這項(xiàng)工作中的神經(jīng)元排名相當(dāng)簡(jiǎn)單:每個(gè)濾波器的權(quán)重按照L1規(guī)范排名。 在每個(gè)修剪迭代中,對(duì)所有的過(guò)濾器進(jìn)行排序,在所有層中修剪m個(gè)排名最低的過(guò)濾器,重新訓(xùn)練和重復(fù)!

            最近的另一篇分析殘差網(wǎng)絡(luò)結(jié)構(gòu)的論文中提出了修剪“過(guò)濾器”的關(guān)鍵特點(diǎn)。 作者指出,在刪除層的時(shí)候,具有殘差快捷連接(例如ResNets)的網(wǎng)絡(luò)比不使用任何快捷連接(例如VGG或AlexNet)的網(wǎng)絡(luò)在保持良好的準(zhǔn)確性方面更為穩(wěn)健。這個(gè)有趣的發(fā)現(xiàn)具有重大的實(shí)際意義,因?yàn)樗嬖V我們,在修剪網(wǎng)絡(luò)進(jìn)行部署和應(yīng)用時(shí),網(wǎng)絡(luò)設(shè)計(jì)至關(guān)重要(例如ResNets)。 所以使用最新最好的方法總是很好的!


          上一頁(yè) 1 2 下一頁(yè)

          關(guān)鍵詞: 深度學(xué)習(xí)

          評(píng)論


          相關(guān)推薦

          技術(shù)專(zhuān)區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();