<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 教程詳解：用卷積神經(jīng)網(wǎng)絡(luò)檢測臉部關(guān)鍵點(diǎn)（一）

教程詳解：用卷積神經(jīng)網(wǎng)絡(luò)檢測臉部關(guān)鍵點(diǎn)（一）

作者：時(shí)間：2018-08-03 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

收藏

這是一個(gè)手把手教你學(xué)習(xí)深度學(xué)校的教程。一步一步，我們將要嘗試去解決Kaggle challenge中的臉部關(guān)鍵點(diǎn)的檢測問題。

本文引用地址：http://www.ex-cimer.com/article/201808/385311.htm

這份教程介紹了Lasagne，一個(gè)比較新的基于Python和Theano的神經(jīng)網(wǎng)絡(luò)庫。我們將用Lasagne去模擬一系列的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，討論一下數(shù)據(jù)增強(qiáng)(data augmentaTIon)、流失(dropout)、結(jié)合動(dòng)量(momentum)和預(yù)先訓(xùn)練(pre-training)。這里有很多方法可以將我們的結(jié)果改善不少。

我假設(shè)諸位已經(jīng)知道了一些關(guān)于神經(jīng)網(wǎng)絡(luò)的只是。所以我們就不介紹神經(jīng)網(wǎng)絡(luò)的背景知識(shí)了。這里也提供一些好的介紹神經(jīng)網(wǎng)絡(luò)的書籍和視頻，如Neural Networks and Deep Learning online book。Alec Radford的演講Deep Learning with Python’s Theano library也是一個(gè)快速介紹的好例子。以及ConvNetJS Browser Demos

預(yù)先準(zhǔn)備

如果你只需要看懂的話，則不需要自己寫一個(gè)代碼然后去執(zhí)行。這里提供一些安裝的教程給那些配置好CUDA的GPU并且想要運(yùn)行試驗(yàn)的那些人。

我假設(shè)你們已經(jīng)安裝了CUDA toolkit, Python 2.7.x, numpy, pandas, matplotlib, 和scikit-learn。安裝剩下的依賴包，比如Lasagne和Theano都可以運(yùn)行下面的指令

pip install -r https://raw.githubusercontent.com/dnouri/kfkd-tutorial/master/requiremen...

注意，為了簡潔起見，我沒有在命令中創(chuàng)建虛擬環(huán)境，但是你需要的。

譯者：我是在windows10上面配置這個(gè)環(huán)境的，安裝anaconda(再用此環(huán)境安裝依賴包)、VS2013(不推薦2015)、CUDA工具即可。

如果一切都順利的話，你將會(huì)在你的虛擬環(huán)境下的src/lasagne/examples/目錄中找到mnist.py并運(yùn)行MNIST例子。這是一個(gè)對(duì)于神經(jīng)網(wǎng)絡(luò)的“Hello world”程序。數(shù)據(jù)中有十個(gè)分類，分別是0~9的數(shù)字，輸入時(shí)28TImes;28的手寫數(shù)字圖片。

cd src/lasagne/examples/

python mnist.py

此命令將在三十秒左右后開始打印輸出。這需要一段時(shí)間的原因是，Lasagne使用Theano做重型起重; Theano反過來是一個(gè)“優(yōu)化GPU元編程代碼生成面向數(shù)組的優(yōu)化Python數(shù)學(xué)編譯器”，它將生成需要在訓(xùn)練發(fā)生前編譯的C代碼。幸運(yùn)的是，我們組需要在第一次運(yùn)行時(shí)支付這個(gè)開銷的價(jià)格。

譯者：如果沒有配置GPU，用的是CPU的話，應(yīng)該是不用這么久的編譯時(shí)間，但是執(zhí)行時(shí)間有一些長。如果用GPU，在第一次跑一些程序的時(shí)候，會(huì)有提示正在編譯的內(nèi)容。

當(dāng)訓(xùn)練開始的時(shí)候，你會(huì)看到

Epoch 1 of 500

training loss: 1.352731

validaTIon loss: 0.466565

validaTIon accuracy: 87.70 %

Epoch 2 of 500

training loss: 0.591704

validation loss: 0.326680

validation accuracy: 90.64 %

Epoch 3 of 500

training loss: 0.464022

validation loss: 0.275699

validation accuracy: 91.98 %

…

如果你讓訓(xùn)練運(yùn)行足夠長，你會(huì)注意到，在大約75代之后，它將達(dá)到大約98%的測試精度。

如果你用的是GPU，你想要讓Theano去使用它，你要在用戶的主文件夾下面創(chuàng)建一個(gè).theanorc文件。你需要根據(jù)自己安裝環(huán)境以及自己操作系統(tǒng)的配置使用不同的配置信息：

[global]

floatX = float32

device = gpu0

[lib]

cnmem = 1

譯者：這是我的配置文件。

[cuba]

root = C:Program FilesNVIDIA GPU Computing ToolkitCUDAv8.0

[global]

openmp = False

device = gpu

floatX = float32

allow_input_downcast = True

[nvcc]

fastmath = True

flags = -IC:Anaconda2libs

compiler_bindir = C:Program Files (x86)Microsoft Visual Studio 12.0VCbin

base_compiledir = path_to_a_directory_without_such_characters

[blas]

ldflags =

[gcc]

cxxflags = -IC:Anaconda2MinGW

數(shù)據(jù)

面部關(guān)鍵點(diǎn)檢測的訓(xùn)練數(shù)據(jù)集包括7049(96x96)個(gè)灰度圖像。對(duì)于每個(gè)圖像，我們應(yīng)該學(xué)習(xí)找到15個(gè)關(guān)鍵點(diǎn)的正確位置(x和y坐標(biāo))，例如

left_eye_center

right_eye_outer_corner

mouth_center_bottom_lip

一個(gè)臉部標(biāo)記出三個(gè)關(guān)鍵點(diǎn)的例子。

數(shù)據(jù)集的一個(gè)有趣的變化是，對(duì)于一些關(guān)鍵點(diǎn)，我們只有大約2,000個(gè)標(biāo)簽，而其他關(guān)鍵點(diǎn)有7,000多個(gè)標(biāo)簽可用于訓(xùn)練。

讓我們編寫一些Python代碼，從所提供的CSV文件加載數(shù)據(jù)。我們將編寫一個(gè)可以加載訓(xùn)練和測試數(shù)據(jù)的函數(shù)。這兩個(gè)數(shù)據(jù)集的區(qū)別在于測試數(shù)據(jù)不包含目標(biāo)值; 這是預(yù)測這些問題的目標(biāo)。這里是我們的load()函數(shù)：

# file kfkd.py

import os

import numpy as np

from pandas.io.parsers import read_csv

from sklearn.utils import shuffle

FTRAIN = '~/data/kaggle-facial-keypoint-detection/training.csv'

FTEST = '~/data/kaggle-facial-keypoint-detection/test.csv'

def load(test=False, cols=None):

Loads data from FTEST if *test* is True, otherwise from FTRAIN.

Pass a list of *cols* if you're only interested in a subset of the

target columns.

fname = FTEST if test else FTRAIN

df = read_csv(os.path.expanduser(fname)) # load pandas dataframe

# The Image column has pixel values separated by space; convert

# the values to numpy arrays:

df['Image'] = df['Image'].apply(lambda im: np.fromstring(im, sep=' '))

if cols: # get a subset of columns

df = df[list(cols) + ['Image']]

print(df.count()) # prints the number of values for each column

df = df.dropna() # drop all rows that have missing values in them

上一頁 1 2 3 下一頁

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 卷積神經(jīng) 網(wǎng)絡(luò) GPU CPU

評(píng)論

相關(guān)推薦

消息稱英偉達(dá) RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應(yīng)緊張

消費(fèi)電子英偉達(dá) GPU | 2024-07-29

INA217的輸入穩(wěn)定網(wǎng)絡(luò)電路

設(shè)計(jì)方案 INA217 輸入穩(wěn)定網(wǎng)絡(luò) | 2009-07-06

: 影響未來的20項(xiàng)數(shù)字技術(shù)

hpnet | 2002-05-30

[轉(zhuǎn)帖]IBM可編程網(wǎng)絡(luò)處理器

amine | 2002-05-17

幫個(gè)忙：一個(gè)網(wǎng)絡(luò)接口是否能擁有兩個(gè)IP地址？

xiaohua | 2002-05-29

什么是 DLSS，值得嗎？

智能計(jì)算 DLSS gpu NVIDIA | 2024-07-17

英特爾CPU故障率100％游戲商大崩潰改用AMD

消費(fèi)電子英特爾 CPU 故障率游戲商 AMD | 2024-07-24

硬件工程師手冊(cè)

資源下載華為硬件工程師接口 CPU 單片機(jī) | 2008-01-14

INA166的輸入穩(wěn)定網(wǎng)絡(luò)電路

設(shè)計(jì)方案 INA166 輸入穩(wěn)定網(wǎng)絡(luò) | 2009-07-06

8、16位MCU接入TCPIP網(wǎng)絡(luò)方案

資源下載單片機(jī) MCU TCP IP 網(wǎng)絡(luò) | 2008-01-05

嵌入式Linux網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)開發(fā) 中

視頻嵌入式 Linux CGL 網(wǎng)絡(luò) | 2009-10-28

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

安捷倫(Agilent)科技公司的網(wǎng)絡(luò)優(yōu)化測試儀

hpnet | 2002-05-17

消息稱英偉達(dá)曾向臺(tái)積電詢問建設(shè)廠外 CoWoS 先進(jìn)封裝專線可能，遭拒絕

EDA/PCB 英偉達(dá) GPU 封裝工藝臺(tái)積電 | 2024-07-23

龍芯 3C6000 服務(wù)器 CPU 流片成功：性能達(dá)英特爾至強(qiáng) Silver 4314 水平

網(wǎng)絡(luò)與存儲(chǔ) 龍芯中科 CPU | 2024-07-25

Addison.Wesley.Advanced.Linux.Networking.part2.rar

資源下載操作系統(tǒng) Linux 網(wǎng)絡(luò) 高級(jí)配置 | 2007-02-09

打破NVIDIA壟斷！英國公司實(shí)現(xiàn)CUDA軟件在AMD GPU上無縫運(yùn)行

智能計(jì)算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

IGBT無損吸收網(wǎng)絡(luò)

設(shè)計(jì)方案無損吸收網(wǎng)絡(luò) | 2009-07-06

嵌入式Linux網(wǎng)絡(luò)開發(fā) 下

視頻嵌入式 Linux 網(wǎng)絡(luò) BSD | 2009-10-26

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

INA103構(gòu)成的使放大器穩(wěn)定工作的輸入網(wǎng)絡(luò)

設(shè)計(jì)方案 INA103 構(gòu)成放大器穩(wěn)定工作輸入網(wǎng)絡(luò) | 2009-07-06

Addison.Wesley.Advanced.Linux.Networking.part1.rar

資源下載操作系統(tǒng) Linux 網(wǎng)絡(luò) 高級(jí)配置 | 2007-02-09

嵌入式Linux網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)開發(fā) 下

視頻嵌入式 Linux CGL 網(wǎng)絡(luò) | 2009-10-28

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計(jì)算 Meta Llama 3 英偉達(dá) H100 顯卡 GPU | 2024-07-29

Addison.Wesley.Advanced.Linux.Networking.part3.rar

資源下載操作系統(tǒng) Linux 網(wǎng)絡(luò) 高級(jí)配置 | 2007-02-09

嵌入式Linux網(wǎng)絡(luò)開發(fā) 中

視頻嵌入式 Linux TCP 網(wǎng)絡(luò) | 2009-10-26

目標(biāo)完全替代閉源驅(qū)動(dòng)，英偉達(dá)宣布全面轉(zhuǎn)向開源 GPU 內(nèi)核模塊

嵌入式系統(tǒng) 閉源驅(qū)動(dòng) 英偉達(dá) 開源 GPU 內(nèi)核模塊 Linux | 2024-07-22

怎么樣才能讓一個(gè)網(wǎng)絡(luò)接口同時(shí)有兩個(gè)ip address？

xiaohua | 2002-05-31

采用TDA4290的音量調(diào)節(jié)網(wǎng)絡(luò)

設(shè)計(jì)方案采用 TDA4290 音量調(diào)節(jié) 網(wǎng)絡(luò) | 2009-07-06

嵌入式Linux網(wǎng)絡(luò)設(shè)備驅(qū)動(dòng)開發(fā) 上

視頻嵌入式 Linux CGL 網(wǎng)絡(luò) | 2009-10-28

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();