<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動態(tài) > 深度學(xué)習(xí)在視覺搜索和匹配中的應(yīng)用

深度學(xué)習(xí)在視覺搜索和匹配中的應(yīng)用

作者：Karsten Noe 時(shí)間：2020-09-17 來源：AI公園

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

收藏

導(dǎo)讀

通過使用預(yù)訓(xùn)練網(wǎng)絡(luò)在遙感圖像應(yīng)用中減少對標(biāo)注數(shù)據(jù)的需求。
本文引用地址：http://www.ex-cimer.com/article/202009/418421.htm

深度學(xué)習(xí)是一個(gè)了不起的方法，用于遙感數(shù)據(jù)集，如衛(wèi)星或航空照片的目標(biāo)檢測和分割/匹配。然而，就像深度學(xué)習(xí)的許多其應(yīng)用場景一樣，獲得足夠的帶標(biāo)注的訓(xùn)練數(shù)據(jù)可能會耗費(fèi)大量的時(shí)間。在這篇文章中，我將介紹一些我們的工作，即使用預(yù)先訓(xùn)練好的網(wǎng)絡(luò)來在遙感數(shù)據(jù)的目標(biāo)檢測任務(wù)中避免標(biāo)注大型訓(xùn)練數(shù)據(jù)集的大量繁瑣工作。

2019年9月中旬，我參加了北歐遙感會議。從許多會談中可以明顯看出，深度學(xué)習(xí)已經(jīng)進(jìn)入許多遙感專家的工具箱。觀眾們對這個(gè)話題的興趣似乎很大，他們討論了在各種應(yīng)用中使用深度學(xué)習(xí)技術(shù)的影響和適用性。

討論的內(nèi)容之一是使用為一種數(shù)據(jù)(通常是自然圖像)開發(fā)和訓(xùn)練的神經(jīng)網(wǎng)絡(luò)，并將其應(yīng)用于其他類型(遙感)數(shù)據(jù)源中的實(shí)踐。例如，來自挪威計(jì)算中心的?ivind Due Trier展示了一項(xiàng)工作，在一個(gè)為計(jì)算機(jī)視覺應(yīng)用開發(fā)的標(biāo)準(zhǔn)的物體檢測網(wǎng)絡(luò)應(yīng)用于過濾海拔地圖上，為了定位挪威考古遺址。這里，來自聽眾的反對意見是，使用這個(gè)模型沒有意義。我強(qiáng)烈反對這一點(diǎn)，盡管神經(jīng)網(wǎng)絡(luò)是為自然圖像開發(fā)的，但在其他數(shù)據(jù)源上測試它也是有意義的。在這種情況下，演示者可以演示它的工作原理！在我看來，甚至嘗試在數(shù)據(jù)源之間遷移學(xué)習(xí)也是有意義的 —— 為什么用在另一種數(shù)據(jù)集上訓(xùn)練的濾波器來初始化網(wǎng)絡(luò)會比隨機(jī)初始化更糟糕呢？開發(fā)的模型可能太大，容易過擬合，但是使用現(xiàn)有代碼庫和預(yù)訓(xùn)練過的模型進(jìn)行快速試驗(yàn)的好處往往太大，因此進(jìn)行試驗(yàn)是很有意義的。

在這篇文章的其余部分，我將展示一些我們在實(shí)驗(yàn)室中所做的工作，這些工作是將一個(gè)在一個(gè)領(lǐng)域(ImageNet自然圖像)訓(xùn)練過的網(wǎng)絡(luò)用于在另一個(gè)領(lǐng)域(航拍圖像)進(jìn)行基于圖像的搜索。希望我能使你相信這種方法是有意義的。我并不是說ImageNet網(wǎng)絡(luò)可以得到最好的結(jié)果，而是說在考慮可能需要的標(biāo)注工作量時(shí)，使用跨域網(wǎng)絡(luò)確實(shí)有意義。

視覺搜索以及所需的訓(xùn)練數(shù)據(jù)

深度學(xué)習(xí)或其他機(jī)器學(xué)習(xí)技術(shù)可用于開發(fā)識別圖像中物體的魯棒方法。對于來自飛機(jī)的航拍圖像或高分辨率衛(wèi)星照片，這將使不同物體類型的匹配、計(jì)數(shù)或分割成為可能。然而，使用深度學(xué)習(xí)需要大量的訓(xùn)練數(shù)據(jù)，除非你已有了可用的用于所需的物體類別的注冊數(shù)據(jù)，而創(chuàng)建這樣一個(gè)訓(xùn)練數(shù)據(jù)集是一個(gè)非常耗時(shí)的過程。

因此，在與哥本哈根市的合作中，我們朝著一種工具邁進(jìn)了一步，該工具可以用于匹配所需的物體類型，而不需要預(yù)先創(chuàng)建訓(xùn)練數(shù)據(jù)。該工具基于之前的一個(gè)項(xiàng)目背后的技術(shù)。這個(gè)在線演示可以讓你點(diǎn)擊丹麥航拍圖像數(shù)據(jù)集上的一個(gè)地方，并查看丹麥的100個(gè)看起來最相似的地方。相似度度量是基于一個(gè)訓(xùn)練有素的神經(jīng)網(wǎng)絡(luò)來區(qū)分不同的物體類型。例如，點(diǎn)擊游艇碼頭或風(fēng)力渦輪機(jī)將會產(chǎn)生以下結(jié)果：

基本上，該技術(shù)的工作原理是將數(shù)據(jù)集分割成一堆小片段(在本例中是4800萬個(gè)片段)，每個(gè)片段運(yùn)行一個(gè)Resnet-34網(wǎng)絡(luò)，該網(wǎng)絡(luò)訓(xùn)練用來區(qū)分ImageNet數(shù)據(jù)集中的1000個(gè)不同物體。我們沒有使用最終的分類(1000個(gè)類中的一個(gè))，而是從網(wǎng)絡(luò)中為每個(gè)片段提取一個(gè)所謂的描述符，它由2048個(gè)數(shù)字組成。為了節(jié)省內(nèi)存和減少計(jì)算負(fù)擔(dān)，我們訓(xùn)練了一個(gè)自動編碼器神經(jīng)網(wǎng)絡(luò)來壓縮2048個(gè)數(shù)字到512位。在那之后，來自航拍圖像數(shù)據(jù)集的4800萬個(gè)圖像片段可以在不到80毫秒內(nèi)與一個(gè)新的片段相比較！autoencoder是針對這個(gè)特定的數(shù)據(jù)集進(jìn)行訓(xùn)練的，這意味著它可以以自監(jiān)督的方式擬合相關(guān)的特征。

在一開始，這個(gè)解決方案有一些弱點(diǎn)，為了使技術(shù)更健壯，我們解決了：

我們改進(jìn)了旋轉(zhuǎn)不變性，基于從網(wǎng)絡(luò)輸出提取的描述子，對圖像片段旋轉(zhuǎn)0, 90, 180和270度。
基于不同尺度的片段計(jì)算描述符。這可以找到不同大小的物體。
我們開發(fā)了一種“refining”搜索的交互式方法，使得匹配不只是基于單個(gè)片段，而是基于多個(gè)片段。

從2016年公開的12.5厘米分辨率的丹麥spring航拍圖像數(shù)據(jù)集中，我們在哥本哈根周圍的以下區(qū)域計(jì)算了3種不同比例的8,838,984個(gè)片段的描述符：

交互式匹配

交互式匹配目前還處于原型階段，最好通過一個(gè)示例來解釋：假設(shè)我們想要映射一個(gè)區(qū)域中航行的所有船只。我們首先選擇一個(gè)包含一艘船的片段：

基于所存儲的描述符，系統(tǒng)計(jì)算所選片段與所有其片段出之間的“距離”(相似性)。然后，排序完成，100個(gè)最相似的片段顯示給用戶：

可以看到，這些片段中有一些包含船只，但結(jié)果遠(yuǎn)遠(yuǎn)不夠好。用戶現(xiàn)在可以選擇一些他滿意的片段：

然后，將所選擇的所有片段和數(shù)據(jù)庫中所有片段的描述符進(jìn)行比較，再根據(jù)它們的平均相似距離進(jìn)行排序。這就產(chǎn)生了下面的前100名：

可以看到有顯著的改善。我們可以選擇再運(yùn)行一次迭代搜索，通過選擇更多的我們滿意的片段，并再次運(yùn)行排序：

船只仍在前100名之列，這是一個(gè)好跡象。請注意，我們之前標(biāo)記為滿意的片段不再出現(xiàn)在交互式細(xì)分中。

從排序到匹配

迭代方法的結(jié)果是對880萬個(gè)片段進(jìn)行排序，基于在交互細(xì)化過程中選擇的片段的平均相似距離。理想情況下，應(yīng)該有個(gè)邊界，前N個(gè)片段包含船只，剩下的片段是沒有的。然而，在實(shí)際中，更確切地說，是前M個(gè)片段包含船只，之后在片段M和片段N之間有一個(gè)間隔，其中一些包含船只，而不是所有都包含船只。在M之后的片段被假設(shè)不包含船，以避免誤報(bào)。我們創(chuàng)建了一個(gè)快速而粗糙的用戶界面，用戶可以在其中檢查已排序的片段，并為M和N建立一些有用的值。

如果排序是好的，如果M和N被合理地設(shè)置，你現(xiàn)在就有了干凈的訓(xùn)練數(shù)據(jù)，包括包含船只的片段(排序M)和不包含船只的片段(排序N)。這可以用來訓(xùn)練一個(gè)分類網(wǎng)絡(luò)(或者可能的目標(biāo)檢測網(wǎng)絡(luò))來識別船只。然而，在我們的例子中，我們選擇測試一種更簡單的啟發(fā)式來匹配船：我們在排序中從M之前選擇了100個(gè)隨機(jī)的片段(正樣本)，在N之后選擇了100個(gè)隨機(jī)的片段(負(fù)樣本)。這些片段組成了一個(gè)200個(gè)樣本的比較集。對于M和N之間的每個(gè)片段，我們找到與比較集中描述符最相似的兩個(gè)片段。如果這兩個(gè)片段都是正樣本，片段被接受為一條船，并且片段的輪廓被保存為一個(gè)多邊形。對于所有正的示例樣本(排序rank<M)，也創(chuàng)建一個(gè)多邊形。結(jié)果概覽如下：

放大后，你可以看到像這樣的東西(由于某些原因，包圍框少了一條邊)：

匹配并不完美，但在不到一刻鐘的時(shí)間內(nèi)，該技術(shù)可以提供情況的概述。與此同時(shí)，你也為訓(xùn)練數(shù)據(jù)集創(chuàng)造了一個(gè)很好的起點(diǎn)，可以用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)或其他機(jī)器學(xué)習(xí)方法。

匹配樹木

用同樣的重復(fù)的過程來匹配樹木樹，得到一個(gè)像這樣的匹配：

放大，看起來是這樣：

同樣，這個(gè)匹配并不完美，但它為進(jìn)一步的工作提供了一個(gè)良好的起點(diǎn)。

我希望這篇文章在如何使用預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)的物體定位方面能激發(fā)一些靈感，比如從地圖中提取訓(xùn)練數(shù)據(jù)。我很有興趣了解更多潛在的使用案例，所以如果你曾經(jīng)需要在大圖片(如地圖)中尋找特定的物體，請留下評論！

另外，我非?？释牭侥愕南敕?，如何使用自監(jiān)督的方法來創(chuàng)建一個(gè)更好的圖像patch的嵌入表示。

英文原文：https://towardsdatascience.com/deep-learning-for-visual-searches-and-mapping-89b85061ef9e

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 深度學(xué)習(xí)

評論

相關(guān)推薦

一種改進(jìn)的可遷移深度學(xué)習(xí)模型*

智能計(jì)算 202210 可遷移深度學(xué)習(xí) 無標(biāo)簽 | 2022-10-25

基于圖結(jié)構(gòu)的圖像注意力網(wǎng)絡(luò)

智能計(jì)算 202207 深度學(xué)習(xí) 注意力機(jī)制圖像分類人臉識別 | 2022-07-26

TFLite模型的開盲盒體驗(yàn)

嵌入式系統(tǒng) TFLite 模型推理庫深度學(xué)習(xí) | 2024-05-10

射頻系統(tǒng)的深度學(xué)習(xí)

資源下載 ADI RF DSP 深度學(xué)習(xí) | 2020-04-20

基于深度學(xué)習(xí)的跌倒檢測技術(shù)對比與分析*

智能計(jì)算深度學(xué)習(xí) 跌倒檢測卷積神經(jīng)網(wǎng)絡(luò) 長短期記憶網(wǎng)絡(luò) 202212 | 2022-12-22

什么是人機(jī)交互技術(shù)？

龍騰AI技術(shù) | 2022-11-02

Firefly DL小巧輕便，嵌入式深度學(xué)習(xí)加速部署

智能計(jì)算 Firefly DL 深度學(xué)習(xí) 人工智能 | 2023-12-22

AI深度學(xué)習(xí)

loof_lripa | 2024-04-20

深度強(qiáng)化學(xué)習(xí)核心技術(shù)開發(fā)與應(yīng)用

szhlss123 | 2022-08-10

Deep Learning中文版

資源下載深度學(xué)習(xí) 中文 | 2019-06-11

深度學(xué)習(xí)（DeepLearning）

szhlss123 | 2022-08-17

為什么深度學(xué)習(xí)如此容易被愚弄？AI研究員正努力修復(fù)神經(jīng)網(wǎng)絡(luò)缺陷

智能計(jì)算 DNN 深度神經(jīng)網(wǎng)絡(luò) 深度學(xué)習(xí) | 2022-07-05

深度學(xué)習(xí)（人工神經(jīng)網(wǎng)絡(luò)的研究的概念）

大綠葉 | 2020-07-28

直覺有害！Facbook最新研究：易于解釋的神經(jīng)元會誤導(dǎo)DNN的學(xué)習(xí)

智能計(jì)算 DNN 深度神經(jīng)網(wǎng)絡(luò) 深度學(xué)習(xí) | 2022-07-05

基于深度學(xué)習(xí)的智能電網(wǎng)短期日負(fù)荷曲線預(yù)測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

智能計(jì)算 202302 深度學(xué)習(xí) 短期負(fù)荷預(yù)測卷積神經(jīng)網(wǎng)絡(luò) 長短期記憶網(wǎng)格 Flask | 2023-02-27

視覺慣性導(dǎo)航融合算法研究進(jìn)展

物聯(lián)網(wǎng)與傳感器 202302 視覺慣性導(dǎo)航優(yōu)化耦合算法深度學(xué)習(xí) | 2023-02-21

深度學(xué)習(xí)模型的云邊協(xié)同訓(xùn)練和部署*

智能計(jì)算云邊協(xié)同深度學(xué)習(xí) 服務(wù)器部署 202212 | 2022-12-22

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();