<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>

<label id="pryje"></label>

新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 基于GPU的并行Voronoi圖柵格生成算法

基于GPU的并行Voronoi圖柵格生成算法

作者：時(shí)間：2018-08-08 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

收藏

Voronoi圖是一種空間分割算法。其是對(duì)空間中的n個(gè)離散點(diǎn)而言的，它將平面分割為n個(gè)區(qū)域，每個(gè)區(qū)域包括一個(gè)點(diǎn)，此區(qū)域是到該點(diǎn)距離最近的點(diǎn)的集合。由于Voronoi圖具有最鄰近性，鄰接性等眾多性質(zhì)和完善的理論體系，其被廣泛的應(yīng)用在地理學(xué)、氣象學(xué)、結(jié)晶學(xué)、航天、機(jī)器人等領(lǐng)域。

本文引用地址：http://www.ex-cimer.com/article/201808/385935.htm

Voronoi圖的生成主要有矢量方法和柵格方法。矢量法中，典型的方法有增量法、分治法和間接法。分治法是一種遞歸方法，算法思路簡(jiǎn)單，但是很難在應(yīng)用過程中實(shí)現(xiàn)動(dòng)態(tài)更新。間接法則是根據(jù)其對(duì)偶圖Delaunay三角網(wǎng)來構(gòu)造Voronoi圖，因此其性能的高低由所采用的Delaunay三角網(wǎng)的構(gòu)造算法所決定。增量法通過不斷向已生成的Voronoi圖中增加點(diǎn)來動(dòng)態(tài)構(gòu)建Voronoi圖。相對(duì)于前兩種方法，增量法構(gòu)造簡(jiǎn)單并且容易實(shí)現(xiàn)動(dòng)態(tài)化，所以被廣泛應(yīng)用。矢量方法的優(yōu)勢(shì)是生成Voronoi圖精度高，但是存在存儲(chǔ)復(fù)雜，生長(zhǎng)元只能是點(diǎn)和線，以及難以向三維及高維空間擴(kuò)展等問題。因此本文重點(diǎn)研究了Voronoi圖的柵格生成方法，首先比較了常見的柵格方法生成Voronoi圖的優(yōu)缺點(diǎn)，然后結(jié)合CUDA的出現(xiàn)，提出一種基于GPU的 Voronoi圖并行柵格生成算法。

1 柵格法簡(jiǎn)介

柵格方法生成Voronoi 圖主要是將二值圖像轉(zhuǎn)化為柵格圖像，然后確定各個(gè)空白柵格歸屬。主要方法有兩類，一類以空白柵格為中心，計(jì)算每個(gè)空白柵格到生長(zhǎng)目標(biāo)的距離，以確定其歸屬，常見的方法有代數(shù)距離變換法，逐個(gè)空白柵格確定法等;另一類以生長(zhǎng)目標(biāo)為中心，不斷擴(kuò)張生長(zhǎng)目標(biāo)的距離半徑，填充其中的空白柵格，直到將整個(gè)圖像填充完成，主要有圓擴(kuò)張法，數(shù)學(xué)形態(tài)學(xué)距離變換法等。代數(shù)距離變換法對(duì)距離圖像進(jìn)行上行掃描(從上到下，從左到右)和下行掃描(從下向上，從右到左)兩次掃描，計(jì)算出每個(gè)空白柵格最鄰近的生長(zhǎng)目標(biāo)，以此生長(zhǎng)目標(biāo)作為其歸屬。此方法中柵格距離的定義直接影響了空白柵格的歸屬和Voronoi圖的生成精度，通常使用的柵格距離定義有街區(qū)距離、八角形距離、棋盤距離等。距離變換的柵格生成方法精度低、耗時(shí)長(zhǎng)，所需要花費(fèi)的時(shí)間和柵格的數(shù)量成正比，當(dāng)柵格為n×n大小時(shí)，其時(shí)間復(fù)雜度為O(n×n)。圓檢測(cè)法以生長(zhǎng)目標(biāo)為圓心，以一定的步長(zhǎng)為初始半徑，所有生長(zhǎng)目標(biāo)同時(shí)對(duì)其構(gòu)成的圓內(nèi)的空白柵格進(jìn)行覆蓋。通過不斷擴(kuò)大生長(zhǎng)目標(biāo)的半徑，將會(huì)有越來越多的空白柵格被各個(gè)圓所覆蓋，直到最終覆蓋完整個(gè)圖像。數(shù)學(xué)形態(tài)學(xué)距離變換法與圓檢測(cè)法類似，其思想來源于數(shù)學(xué)形態(tài)學(xué)中膨脹操作，膨脹操作起到了擴(kuò)大圖像的效果，通過不斷的對(duì)生長(zhǎng)目標(biāo)進(jìn)行膨脹操作，最終擴(kuò)張到所有的空白柵格。這兩種方法有個(gè)共同的缺點(diǎn)，在每次擴(kuò)張后，都需要判斷整個(gè)柵格圖像是否已完成擴(kuò)張，而這需要遍歷柵格圖像，十分耗時(shí)。

2 GPU下的柵格生成方法

2.1 CUDA編程模型與GPU

CUDA是一個(gè)并行編程模型和一個(gè)軟件編程環(huán)境，其采用了C語(yǔ)言作為編程語(yǔ)言，提供了大量的高性能計(jì)算指令開發(fā)能力，使開發(fā)者能夠在GPU的強(qiáng)大計(jì)算能力上建立起一種更加高效的密集數(shù)據(jù)計(jì)算解決方案。

CUDA將CPU作為主機(jī)端，GPU作為設(shè)備端，一個(gè)主機(jī)端可以有多個(gè)設(shè)備端。其采用CPU和GPU協(xié)同工作的方式，CPU主要負(fù)責(zé)程序中的串行計(jì)算的部分，GPU主要負(fù)責(zé)程序中的并行計(jì)算的部分。GPU上運(yùn)行的代碼被稱為內(nèi)核函數(shù)，其能夠被GPU上內(nèi)置的多個(gè)線程并行執(zhí)行。一個(gè)完整的任務(wù)處理程序由 CPU端串行處理代碼和GPU端并行內(nèi)核函數(shù)共同構(gòu)成。當(dāng)CPU中執(zhí)行到GPU代碼時(shí)，其首先將相關(guān)數(shù)據(jù)復(fù)制到GPU中，然后調(diào)用GPU的內(nèi)核函數(shù)，GPU中多個(gè)線程并行執(zhí)行此內(nèi)核函數(shù)，當(dāng)完成計(jì)算后，GPU端再把計(jì)算的結(jié)果返回給CPU，程序繼續(xù)執(zhí)行。通過將程序中耗時(shí)的且便于并行處理的計(jì)算轉(zhuǎn)移到GPU中使用GPU并行處理，以提高整個(gè)程序的運(yùn)行速度。CUDA是以線程網(wǎng)格(Grid)，線程塊(Block)，線程(Thread)為三層的組織架構(gòu)，每一個(gè)網(wǎng)格由多個(gè)線程塊構(gòu)成，而一個(gè)線程塊又由多個(gè)線程構(gòu)成，如圖1所示。在GPU中，線程是并行運(yùn)行的最小單元，由此可見，當(dāng)存在大量的線程時(shí)，程序的并行程度將會(huì)十分高。目前的GPU上一個(gè)網(wǎng)格最多包含65535×65535個(gè)線程塊，而一個(gè)線程塊通常有512個(gè)或1024個(gè)線程，所以理論上可以對(duì)65535×65535×512個(gè)柵格同時(shí)進(jìn)行計(jì)算。

2.2 并行Voronoi圖柵格生成算法

傳統(tǒng)的柵格生成算法中，不論是采用以空白柵格為中心確定其歸屬的方法，還是以生長(zhǎng)目標(biāo)為中心通過不斷增長(zhǎng)生長(zhǎng)目標(biāo)半徑對(duì)空白柵格進(jìn)行覆蓋的方法，他們?cè)谟?jì)算每個(gè)空白柵格距離時(shí)，只能通過遍歷柵格，逐一處理。而柵格處理過程中的一個(gè)重要特點(diǎn)是，各個(gè)柵格的計(jì)算并不依賴于其他柵格的計(jì)算結(jié)果。即各個(gè)柵格的計(jì)算是相互獨(dú)立的，而由于CPU的串行性，導(dǎo)致了各個(gè)柵格只能順序處理，降低了處理速度。

圖1GPU組織架構(gòu)

由于GPU下的多個(gè)線程都是硬件實(shí)現(xiàn)的，各個(gè)線程的處理都是并行的，因此將柵格距離的計(jì)算分散到GPU端各個(gè)線程，必然能夠提高其生成速度。為了并行處理柵格化圖像，可以采用如下的想法，將每一個(gè)柵格點(diǎn)對(duì)應(yīng)于一個(gè)線程，此線程計(jì)算此柵格到所有的生長(zhǎng)目標(biāo)的距離，取最小距離的生長(zhǎng)目標(biāo)作為其歸屬。即采用一個(gè)線程用來確定一個(gè)空白柵格歸屬的方法。

確定方法后，就需要對(duì)GPU端內(nèi)核函數(shù)進(jìn)行設(shè)計(jì)，由于內(nèi)核函數(shù)是并行處理的執(zhí)行單元，其設(shè)計(jì)方式直接決定了GPU端的程序運(yùn)行效率。因此如何設(shè)計(jì)良好的內(nèi)核函數(shù)是提高并行速度的關(guān)鍵。本文采用如下方式進(jìn)行內(nèi)核函數(shù)的設(shè)計(jì)，假設(shè)共分配了K個(gè)并行處理線程，柵格規(guī)模為M×N，設(shè)A[i]為第i個(gè)線程處理的柵格編號(hào)。當(dāng)K

由于顯卡上的內(nèi)存是動(dòng)態(tài)隨機(jī)存儲(chǔ)(DRAM)，因此最有效率的存取方式，是以連續(xù)的方式存取。當(dāng)采用第一種方式時(shí)，看似是一種連續(xù)的存取方式，實(shí)際上恰好是非連續(xù)的，當(dāng)?shù)趇個(gè)線程處理第i個(gè)柵格時(shí)，由于處理需要一定的時(shí)間，此時(shí)GPU自動(dòng)將下個(gè)一線程i+1需要的內(nèi)存數(shù)據(jù)取出給其使用，此時(shí)下一個(gè)線程的內(nèi)存數(shù)據(jù)卻是在i+C處，內(nèi)存變成了間斷存取。而在使用第二種方式進(jìn)行處理時(shí)，恰好是一種連續(xù)的存取方式，由于第i個(gè)線程正在處理第i個(gè)柵格數(shù)據(jù)，此時(shí) GPU為第i+1個(gè)線程準(zhǔn)備數(shù)據(jù)，而此時(shí)的數(shù)據(jù)正好為第i+1內(nèi)存處。滿足了內(nèi)存的連續(xù)存取特性。因此本文采用第二種方式，內(nèi)核函數(shù)的設(shè)計(jì)偽代碼如下：

上一頁(yè) 1 2 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： GPU 并行Voronoi 圖柵格

評(píng)論

相關(guān)推薦

這顆芯片有故事，你有酒嗎？

FPGAwuhan | 2016-08-20

Intel 收購(gòu) NVDIA 意欲何為

視頻 Intel NVDIA CPU GPU 移動(dòng)處理 | 2012-12-26

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

獲得GPU存儲(chǔ)性能的四種方法

資源下載 GPU 存儲(chǔ) | 2020-04-01

中國(guó)科學(xué)院院士：CPU、GPU架構(gòu)上國(guó)人沒貢獻(xiàn)很遺憾應(yīng)加強(qiáng)創(chuàng)新

嵌入式系統(tǒng) CPU GPU 架構(gòu) | 2024-07-12

GPU和CPU芯片誰(shuí)更復(fù)雜?

睡夢(mèng)中的雄師 | 2023-08-24

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達(dá)創(chuàng)造 2100 億美元年收入

智能計(jì)算 GB200 AI 英偉達(dá) GPU | 2024-07-26

目標(biāo)完全替代閉源驅(qū)動(dòng)，英偉達(dá)宣布全面轉(zhuǎn)向開源 GPU 內(nèi)核模塊

嵌入式系統(tǒng) 閉源驅(qū)動(dòng) 英偉達(dá) 開源 GPU 內(nèi)核模塊 Linux | 2024-07-22

GPU圖形處理器各大廠家芯片參數(shù)介紹

資源下載 GPU 芯片 | 2013-08-30

gpu_gpu是什么意思

dolphin | 2014-06-12

APU與GPU共進(jìn) AMD搶攻嵌入式應(yīng)用

設(shè)計(jì)方案 APU GPU AMD | 2015-08-19

CPU與GPU：誰(shuí)將主導(dǎo)下一次計(jì)算革命？

資源下載 CPU GPU 計(jì)算革命融合集成 SOC | 2008-05-26

醫(yī)療電子平臺(tái)選擇:FPGA、ARM、X86、DSP還是GPU分析

設(shè)計(jì)方案 FPGA ARM DSP GPU X | 2015-08-13

消息稱臺(tái)積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺(tái)積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

談GPU的作用、原理及與CPU、DSP的區(qū)別

設(shè)計(jì)方案 GPU CPU DSP 緩存體系 3 | 2015-08-13

Imagination：我們的移動(dòng)GPU技術(shù)一騎絕塵

設(shè)計(jì)方案 Imagination TI GPU | 2015-08-19

LabVIEW和GPU用于實(shí)時(shí)高性能運(yùn)算系統(tǒng)

資源下載 NI LabVIEW GPU | 2013-03-29

消息稱英偉達(dá) RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應(yīng)緊張

消費(fèi)電子英偉達(dá) GPU | 2024-07-29

打破NVIDIA壟斷！英國(guó)公司實(shí)現(xiàn)CUDA軟件在AMD GPU上無(wú)縫運(yùn)行

智能計(jì)算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

Manpower代招上海 US MNC GPU Physical design technical leader

魔都獵頭招聘 | 2013-07-23

大嘴業(yè)話：A12真的能改變競(jìng)爭(zhēng)格局么？

視頻 ARM A12 GPU | 2013-06-21

基于視覺的駕駛員輔助嵌入式系統(tǒng)(下)

資源下載 ADAS 嵌入式 GPU | 2014-03-28

基于GPU的數(shù)字圖像并行處理研究

設(shè)計(jì)方案圖像處理算法并行流處理 GPU | 2015-08-13

《E點(diǎn)冷知識(shí)》：引發(fā)AI行業(yè)大地震的CUDA究竟有多強(qiáng)大

視頻英偉達(dá) GPU CUDA AI | 2024-03-26

Meta訓(xùn)練Llama 3遭遇頻繁故障

智能計(jì)算 Meta Llama 3 英偉達(dá) H100 顯卡 GPU | 2024-07-29

消息稱英偉達(dá)曾向臺(tái)積電詢問建設(shè)廠外 CoWoS 先進(jìn)封裝專線可能，遭拒絕

EDA/PCB 英偉達(dá) GPU 封裝工藝臺(tái)積電 | 2024-07-23

RISC-V為開源GPU鋪平道路

風(fēng)的印記 | 2021-08-16

GPU的形態(tài)已徹底改變，英偉達(dá)GTC大會(huì)發(fā)布的到底是什么

視頻英偉達(dá) GPU Blackwell AI GTC | 2024-03-26

什么是 DLSS，值得嗎？

智能計(jì)算 DLSS gpu NVIDIA | 2024-07-17

焦點(diǎn)

推薦視頻

技術(shù)專區(qū)

看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();