生活随笔
收集整理的這篇文章主要介紹了
使用CUDA计算Haar小波变换
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在《Haar小波變換的快速實現》一文里我們提到了Haar小波變換的計算,在這里我們使用CUDA實現文中提到的計算方式。
| 02 | _cuda_haar(float?*A,?float?*B,?int?w,?int?h,?int?b_w,?int?b_h,?int?row_scan) |
| 04 | ????int?i = blockIdx.x * blockDim.x + threadIdx.x; |
| 05 | ????int?j = blockIdx.y * blockDim.y + threadIdx.y; |
| 07 | ????int?extern_w = b_w * 2; |
| 08 | ????int?extern_h = b_h * 2; |
| 16 | ????if?(row_scan)//行變換,因為數據為HSL格式,所以只提取L分量,即i * 3 + 2位置的數據,生成的數據只是一個L分量,并*255量化 |
| 18 | ????????if?(j % 2 != 0) |
| 20 | ????????????if?(j > w) |
| 22 | ????????????????B[i * extern_w + b_w + j/2] = A[(i * w + j - 1) * 3 + 2] * 255; |
| 25 | ????????????????B[i * extern_w + b_w + j/2] = (A[(i * w + j - 1) * 3 + 2] - A[(i * w + j) * 3 + 2]) * 255 * 0.5; |
| 30 | ????????????if?(j == w) |
| 32 | ????????????????B[i * extern_w + j/2] = A[(i * w + j) * 3 + 2] * 255; |
| 35 | ????????????????B[i * extern_w + j/2] = (A[(i * w + j) * 3 + 2] + A[(i * w + j + 1) * 3 + 2]) * 255 * 0.5; |
| 40 | ????????if?(i % 2 != 0) |
| 42 | ????????????if?(i > h) |
| 44 | ????????????????B[(i/2 + b_h) * extern_w + j] = A[(i - 1) * extern_w + j]; |
| 47 | ????????????????B[(i/2 + b_h) * extern_w + j] = (A[(i - 1) * extern_w + j] - A[i * extern_w + j]) * 0.5; |
| 51 | ????????????if?(i == h) |
| 53 | ????????????????B[i/2 * extern_w + j] = A[i * extern_w + j]; |
| 56 | ????????????????B[i/2 * extern_w + j] = (A[i * extern_w + j] + A[(i + 1) * extern_w + j]) * 0.5; |
代碼有點亂,本來行變換和列變換是一次完成的,中間使用一個臨時全局存儲空間進行存儲,但發現做列變換時從全局存儲空間提出的數據有一部分是“臟”的,使用_threadfence做了同步處理。問題暫時沒有找到,就使用這個替代方法了:先做行變換,然后將數據拷回內存,再拷回顯存,第二次調用此內核函數,做列變換。
變換結果如下:
作者:renjihe 出處:http://www.renjihe.com
本站所有文章均是原創,版權歸本站所有。歡迎轉載,但未經同意必須保留此段聲明,且在文章頁面明顯位置給出原文連接,否則保留追究法律責任的權利.
總結
以上是生活随笔為你收集整理的使用CUDA计算Haar小波变换的全部內容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。