|
GPU去噪器,具有非常高的静态图像和视频性能
图像/视频去噪广泛应用于许多相机应用中,特别是对于低光照明的任务。 我们已经开发了几个GPU加速的去噪内核,这些内核运行在Windows/Linux/ARM上现有的NVIDIA硬件上。 我们在图像和视频处理方面都取得了非常高的性能.
GPU Denoiser库功能
- 输入格式:每通道8/10/12/14/16位cpu或GPU内存输入数据阵列
- 输出格式:CPU或GPU内存中的24/48位输出数据阵列
- 具有16/32位精度的去噪
- 没有AI的高速去噪
- 去噪算法
- 小波去噪器(raw和rgb)Cdf5/3和CDF9/7与硬,软,Garrote阈值
- 双边去噪器
- NLM去噪器
- 与用于机器视觉摄像机的FastVCR软件兼容
- 定时和性能测量
- OS Windows-10/11, Linux Ubuntu and L4T (Jetson NX, Xavier, Orin)
- 与NVIDIA Gpu的兼容性 (Jetson, GeForce, Quadro), cc >=5.0, CUDA-12.6
GPU去噪器的基准
图像分辨率: 4112×2176 (8.9 MPix), 每通道16位, RGB/RGGB
测试描述:gpu内存中的所有数据,时序只包括GPU计算
二维小波变换: CDF 9/7
DWT分辨率数量:最多7
YCBCR的DWT阈值:80;150;150
NLM去噪器参数: 模糊窗口3&次;3和更多, 搜索窗口3&次;3和更多,强度1-3000
该算法可以使用内部4:4:4或4:2:0子采样
NLM还可以为4:2:0和4:4:4子采样模式的Y和Cb/Cr通道提供独立的去噪参数
用于测试的NLM去噪器参数:模糊窗口3×3,搜索窗口5×5,强度500
用于测试的双边去噪器参数:直径3,sigma Color5,sigmaSpace500
软件: OS Windows-10/11, CUDA-12.6
硬件: NVIDIA GeForce RTX 4090
- 生DWT去噪剂 - 1.8 ms (4.9 GPix/s)
- DWT去噪器 (YCbCr, 4:4:4) - 3.05 ms (2.9 GPix/s)
- NLM去噪器 (RGB) - 0.19 ms (40 GPix/s)
- NLM去噪器 (YCbCr, 4:2:0) - 0.20 ms (40 GPix/s)
- NLM去噪器 (YCbCr, 4:4:4) - 0.37 ms (21 GPix/s)
- 双边去噪器 (RGB) - 0.13 ms (61 GPix/s)
上面的结果显示了超快的性能,并且比我们最好的MG debayer算法的处理时间快得多,对于该GPU上的相同图像,处理时间约为0.6 ms (13 GPix/s)。 我们的去噪器曾经比这个去马赛克算法慢得多.
我们已经开发了这个软件作为我们的GPU图像和视频处理SDK的一部分. 现在,我们的客户可以在他们的应用程序中使用这些GPU加速的去噪器作为图像处理管道的一部分.
测试
要测试我们的GPU去噪器,请下载FastVCR软件,该软件不仅可以实时与机器视觉相机配合使用,还可以与SSD的RAW或PGM图像配合使用。 这是评估图像质量和性能的真正测试.
这是下载windows-10/11试用软件的直接链接: FastVCR 软件.
它适用于CUDA-12.6,因此请在测试前安装最新的NVIDIA驱动程序.
基于GPU的去噪路线图
- 加速双边去噪 - 完成了
- FFmpeg GPU上的YUV去噪滤波器 - 进行中
- 原始去噪噪声轮廓校准和实现 - 进行中
- Gpu上的时间去噪器 - 进行中
|