做一些让自己感觉有趣的事情
分类:C++
最近碰到一个项目需求,在ubuntu22的环境下,使用TensorRT框架推理优化神经网络模型,使用cuda并行处理多路输入,并将这部分功能封装为动态链接库,方便主程序调用。
分类:高性能计算
CUDA-C是一种用于通用计算的并行编程模型,专门为NVIDIA的GPU架构设计。随着数据量和计算需求的不断增长,传统的CPU在处理某些计算密集型任务(如图像处理、科学计算、深度学习)时可能会变得非常缓慢。GPU的并行处理能力可以显著提高这