Yolov5s部署

实现步骤：

1 获取 best.pth

下载对应版本的yolo5代码，训练得到best.pth

修改一段代码（注意，训练阶段不要修改）。将yolov5/models/yolo.py文件中class Detect(nn.Module)类的函数forword修改。

修改后将best.pt移动至yolov5/export.py同一文件夹下，在命令行调用以下命令：

python export.py --weights best.pt --img 640 --batch 1 --include onnx
或
python export.py --weights best.pt --include  onnx

便可以得到成功转换的模型best.onnx。

(可能会报错说ONNX版本不支持，那么就将export.py中parse_opt()函数的--opset参数修改为12)

(也可能报错说不支持SiLU，把./models/common.py里的SiLU改成ReLU即可)

此处的转换工具只能在Linux系统上运行，在linux上下载（clone）转换工具rknn-toolkit2。并配置好相关环境，使用docker或直接配置。

根据rknn-toolkit2\docker\docker_file\ubuntu_18_04_cp36目录下的Dockerfile构建。

开发板环境还不完备，后面需要什么就安装什么，apt install xxx，例如git，gcc，g++等。

git clone https://github.com/rockchip-linux/rknpu2

(注意此步骤不能windows上下载后传到开发板，要在开发板上拉取)

进入/home/lhk/rknpu2/examples/rknn_yolov5_demo目录。有需要的话则修改下图内容为自己的。
将转换后的best.rknn文件放在model/RK3588目录下，运行bash ./build-linux_RK3588.sh，成功后生成install文件夹，进入install/rknn_yolov5_demo_Linux。（需要gcc，g++环境，安装即可）
在model目录下放入需要推理的图片test.jpg，运行./rknn_yolov5_demo ./model/RK3588/best.rknn ./model/test.jpg

也可以支持h264、h265、rtsp视频流。例如h264视频流，指令:

./rknn_yolov5_video_demo model/RK3588/best.rknn model/test.h264 264

执行cat /sys/kernel/debug/rknpu/load查看npu的使用情况，可以发现虽然有多个npu，但是没有全部用上

使用while true ; do cat /sys/kernel/debug/rknpu/load ; sleep 1 ; done;可以持续监控npu使用情况

以前尝试过实现多线程，但没成功。推测是编解码相关的问题。同目录PPT中有详细介绍。

参考这个仓库 https://github.com/leafqycc/rknn-cpp-Multithreading，通过自己实现多线程把帧率拉到140+。但是当时拉下代码尝试，确实是能使用多核了，但是利用率极低，推测是编解码相关的问题，当时设备环境好像不支持硬件解码，多多多次配置ffmpeg后也没有成功。

官方代码，支持mpp硬件解码，但暂未实现多线程。推测在其基础上自己手动实现多线程即可，但是该源代码风险大也困难，未尝试

既然 5.1 中不支持硬件解码，而官方代码是支持的，且设备本就有官方的环境，那可以尝试在 5.1 代码中调用mpp相关接口去实现硬件编解码。感觉比较难，未尝试