推理速度不科学啊 #4

wbjnpu · 2023-06-07T14:38:15Z

我集成到自己的工程中，同样的模型单线程linux下速度竟然只有onnx推理的1/8，不知为何

spianmo · 2023-06-07T14:40:05Z

我集成到自己的工程中，同样的模型单线程linux下速度竟然只有onnx推理的1/8，不知为何

使用的是GPU版本吗？目前NCNN的GPU推理效率并不很高

wbjnpu · 2023-06-07T23:57:04Z

我集成到自己的工程中，同样的模型单线程linux下速度竟然只有onnx推理的1/8，不知为何

使用的是GPU版本吗？目前NCNN的GPU推理效率并不很高

cpu的，没有开vulkan的。另外就是精度问题，用我的相同的模型推理出的句子长度比onnx要短30%，发音也有问题，我看是在dp后计算帧数就明显少了

sunjunlishi · 2024-01-03T09:55:41Z

是不是模型是fp16的原因？

spianmo · 2024-01-11T01:35:05Z

是不是模型是fp16的原因？

有可能，试试int8的

sunjunlishi · 2024-02-05T07:53:33Z

支持中文的代码呀

Provide feedback