图1 PaddleClas图像分类应用示意图
从大名鼎鼎的Resnet50到如今火热的Swin-Transformer,模型精度不断被刷新,但是预测效率并不高。使用Swin-Transformer最小的模型在CPU上预测速度也超过100ms,远远无法满足实时需求。
虽然使用MobileNet系列等轻量化模型可以保证较高的预测效率,在CPU上预测一张图像大约3ms,但是模型精度往往和大模型有很大差距。
想要得到性能理想的模型往往需要经过反复的调优操作和重新训练,即使是高频业务场景可参考的实践教程也极少,项目落地不仅耗时长,难度也很大。
表1 不同模型精度速度结果对比
图2 9大场景模型效果示意图
传送门:
https://github.com/PaddlePaddle/PaddleClas
图3 超轻量图像分类方案(PULC)示意图
PP-LCNet作为针对CPU量身打造的骨干网络模型,在速度、精度方面均远超如MobileNetV3等同体量算法,多个场景模型优化后,速度较SwinTransformer的模型快30倍以上,精度较MobileNetV3_small_0.35x高18个点。
SSLD半监督蒸馏算法可以使小模型学习到大模型的特征和ImageNet22k无标签大规模数据的知识。在训练小模型时,使用SSLD预训练权重作为模型的初始化参数,可以使不同场景的应用分类模型获得1-2.5个点的精度提升。
该方案融合了图像变换、图像裁剪和图像混叠3种数据增强方法,并支持自定义调整触发概率,能使模型的泛化能力大大增强,提升模型在实际场景中的性能。模型可以在上一步的基础上,精度再提升1个点左右。
SKL(symmetric-KL)在经典的KL知识蒸馏算法的基础上引入对称信息,提升了算法的鲁棒性。同时,该方案可以方便的在训练中加入无标签训练数据(Unlabeled General Image),可以进一步提升模型效果。该算法可以使模型精度继续提升1-2个点。
表2 图像分类产业落地工具集支持的训练推理部署功能列表
链接指路:https://github.com/PaddlePaddle/PaddleClas
入群福利:
图4 PaddleClas入群礼包内容示意
入群方式:
官网地址:https://www.paddlepaddle.org.cn
PaddleClas项目地址:
GitHub: https://github.com/PaddlePaddle/PaddleClas
Gitee: https://gitee.com/paddlepaddle/PaddleClas