团队简介
我们属于商汤研究院,是商汤科技研究院通用模型团队,负责公司大模型,多模态,自动驾驶等相关前沿算法研究与落地。
自动驾驶方向
工作职责
- 负责视觉感知大模型研发,探索多任务端到端自动驾驶算法,和来自于自动驾驶的业务团队并肩探索,致力于推动前沿算法的落地。
- 负责多模态感知统一模型的研发,模态主要面向lidar和radar,探索更高效的多传感器前端融合感知方案,最终将用于智能体在实际三维世界中的视觉探索。
- 负责探索深度学习前沿算法发展,结合超大模型、多模态学习、无监督学习等先进工具,不断优化迭代,保证感知产品在相关领域的先进性和竞争力。
任职要求
- 对基础感知算法、多模态统一感知有较为深入的认识,熟悉3D检测及BEV相关算法,对自动驾驶算法有一定经验;
- 掌握常见的深度学习框架,掌握pytorch,python编程基础,熟悉并行计算加速;
- 具有良好的沟通能力和团队合作精神,对基础模型精度上限的探索有浓厚的兴趣。
AIGC方向
工作内容
- 参与AIGC视频生成方向的研究,紧跟学术界和工业界前沿,致力于构建业内领先的视频生成算法;
- 参与视频生成相关算法的优化,包括但不限于:文生视频、文生语音、Audio2Face等;
- 与产品团队合作,将视频生成算法用于实际产品中,推动视频生成算法在商业领域的落地。
任职要求
- 掌握常见的深度学习框架,掌握pytorch,python编程基础,熟悉并行计算加速;
- 在国际顶尖期刊或会议(如ACL, EMNLP, NACCL,NeurIPS等)发表过论文, 知名比赛中有优异表现的优先;
- 有diffusion model、视频生成、TTS研究经验优先。
活体方向
工作职责
- 研究深度学习活体识别、深度伪造、对抗攻击,follow前沿的相关算法,紧跟学术前沿,开展高水平和创新性的研究,保持算法在工业界和学术界的领先,参与顶会论文投稿及专利申请;
- 负责开发活体对抗算法所需要的工具以及基础设施,实现算法部署与工程化、文档输出 ;
任职要求
- 掌握常见的深度学习框架,掌握pytorch,python编程基础,熟悉并行计算加速,了解神经网络模型的工程部署;
- 对身份认证有基础的认识,了解人脸比对、活体识别系列算法;
-
掌握图像生成,熟悉stable diffusion、DALL-E等算法;
- 熟悉深度学习数据处理流程和训练流程,有模型训练经验;
- 具有良好的沟通能力和团队合作精神,对计算机视觉有浓厚兴趣。