Back to all jobs
B
具身智能VLA模型数据算法工程师-AI数据与安全
Beijing
RegularR&DJob Description
1、负责具身智能VLA(视觉-语言-动作)模型预训练数据全流程研发,聚焦数据合成、自动化打标、质量分析与优化,支撑模型实现“感知-理解-执行”一体化能力提升,适配人形机器人、智能交互终端等具身场景需求; 2、研发高效的自动化打标算法,整合多模态感知、理解等能力,实现动作轨迹、3D位姿、物体交互关系、语言指令对齐等关键信息的自动标注,优化标注精度与效率,降低人工标注成本;搭建VLA预训练数据质量分析体系,设计多维度质量评估指标(如动作执行准确率、跨域迁移稳定性、数据对齐精度等),开发异常数据检测、噪声过滤算法,剔除模糊、错位、语义不一致等低质量样本,保障预训练数据的可靠性与鲁棒性,支撑模型训练效果达标;设计并实现VLA模型预训练数据合成算法,基于仿真引擎/AIGC模型等能力,构建虚拟仿真场景,结合域随机化技术生成大规模、多样化的视觉-语言-动作配对样本,覆盖家居、服务等多类真实场景任务,满足模型预训练的数据规模与多样性要求; 3、参与VLA模型预训练、微调及验证全流程,结合数据特性优化训练策略,分析数据质量对模型性能的影响,迭代优化数据方案,提升模型在真实物理场景中的泛化能力与动作执行可靠性; 4、跟进具身智能、VLA模型、多模态数据处理领域的前沿技术(如Sim-to-Real迁移、多模态对齐、自动标注框架等),开展技术调研与方案验证,将先进技术落地到数据研发流程中,推动数据算法的创新与优化; 5、与模型研发、机器人硬件、仿真测试等团队紧密协作,明确数据需求,交付符合模型训练标准的高质量预训练数据集,配合完成算法集成、测试与迭代,支撑具身智能产品的落地应用。