具身智能VLA模型数据算法工程师-AI数据与安全

1、负责具身智能VLA（视觉-语言-动作）模型预训练数据全流程研发，聚焦数据合成、自动化打标、质量分析与优化，支撑模型实现“感知-理解-执行”一体化能力提升，适配人形机器人、智能交互终端等具身场景需求； 2、研发高效的自动化打标算法，整合多模态感知、理解等能力，实现动作轨迹、3D位姿、物体交互关系、语言指令对齐等关键信息的自动标注，优化标注精度与效率，降低人工标注成本；搭建VLA预训练数据质量分析体系，设计多维度质量评估指标（如动作执行准确率、跨域迁移稳定性、数据对齐精度等），开发异常数据检测、噪声过滤算法，剔除模糊、错位、语义不一致等低质量样本，保障预训练数据的可靠性与鲁棒性，支撑模型训练效果达标；设计并实现VLA模型预训练数据合成算法，基于仿真引擎/AIGC模型等能力，构建虚拟仿真场景，结合域随机化技术生成大规模、多样化的视觉-语言-动作配对样本，覆盖家居、服务等多类真实场景任务，满足模型预训练的数据规模与多样性要求； 3、参与VLA模型预训练、微调及验证全流程，结合数据特性优化训练策略，分析数据质量对模型性能的影响，迭代优化数据方案，提升模型在真实物理场景中的泛化能力与动作执行可靠性； 4、跟进具身智能、VLA模型、多模态数据处理领域的前沿技术（如Sim-to-Real迁移、多模态对齐、自动标注框架等），开展技术调研与方案验证，将先进技术落地到数据研发流程中，推动数据算法的创新与优化； 5、与模型研发、机器人硬件、仿真测试等团队紧密协作，明确数据需求，交付符合模型训练标准的高质量预训练数据集，配合完成算法集成、测试与迭代，支撑具身智能产品的落地应用。

Job Description

About ByteDance