大模型智能体安全研究员-Flow安全

1、智能体安全风险发现、建模与评估：针对大模型智能体系统（含工具调用、插件集成、多步工作流编排等场景），系统性地发现和建模安全风险，包括但不限于Prompt Injection（直接/间接注入）、指令绕过、越权调用外部工具或第三方服务、敏感数据泄露、上下文污染、模型幻觉与推理偏差引发的业务风险等；建立风险分级与影响评估框架，制定安全基线标准与准入规范； 2、防护策略与安全机制设计：结合威胁模型与业务场景，设计并迭代智能体系统的安全防护架构与策略规则体系，涵盖输入输出过滤、Prompt防护层、工具调用权限沙箱、上下文隔离、敏感操作审批、安全对齐（Alignment）策略以及基于意图识别的异常行为检测等方向； 3、安全评测体系建设与红队测试：构建覆盖大模型智能体核心攻击面的标准化安全评测基准（Benchmark），组织和执行红队测试（Red Teaming），开发自动化攻击模拟工具与对抗性测试框架，持续验证并推动防护能力的工程化与规模化； 4、前沿安全研究与情报跟踪：持续跟踪AI安全领域的最新学术研究、攻击技术演进与行业安全事件，提炼可落地的防护思路与方法论，保持团队在大模型安全攻防方面的技术前瞻性； 5、跨团队协作与安全能力落地：与产品、工程、算法及合规团队紧密协作，将安全研究成果转化为可工程化的安全组件和规范流程，推动安全能力在智能体产品全链路中的系统性集成与持续运营。

Job Description

About ByteDance