Back to all jobs
B

大模型智能体安全研究员-Flow安全

Shenzhen
RegularSecurity

Job Description

1、智能体安全风险发现、建模与评估:针对大模型智能体系统(含工具调用、插件集成、多步工作流编排等场景),系统性地发现和建模安全风险,包括但不限于Prompt Injection(直接/间接注入)、指令绕过、越权调用外部工具或第三方服务、敏感数据泄露、上下文污染、模型幻觉与推理偏差引发的业务风险等;建立风险分级与影响评估框架,制定安全基线标准与准入规范; 2、防护策略与安全机制设计:结合威胁模型与业务场景,设计并迭代智能体系统的安全防护架构与策略规则体系,涵盖输入输出过滤、Prompt防护层、工具调用权限沙箱、上下文隔离、敏感操作审批、安全对齐(Alignment)策略以及基于意图识别的异常行为检测等方向; 3、安全评测体系建设与红队测试:构建覆盖大模型智能体核心攻击面的标准化安全评测基准(Benchmark),组织和执行红队测试(Red Teaming),开发自动化攻击模拟工具与对抗性测试框架,持续验证并推动防护能力的工程化与规模化; 4、前沿安全研究与情报跟踪:持续跟踪AI安全领域的最新学术研究、攻击技术演进与行业安全事件,提炼可落地的防护思路与方法论,保持团队在大模型安全攻防方面的技术前瞻性; 5、跨团队协作与安全能力落地:与产品、工程、算法及合规团队紧密协作,将安全研究成果转化为可工程化的安全组件和规范流程,推动安全能力在智能体产品全链路中的系统性集成与持续运营。

About ByteDance

First seen: May 5, 2026
Last updated: May 7, 2026