调用 ChatGPT API 时,官方不提供自动过滤用户敏感信息的功能,开发者需要在请求发送前自行构建预处理层。适用所有涉及个人隐私数据(PII)或商业机密的场景,风险边界在于本地过滤规则可能遗漏导致数据泄露。
先说结论:敏感信息过滤必须在客户端或服务端中间件完成,不能依赖 API 接口本身。
- 先判断:明确需要过滤的数据类型,如手机号、邮箱、身份证或密钥。
- 优先做:在发送请求前部署正则匹配或专用隐私保护工具进行脱敏。
- 再验证:通过构造包含敏感信息的测试用例,确认请求体中已无明文数据。
快速处理思路
没有单一命令可直接启用 API 侧过滤,需采用代理中间件模式处理。建议在应用服务器与 OpenAI API 之间增加一层数据清洗服务,所有用户输入先经过该服务再转发。公开资料中没有看到可靠的量化数据表明单一正则能覆盖所有场景,通常需组合多种规则。
为什么会这样
OpenAI API 设计遵循责任共担模型,数据合规责任归属于调用方。官方文档明确说明 API 用于处理用户数据,但不会自动识别并移除个人隐私信息。Moderation API 仅用于检测内容政策违规(如仇恨言论),不具备隐私脱敏功能。
分步处理
第一步定义敏感实体,列出业务中可能出现的手机号、邮箱、地址等字段格式。第二步选择过滤工具,简单场景使用正则表达式,复杂场景接入 Microsoft Presidio 或 AWS Comprehend 等隐私识别服务。第三步编写中间件代码,在 HTTP 请求发起前拦截 Body 内容并执行替换逻辑。第四步配置日志审计,记录脱敏前后的哈希值以便追踪,但不记录明文。
怎么验证是否生效
检查发送前的网络请求日志,确认 Payload 中敏感字段已被星号或占位符替换。使用包含测试用手机号和邮箱的 Prompt 发起请求,观察后端日志中实际发送给 API 的内容。确认 OpenAI 返回结果中不包含原始敏感信息,且业务逻辑能正常处理脱敏后的文本。
常见坑
正则规则过于简单导致漏过滤,例如未覆盖国际手机号格式。过度脱敏影响模型理解,例如将关键实体全部替换导致回答质量下降。误将 Moderation API 当作隐私过滤工具使用,导致安全策略配置错误。
常见问题
OpenAI 会用 API 数据训练模型吗?
付费 API 用户数据默认不用于训练,但仍建议最小化数据暴露。官方隐私政策说明 API 数据保留策略与免费 Chat 界面不同,但开发者仍需遵守数据保护法规。
Moderation API 能过滤隐私吗?
不能,Moderation API 仅检测内容安全策略违规。它用于识别暴力、自残等风险内容,不具备识别手机号或身份证等 PII 信息的功能。
参考来源
- OpenAI 官方文档,Data Privacy,https://platform.openai.com/docs
- OpenAI 官方文档,Moderations API,https://platform.openai.com/docs/guides/moderation