调用 ChatGPT API 时怎么过滤用户输入的敏感信息？

调用 ChatGPT API 时，官方不提供自动过滤用户敏感信息的功能，开发者需要在请求发送前自行构建预处理层。适用所有涉及个人隐私数据（PII）或商业机密的场景，风险边界在于本地过滤规则可能遗漏导致数据泄露。

先说结论：敏感信息过滤必须在客户端或服务端中间件完成，不能依赖 API 接口本身。

先判断：明确需要过滤的数据类型，如手机号、邮箱、身份证或密钥。
优先做：在发送请求前部署正则匹配或专用隐私保护工具进行脱敏。
再验证：通过构造包含敏感信息的测试用例，确认请求体中已无明文数据。

快速处理思路

没有单一命令可直接启用 API 侧过滤，需采用代理中间件模式处理。建议在应用服务器与 OpenAI API 之间增加一层数据清洗服务，所有用户输入先经过该服务再转发。公开资料中没有看到可靠的量化数据表明单一正则能覆盖所有场景，通常需组合多种规则。

为什么会这样

OpenAI API 设计遵循责任共担模型，数据合规责任归属于调用方。官方文档明确说明 API 用于处理用户数据，但不会自动识别并移除个人隐私信息。Moderation API 仅用于检测内容政策违规（如仇恨言论），不具备隐私脱敏功能。

分步处理

第一步定义敏感实体，列出业务中可能出现的手机号、邮箱、地址等字段格式。第二步选择过滤工具，简单场景使用正则表达式，复杂场景接入 Microsoft Presidio 或 AWS Comprehend 等隐私识别服务。第三步编写中间件代码，在 HTTP 请求发起前拦截 Body 内容并执行替换逻辑。第四步配置日志审计，记录脱敏前后的哈希值以便追踪，但不记录明文。

怎么验证是否生效

检查发送前的网络请求日志，确认 Payload 中敏感字段已被星号或占位符替换。使用包含测试用手机号和邮箱的 Prompt 发起请求，观察后端日志中实际发送给 API 的内容。确认 OpenAI 返回结果中不包含原始敏感信息，且业务逻辑能正常处理脱敏后的文本。

常见坑

正则规则过于简单导致漏过滤，例如未覆盖国际手机号格式。过度脱敏影响模型理解，例如将关键实体全部替换导致回答质量下降。误将 Moderation API 当作隐私过滤工具使用，导致安全策略配置错误。

常见问题

OpenAI 会用 API 数据训练模型吗？

付费 API 用户数据默认不用于训练，但仍建议最小化数据暴露。官方隐私政策说明 API 数据保留策略与免费 Chat 界面不同，但开发者仍需遵守数据保护法规。

Moderation API 能过滤隐私吗？

不能，Moderation API 仅检测内容安全策略违规。它用于识别暴力、自残等风险内容，不具备识别手机号或身份证等 PII 信息的功能。

参考来源

OpenAI 官方文档，Data Privacy，https://platform.openai.com/docs
OpenAI 官方文档，Moderations API，https://platform.openai.com/docs/guides/moderation