网友自测结果统计
by apiranking.com
两成以上
中转站没能干净通过检测
通过 79%
· 存疑 7%
· 未通过 14%
Claude Sonnet 4.6
通过率 67%
Claude Opus 4.8
通过率 77%
GPT-5.5
通过率 84%
Gemini 3.1 Pro
通过率 83%
apiranking.com
用你自己的 key 测一测
常见异常:我买的 Claude 可能被做了什么手脚
- 直接换模型——按 Claude 价收费,后端却用 GPT-4o-mini、Qwen、DeepSeek 等便宜模型顶包,回答看着像样,你却在为 Claude 买单;
- 偷换版本——你以为是 Claude Sonnet 4.6 / Opus 4.8,实际给你更旧更便宜的老版本;
- 砍上下文——宣称支持长上下文,实际偷偷截断,长文场景"失忆";
- 响应伪装——把第三方模型的响应套上 Anthropic 的外壳字段,肉眼难分。
利润倒推:中转站卖得比成本还低,差价只能从"换更便宜的后端"里挤——价格低到不合常理的,掉包/降级概率最高。查出来是假的/存疑,先别在这家继续充值(尤其大额),换到中等价位的站,系统避坑看 选站避雷。
更多说明:原理、手动初判、研究数据、常见问题
它怎么工作的
你填自己的 base_url + 临时 key,它当场用你这条通道跑公开检测维度(计费/元数据指纹、输出风格等),比对是否符合真 Anthropic 的特征。端点只认官方客户端时自动改用客户端方式深测。完整体系见 中转站鉴真方法。
不用工具,怎么先自己判断
低成本信号,命中越多越可疑:价格明显低于行业底价(最硬,先看这个);同样的提问回答风格突然变了;长文失忆/被截断;该版本该有的能力缺失或知识截止偏早;频繁报错超时。这些只能让你"起疑",要坐实还得实测。
45.83%
24 个中转端点未通过模型身份核验
83.82%→37%
声称 Gemini-2.5-flash,同题库准确率掉一半
$14.84→$5.70
按 GPT-5 付费,实得 token 价值不到一半
17 / 187
个中转 API 被 187 篇论文引用却查出造假
来源:CISPA《Real Money, Fake Models》(2026,24 端点 / 17 服务实测)· arXiv:2603.01919。
会不会泄露我的 API key?
API key 绝不入库——后端只保留末 6 位指纹(如 …f16f99)用于内部对账,无法被用来调用 API。其它请求元数据(base_url/检测结果/IP/耗时)会匿名记录用于产品改进(verify_run 可审计)。建议仍用临时 key、测完在中转站后台重置最稳妥。
能测 GPT、Gemini 的真假吗?
已全部支持:Claude(Sonnet 4.6、Opus 4.8)/ GPT-5.5 / Gemini 3.1 Pro,都用 3 道动态推理题串联看模型答题正确率。
这个自测和排行榜上的「真假检测」是一回事吗?
不是。自测是你拿自己的 key 当场跑、只给你看的即时结果;排行榜是我们的探针检测体系。两者方法不同、互不写入。
5 个真假鉴别特征
- Tokenizer 指纹:真 Claude/GPT 的 token 化方式有独特签名,被掉包后 token 数与 prompt 字符的比例会跑偏。
- Metadata 行为:上下文窗口、stop_reason、usage 字段等真模型有固定模式;冒充者多用 OpenAI 兼容协议套壳,metadata 极易出穿帮。
- 同 prefix 缓存:Anthropic 官方 prompt cache 命中率与 token 折扣有可测特征;逆向/拼车站点几乎无法复现。
- 长文本风格:Sonnet 4.6 / Opus 4.8 / GPT-5.5 / Gemini 3.1 Pro 各有词汇分布与句式偏好,掉包成便宜模型后风格信号显著漂移。
- 价格倒推:定价低于官方成本一半以上的端点,"用真模型"在经济上不成立——价格本身就是最强弱信号。