Ctrl+D(Windows)或 ⌘+D(Mac)将本站加入收藏夹

测你的 key 是不是真模型

怀疑被掉包 / 降级?AI 中转站检测当场跑出结果 · 已检测 57,834

检测怎么判真假?看鉴真方法 →

约 40–60 秒
网友自测结果统计
by apiranking.com
两成以上
中转站没能干净通过检测
通过 79%  · 存疑 7%  · 未通过 14%
Claude Sonnet 4.6 通过率 67%
通过 67%
存疑 14%
未通过 20%
Claude Opus 4.8 通过率 77%
通过 77%
未通过 14%
GPT-5.5 通过率 84%
通过 84%
未通过 12%
Gemini 3.1 Pro 通过率 83%
通过 83%
未通过 16%
apiranking.com 用你自己的 key 测一测
常见异常:我买的 Claude 可能被做了什么手脚
  • 直接换模型——按 Claude 价收费,后端却用 GPT-4o-mini、Qwen、DeepSeek 等便宜模型顶包,回答看着像样,你却在为 Claude 买单;
  • 偷换版本——你以为是 Claude Sonnet 4.6 / Opus 4.8,实际给你更旧更便宜的老版本;
  • 砍上下文——宣称支持长上下文,实际偷偷截断,长文场景"失忆";
  • 响应伪装——把第三方模型的响应套上 Anthropic 的外壳字段,肉眼难分。

利润倒推:中转站卖得比成本还低,差价只能从"换更便宜的后端"里挤——价格低到不合常理的,掉包/降级概率最高。查出来是假的/存疑,先别在这家继续充值(尤其大额),换到中等价位的站,系统避坑看 选站避雷

更多说明:原理、手动初判、研究数据、常见问题

它怎么工作的

你填自己的 base_url + 临时 key,它当场用你这条通道跑公开检测维度(计费/元数据指纹、输出风格等),比对是否符合真 Anthropic 的特征。端点只认官方客户端时自动改用客户端方式深测。完整体系见 中转站鉴真方法

不用工具,怎么先自己判断

低成本信号,命中越多越可疑:价格明显低于行业底价(最硬,先看这个);同样的提问回答风格突然变了;长文失忆/被截断;该版本该有的能力缺失或知识截止偏早;频繁报错超时。这些只能让你"起疑",要坐实还得实测。

45.83%
24 个中转端点未通过模型身份核验
83.82%→37%
声称 Gemini-2.5-flash,同题库准确率掉一半
$14.84→$5.70
按 GPT-5 付费,实得 token 价值不到一半
17 / 187
个中转 API 被 187 篇论文引用却查出造假

来源:CISPA《Real Money, Fake Models》(2026,24 端点 / 17 服务实测)· arXiv:2603.01919

会不会泄露我的 API key?

API key 绝不入库——后端只保留末 6 位指纹(如 …f16f99)用于内部对账,无法被用来调用 API。其它请求元数据(base_url/检测结果/IP/耗时)会匿名记录用于产品改进(verify_run 可审计)。建议仍用临时 key、测完在中转站后台重置最稳妥。

能测 GPT、Gemini 的真假吗?

已全部支持:Claude(Sonnet 4.6、Opus 4.8)/ GPT-5.5 / Gemini 3.1 Pro,都用 3 道动态推理题串联看模型答题正确率。

这个自测和排行榜上的「真假检测」是一回事吗?

不是。自测是你拿自己的 key 当场跑、只给你看的即时结果;排行榜是我们的探针检测体系。两者方法不同、互不写入。

5 个真假鉴别特征
  • Tokenizer 指纹:真 Claude/GPT 的 token 化方式有独特签名,被掉包后 token 数与 prompt 字符的比例会跑偏。
  • Metadata 行为:上下文窗口、stop_reason、usage 字段等真模型有固定模式;冒充者多用 OpenAI 兼容协议套壳,metadata 极易出穿帮。
  • 同 prefix 缓存:Anthropic 官方 prompt cache 命中率与 token 折扣有可测特征;逆向/拼车站点几乎无法复现。
  • 长文本风格:Sonnet 4.6 / Opus 4.8 / GPT-5.5 / Gemini 3.1 Pro 各有词汇分布与句式偏好,掉包成便宜模型后风格信号显著漂移。
  • 价格倒推:定价低于官方成本一半以上的端点,"用真模型"在经济上不成立——价格本身就是最强弱信号。