界面新闻记者 |
界面新闻编辑 | 文姝琪
OpenClaw刚火起来那几天,夏达(化名)发现自己的API中转站流量一天内就涨了好几倍。他说,这是一门不需要费太大功夫就能赚钱的生意。
但这门生意“丰俭由人”。如果想要暴利,就需要穷尽各种所谓灰色地带手法;如果想要以正规军方式长远走下去基本不可能,“国内很难以那样的成本和价格存活。”夏达说。
他预测,市面上最终会留下一些有自研技术实力的平台,反之则会被逐渐淘汰。他没有想把精力耗在这个混乱、内卷的低价竞争市场里,转而开始考虑做国产Token出海。
Token(词元),大模型处理信息的最小信息单元,对擅于利用信息差的人来说,也是攫取财富的来源。伴随着大模型与AI应用的急剧成熟,全球范围内的Token消耗量在巨量增长。
来自国家数据局的最新数据显示,2025年,全国日均词元调用量从年初的超万亿增长到年末的100万亿。豆包大模型去年底日均Token消耗在63万亿左右,4月初就达到120万亿,核心原因在于多模态AIGC创作以及龙虾类产品的爆发。

在此蓬勃状态下,Claude、GPT等系列海外模型因一定性能领先也招徕了大量国内用户。受限于一些技术区隔以及昂贵订阅费用,国内用户想要以便捷和相对合适的价格使用这些模型,就必须经过API中转站。
于是,在这股Token增长浪潮之中,有人手握号池做起了Token的二道贩子。不过,在国产模型的算力与电力基础设施优势逐渐突出后,有人猜测,贩卖的方向或许会有所改变。

没有底线就能赚钱的隐秘生意
夏达原本自己有一门AI出海业务,对Claude等海外厂商模型需求量巨大。
起初,团队也是订阅官方API,但每日Token消耗量达到数亿级别,每月仅内部开发就要消耗1万多美金,为了降成本不得不转向第三方。
这时候团队发现,市面上大多数API中转站平台没法信任。
他们至少试了30多家平台。要么“今天还好好的、明天就挂了”,要么好不容易找到一家稳定的,却发现自己的产品线全崩了。“为什么呢?因为他们给你卖‘假货’了。”
经总结,中转站的生意整体分三档。第一档属于正规,以企业行为大规模采购以获得折扣价,例如Open Router、Cursor这样的大客户,就可以从“批发”转“零售”,但利润相对微薄。
第二档属于混乱,用海外账号建立号池、借企业免费项目薅羊毛,再重复分发同一个账号最大限度套利,按官方价格2-5折售卖的大多如此,“路子都是五花八门的,就看你怎么各显神通了。”一个200美金月租的Claude Code Max账号,可以拆分套到2-3千美金(更高时候可以到4-5千美金)。
最次的第三档,就属于前面所说的“卖假货”。它指的是用户所买非所得,中转站声称卖Claude,但实际接入其他厂商模型。“这属于同行都看不上的无底线行为。”另一名API中转站从业者表示,一些卷款跑路的人会这么干。
中转站的暴利潜力正在于它看不穿的中间层身份。被行家认为“更是没有下限”的做法有许多,除了卖货不对版的模型,Token价格倍率不明晰、偷改倍率以增加用户费用等等也都存在。“比如表面上卖你1美金、100万token,实际上扣费的时候扣了你5美金。”
为了尽可能挣钱,大多数中转站生意处在第二档。而即便风险偏高、稳定性较低,第二档生意也远比第一档好做。“因为Claude实在太贵了,可能一轮对话就要花掉五六毛,大部分人接受不了。”夏达说。
有投资人告诉界面新闻记者,他所关注到的一个中转站项目,月流水可达约500万元,毛利率几乎是50%。其他影响最终利润的条件在于,中转站是否投入大量力气在合规上,比如各类资质认证、数据存储方案、数据安全风险等等。
合规受到看重是因为有中转站打包出售自己所掌握的数据,给其他厂商用于模型训练——这是另一个灰产地带。
模型厂商四处购买数据用于模型训练,这是业内公开的秘密。但这个生态非常复杂混乱,一名知情人士表示,即便是厂商,也不一定知道数据的详细和真实来源,因为涉及太多中间人。这很可能导致的情形是,一个厂商从三个不同渠道买来三份数据,最后可能都是同一份。
“对中转站来说,底线是不掺假,再就是不卖数据。但说实话,两件事都很难。”前述从业者表示,“不用付出任何成本就有人送你一笔钱,很少有人能抵挡住这个诱惑。”
可以合规,但耗不起
面对这样的现状,夏达决定团队自己做。
从源头开始组建号池到团队稳定使用,大概只用了一个月时间。如果算上后期替换开源框架和重写底层UI,流程会拉到两个月。
自建成本的确可以快速下降。“对比官方可以降大概七成,相当于打了三折。”与此同时,错误率也有明显降低。夏达说,即便是官方调用也有对应的错误率,而中转站据他们测算普遍调用错误率在15%-20%,经团队自己调校后,可以控制在5%左右。
从自用变商用,只是因为给同为开发者的朋友提供了一次方便,最后反而吸引到了一批相对稳定的中小企业客户。这些客户对合规性要求不会特别高,每月消耗在几百到几千美金。如果是大客户,可能更倾向于私有化部署。
“这个行业是很乱的,不懂技术照样可以做,照样可以赚到钱。”夏达说,理论上而言,一个人只要懂得怎么开通Claude Code或GPT的订阅,就能做这个生意。“甚至花笔钱找人帮你搭起来也一样。”
要把中转站当成一门正经生意来做,也不是没有门槛。例如,不用开源框架、重写底层代码,其必要性在于对一些bug能够更好追踪和处理;再比如增加成本投入,把号池扩大两倍,以做到更好的负载均衡;更有技术能力的,就对可能出现的错误分发进行更好的算法优化。
站在这个角度来说,不懂维稳和售后的中转站存活时间都不长。有时候它们不一定是主观上“跑路”,而是真的没有承接能力。
夏达现在有种预感,中转站赚钱的风口要过去了。
一方面,Anthropic在加速收紧政策。4月5日,Claude Code负责人Boris Cherny官方宣布Claude订阅不再支持OpenClaw等第三方harness平台。而在中转站面对的需求里,绝大多数人都是冲着Claude去的,别的模型不具备足够吸引力。
另一方面,他发现中转站Token消耗量没有持续暴涨,变得贴近龙虾爆火前的水平。“你会发现C端用户因为OpenClaw热度来了,又因为OpenClaw回冷走了,所以没什么意义。”
2026年一季度,OpenRouter数据显示,中国大模型厂商屡次占领Token消耗量榜单前五。DeepSeek、月之暗面、Minimax、智谱、千问、阶跃星辰、小米等中国厂商名称,稳定交替出现在其按周总结的市占率前十名单中。
“大厂会吃掉大部分市场,剩下才是我们小个体户的盘子。”夏达清楚意识到。出海,是团队留在AI牌桌上的一个机会。
据一名AI Infra技术人员拆解,Token成本的核心构成是算力成本,再往下拆解还可以分为GPU成本、服务器成本、机房成本、电力成本等。
“静态来看,对几乎所有大模型,GPU芯片都占成本绝大部分。动态来看,不同模型结构设计对成本影响程度最大,差距可达10倍。”他说,而这是中国模型厂商最下功夫的地方之一。
于是在Token时代,国产模型因为有算力和电力的成本优势,结合自身的算法创新,有机会往海外做更大规模输出,在一个由IaaS(基础设施即服务)向MaaS(模型即服务)的集体转型趋势中,重新塑造一个全球云厂商格局。
但作为这片市场的“小个体户”,夏达提及这门生意的利润率不会太高了。考虑到大规模合作流程的复杂性,中间商可能会自行找服务器部署,通过比官方少赚一点的方式去售卖。
这不是一个多么大的机会,但可能是所有对行业红利有想法的人,一个速通商业模式的现成渠道。“AI的问题在于它变得太快了,就像OpenClaw火了没两天又到了Hermes,谁知道后面还有什么?”
“但Token就不一样了,”夏达说,“它细水长流,它的需求永远在。”
