一场深刻的、关乎未来“AI成本”定义的“性价比战争”,正由全球所有顶级的AI大模型厂商,以一种,近乎于“不计成本”的、极其残酷的方式,悍然引爆。
1.2月18日,谷歌,正式发布了其最新一代的轻量级高性能模型Gemini 3 Flash。
其输入的API价格,仅为0.5美元/百万Tokens。
这个数字,使其,瞬间,登顶了全球AI模型竞技场Imarena.ai的“性价比之王”宝座。
然而,这场,由谷歌所点燃的“价格战”,还未,完全地,在市场上,掀起波澜。

另一家,来自中国的“价格屠夫”——DeepSeek(深度求索)——则以一种,更为激进、也更具“毁灭性”的姿态,将这场战争,直接地,推向了“白热化”。
其于12月初,所发布的V3.2系列模型,其定价策略,堪称“疯狂”:
-
其V3.2正式版,每百万token的输入价格,仅为0.28美元。
-
而其,性能更强的“长思考增强版”V3.2-Speciale,其价格,也仅为0.4美元/百万Tokens。
这个数字,大约,仅相当于其最主要的商业竞争对手——GPT-5、Gemini 3.0 Pro、Claude Opus 4.5——价格的1.6%至4%。
这,并非一次简单的、为了抢占市场的“促销活动”。
它,是一次深刻的、系统性的、由技术进步所驱动的“成本革命”。其背后,是DeepSeek,通过,将创新的“稀疏注意力”(Sparse Attention)机制,引入其核心架构,从而,在不损失模型性能的前提下,所实现的、计算效率的巨大飞跃。
而这场,由DeepSeek所开启的“价格雪崩”,也迅速地,在整个中国市场,引发了一场“连锁反应”。
阿里、百度、智谱等所有主流的大模型厂商,都随之,纷纷宣布,大幅降价。
中国的商用大模型API,一夜之间,集体地,迈入了“厘时代”。
爱力方的分析认为,这场,愈演愈烈的“性价比战争”,其背后,是整个AI产业,发展逻辑的一次深刻的“范式转移”。
它,标志着,大模型的技术,已日益趋于成熟。
整个行业的竞争,正在从过去那个,以“模型性能”为唯一衡量标准的“上半场”,不可逆转地,转向一个,以“场景落地”和“商业化应用”为核心的“下半场”。
而在这场“下半场”的竞赛中,“降本增效”,将成为,所有B端(企业级)用户,在选择AI应用时,所考量的、最核心、也是最根本的诉求。
更低的模型接入价格,意味着,AI应用的服务商,将能够,为客户,提供更具吸引力的、低成本的优质服务。
而成本曲线的陡峭下降,也将极大地,激活那些,过去,对价格高度敏感的场景,从而,缓解用户“想用,而不敢用”的普遍困境。

AI,正站在一轮,全新的“应用落地加速”的起跑线上。
而在这场,全新的“落地竞赛”中,另一类,过去,一直被视为“幕后英雄”的玩家——以联想集团为代表的、算力基础设施硬件与服务提供商——其战略价值,正变得,前所未有的凸显。
当AI大模型厂商,为了,打造更高性价比的产品,而对“更高效的算力基础设施”,产生了“刚性”的需求时,一场,全新的、围绕着成本的“行业洗牌”,也便,随之开启。
-
联想,所推出的DeepSeek版AI工作站,将大模型本地化部署的入门级方案,直接地,打入了5万元人民币的区间,相比于传统的方案,其落地成本,下降了98%。
-
其最新一代的、搭载了液冷散热系统的AI服务器,和全新升级的“万全异构智算平台4.0”,更是,通过,将千卡训练场景中的MFU(模型浮点运算利用率),从30%,提升至60%,来直接地,帮助大模型厂商,实现“降本”。

最终,随着,这场“性价比战争”的,持续地,深入。
一个,由“算力-模型-应用”,这三者,所共同构成的、全新的“正向飞",正在快速地成型:
-
应用端的企业,借助,更低的模型API调用成本,来加速其,在各种场景的落地。
-
这,反过来,又推升了对大模型算力的海量需求。
-
而算力基础设施的提供商,则通过,提供更优性能、更低能耗的算力供给,来进一步地,降低大模型的训练与推理成本。
-
从而,为应用端的企业,提供更强的成本助力。
在这场,环环相扣的“飞轮效应”之中,那些,能够在“算力”与“应用”这两个环节,同时占据领先优势的“双料玩家”(例如,联想集团),其,通过,与大模型厂商,在上游的算力供给和下游的应用落地上的双线合作,所能产生的“化学反应”,将有望,促成整个合作链条的、规模化的扩张与市场份额的持续成长。