排版格式成了AI生成过不去的坎?
作者|王铁梅
编辑|古廿
五年前,WPS发布了一篇自述文章,标题是《现在大家正在用的WPS,我们用32年更新了9999个版本》。
换算下来,相当于每月更新26次。用这种产品节奏,WPS在微软阴影下走出了一条更符合国情的办公软件生存路径。
最典型的莫过于办公软件本身免费,但是弹窗广告变现。尽管被诟病,但是中国互联网商业模式的玩法,依然给了这家企业和微软差异化竞争的空间,且在微软的Windows操作系统大本营拿下60%的覆盖度。
直到AI的出现。
2023年末,ChatGPT掀起大模型浪潮一年后。金山办公CEO章庆元对外宣布,WPS个人版将全面关闭商业广告,全力投入AI方向。对此他表示:为什么我们广告停了以后还敢投入?我觉得用户会愿意为AI付钱。
在这之前,章庆元在接受采访时谈到希望商业模式更优雅,将会逐步关闭广告。彼时他认为可以取消广告的理由主要有三个:老百姓有钱了;移动支付兴起;会员付费意识觉醒。两者相比较,AI给金山办公带来的产品付费转型更具说服力。
从产品角度而言,全面转向AI后,截至到今年WPS在C端产品迭代到了灵犀3.0;在B端也全面升级WPS 365,定位为一站式AI协同办公平台。
但是在变现能力的设计上,WPS并未押上All in AI的激进玩法。
据「市象」了解,目前WPS整体的AI用户数在四五千万左右。三种C端会员中,目前超级会员用户最多,其次是大会员,AI会员最少。主要是增值权益的设计上,AI会员功能有限,而大会员包含AI会员能力的同时,还有传统功能,订阅价格只贵了100元左右。
从定价策略上看,AI会员更像是一个定价“陪跑”,用来凸显大会员的价值优势。
换言之,真正单独为AI买单的用户并不多。WPS并没有把AI当作核心付费产品,而是作为会员体系中的增值能力,用来提高整体订阅率与续费意愿。因此在付费标准上,金山办公全球都采用包月定价模式,而非Agent办公软件常用的token模式付费。
在业内人士看来,目前WPS的AI主要应用在文本编辑修改这种对token消耗量有限的调用上,比Agent办公软件的一句话生成的token消耗量更低,采用普通用户更熟悉的包月付费更合适。
在AI功能方面,目前WPS文生视频功能不多,可能后续会有少量视频存储、简单剪辑功能。比如PPT转视频的功能后续可能会上线。
拥有6.47亿月活的金山办公正试图让AI真正融入用户现有的工作流程,而非创造全新的使用习惯。这也让WPS的AI路线与不少AI办公软件形成差异,后者往往试图用AI重构使用路径。
在金山办公总裁助理看来,“用户要的不是炫酷,而是有用。”这套逻辑下,WPS不是要重建用户的工作方式,而是让AI成为用户熟悉流程中的新手段。
相比从头重写工作流的AI办公新秀,WPS这种老编辑式的AI进化,也让WPS在这轮AI办公重构中显得特别。
不到30天时间里,阿里旗下两款To C AI应用接连出手:
先是11月底,深度融合千问AI助手的夸克浏览器迎来升级。发布六大千问AI套件。
虽然对准Chrome,但是基于屏幕共享功能,夸克可以和WPS等多种办公软件联动,帮助用户写Word文档、做Excel表。甚至夸克浏览器自己也可以做表格、生成PPT,或者提取一个word文档。
接着12月初,阿里的另一个AI产品千问继续升级。继上线一周下载量迅速突破1000万次后,这一次将功能瞄准office三件套。
12月4日,推出面向办公与协作场景的全新能力。此次更新将文档生成、智能排版、在线编辑、多格式转换等整合为一站式操作。同时,全新PPT生成能力上线,千问可基于图片、文档、语音等多种输入内容精准提炼、智能匹配模板。
上述能力同时向所有用户免费开放。
相比夸克,千问这次的升级直指office三件套。千问产品经理书瑶对外透露“千问的办事能力在进一步增强。我们希望千问不仅能激发用户产生想法,更能为用户交付完整文档。”将Office能力融入到对话中,让AI助手从生成内容进化到完成任务。
能干活才是原生AI应用解决粘性的关键。“某些应用打开率偏低,回到本质上来说,它跟需求本身的频率、频繁程度和它的朴素程度,以及刚性需求的重要程度是强相关的。”书瑶表示。
在他看来:“千问上线办公能力,核心就是希望解决真实、朴素但每天必要的高频需求。从结果上来看能保证打开率,因为这是用户自然需求的反映。”
值得注意的是,从阿里巴巴管理层到产品层面,都在尝试确立在AI时代的新标准。阿里巴巴集团联合创始人、董事长蔡崇信最新一次在香港大学的演讲中,尝试提出阿里巴巴在AI时代的竞赛规则。
“美国人定义的AI竞赛规则是错的。美国人怎么算谁赢?看谁的大语言模型更强。今天是OpenAI领先,明天是Anthropic,后天可能是别人。”蔡崇信说,这个计分方式本身就有问题。“真正的赢家不是谁有最好的模型,而是谁用得最好。”
不止是阿里,在追求办事能力的AI竞争定义下,办公三件套也成为大模型企业、初创AI企业的首选。
在阿里之前,昆仑万维发布天工超级智能体,打出“AI版Office”的旗号,其内置的专家智能体可以一键生成专业的文档、PPT和表格。
大模型企业瞄准office全家桶之外,更多的初创企业,选择更聚焦的AI办公细分场景。
以最为激烈的PPT领域为例,海外跑出了年收入过亿美元的Gamma验证了AI办公的商业闭环,国内的AiPPT产品也用20个月拿到2000万用户。其中超过60%的流量来自Kimi、智谱等大模型入口。
这些数据揭示了一个趋势:办公软件看似是红海,但AI正在让office三件套都有可能成为独立战场。
文档撰写、表格处理、PPT展示,这些原本传统办公软件体系内的功能,如今在AI能力的解耦下,被外包给垂类应用。每一个场景,都有可能诞生新的估值30亿美金级的独角兽。
AI办公初创企业,通过绑定AI代际红利,完成对传统办公工具的侧翼包抄。当AI办公工具开始从传统办公软件中分流时,以微软和WPS为代表的传统办公软件巨头必须回答,什么才是办公软件的护城河。
微软是AI时代最早起飞的玩家。
投资OpenAI,让它在大模型底层占据了稀缺资源位;Copilot之后,尽管没有成为AI办公的样板工程。但从业务结构看,微软的增长主引擎已不是Office,而是Azure和Copilot背后的AI基础设施。
Office更多承担的是入口和生态角色。相比之下,金山办公的基本盘要纯粹得多。在一次媒体采访中,金山办公副总裁田然被问到WPS是否会成为AI时代的“超级入口”。
他的回答很清醒:“我不觉得WPS是超级入口,如果真成了,那这个世界该多可悲啊。未来有眼镜、耳机、音箱等多种入口,但Office是每个智能体都该具备的能力。”
不争“超级入口”的WPS,想成为所有AI助理的“必备模块”,构建标准能力,成为每个AI智能体生成文档时必须调用的那一层。
这也是WPS与微软的差异:微软用Copilot重构Office体验,但最终目标是绑定Azure的企业云端。WPS用灵犀重构办公交互,但核心是守住格式、接口、兼容性这套文档基建。
7月份的WAIC现场,WPS灵犀3.0发布会后的一场群访中,谈及AI市场中的优势,WPS相关负责人透露:多家专注于PPT生成的AI初创企业,也在主动寻求和金山办公合作,想要解决生成内容和真实Office环境深度兼容的问题。
因为目前市场上所谓的一键生成PPT,本质上都是生成一个看起来像的PPT,实质是HTML格式或者图片格式。想要保证在用户熟悉的编辑环境中无缝二次编辑,跨设备演示,异常艰难。
在金山办公PPT产品负责人陆炜俊看来,虽然市场上很多AIPPT生成工具,但是效果完全取决于大模型,没办法做二次的变更了。让AI能够精准理解用户的实时需求,并根据用户的指令快速调整内容,是2025年AI办公行业亟待解决的核心痛点。
因此,WPS判断AI办公真正的壁垒,恰恰在于做完之后能不能修改、调整、编辑。灵犀产品的核心思路不是一句话生成,而是类似AI时代的编辑模式“边生成、边修改”。
例如在WPS的AIPPT中,用户可以通过自然语言实时调整内容结构“帮我把第二页扩展三条要点”“把这一页版式换成深色系”“加一张财报图表”,灵犀可以立即理解并执行,且整个修改过程发生在熟悉的PPT编辑环境中。
这不是prompt-to-image的AI,而是prompt-to-slide的持续对话的老编辑模式。
灵犀能够做到“边聊边改”,依赖的是WPS对Office格式的深度积累。
金山办公在过去30年里积累了对Office文档的“增删改查能力”,不仅能精准读取格式信息,还能将其转译为大模型能理解的“中间层文件”。这是PPT能被AI读懂、改写、再生成的根本前提。
与之对照的是,大多数AI初创工具,在做格式转写时只能提取文本,再交给模型生成视觉稿,缺乏格式积累。在正式办公场景中,PPT与Word文档的格式要求极高,很多AI工具生成的内容即便内容不错,也无法落地到标准场合使用。
过去三年,AI办公经历了三个阶段:
2023年的插件增强阶段:微软Copilot最早尝试嵌入AI能力于Office,但仅限于“语义增强”,办公逻辑未被重构。
2024年的轻量生成阶段:Manus、Genspark等AI平台支持一句话生成内容,但协作能力薄弱,编辑器体验不佳,难以进入工作流。
2025年的原生交付阶段:以千问、夸克为代表的AI助手,开始直接从语音/文档/图片输入生成结构化办公成果,实现任务闭环。
在第三个阶段,大模型企业也开始冲击AI办公的格式标准。比如千问除了让新增功能容易上手、内容更加专业,也在使用细节上进行了改进。
相比目前市面上大多数AI产品仍停留在只能生成文字阶段,文字生成后,用户往往需要将AI生成文字复制到其他Office软件中才能进行排版修改,体验受影响。千问目前可以做到生成即排版。
另外,千问的智能编辑器也支持更多精细化操作。用户可以对特定段落,要求千问进行润色、扩写或风格调整。
此前面对大模型的冲击,WPS选择的AI路线是一条务实的防御路径:不自研大模型,将AI内化,全力强化自身专业办公的地位。
在大模型能力层面,布局“多模型适配”机制,根据不同任务调用不同大模型,以平衡效果与成本。目前,金山办公接入了DeepSeek、MiniMax、智谱AI、文心一言、通义、商汤等多个主流大模型。
章庆元强调不会自研基础大模型,只做模型的应用。“我们自认不是模型厂商,而是应用厂商,但会自研一些小模型,用于垂直的应用场景。”这套早在2023年百模大战之时,金山办公就定下的策略,目前看来是正确的。
今年DeepSeek一出现,基础模型的调用成本下降。作为应用方的WPS,可以灵活选择最优模型。WPS的AI底层能力是开放的,但场景入口、内容交付、格式处理则牢牢掌握在自己手中。
千问与WPS的技术路径,看似方向不同,实则都在争夺最终交付权。
不同的是,以千问为代表的大模型厂商,从AI助手出发,试图走完“基础模型→内容生成-交付结果”的全流程。WPS则从文件标准与格式处理的末端出发,把AI深度绑定在文档入口、编辑流程和排版格式中,不做模型,但守住标准。
这使得WPS成为平台与模型厂商之间的中立连接器,在大模型快速平权的背景下,反而拥有更大的协同空间。
陆炜俊曾用一个比喻描述行业现状:“整个办公行业像在挖两条尚未贯通的隧道,一端是炫目的AI交互能力,一端是对办公规则的深刻理解,只有两端真正打通,才能解决根本问题。”
如今看来,WPS选择的方向,是占据那条“办公规则理解”的主隧道。而那条通往AI原生交互的隧道,则正由千问等大模型企业高速掘进。这种角色变化,也正在催化办公生态的一轮微妙重构。
五年前,当在线协作平台开始崛起,飞书、钉钉等新兴玩家在文档层并未自建底座,而是普遍选择与金山办公合作,接入其成熟的编辑与格式能力;如今,类似的合作结构是否会在AI办公场景中重演,也决定了WPS的编辑护城河深不深。