万象有声公测启动 懒人听书团队携AIGC打造有声工厂

2026年03月30日 14:31
本文共计3486个字,预计阅读时长12分钟。
来源/aibase 责编/爱力方

从手工作坊到智能工厂的产业升级,正在有声内容产业悄然发生。

AI技术深刻影响图文、视频等各个内容领域时,音频行业似乎仍在等待属于自己的“破局时刻”。面对海量网文、出版物IP因传统制作流程的高成本、低效率而持续“沉睡”的行业困局,整个音频内容产业都在呼唤一个真正的系统性解决方案。

今天,由原国内头部音频平台“懒人听书”核心团队创立的 “万象有声” ,在历经一年多的深度研发与大半年的定向内测后,正式宣布面向全行业开启公测。

这并非又一个简单的AI配音工具,而是一个旨在探索、验证打破行业成本、效率与品控的“不可能三角”,推动生产模式从“手工作坊”迈向智能化的 全方位有声创作平台

image.png

01行业困局:繁荣市场下的内容供给挑战

中国有声阅读市场用户已超6亿,规模持续增长,但供给端却面临多重挑战。

一面是“听读一体”成为主流,用户对“广播剧级”沉浸体验的需求飙升。另一面,是传统生产模式难以调和的三大痛点:

• 高成本:真人精品制作单小时成本动辄上千元,仅能覆盖头部极小部分的优质IP。

• 低效率:工具链割裂,异地协作复杂,单个标准项目从立项到成品交付通常需要30-60天。

• 难品控:流程不透明,人工审听易出现错漏或疲劳,导致质量稳定性难以保证。

这直接导致阅文等平台海量的中腰部IP成为难以快速变现的“堰塞湖”,而TME等音频平台则苦于优质内容的持续供给不足。市场急需一种成本可控、制作效率提升,又能提供接近真人广播剧听感的工业化解决方案。

02老兵归来:十年行业经验的 AI 重塑

“万象有声”的探索,基于其团队独特的行业背景。

核心创始团队全部源自“懒人听书”原班管理层,包括原创始人/CEO、产品VP、技术VP及内容制作总监。他们不仅拥有十余年行业深耕经验,主导过平台从零到一乃至被腾讯音乐收购的全过程,更深知产业链每一环的实际痛点。

该团队表示,在懒人听书的长期运营中,他们深刻体会到传统制作流程对创作者的诸多束缚,例如繁琐的画本、耗时的对轨、混乱的协作和复杂的薪酬核算。他们认为,AI大模型的突破,提供了将行业经验系统化、算法化以系统性解决这些痛点的时机。

因此,这支团队带来的并非单纯的技术叠加,而是 将行业操作标准转化为算法规则 的能力。他们将配音中的气口、停顿、情绪衔接等过去依赖经验的模糊环节,转化为可量化、可执行的精准算法,从而构建出一个根植于行业认知的智能平台

03核心引擎:“双轨制”破解存量与增量难题

“万象有声”的核心探索,在于其提出的 “双轨制生产引擎” ,旨在对应市场对专业精品与海量转化的双重需求。用户可根据内容类型和制作需求,灵活选择两种模式。

第一轨道:精品提效,为真人创作赋能

针对专业工作室和精品PGC内容,万象有声是一个全面打通有声制作全流程的平台,试图解决创作者过去面临的跨工具、多平台切换难题。平台提供的几大核心工具,正在重新定义有声内容的生产流程:

1. 智能画本:实现文本的智能分章拆段、角色提取与归一、自动生成人物小传、智能匹配播音员,并精准标注多音字和生僻字的发音、对话的情感等。

2. 智能对轨:可将配音演员用专业软件录制的数小时长干音,自动切分并毫秒级匹配到对应剧本台词,据称能将传统后期对轨效率提升高达500%。

3. 录剪一体工作站:一个集成在浏览器内的专业级音频工作站,支持边看稿边录音、边录边剪,实现录制与剪辑的无缝衔接

4. 智能审听:利用AI进行细颗粒度的全量质检,替代传统的人工抽查,试图实现对内容品质的全面覆盖与控制。

5. 团队协作:通过可视化的任务流、工单系统与自动化的薪酬结算,构建完整的线上协作生态,以期实现项目全流程的透明化管理。

image.png

第二轨道:产能跃迁,为海量IP量产

针对网文平台海量的中长尾IP库存,平台提供 全自动无人值守AI多播有声剧制作工作台。从电子书导入、智能拆章、角色分析、AI演播到后期合成,全程自动化,旨在以极低的边际成本,快速生成“准广播剧”体验的有声内容,帮助平台快速填补内容缺口。

万象有声为出版机构、网文平台、短剧/漫剧机构等提供了标准化的API接口。通过这些接口,合作伙伴能够更便捷地接入平台,尝试将海量IP资源进行批量化、自动化的有声内容转化,以期释放存量内容的商业价值。

image.png

04深度工程化:构建真正的技术壁垒

与依赖“千人工厂”进行人工精调的通用大模型方案不同,“万象有声”凭借团队对垂直场景的深刻理解,构建了差异化的工程化能力:

• 团队协作工程化:平台完整复刻了线下精品内容制作的标准化流程,并通过智能化的任务分配与流转机制,试图将创作团队从繁杂的协调管理中解放出来。这种“工艺标准化+流程智能化”的结合,构成了其体系能力的一部分。

• 百万级发音字典:旨在解决玄幻、修仙网文中海量生僻字、多音字的统一读音难题。

• 角色一致性算法:旨在确保百万字长篇连载内容中,同一角色的音色与性格特征始终保持统一。

• 智能旁白处理:能自动识别并剔除“说道”等剧本中的提示词,从而提升听众的沉浸感。

• 智能重绘技术:当文稿局部修改后,AI仅重新生成涉及变动的段落,据称可将AI算力成本降低达90%。

05商业设计:为不同创作路径量体裁衣

为了解决音频内容制作场景的多样性问题,万象有声平台采用了“SaaS(会员订阅)+ PaaS(按量付费)+ IaaS(基建扩展)”的三位一体混合商业模型,避开行业中“一刀切”收费模式可能造成的用户排他效应。

该模型主要覆盖三类典型生产场景,并根据不同用户群体的根本需求进行差异化设计:

• 纯真人制作场景:目标用户为工作室和个人创作者,项目以纯真人制作为主,行业中的精品多人有声剧基本都属于这类创作。用户只需要订阅会员,平台提供不限字数、不限项目的全套协作工具链,会员内赠送的积分可用于AI智能画本、智能对轨、生成 AI 音效等,基本不需要再支付其它的额外费用。

• 纯AI生产场景:目标用户为版权机构或音频平台,以AI为主完成画本编辑和配音,市场上中长尾IP制作多播有声剧的主要制作方式。创作者无需订阅会员,按实际用量消耗积分进行制作。内容量大时,可以结合平台提供的创作加油包以批发价购买积分,整体价格显著低于行业平均水平。

• AI+真人混合制作场景:目前行业中普遍采用的有声书制作方式,AI完成画本初稿,旁白使用AI配音,对话由真人配音。万象有声为针对这类场景提供了会员+加油包/无忧包的组合形式,工作室根据周期内项目的数量按量扩展需要的算力,可以极大的节省创作成本。

从商业可行性角度观察,该模型将订阅服务、按量消耗与按需扩展相互解耦,为不同创作习惯的用户提供了可预期的成本结构,也为平台自身提供了更为多元的收入来源。内测阶段已证实,此模型能够初步服务于多元生产场景,满足不同用户人群的需求。

06内测反响:效率与品质的双重确认

平台在内测期间获得了超过2000名专业从业者的实际应用验证。据公开的内测数据显示,一个原本需要30天的有声书项目,在平台工具的助力下,其生产周期可被缩短至5-7天。效率的提升主要源于平台将原本分散的画本、录音、对轨等环节整合至同一协作环境,及这些工具的智能化辅助,减少了跨工具沟通与使用的成本。

一位为多部热门广播剧配音的资深CV老师在使用后反馈:“以前画本、录音、对轨、后期分散在不同软件,沟通成本极高,现在集中在一个平台处理,沟通损耗大幅降低,效率提升是能够被具体感知的,产能几乎翻了一番。”

阅米文化创始人李吉则从版权平台反馈:“万象有声的AI播音在情感传达上已接近真人水准。结合其智能画本及自动对轨能力,我们现在具备了稳定产出B+级以上精品有声书的能力。对我们内容团队而言,这种能力的稳定性比单纯的速度提升更为重要。”

07开启公测:邀请行业共建有声未来

“万象有声”在结束半年多的定向内测后,现已正式开启公测,向内容创作者、配音演员、音频工作室及网文、音频平台等开放注册。

其团队表示,平台目标在于降低创作流程耗时,让创作者的精力能够更聚焦于内容本身的打磨。公测被视为一次与行业伙伴共同探索、验证平台能力的机会,团队期待通过收集反馈,与行业一同推动有声内容生产向更高效、可控的方向探索。

公测注册:访问官网https://www.audimind.com/

关于万象有声:

万象有声(Audimind)是由原“懒人听书”核心创始团队打造的 AI 赋能的一站式有声内容创作平台,致力于通过“双轨制生产引擎”与深度工程化能力,尝试应对传统有声制作中的高成本、低效率与品控挑战,探索音频内容产业链的基础设施优化路径。

来源:万象有声开启公测:懒人听书原班人马杀回,用 AIGC 再造一个“有声工厂” | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agent.ren/