从大模型腹地到Agent前沿:一位技术理想主义者的破茧与重塑

温故智新AIGC实验室

在大模型浪潮的激荡中,前百川智能工具链负责人徐文健率领一支8人团队,仅用两个多月便打造出热门AI音频Agent产品ListenHub,其背后是对“玄学”般Agent技术的深入探索,以及中国新一代AI创业者向全球市场进发的雄心

在瞬息万变的AI前沿,每一次潮汐的涌动都伴随着人才的迁徙与新芽的萌发。当“大模型六小虎”们在基座模型的激烈厮杀中寻求各自的生存之道时,一批心怀技术理想的建设者正从其腹地走出,将目光投向了更具想象力的AI Agent领域。前百川智能工具链负责人徐文健便是其中之一。这位1994年出生的创业者,在亲历了大模型狂飙突进的半年后,毅然选择再次启程,与合伙人冯雷共同创立了火星电波(Mars Radio),并在短短两个多月内,“肝”出了一款引人注目的AI音频Agent产品——ListenHub。

徐文健的职业轨迹并非一帆风顺,其创业冲动早在进入大厂之前便已萌芽。从南京工程学院走出的他,曾致力于克服内向,积极投身创业活动。在滴滴的经历让他对大厂的“祛魅”之余,也埋下了创业的种子。然而,早期的两次创业尝试——一款前瞻性的云Coding产品和一款AI教育应用——皆因团队流失、市场拓展受阻以及作为CEO的认知与能力不足而遗憾告终。这些挫折并非无谓的牺牲,它们为他后续的决策积累了宝贵的经验,让他深刻认识到**“缺乏坚持无疑是致命的”**,以及“缺乏持续的正向反馈和清晰的战略方向”是项目失败的关键。

大模型洗礼与Agent启示

两次失败后,徐文健并未急于投身新的创业,而是选择进入百川智能,希望积淀更多关于AI的认知与实践经验。他感受到了大模型公司在Benchmark(基准测试)厮杀中的“巨大压力和焦虑”,但也因此感受到了前所未有的“亢奋”。在他看来,“六小虎对国内最大的贡献,就是培养了一大批AI创业者。” 百川的经历,如他所说,为他“添上了AI标签”,让他有机会深入探索AI领域。

正是身处百川内部,徐文健意外地接触并深入理解了Agent技术。他所在的团队是国内最早一批意识到Agent价值的团队,甚至开发了国内第一代Agent Workflow的Demo版本。尽管该项目最终未能继续推进,但这次经历彻底颠覆了徐文健对Agent的早期认知。到了2023年末,他已坚定认为Agent有潜力“重构整个世界,它与大模型同等重要”。这一认知在他和冯雷于同年12月成立火星电波时,成为了公司开启Agent创业的核心驱动力。

ListenHub:AI音频Agent的实践与哲学

火星电波的创业方向围绕着“AI将如何成为互联网时代最大的变量”这一宏大命题展开,最终聚焦于内容消费领域,横跨创作者和消费者两端。他们的愿景是:AI不仅能弥补创作者的时间、能力和知识鸿沟,更能为消费者提供“有人味”、高度个性化乃至深层定制化的内容体验。AI记录并分析用户的“人格”和生活经历,进而生成适配其当下情绪和场景的专属内容。

基于这一愿景,团队选择了技术相对成熟且成本可控的AI音频方向,并率先在AI播客场景落地了ListenHub。这款产品在今年3月启动研发,仅用两个多月便在5月正式发布。

ListenHub内部整合了三个核心引擎

  1. 意图分析引擎:负责解析用户输入,针对不同问题扩展出深度分析的文章结构。
  2. 内容生成引擎:生成具有“人情味”和高度个性化的内容。
  3. 音频转化引擎:将文字内容转化为多样形态的音频。

徐文健坦言,“Agent技术确实有些玄学的成分。” 由于Agent目前缺乏统一的标准或框架,团队在研发过程中进行了大量的“摸着石头过河”式的尝试和探索。他们研究了众多开源AI播客生成工具,通过不断试错,找到了一种“比开源结构更有效的实现方式”。这种方法论,结合多模型调用和徐文健早期的产品开发经验,成为了ListenHub快速迭代的关键。

在资源有限的初创阶段,火星电波团队专注于将产品链路中的每个节点做到极致。徐文健形象地解释道,如果链路中每个环节的完成度是0.8,最终效果是0.8^4;但如果能达到1.2,则会是1.2^4的效果,两者之间可能存在五倍的用户体验差距。这种对细节和平衡的极致追求,使得ListenHub的性能在不到半年时间里提升了5~6倍。他们甚至延迟了反思机制、RAG技术和更智能记忆机制的引入,以确保有限资源下核心功能的完善度,体现了在性能、质量和扩展性之间进行大量决策和权衡的工程哲学。

市场回响、质疑与出海雄心

ListenHub发布后迅速凭借其生成质量和拟人效果俘获了用户,注册用户约一万,日活跃用户超一千。尽管徐文健对首次发布的宣发和上线节奏有所反思,认为本可争取更高DAU,但产品的积极反馈仍旧让他感到意外和鼓舞。

一个新产品总会伴随着支持与质疑。ListenHub面临的批评主要集中在产品时长和“一句话生成xx”类AI产品的价值上,认为它们容易沦为“高级摘要工具”,信息密度低。对此,徐文健强调,“问题的关键在于用户是否使用你的产品,使用就意味着价值。” ListenHub的核心在于让用户既是创作者也是消费者,作为一种“音频搜索引擎”来生成专属内容。

更深层的商业化考量促使火星电波将目光投向了海外市场。徐文健指出,尽管ListenHub的音频成本已控制得较低,但国内用户每月70元的订阅费用仍显昂贵。因此,团队选择在国内持续改进产品、提升影响力,而将商业变现的主力放在海外。这反映了当前中国AI创业公司的一个显著趋势:“我们这批AI创业公司实际上是第一批从创业之初就立志要出海、要做全球化业务的中国企业。” 1 这不仅是市场策略,更体现了这代创业者更广阔的视野和更大的野心。

与巨头的“合作”与“护城河”再定义

在ListenHub发布不久,字节跳动的豆包便推出了类似功能的大模型语音播客模型,这正是许多AI初创公司面临的普遍挑战:如何与拥有海量资源的大厂竞争。徐文健对此的态度是“不太关注竞争对手”,而是强调专注于自身产品的打磨和理念的深化。他将初创公司与大厂的关系定义为“合作伙伴”——初创公司利用大厂的基础设施(infra能力),同时通过专注和极致细化来补充大厂可能因战略分散而停滞的特定产品迭代。

徐文健认为,模型公司与应用公司之间存在显著差异,大模型本身不应作为最终产品存在。在他看来,一家企业的真正护城河并非仅仅是技术或产品,而是其**“组织和理念,后者才是无法被复制的。”** 2 即使强大的技术如GPT也能迅速被复制,但创始人的基因、理念和思想从公司创立之初便已定义了它的独特性。

为了维护这种核心理念和组织文化,徐文健倾向于将火星电波打造成一家“小而美”的公司,预期规模控制在20人以内。他认为,随着公司规模的扩大,价值观很容易被稀释和裂化,导致效率降低。这种对团队规模的自觉限制,是其从百川等大厂经历中汲取的重要反思,旨在避免陷入“大厂病”的循环。

在30岁时选择再次投身创业,徐文健坦言这是一次“黑洞”般的自我吞噬,需要放弃稳定的利益,面对未知的风险。然而,这种勇敢的迈步也让他获得了内心的自由与满足,用他自己的话说,是在“30岁找到了真我”。在AI Agent技术尚存“玄学”成分的当下,火星电波的故事不仅关乎一个热门产品的诞生,更折射出新一代技术理想主义者如何在大模型时代的洪流中,以独特的理念和实践,探索AI重塑内容生产与消费的无限可能,并勇敢地在全球舞台上追逐他们的愿景。

引文


  1. 离开百川去创业,8个人用2个多月肝出一款热门Agent产品 - 36氪·徐文健(2025/6/26)·检索日期2024/7/25 ↩︎

  2. 没人该为王小川的梦想买单 - 新浪财经·(2025/6/23)·检索日期2024/7/25 ↩︎