社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

「AIGC第一股」出门问问交上完美答卷:营收破2.2亿,同比增长88.5%

机器之心 • 5 天前 • 18 次点击  
机器之心报道
编辑:佳琪、泽南

如今爆火的生成式 AI 领域里,先进的技术层出不穷,但能实现研发、收入齐头并进的公司还真不算多。


不过就在本周四,「AIGC 第一股」出门问问发布了 2024 年度报告,其成绩引发了业内关注。


财报显示,截至去年 12 月 31 日,出门问问总收入达人民币 3.9 亿元,与 2023 年同期相比增长 6%。值得关注的是,其中 AIGC 解决方案收入为人民币 2.2 亿元,较 2023 年同比增长达到了 88.5%。



出门问问的纯软件 AIGC 产品化服务经历了持续的大幅增长:2021-2024 年营收分别约为 0.07 亿元、0.4 亿元、1.18 亿元和 2.22 亿元,占总收入的比例分别是 1.7%、8.0%、23.3% 以及 56.8%,已成为公司的最主要业务。


看起来,出门问问正在竞争日益激烈的生成式 AI 领域持续突进。


生成式 AI 能力,覆盖全链路


与深度学习技术发展初期时类似,目前生成式 AI 技术发展日新月异,但全行业也面临着商业化思路随时会被挑战的问题。一方面已经出现很多成功的 AIGC 用例,从 ChatGPT 会员、大模型 API 到大模型一体机,呈现出一片火热的态势;另一方面,全球的 AI 大模型公司都面临着投入转化的问题,时有明星大模型公司传出停止预训练,甚至寻求被收购的消息。


动辄千亿参数的基础大模型所需要的研发和投入,让参与其中的玩家在跟进先进水平的同时,无不在思考业务的发展前景。


在这样的环境下,出门问问的业务早已做到了纯软件、高毛利与国际化。当很多 AI 创业公司陷入高级人力外包的「项目制」困局时,出门问问 All in 生成式 AI,并在服务形态上做出了面向消费级市场的选择。


这样良好的增长态势,离不开公司创始人李志飞对 AIGC 应用的深刻理解。


李志飞认为,无论是在底层模型,还是在产品能力上下功夫,终究都要直面商业化这道必答题。


AI 创业需要找准用户的需求,但这只是起点。用户愿意付费、不惧巨头竞争、商业模式可持续,这三点缺一不可。只有找到既能持续盈利又具备护城河的商业模式,才能在风起云涌 AIGC 生态中站稳脚跟。


基于这样的思考,出门问问选择了一条独特的发展路径:通过打通文本、图像、音频、视频等 AIGC 全链路能力,并将其模块化、标准化,搭建起一个如同「积木」般灵活组合的技术体系


面向全球内容创作者,出门问问形成了的以 AI 配音助理「魔音工坊」(海外版「DupDub」)、AI 数字分身「奇妙元」(海外版「LivGen」)、企业级 AI 数字员工平台「奇妙问」和一键式 AI 短视频生成平台「元创岛」为核心的产品矩阵。



要支撑起如此丰富的产品矩阵,强大的技术底座必不可少。


2023 年,出门问问推出了具备多模态生成能力的自研大语言模型「序列猴子」。这个看起来有些奇怪的名字来自「无限猴子」定理 —— 如果一群猴子随机地敲打打字机,从概率上来讲,总有一天这群猴子一定会写出完整的莎士比亚作品。


「序列猴子」将 AI 的创造力延伸到了维度,它同时支持文字生成、图像生成和语音识别和语音生成,成为出门问问产品版图的强大引擎。



「注意看,这个男人叫小帅,这个女人叫小美……」 这些台词有点耳熟?其实我们早就和出门问问的产品是老相识了。


这些影视解说的 AI 配音,都来自「魔音工坊」。



作为全球领先的一站式 AI 配音软件,「魔音工坊」及其海外版「DupDub」正在重新定义短视频的内容创作流程。这背后,是出门问问在语音技术领域的持续突破。


为了打造更自然、更真实的 AI 声音,出门问问携手香港科技大学、上海交通大学等顶尖研究机构,共同开源了新一代语音生成模型 Spark-TTS。在此基础上推出的革命性 TTS 引擎 TicVoice 7.0 更是实现了质的飞跃——它能够仅依靠语言模型,以单阶段、单流方式完成语音生成,带来媲美真人的自然声线,同时还具备跨语种生成的惊艳能力。


TicVoice 7.0 的能力已经在「魔音工坊」中充分展现:仅需 3-10 秒的音频即可完成语音克隆,支持 50 个国家语言、600 多个声音库,在客服、有声书、情感直播、影视解说等场景中持续创造着惊喜。


如果说「魔音工坊」让 AI 掌握了说话的艺术,那么「奇妙元」则为这些声音找到了最适合它们的形象。



在义乌中国小商品城,两万家商户的数字分身正开着永不打烊的全球贸易——他们的虚拟形象用着地道的英语,穿梭在世界各地的客户之间,让小商品走向大世界。


打开「奇妙元」的界面,我们只需要上传一小段真人出镜的视频,就能做到「一条视频,全球开播」。克隆出自己的数字分身之后,想说日语、韩语、西班牙语,各种语言的带货视频都能批量制作。


让跨语言视频制作变得如此简单的能力,源自出门问问在数字人技术上的深度突破。最新的 WetaAvatar 4.0-Talking Photo 通过双引擎驱动,将数字人的表现力提升到新高度:运动预测引擎能从语音中精准提取参数,实现嘴型与声音的完美同步;人脸驱动引擎则能将静态照片注入生命力,让面部表情和微表情的变化都栩栩如生。



当它与 TicVoice Pro 结合,就轻松实现了语音和形象的双重克隆,大大降低了视频制作门槛。


WetaAvatar 4.0-Talking Photo 的技术架构。


而「序列猴子」视频理解大模型的加入,更是让 AI 能够精准解析任意长宽比的视频画面,通过强大的 OCR 与快速推理能力,全方位赋能创作过程。


出门问问的数字人引擎技术示意图。


从数字世界来到物理世界,结合了「奇妙元」和具身智能的「奇妙问」在企业服务领域大放异彩。



「奇妙问」是一个 AI 交互式数字员工生成平台。 从数字接待员到智能导医台,从校园辅导员到智慧零售导购,「奇妙问」已在义乌小商品城、西安交大、美宜佳等众多场景中落地。


「元创岛」则专注于让 AI 视频创作变得简单。这个「一键成片」的平台从诞生之日起就确立了清晰的商业模式,在 AI 创作、小说推流、短剧制作等领域快速扩张,吸引了咪咕音乐等众多头部用户。



灵活的技术模块和产品功能的任意组合,出门问问不必担心 AI 行业普遍存在的重模型轻产品的问题,实现了技术能力的最大化复用:


首先是技术升级更加灵活。就像更换零件一样,系统可以随时接入最新的模型能力,比如 DeepSeek 的先进算法,或是华为云昇腾的强大算力,持续提升产品性能。


其次是产品创新更加敏捷。不同功能模块的组合可以快速孵化新产品,例如在荷兰国际广播大会上亮相的「AI 数字员工」,就是将「魔音工坊」的多语言配音能力与「奇妙元」的数字分身技术结合的成果。


2024 年 9 月,「奇妙元」海外版 「LivGen」数字人亮相荷兰国际广播大会。


最重要的是,这种架构让产品能够快速响应市场需求。以「魔音工坊」为例,最初的新闻播报助手,到有声小说配音工具,被印证不可行之后,迅速转型为如今风靡全网的短视频配音平台,每一步都源于对市场反馈的精准把握。


这套架构催生了一个强大的价值增长闭环:产品产生的海量数据持续反哺大语言模型训练,提升模型能力;升级后的模型又为产品注入「更强大脑」,打造出更具竞争力的产品。


市场用数据给出了最好的印证——去年,出门问问的 AIGC 产品吸引了超过 1000 万注册用户,其中付费用户突破 100 万人。


持续引领行业风向,未来还要组织 AI 化


今年 1 月 DeepSeek 横空出世,既推动了 AI 领域技术进步,也让生成式 AI 再次破圈,催生了大量热门应用。盛景之下,人们开始重估 AI 领域中的众多公司和机构,可以看到,其实此前一些国内公司已经展示了实力。


2024 年 4 月,号称「AIGC 第一股」的出门问问在香港联交所挂牌上市。其报告公司 AIGC 业务增长达 123.8%,在总营收中的占比超过一半,已经走完了从传统 AI 收入模式转型至生成式 AI 的进度条。


这并不是出门问问第一次做到先行业而动。事实上,AI 领域几次跨越周期的转型,出门问问都是最早出发的那一批。


2012 年,刚刚成立的出门问问率先了切入语音助手赛道。其团队从零到一构建了开发声音信号识别、自然语言处理、垂直搜索等一系列技术,提供的中文语音助手可以实现查天气、查航班、查火车票等功能,构建起了「语音版搜索引擎」。


在语音识别面临场景限制,AI 技术不成熟等挑战之下,出门问问果断走向「软硬结合」的道路。自 2014 年起,公司陆续推出智能手表、智能后视镜、ADAS 等产品,并打开了海外市场。这家公司也逐渐从一个单纯的软件技术服务商转变成为覆盖算法、硬件、供应链、销售、品牌、电商的全栈式软硬结合公司,业务逐渐扩展到了车载、金融、物联网等领域。


到 2022 年末,ChatGPT 引爆全球生成式 AI 浪潮,科技公司和创业团队面临着大模型研发极度耗费资源的挑战,出门问问果断开启了「产模结合」之路,依靠自研基础大模型能力和一系列产品重回大众视野。


回溯出门问问发展的这段历程,可以清晰地看到这家公司的前瞻性与探索精神。每在浪潮来临之际,出门问问都是最早做到行业认知,并开始行动的。


放眼未来,出门问问早已开始了新的尝试。「当 AI 智能体变得可行的时候,除了做产品外,公司的组织 AI 化是都在考虑的事情,」李志飞在本周的业绩媒体会上表示。「一个 200 人的公司,在未来也许只有二三十个人类员工,其余都是 agent,这不是科幻,而是很多小型的创业公司正在做的事情,我们作为一个存在十几年的公司,必须跟上这个潮流,使我们转型为一个原生 AI 组织。」


出门问问计划在未来一年将 AI 嵌入公司的整个工作流程,实现文档的全数字化,进而让智能体全过程参与执行与管理,以此实现效率提升、扁平化管理等效果。


从自我开始用 AI 改变生产关系,大幅提升生产力,这样才能更好地引领更多行业的智能化转型。可以预见在一系列「智能体化」之后,出门问问前进的脚步还将更快。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/180491
 
18 次点击