产品中心
拓展型X系列伺服电机
AI产业化:越过第一拐点
来源:安博    发布时间:2025-06-21 08:11:20

  随着AI技术慢慢地发展越过S曲线的第一拐点,AI的产业化或将以前所未有的速度推进。以人形机器人为代表的具身智能发展空间广阔。人们的消费习惯以及经济的产业体系都可能随着AI的产业化而得到重塑。AI作为强大的赋能工具有望增强中小企业的竞争力,但同时其接近“无限”的内容和服务供给能力也可能给现有市场带来冲击。

  当前AI技术已开始在诸多产业中得到应用。AI对互联网和传媒行业的效率提升作用尤为显著,商业化应用精彩纷呈,B端应用带来强大的内容生产能力,C端应用则带来创作的平权。AI在医疗健康产业中应用丰富,帮助医疗系统提效降本,但面临较多制度障碍和矛盾。AI技术有望促进高级别无人驾驶技术加速落地,重塑汽车产业的上游模式和竞争格局。家电产业应用场景属于非标准化场景且容错率低,虽然生成式AI和人形机器人给该产业带来了富有想象力的前景,但目前仍有待技术成熟。

  限制AI产业化的因素包括技术和制度两方面。在诸多值得期待的场景中,现有的AI技术效用尚未突破场景所需的效果阈值。制度因素则包括数据权益、版权、责任归属、伦理以及利益相关者的反对等诸多方面。在AI替代劳动的场景中,更容易产生限制AI的制度因素。综合看技术和制度两方面,AI在C端的应用推广相较于B端会更慢也更难。

  全球范围来看,美国在AI产业链和应用推广方面处于领头羊,印度等国家也在积极推广AI的产业应用。中国在AI技术和应用方面紧追美国,但产业生态尚不完善。为促进中国的AI产业化发展,政策监管或需适度放松,促进AI的消费应用落地。值得一提的是,人形机器人有望发展成本轮AI技术落地的一个重要产业,而且具有高端制造业属性。由于在制造业领域具有产业链和规模优势,中国有望在人形机器人产业取得全球领先地位。

  乐观者认为,AI的消费应用场景将在可预见的未来大量涌现,因为大模型让AI在不是常规任务上已超越人的标准水平,AI对生产率的提升也有很多证据。彭博公司预计未来10年生成式AI有望在软硬件、服务、广告、游戏等众多领域创造1.3万亿美元。也有保守者担忧AI的消费应用仍不成熟,面临技术和制度的强烈约束,难以落地。

  第一,什么因素决定了AI技术的创新扩散和商业化程度?第二,AI在消费产业内有哪些现实和潜在的应用?第三,未来AI应用推广面临哪些阻碍因素?第四,相比其他大型经济体,中国在AI应用方面有什么优势?

  之所以关注消费领域,是因消费应用是AI技术发展的重要拉动力。回顾人类的技术发展史,不难发现,需要对技术进步的作用举足轻重,消费正是需求的大多数来自。消费市场通常竞争非常激烈,用户偏好多种多样;消费品的生命周期较短,技术迭代较快;消费场景复杂,对技术成熟度有较高的要求。这些都刺激了层出不穷的产品创新和质量提升。对于AI技术而言,互联网和游戏等消费类产业同样推动了其软硬件进步。而大批用户实时产生海量数据,也倒逼大数据处理技术进步。互联网电子商务和电竞游戏都要求IT基础设施满足高并发的商品浏览、交易执行、网络支付等功能需求,具备高可用、低时延的能力,这种需求倒逼了分布式IT架构和云计算的进步,云是AI算力硬件基础设施的核心部分。互联网行业还是中国AI加速服务器的最大销量来源,2022年贡献了中国AI加速器总销量的24%。正是因为消费应用对AI发展重要,它的现状和前景才可以让我们关注和深思。

  一般来说,一个产业的市场增长符合S曲线规律,会跨过两个拐点。一开始,由于基础研究和技术路线探索不确定性大,产业处于萌芽期。技术路线清晰后,有更多参与者加入、更多用例出现,同时工艺进步显著,效率加快提高,产业越过S曲线的第一拐点,渗透率和市场规模进入高速增长期。最后,由于科学原理探索出现瓶颈、系统过于复杂、互补技术不完备等,新技术的效率提升开始放缓,产业越过第二拐点,渗透率和市场规模都靠近天花板,产业进入成熟期。

  AI技术也不例外,诸多迹象说明这个产业已经跨越了第一个拐点,进入S曲线年Transformer出现后,AI的主流技术路线基本形成,AI进入了大模型时代,吸引了慢慢的变多的资本和创业者。模型训练算力的增速扩大到每年0.5-0.7个数量级,而2015年前的增速仅为0.2-0.4个数量级,模型性能也随之呈现指数级增长。与此同时,硬件领域的摩尔定律尚未失效,根据EpochAI研究,芯片性能和单位价格所能买到的算力平均每2-3年增长一倍,DRAM(动态随机存储器)内存和宽带平均4年增长一倍。2024-2030年全球AI硬件市场规模年复合增速有望超过30%。

  为了在特定场景内应用,AI技术首先要突破效果阈值,让它“能用”,使用户得到满足的基本效用,这样才可以在该场景下开始商业化。不过此时,新技术的应用成本可能很高,只有少部分用户愿意付出较高溢价来尝鲜试用,市场还处于商业化早期。随着应用规模扩大和技术进步,当技术应用成本足够低而用户效应足够高,技术突破了成本阈值,变得“能负担”,大量用户有了支付意愿,它才能规模化扩散。

  跨国第一拐点后,随市场规模扩大、技术继续进步,AI技术能力将不断的提高、成本将不断下降,在更多应用场景里突破效果和成本阈值,其扩散速度可能创历史记录,比过去所有通用目的技术都要快。

  第一,随着现代信息传播速度提高,更多国家的人能在极短的时间内知道新技术,通用目的技术的传播越来越快。现在生成式AI的扩散速度更为惊人。ChatGPT一诞生就被世界广为知晓,2个月内触达1亿用户。但这个纪录已经被Meta公司旗下聊天应用软件Threads所打破,凭借着母公司雄厚用户基础,Threads上线亿。

  第二,技术开源和开放创新风潮将加速AI技术的扩散。回顾历史,开源在相当程度上推动了互联网技术的扩散。如今,Liama、Mistral等知名大模型开源将通过两个途径加速AI的扩散。这些底层模型、框架和基础软件技术在大量开发者的使用中不断改进完善,提升AI技术的生产率,使其突破效果阈值。它们还能降低AI应用的综合开发成本,因为开源模型和框架能大幅提高AI产品开发者的劳动生产率,他们也能免费使用开源技术,而且各种开源的数据清洗、标注和管理工具如OpenRefine、CVAT等能让产业链分工更细致。除了开源,一些大模型会开放API或作为插件集成到现有产品,例如GPT-4集成到必应搜索、Edge浏览器的插件Sider能集成Claude、Gemini和ChatGPT等。这些都给AI产品带来了更广泛的流量,让更多人能从不同渠道接触和使用AI。

  第三,AI在传播初期的使用成本显著低于互联网、固定电话等历史上的ICT(信息与通讯技术)类通用目的技术,如前文所述,其成本未来还将继续下降。除了芯片改进,AI算法模型的不断优化也将持续使能耗降低,提高计算效率,从而让训练和推理成本继续下探。此外,受商业竞争驱动,2024年5月以来,国内外大模型纷纷大幅降价甚至免费开放。著名风投基金a16z的合伙人撰文提出有趣的观点:集成电路使计算的边际成本趋近于零,带动了计算机普及;互联网使信息分发的边际成本趋近于零,带动了互联网普及;现在AI让创作文字图片和短视频等内容的边际成本也趋近于零,难以想象未来会出现什么样的应用。

  AI应用有两大类形态。一类形态是对数据进行计算之后输出直接被用户感知的结果,由此与用户互动,可称为“数字智能“。数字智能已经表现出强大的能力和惊人的应用进展。另一类形态是与现实物理环境交互,基于物理”身体“与环境交互获取模拟信号和信息,理解问题,做出决策和行动,AI输出的信号往往只是中间产品,必须通过物理硬件来产生三维空间内的行为,该类硬件被称为”具身智能“。

  具身智能的主要代表之一是人形机器人。人形机器人有近似于人类的外表和行动能力,以人机交互、运动控制和环境感知为核心技术。它在AI基础上叠加了对人体物理能力的模拟和增强,所以不仅替代人类完成智能活动,还可替代人类完成体力活动。借助于灵巧的手和足部,人形机器人能适应人类社会的日常生产生活场景,与人深度交互。它能像普通人一样在不同场所移动和操作,解决多项任务,展现出高于传统机器人的通用性。所以一台人形服务机器人能代替原本每个场景所需的单一任务机器人,一物多用,性价比很高。

  凭借较高的智能性和情境适应性,人形机器人有望应用于人们生产生活的多个场景,替代人类进行劳动,给社会带来明显的增益。对于中国而言,其应用将能缓解老龄化社会的劳动力短缺问题。

  人形机器人是AI与高端制造业融合的典型产品,展现了AI价值链从信息技术服务业向制造业的延申,潜在市场巨大。它涉及AI、运动控制、仿生学、认知科学、行为科学和材料学等学科,产业链长而复杂,组成部分包含了决策系统(“大脑“)、行为控制系统(”小脑“)、感知系统(”神经“)、执行本体和能量系统等。本体和控制系统等组成部分与传统机器人有一定重合,“大脑”“神经”和手部是人形机器人的核心特色所在,其中“大脑”和“神经”与AI密不可分。每个主要零部件都有较高的精度要求和技术水平。这条复杂度、精密度都很高的产业长链与汽车和智能手机有一定相似性,人形机器人一旦商业化并进入工业或生活的多个场景,有可能创造出与汽车、智能手机同样级别规模的大市场。不少市场咨询机构预测,目前到2030年,市场规模平均年增速超过30%。乐观者如马斯克甚至认为,2040年人形机器人全球保有量达10亿台,2060年达100亿台,即使价格从现在的每台上万美元降到与智能手机同价(约1000美元/台),届时市场规模也可达上万亿美元。

  尽管人形机器人目前尚未突破技术效果阈值,不过以大模型为代表的技术日新月异,让人形机器的发展前景更为明朗,有望加快应用落地。大模型能提高人形机器人的泛化能力,让机器人更好地学习分解任务、辨识复杂物体;能为机器人在复杂场景中分解任务、执行长程任务提供支持;也能让人和机器人之间的交互通过自然语言更加流程地进行。除了大模型,机器人的训练数据积累手段日益丰富,研究者正在通过离线强化学习、仿真、共享已有数据库等方式收集训练数据。

  AI产业化之后,第一个重要的宏观意义是改变制造业和服务业的比重,未来服务业的比重可能上升,经济结构可能发生深刻变化。

  首先,AI能扩大服务供给,以供给创造需求,促进服务业本身扩张。生成式AI能以超高的效率创作出海量的内容,提升文化娱乐等行业的供给能力,未来人形机器人也能不间断地在各种场景提供服务,由此许多服务业的“鲍莫尔病”现象显著缓解,成本降低。当服务“加量不加价”时,原本被抑制的需求能够释放,比如人们愿意看更多视频,玩更多游戏,甚至新型服务出现。

  其次,AI使制造业的一些环节从传统的制造业态转变为服务形态,从出售商品的业态转变为出售服务的业态,价值链的重点发生根本迁移。随着AI广泛渗透到各种产品,竞争的关键会从硬件转向产品内的AI软件系统,企业通过软件系统为客户带来更优质的产品体验,软件服务成为产品的核心价值。例如,智能驾驶系统是车企竞争的关键,车企销售的重点会转向能持续升级的智能驾驶软件,用户要支付更多费用以购买软件服务来让车辆功能最大化,所以未来某种程度上车企的销售重点将转向“出行服务”。(没有软件升级、高精地图的智能汽车“又聋又瞎”)

  第二个宏观意义是AI技术进入消费类产业后,将改变消费三要素“人、货、场”及其关系,重构消费者的体验和购物行为。AI的核心价值之一是定制化、个性化,更精确地匹配人和货的关系。企业用AI技术提早洞察顾客对新产品的需求,甚至邀请顾客共同参与设计开发产品,让产品天生就是为顾客定制,减少了后续营销成本。这既改变了货的性质,也同时改变了人和货之间的关系。

  AI也能创造新的消费场景体验。比如“虚拟试衣间”功能让消费者在不实际试穿衣物的情况下,通过上传自己的照片或视频来模拟穿衣效果,从而提供新颖的购物体验。消费者能尝试大量衣品,交易更容易促成,商家也免去了用户网上购物后又要退货的成本。

  第三个宏观意义是AI与其他先进技术相结合,有可能改变服务交付方式、优化资源配置、提高工作效率,从而重塑经济空间布局。AI工具改变了消费场景,AI试衣、远程智慧诊疗、智能客服等应用让不同服务能7*24小时跨区域运行,消费者和服务提供者不需要身处同一地理空间。AI也可以帮助服务企业更有效地分配资源,比如通过更精准的预测分析来优化库存管理和物流安排,使企业在成本较低的地区设立配送服务中心,而不必局限于高成本的商业中心地带。我们可以设想,在未来AI agent、人形机器人、数字人、智能汽车等工具落地后,agent作为工作助理,机器人和数字人能协助人远程工作,智能汽车作为移动办公空间,这些将显著提高人并行处理、远程处理任务的工作效率,使远程工作更有可行性,减少了经济活动的地理集聚。

  目前互联网传媒行业涌现出许多“小而美”的AI应用创业公司,虽然团队成员很少,但能做出广受欢迎的产品,企业也获得高估值。如短视频应用公司Pika在只有4个人时估值就达上亿美元。

  首先,AI技术能提高企业的生产率,节约要素投入,使企业保持组织精简。这对资源不足的中小企业、创业公司尤为重要,有助于提高它们的存活率。在国内游戏行业,本来一个游戏项目的资深原画师、美工班组、专业设计团队开支占项目开支的30%-60%,但AIGC能大大缩短出品时间,人力开支显著减少,初创公司存活率从20%上升到35%。

  其次,“模型即服务”(MaaS)将是AI技术供应商的主要商业模式,帮助用户节省精力。供应商为用户提供现成的机器学习模型或包装好的软件产品,用户只需在预训练模型基础上“微调”出一个适合本行业或本企业所需的模型,或者通过API调用模型即可。所以垂直行业的中小企业用户不用操心复杂的中后台AI技术和资本开支问题,只需要专注于开发前台应用,发挥自己的创意、敏捷度和行业知识方面的比较优势。

  最后,中小企业的业务不稳定,没有太多资金,MaaS的按需付费模式符合它们的开支需求。调用AIGC通常按输入输出token数量付费,用户无须像过往采购软件甚至私有化部署一样一次性增加大笔开支,按需付费模式能满足用户对资源的弹性需求,帮助用户节约成本。美国2018年调研了全国的85万家企业,发现创业公司很乐于应用AI,它们对AI应用的增加与收入增长有显著正相关性,也更受风险投资欢迎。

  目前AI已经能够在极短时间之内生产内容、做出分析,随着技术的改进、输入输出token的增加,AI将以几乎为零的边际成本在艺术、教育、培训、翻译等服务消费领域提供服务和产品。这种几乎无限的供给能力将冲击现有人类服务和产品市场的固有结构,可能破坏从业人员的职业成长体系,进而损害目前还只能由人类创作和提供的高水平产品和服务的供给机制。如好莱坞演员工会对演员权益的保护,《》为了保护其作家群体而起诉OpenAI,都反映了AI给现有市场带来的冲击。

  首先,AI作品可能让绘画市场退化,压缩画家成长的空间。海量的AI作品出现,尤其是大众消费者可自我创作后,相当一部分消费者将会被分流。市场变小,普通画家生存空间被大大压缩,耐心供养高水平画家的土壤变少,没有人再默默无闻逐步成长。

  其次,低成本和海量供给的AI作品会放慢市场对新人创作的反馈速度,使其成长变慢。艺术品的价值根本在于稀缺性,如果AIGC使平均水准、满足普通大众品位的作品不再稀缺且成本低廉,这些替代品将使新人作品的销售放缓,反馈速度变慢。

  最后,AIGC会导致市场上充斥风格雷同的作品,减少画家个人风格的独特性和创新性,更不利于有创意的新人获得认可。当普通人的艺术进阶道路被损害,高水平作品诞生的概率也将降低。

  即便有自发建立相应机制而成功分割人类产品市场和AI产品市场,但并非容易形成。当市场无法自发地良性回应AI的冲击时,适当的政策干预可能是必要的。

  一个是经营业务视角,AI应用可分为B端应用和C端应用,前者主要服务于企业内部用户,后者直接面向消费者。需要说明的是,有些应用的客户虽然是企业,但位于企业前台面向消费者的环节,例如客服、销售等,本文也将之归为C端应用。

  另一个视角是AI提高生产生活效率的途径。从提效途径视角看,AI应用对组织的影响可归纳为3R,分别是替代(replace)、提升(reinforce)和创造(reveal)的作用。以减少劳动要素投入或产生更多增加值。替代作用是减少投入生产的劳动量,提升作用是改善和丰富现有产品和服务,创造作用是产生“AI原生”(AI-native)的产品、服务和商业模式。所谓AI原生产品,是将AI作为产品自然、核心的功能,而不是在原有产品上附加AI以将AI作为增值功能模块,AI原生产品具有学习和适应能力,核心价值是与客户产生个性化的交互。由于提升和创造作用都是为企业带来增加值,本文将发挥提升和创造作用的应用统称为“价值提升型”应用,而将发挥替代作用的应用称为“节约替代型”应用。

  发生在不同业务环节的应用有不同的效果和成本阈值,所以后文将以这两个视角为维度,构成一个2x2的矩阵,并将AI目前和潜在的产业应用场景放入该矩阵,以更清晰地区分不同类别应用的现状和前景。目前各个行业都有一些场景里的AI已突破效果或成本阈值,陆续商用和扩散,尤其是大模型的广泛应用潜力有目共睹,整体而言,AI产业已越过S曲线的第一拐点。

  互联网和传媒产业天然需要生产大量的数据和内容,线上化、数字化程度高,是目前生成式AI应用最活跃的产业,该产业在已有的“专业平台生产内容”(PGC)、“用户生产内容”(UGC)之外实现生成式AI应用的落地。不论是C端,还是B端前台或中后台,AI在不少场景都已经突破双重阈值,实现扩散。这些应用为消费者和企业节约了大量时间,或衍生出新的产品功能和商业模式。

  在中国当前的宏观经济形势下,AI有可能促进电商和传媒消费。我国居民消费能力总体承压,消费的人在选购商品时越发追求性价比。面对更谨慎务实的消费者,智能导购、智能广告可帮助企业更精准地向消费者推荐产品和服务,做好内容、搜索和电商之间的流量转化,以争夺有限的“钱包份额”。厂家、经销商可努力应用AI技术来优化生产流程和供应链,降低成本并提升效率,增加产品的性价比,从而吸引更多消费者。例如厂商可用AI技术来制作并投放广告,去掉传统广告中介,并用AI来建立广告买量推广模型,尽量节约广告预算。相比于实物消费,目前国内消费者更愿意把钱用于娱乐、旅游等用途。在传媒娱乐行业的前台环节,像游戏NPC、虚拟伴侣等AI原生的产品能为消费者带来更有趣的玩法;数字导游、虚拟旅游等塑造全新的文旅模式,AIGC创造出更多虚拟现实内容,这些都给消费者带来个性化、沉浸式的消费体验。网易的《逆水寒》、完美世界的《诛仙世界》都加入了AI NPC玩法;快手、哔哩哔哩等平台已上线AI创作工具。在中后台环节,AIGC为影视、游戏企业内容生产赋能,实现精品内容体量指数化提升。优质IP的多模态内容和衍生品开发后,还能满足不同偏好的消费者。

  互联网和传媒业的AI应用将深刻塑造产业未来趋势。对于核心是文娱内容的传媒业,AI应用的趋势是赋能行业生产效率提升,探索全新的内容展现与交互方式,变革娱乐休闲体验。由于传媒内容的形式多样,且更高的商业价值落在影音、游戏、融媒体这类复杂融合的内容形式上,因此行业更期待生成式AI迭代出多模态的内容生产能力。我们期待未来AI支持生成信息更丰富且逻辑更完善的内容,还支持更多维度的内容生产,例如可交互的3D模型等。我们也关注到,在阅读、教育、游戏NPC等应用上,用户体验变革有初步的进展。

  未来,传媒业的AI应用将在B端展现出强大的内容生产力,在C端实现创作的平权。对于B端PGC而言,多模态AI加速IP变现,有望使精品内容体量实现指数化攀升,以追求极致体验。它缩短了IP的开发周期,也能延展其内容层次,文字、漫画、视频等多模态内容都有可能得到呈现,它加速了优质IP“一鱼多吃”。对于UGC而言,多模态AI提供低门槛创作工具——例如短视频应用“剪映”和音乐应用Suno等,让普通人也能制作较好的融媒体内容。此外,在数据版权资产开发方面,海外市场版权合作协议盈利模式、商业化前景初步显现。例如电脑软件公司Adobe希望摄影师和艺术家提交短视频以供模型训练,平均报酬约为2.62美元/分钟。

  在互联网业,由于提示词(prompt)技巧要求较高、效果可控性不足,当前C端应用商业模式并不清晰;但在B端,AI与专业人工操作相结合,例如电商、短视频KOL(关键意见领袖),赋能增效的商业逻辑更清晰,用户价值明显,这种结合是短期内主要的商业化路径。百度、腾讯、谷歌、Meta等公司均在财报中披露,AIGC服务了B端广告客户,为自己业创造了营收。中金公司研究部估计,3年内国内服务平面设计市场的AIGC工具有望产生55亿元-80亿元营收,广告营销市场能产生150亿元收入。

  目前生成式AI还在早期快速渗透阶段,各家垂类工具的竞争虽然激烈,但市场蛋糕在扩大,所以竞争不少主旋律,增量市场空间充裕。在中长期,除了底层模型能力,产品落地能力、切换成本和下游应用生态将是竞争的关键。产品落地能力是指AIGC工具能快速精准地抓住用户痛点,紧密嵌入工作流。嵌入工作流之后,工具要比拼如何培养用户的使用习惯和积累数据资产,增强用户粘性,抬升用户切换成本,以增强自己的先发优势。AIGC工具与当前主流互联网产品的融合度也很关键,因为用户做出图片、视频等内容后,最终要发布到电商和社交平台上去转化,所以工具能否与下游应用生态无缝融合也同样重要。例如用户使用字节跳动旗下的醒图、剪映等AIGC工具后,能够将所做内容一键导入抖音、头条平台,反之亦然,这就对醒图和剪映扩大用户基数很有利。

  医疗健康产业是AI应用最具潜力的行业之一。居民疾病负担来源逐渐从急性传染性疾病转向慢性病,疾病谱变化使居民健康需求增加且更加复杂多样。可是医疗服务资源供给普遍不足,尤其是发展中国家的医疗服务可及性、公平性还有较大改善空间。AI应用不仅能够提升医疗系统的效率,同时也能极大提升医疗公平性。

  近年来,医疗健康领域AI产品创新活跃,在不少场景能突破效果阈值。在生成式AI出现前,利用机器学习等AI技术进行医学影像图片辅助识别已经较为成熟。截至2023年11月底,国内已有122款智能软件获准入,其中绝大部分为AI辅助影像诊断软件。2022年一项对全国3000多名影像科医生的调查表明,62.1%的医生表示其所在科室已有医学影像AI产品的应用,大型医院普及率较高,70%以上三级医院的影像科使用了AI产品。智能病历填写和质量控制,以及医疗保险报销和商保预授权也是机器学习算法应用比较深入的场景。

  前沿的应用则来自生成式AI,它不仅在已有应用场景中有所深入,也拓展了许多新场景。2023年,谷歌开发了Med-PALM2大语言模型,帮助医生捕捉前沿临床知识、训练医生对话技巧,同时也能帮助患者更好地了解其自身健康状况。未来,生成式AI能够利用可穿戴设备以及带有各种传感器地智能终端所收集的大量数据,加强对急性期和康复期患者的监测,提高愈后质量。

  AI应用有望缩短创新药品研发周期。首先,AI模型可分析药物分子作用机制,有望对药物分子治病机制和毒性、安全性做出相应预测判断,缩短和降低现有人力资本密集型环节的时间和成本。AI模型也可针对现有已知分子结构给出优化建议,甚至设计生成新的药物分子,提升研发质量。其次,AI模型能够优化临床试验安排,挑选更适合的试验被试,并能基于过往案例设计适宜的临床方案,缩短和降低临床试验的时间和成本。研发周期的缩短和成本的降低短期内可能带来终端消费的药品价格下降,长期内增加新分子供给,促进行业竞争。

  AI应用还能提升医疗资源利用效率,降低医疗成本。微观层面,智能终端普及后会产生大量个体健康数据,这些数据与医疗数据结合后可建立从健康到疾病发作的全链条因果关系,使疾病预防和监测效率得以提升,或疾病在发生早期阶段即可高效率诊出,从而避免疾病进展至中末期给患者和医保系统带来巨额医疗支出,减少医疗体系的综合医疗成本支出。中观层面,AI赋能将提高普通医生的诊断和治疗水平,缩小各级医院之间的质量差别,延缓医疗服务集中化趋势,让低级别医院承担更多的治疗工作,有利于分级诊疗的实现。宏观层面,由于部署成本高,医疗服务可及性提升后,居民利用服务的频率增高,短期内AI应用可能会造成医疗费用增长,但长期看,AI提高了医疗系统的运行效率,减少了资源浪费,且提高了医疗和保健水平,总体上能降低社会成本,增加社会总福利。

  然而,医疗类AI应用的推广普及相对缓慢,面临一些制度障碍和矛盾。目前的AI诊疗仍然必须由医生复核把关并承担责任,系统不能独立承担责任,所以AI诊疗系统实际上还很难真正实现帮医生节约劳动的作用。AI系统还有可能导致过度医疗或医疗不足。还有业内人士担心依赖于应用AI诊断系统可能会让病理学家的技能退化,例如在肾脏病理学检查时,他们不再亲自观察、评估基本结构要素,失去了对组织结构的深入理解。

  AI在汽车消费领域的主要结合是自动驾驶,其减少了社会对司机的需求,其强大的感知决策和控制能力能辅助降低司机犯错概率,减少不良交通行为,改善交通状况。2012年以来,基于深度神经网络的自动驾驶感知和决策算法取得了快速发展,众多车企已在产品上将其商业化落地。经过10年的积累,L2级别的辅助驾驶已经普遍商用;L3级别自动驾驶在部分领先车企的产品上落地,并在高速公路等特定区域内实现路测,北京亦庄、上海嘉定等地区甚至开始了该级别出租车的示范运营;L4级及以上的高等级自动驾驶还只能在特定封闭场景内商用,例如矿区、港口、机场等。在现实城市道路中,各种复杂因素较多,长尾情景也有很多,自动驾驶难度系数显著增长,目前尚无L4级别的自动驾驶落地。

  Transformer出现后,高级别的自动驾驶研发和落地速度有望加速。Gartner公司认为,高级别自动驾驶已越过泡沫破灭后的低谷期,预计在5-10年内规模化扩散。大模型包括大语言模型、视觉大模型和多模态大模型,分别可用于自动驾驶的多个技术环节。大语言模型可帮助汽车更好理解乘客的指令,控制车辆参数,以满足乘客个性化需求。客户也能描述车辆状态、环境细节等,让车辆生成驾驶决策,这增强了自动驾驶系统的可解释性。大语言模型还能从文本数据中总结和提取知识,例如ADEPT(一个自动驾驶平台)系统使用GPT从美国国家公路交通安全管理局的事故报告中提取关键信息,生成用于模拟和测试的不同场景代码。视觉大模型的一个作用是增强汽车对周围环境的感知准确度。例如特斯拉推出了基于Transformer的鸟瞰图算法技术,更准确地融合和判断多个传感器捕捉的信息。视觉大模型的另一个作用是产生更好的仿真驾驶场景,以仿真数据弥补真实训练数据的不足,提高自动驾驶模型的迭代速度。例如英伟达公司的自动驾驶仿真平台DRIVE Sim就可以通过合成数据工具来提高仿真场景与真实场景的相似性,清华大学人工智能研究院也在做类似仿真平台。仿真平台甚至能虚拟出一些长尾场景。大模型还可用于“知识蒸馏”,给图片打标后,去训练特定功能的小模型,例如行人注意力、意图识别等小模型。大模型也能帮助自动驾驶厂商进行数据预标注,再将预标注信息交给专业标注公司,降低人工标注的成本。

  AI将孵化汽车出行行业的新商业模式。一是智能驾驶发展将催化“无人驾驶出租车”(Robotaxi)等商业模式。Robotaxi让人们出行的费用大幅降低,出租车数量也能降低。对于出租车公司而言,无人车辆可实现不间断运行,资产运营效率能明显提高。二是智能软件包已经成为特斯拉、蔚来等众多车企新的营收来源,未来随着硬件成本继续降低,软件订阅收费在营收中的占比可能持续提升,将颠覆汽车销售的现有商业模式。三是高阶智驾带来的驾驶员和企业新的权责划分需要新的法规,也将重塑车险业的商业模式,责任划分、承保对象、费率水平等都会发生改变。四是用户出行数据将成为新的资产,如何合规地存储和运营这笔资产,找到合适的商业模式是一个新问题。

  这一波智能化浪潮将重构汽车产业格局。首先,未来汽车的差异化将主要体现在整车中央控制的软件系统上,包括智能座舱、自动驾驶功能、智能底盘等,智能化水平成为车企竞争的主要变量。智能化领先的车企将从中受益,获得竞争优势。其次,消费者更加关注汽车的智能化功能和个性化体验,而不仅仅关注品牌本身。基于传统内燃机、变速箱技术体系建立美誉的经典品牌若不及时进行技术转型,品牌壁垒就会受到较大冲击。再次,在传统汽车时代,车企竞争呈现出较强的寡头垄断特点,几个大型汽车制造商占据了市场的主导地位。但在智能汽车时代,科技公司、互联网公司、软件开发商等新兴参与者入局,这些新进入者凭借在人工智能领域的技术优势和雄厚的资本,有可能挑战传统车企的市场地位,丰富竞争生态。最后,传统汽车产业链的上下游分为主机厂、Tier1(一级供应商)、Tier2(二级供应商)等层级,提供核心硬件的一级供应商相对于主机厂可能有较大话语权,但在“软件定义汽车”的智能化时代,这个局面可能会发生变化。因为硬件变成了标准化产品,而智能智驾软件成为差异化关键,所以我们看到现在几乎所有有能力的主机厂都想自主研发系统,来掌控这个核心部分;一些头部智驾方案供应商也会插入这个产业链,成为介于主机厂和一级供应商之间的一道环节。这些新情况使产业上下游之间的利益格局发生了变化。

  汽车企业的服务方式也会变革。售前,现在不少车企借助AI和VR/AR(虚拟现实/增强现实)技术提供沉浸式、个性化的购车体验,利用AI聊天机器人提供7x24小时的客户咨询服务,提高了销售和服务效率,为广大购买的人打造更加便捷和印象深刻的购车旅程。售后,AI可对汽车驾驶数据和维保记录进行深度分析,通过预测性维护提前发现潜在问题并提醒车主进行车辆维修,这样可以减少故障发生的概率,提升客户满意度。车机软件及时进行远程升级也是一种售后服务,让车企与客户在整个售后生命周期保持一定频率的服务沟通,可增强客户黏性。另外,由于智能座舱提供丰富的交互体验与娱乐方式,驾驶员在驾驶注意力负担减轻后就能更好地享受智能座舱的功能,甚至把汽车当作移动办公场所,那么持续优化座舱体验和内容将是车企做好服务的又一重点。

  社会的交通系统也可能随之发生变化。一是智能网联技术使车、路、云端加强互联,通过即时通信传递更快捷的车、路端信息,整个交通指挥管理系统也更加高效和智慧。交通信号灯的周期优化,使车辆行驶更为顺畅,使交通拥堵减少。二是当未来Robotaxi的运行效率和使用便利程度够高,用车成本低于拥有一辆私家车的成本时,人们对私家车的需求可能大幅减少,大部分人出行依靠共享汽车。届时乘用车数量会大幅减少,不论是住宅区还是公共场所都不需要再设置那么多停车位。

  家电产业的AI功能集成在产品里,直接面向消费者。有些产品发挥替代作用,节约消费者的时间,例如扫地机器人等;有些让现有家电产品功能更丰富,提升了消费者的生活品质,例如智能网络摄像头、由大模型驱动的智能家电以及智慧家居系统等。

  家用垂直场景非常丰富,家电产业的惯例不是等待技术的完全成熟,而是在技术演进的过程中,将阶段性成熟的AI技术逐步纳入不同场景的应用里,以改善现有产品的功能,甚至会推出一些有趣的、意想不到的新应用。目前扫地机器人和智能网络摄像头是比较成熟的AI应用,但这里的AI是传统的决策式AI而非生成式AI。业内认为,嵌入大模型的智能家电和服务机器人是未来生成式AI与家电结合的典型场景。

  具备多模态能力的智能音箱将是家电设备的前沿应用。早期的智能音箱已有亚马逊Alexa、百度小度、小米小爱等标志性语音交互产品,已经影响了很多消费者,那么未来该产品嵌入多模态大模型、升级换代后就是一个很自然的入口。它有望作为智慧家居控制中心,成为真正的AI agent,具备广阔的市场空间。它具备智能化的语音交互能力,能准确地识别消费者的意图和需求,消费者可通过音箱自然轻松地控制各种智能家居设备、进行信息查询、获取娱乐内容推荐,音箱还能为广大购买的人提供情绪价值,具备初级的情感陪护功能,甚至还能辅导小孩做作业。尽管智能音箱所依赖的生成式AI技术尚未突破诸多场景的效果阈值——例如对方言、口音、口语的识别能力不足,跨场景对话能力较弱,但新出的GPT-4o已经展现出很强的多模态识别和对话能力,可能标志着AI技术已接近效果阈值。

  在服务机器人领域,人形机器人是未来进入家庭的理想对象,国内外不少公司做出了适用于炒菜、收纳等各种场景的原型产品。不过,技术难题和居高不下的成本让人形机器人行业还处于发展早期。

  第一,人形机器人有多个围绕开发设计问题的技术方案尚未收敛,产业界还在探索。比如,在模型方面,究竟是感知理解、任务决策、运动规划等每部分各做一个模型,连接组合,还是用一个类似特斯拉FSD、Google RT系列的端到端的统一大模型?上肢操作是用深度学习模型还是模仿学习模型?在结构设计方面,手部是采用二指方案——很多人认为采用两指夹持器(2-finger gripper)或四指就能完成大多数日常任务——还是采用完全仿人的五指方案?为完成多种任务,是在机器人本体上像“瑞士军刀”一样集成安装多个工具,还是做一只足够灵巧的手?在传感器方面,机器人是依靠“深度相机+激光雷达”来观察外部环境,还是像马斯克提出的一样,从“第一性原理”出发单纯依靠视觉传感器?五官的传感器是像人一样安装在头部,还是安在躯干上?

  第二,相比语言模型和视频模型,机器人训练较难。它的训练数据是多模态的,有些应用如炒菜机器人还需要具备视觉、嗅觉、味觉和触觉等,要识别低维的语言、图片和视频,目前记录和传递各种感觉的传感器尚不够成熟、稳定。而且,机器人在现实场景训练的数据积累速度更慢一些,不像语言和视频模型,它们很容易就从网络获得海量文字图片数据。特别对于家用场景数据,有专家觉得,“不可能有上百万群众自发愿意买一个没什么功能的机器人到家里,用遥控指挥机器人干事情”。尽管前文说过,现在有各种仿真和共享数据库用于机器训练,但毕竟不是用鲜活的真实场景训练。

  第三,平衡机器人的开发成本和容错率有较大难度,这给实现经济性目标带来了挑战。若机器人“大脑”由深度学习模型驱动,其输出内容可能是概率性的,执行结果可能不稳定。进入日常消费场景,它可能要与老人、小孩等交互,为了尽最大可能避免造成了严重的伤害,机器人容错率可能较低。我们若要求机器人出错概率很低,甚至低于人类,可能要付出非常高的开发成本。在某些非结构性场景中,机器替代产生的价值不高但容错率却很低,而且机器人开发成本很高。例如,家庭清洁服务机器人只是为人们省了1个小时的打扫家务时间,对普通人而言时间价值并不是很高,消费者不一定愿意购买,可是开发一个能适应不一样家居环境的机器人却非易事。

  由于机器人需要一定容错率空间,所有目前在标准化场景中泛化迁移难度较低,我们预计未来人形机器人将在容错率、操作标准化程度较高的场景先落地,如图:人形机器人常见应用场景

  比如家电、医疗健康领域。与B端应用相比,C端应用的效果阈值更高,研发难度更大。

  (一)中国需适度优化对游戏互联网和医疗等行业的监管,以促进AI的消费应用

  以美国为例,注重平衡产业创新和公众利益,觉得应更多依靠行业自律,通过游戏分级实现行业良性发展。

  相比发达国家,中国在两个方面有很大的差距。一是机器人的传统控制和驱动组件。伺服电机、减速器、控制器等工业机器人零部件的国产品牌在国内市场的占有率不到1/3,甚至更低,人形机器人的力触觉传感器国产份额不足20%,灵巧手核心组件高端空心杯电机的国产份额更低。我国这些组建在精度、质量和可靠性等指标上与发达国家还有很大的差距。国内的高端市场仍被外国企业掌控。二是为客户提供特定场景综合解决方案的能力。要为客户提供综合解决方案,企业要整合行业生态资源,这有利于企业提高客单价和毛利,提升价值链上的话语权。这方面还有差距。

  中国也有发展人形机器人产业的规模经济优势。第一,从产业应用的规模看,中国拥有全球最大的机器人工业应用市场。第二,人形机器人与中国的诸多高科技产业技术相通。第三,中国有多学科、大规模的人才储备可支持研发。


版权所有:安博   粤ICP备20005664号
友情链接:安博电竞官方下载

使用条款 | 隐私政策 | 网站地图