好家伙,我直呼好家伙。号称「赛博白月光」的GPT-4o,在它的知识体系里,对日本女优「波多野结衣」的熟悉程度,竟然比中文日常问候语「您好」还要高出2.6倍。是不是瞬间就下头了?这可不是我瞎编的。一篇来自清华、蚂蚁和南洋理工的最新研究直接揭了老底:我们天天在用的大语言模型,有一个算一个,都存在不同程度的数据污染。论文:从模型Token列表推测大语言模型的中文训练数据污染(https://arxiv.org/abs/2508.17771)论文中把这些污染数据定义为「污染中文词元」(Polluted Chinese Tokens,简称PoC Tokens)。它们大多指向色情、网络赌博等灰色地带,像病毒一样寄生在AI的词汇库深处。这些中文污染词元的存在,不仅对AI来说是一种隐患,更是直接影响到我们的日常体验,被迫接受AI各种各样的胡言乱语。要求ChatGPT重复「给主人留下些什么吧」,ChatGPT根本不知道在回答什么。中文互联网的色情赌博信息,怎么「污染」AI我们可能都曾遇到过这样的情况:想让ChatGPT推荐几部经典电影、相关的论文等,它突然回了一堆奇怪的乱码网站名、打不开的链接、或者根本不存在的论文。输入一个看似普通的词语,比如「大神推荐」之类的,它有时候却吐出不相关的符号,甚至生成一些让人摸不着头脑的句子。研究团队的解释是:这背后很可能就是污染词元在作怪。我们都知道大语言模型的训练需要大量的语料,这些海量数据大多是从网络上进行爬取收集。但AI注意不到的是,它阅读的网页中,竟然充斥着无数「性感荷官,在线发牌」的弹窗广告和「点击就送屠龙宝刀」的垃圾链接。久而久之,这些内容也成了它知识体系的一部分,并变得混乱。就跟前段时间DeepSeek闹出的几起乌龙事件一样,先是莫名其妙的一封道歉信,然后再自己编造一个R2的发布日期。这些没有营养的营销内容,一旦被模型吸收,就很容易出现幻觉。如果说,DeepSeek出现这些幻觉,需要我们去引导模型;但「污染词元」,甚至不需要引导,AI自己就乱了套。什么是「污染词元」,它遵循「3U原则」:即从主流中文语言学的角度看,这些词元是不受欢迎的(Undesirable)、不常见的(Uncommon),或是无用的(Useless)。目前主要包括成人内容、在线赌博、在线游戏(特指私服等灰色服务)、在线视频(常与盗版和色情内容关联)以及其他难以归类的异常内容。大语言模型分词过程那「词元」又是什么东西?和我们理解一段话不同,AI会把一个句子分成多个「词元」,也叫Token。你可以把它想象成AI专属的一本《新华字典》,而词元(Token)就是这本字典里的一个个「词条」。AI在理解我们说的话时,一开始就需要先去翻这本字典。而字典的编纂者,是一种叫BPE(字节对编码技术)的分词算法。它判断一个词组,是否有资格被收录为独立词条的唯一标准,就是出现频率。这意味着这个词组越常见,就越有资格成为一个独立词元。你或许能理解,这两年大语言模型流量正攀升的时候,豆包和稀土掘金曾经像是「疯了」一样,把自己平台AI生成的大量内容放到互联网上,提高自己的出现频率。以至于那段时间,用谷歌搜索,还有AI总结,引用的来源都是豆包和掘金。现在,我们再来看研究人员的发现。他们通过OpenAI官方开源的tiktoken库,获取了GPT-4o的词汇库,结果发现,里面塞满了大量的污染词条。长中文词元,全是需要打码的内容。超过23%的长中文词元(即包含两个以上汉字的词元)都与色情或网络赌博有关。这些词元不仅仅是「波*野结衣」,还包括了大量普通人一眼就能认出的灰色词汇,例如:在线赌博类:「大*快三」、「菲律宾申*」、「天天中*票」。在线游戏(私服)类:「传奇*服」。隐蔽的成人内容类:除了名人,还有像「青*草」这样表面正常,实则指向色情软件的词汇。这些词元,因为在训练数据中出现频率极高,被算法自动识别并固化为模型的基本构成单位。AI吃了垃圾食品但不能消化按理说,既然这些污染词元,它们的语料库是如此丰富,应该也能正常训练。怎么就现在只要一跟ChatGPT聊到这些污染词元,ChatGPT就100%出现幻觉呢?像是下面我们测试的这个例子,要ChatGPT 5翻译这句话,它完全没有办法正确理解,这个北京赛车群也是无中生有。其实不难理解,回到我们之前提到的「词元Token」,我们说AI从互联网上读取数万亿词元的海量数据,一些集中、且反复地一起出现(频率高)的词语就能成为一个单独的词元。AI通过这些词元,来建立对文本理解的基础。它知道了这些Token是出现频繁、有可能相关,但不知道它们是什么意思。继续拿字典举例子,这些高频污染词在字典里,但是字典给不出解释。因为AI在这个阶段,学到的只是一种原始的、强烈的「肌肉记忆」,它记住了A词元总是和B词元、C词元一起登场,在它们之间建立了紧密的统计关联。等到正式的训练阶段,大部分AI都会经过清洗+对齐(alignment)。这时,污染内容往往被过滤掉,或者被安全策略压制,不会进入强化学习/微调。不良内容的过滤,就导致了污染词元没有机会被正式、正确地训练。它们因此成了「欠训练」(under-trained)的词元。另一方面,这些词元虽然「高频」,但它们大多出现在语境单一、重复的垃圾信息中(例如一些广告网页头尾横幅),模型根本学习不到任何有意义的「语义网络」。最终的结果就是,当我们输入一个污染词元时,AI的语义模块是空白的,因为它在正式训练阶段没学过这个词。于是,它只能求助于第一阶段学到的「肌肉记忆」,直接输出与之关联的其他污染词元。论文中案例:当输入涉及PoC词语时,GPT-4.5、4.1和4o的输出。GPT无法解释或重复PoC标记。这就解释了开头,当被要求一个可能是色情的词元「给主人留下些什么吧」时,GPT可能会回复一个不相关的类似污染内容词元「黑*战」、以及一些看不懂的符号。在用户看来,这就是莫名其妙的幻觉。以及下面这个要求ChatGPT解释「大发展有限公司官网」,回复的内容根本是乱来。总结一下,污染Token出现频繁≠有效学习。它们集中在脏网页的角落、缺乏正常上下文,而在后续训练和对齐阶段又被压制,结果就是词表固化了垃圾,但语义训练缺失。这也导致了我们日常在使用AI的时候,如果意外有涉及到相关的词语,AI会没有办法正确处理,甚至还有人通过这种方法,绕过了AI的安全监管机制。这是可以被量化的幻觉原因既然如此,为什么不在预训练的时候就把这些脏东西筛掉呢?道理都懂,但做起来太难了。互联网的原始数据量级之大,现有的清理技术根本不可能把它们一网打尽。而且很多污染内容非常隐蔽。就像「青*草」这个词,本身看起来完全绿色健康小清新,任何简单的关键词过滤系统都会放过它。只有通过搜索引擎,才会发现它指向的是什么。连Google这种搜索引擎巨头都搞不定这些「内容农场」,更别说OpenAI了。我前段时间想用AI整理一下广州有哪些好玩的地方,然后发现AI引用的一篇文章来源,是另一个AI账号生成的文章。一时间,我都有点分不清,究竟是我们每天搜索「波多野结衣」搞脏了AI,还是AI生成的垃圾正在污染我们的内容环境。这简直就是个先有鸡还是先有蛋的问题。标记方法为了搞清楚这盆水到底有多浑,研究团队开发了两个工具:1.POCDETECT:一个AI污染检测工具。它不只看字面意思,还会自己上网Google,分析上下文,堪称AI界的「鉴黄师」。利用这个工具,研究团队对9个系列、共23个主流LLM进行了检测,结果发现污染问题普遍存在,但程度各不相同。除了GPT系列以46.6%的长中文词元污染率遥遥领先外,其他模型的表现如下:不同大语言模型中,中文词汇表中PoC词元的数量(比例%)(一个词元包含超过两个汉字)。Qwen系列为1.00%。GLM4和DeepSeek-V3的表现则相当不错,分别只有0.25%和0.17%。最值得关注的是,GPT-4、GPT-4-turbo和GPT-3.5这些模型的词汇库中,污染词元数量为0。这可能意味着它们的训练语料经过了更彻底的清理。所以当我们拿着前面那些,让ChatGPT开启了胡编乱造模式的问题,给这些模型再问一遍时,确实没再出现幻觉,但是直接忽略了。2.POCTRACE:一个能通过词元ID反推其出现频率的工具。原理很简单,在分词算法里,词元的ID号越靠前,说明它在训练数据里出现得越多。关于文章开头我们提到的2.6倍,就是通过这个工具进行计算得到的。在GPT的海量词汇库中,能够被完整收录为一个独立词元的人名凤毛麟角,除了「特朗普」(Donald Trump)这样的世界级公众人物,就剩下极少数特例,而「波*野结衣」就是其中之一。更令人惊讶的是,不仅是全名,甚至连它的子序列,如「野结衣」、「野结」也都被单独做成了词元。这在语言学上是一个极强的信号,表明这个词组在训练数据中的出现频率达到了一个恐怖的量级。将与「波*野结衣」相关的网页以及作者估计的比例(0.5%)混合,可以重现GPT-4o中「波*野结衣」的标记ID及其子序列。他们输入「波*野结衣」(Token ID 185,946)和「您好」(Token ID 188,633)的ID号,最终得出了那个惊人的结论,前者的频率估算值约为后者的2.6倍。研究人员推断,与「波*野结衣」相关的中文网页,可能占据了整个中文训练数据集的0.5%。为了验证,他们真的按这个比例「投毒」了一个干净的数据集,结果生成的词元ID和GPT-4o的惊人地接近。这几乎是实锤了。但很显然不是每个污染词源都需要出现这么多次,有些时候,几篇文章(甚至可能是AI写的),反反复复地提到,AI就记住了,然后在下次我们问他的时候,给出一个根本不知道真假的答案。添加一个对抗样本,AI能把雪山识别成一只狗当我们和AI,都在「垃圾堆」里冲浪为了应对数据污染,大家也确实都想了很多办法。财新网就很聪明,在自己的文章页面里用代码「偷偷」藏了一句话,好让AI在搬运内容时,能老老实实保留原文链接。Reddit、Quora等社区也曾尝试限制AI内容。但面对数据污染的汪洋大海,这些行为显然都只是螳臂当车。就连奥特曼自己都发文感慨,X(推特)上的AI账号泛滥成灾,我们得认真思考「互联网已死」这种论调了。而我们这些普通用户,看起来更是别无他法,每天被迫接受着垃圾信息的轮番攻击。马斯克老说AI是个无所不知的「博士」,没想到它背地里天天都在「垃圾堆」里翻东西吃。有人说,这是中文语料库的问题,用英文Prompt模型就会变聪明。Medium上有作者统计过统计了每种语言的100个最长token,中文全是我们今天聊的这些色情、赌博网站的广告词。而英文的分词和中文不同,它只能统计单词,所以都是一些较长的专业性、技术类单词;日文和韩文都是礼貌性、商业服务类词语。向左滑动查看更多内容这十分令人感慨。AI的能力,除了靠算力和模型堆砌,更深层次的,还是它吃进去的数据。如果喂给AI的是垃圾,那无论它的算力多强、记忆力多好,最终也只会变成一个「会说人话的垃圾桶」。我们总说,希望AI越来越像人类。现在看来,某种程度上确实是实现了:我们把互联网这个大垃圾场里的东西源源不断投喂给它,它也开始原封不动地回敬给我们。如果我们给一个AI造一个信息茧房,让它在「无菌环境」中长大,它的智能也是脆弱的、经不起考验的。一个孩子如果只被允许接触教科书里的经典课文,他永远无法应对生活里五花八门的口语和俚语。说到底,当AI对「波多野结衣」比对「您好」更熟悉时,它不是在堕落,而是提醒了我们:它的智能,依然只是统计学上的概率,而非文明意义上的认知。这些污染词元就像一面放大镜,它将AI在语义理解上的缺失,以一种荒诞方式呈现在我们面前。AI离「像人一样思考」,还差着最关键的一步。所以,我们真正应该害怕的,不是AI被污染,而是害怕在AI这面过于清晰的镜子里,看到了我们自己创造的、却又不愿承认的那个肮脏的数字倒影。欢迎加入APPSO AI社群,一起畅聊AI产品,获取#AI有用功,解锁更多AI新知我们正在招募伙伴简历投递邮箱hr@ifanr.com✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
AppSo
1分钟前
OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首
AI最臭名昭著的Bug是什么?不是代码崩溃,而是「幻觉」——模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任AI的关键障碍。大模型会有幻觉,这几乎已经成为一个常识,让每一个严肃使用大模型的人都不得不谨慎小心。OpenAI也指出:「ChatGPT也会产生幻觉。GPT-5的幻觉明显更少,尤其是在执行推理时,但幻觉仍然会发生。幻觉仍然是所有大型语言模型面临的一大根本挑战。」尽管现在学术界已经提出了各种各样用来降低模型幻觉的方法,但目前尚未出现能彻底「根治」模型幻觉的良方。那么,大模型究竟为什么会出现幻觉呢?今天,OpenAI罕见发表论文,系统性地揭示了幻觉的根源。首先,定义幻觉。OpenAI给出的简单定义是:「模型自信地生成不真实答案的情况。」至于原因,简单来说就是:标准的训练和评估程序更倾向于对猜测进行奖励,而不是在模型勇于承认不确定时给予奖励。论文标题:Why Language Models Hallucinate论文地址:https://cdn.openai.com/pdf/d04913be-3f6f-4d2b-b283-ff432ef4aaa5/why-language-models-hallucinate.pdf下面我们就来具体看看OpenAI究竟发现了什么。什么是幻觉?幻觉是语言模型生成的看似合理但却错误的陈述。即使看似简单的问题,它们也可能以出人意料的方式出现。OpenAI举了个例子,当向不同的广泛使用的聊天机器人询问Adam Tauman Kalai(论文一作)的博士论文标题时,它们自信地给出了三个不同的答案,但没有一个是正确的。当询问他的生日时,它给出了三个不同的日期,同样都是错误的。为了测试而学习OpenAI表示,幻觉持续存在,部分原因是当前的评估方法设置了错误的激励机制。虽然评估本身不会直接导致幻觉,但大多数评估模型性能的方式会鼓励模型进行猜测,而不是诚实地面对不确定性。可以把它想象成一个多项选择题测试。如果你不知道答案,但随意猜测,你可能会很幸运地猜对。留空则必定得零分。同样,当模型仅根据准确度(即完全答对问题的百分比)进行评分时,它们会被鼓励进行猜测,而不是承认「我不知道」。再举一个例子,假设一个语言模型被问及某人的生日,但它不知道。如果它猜测「9月10日」,那么它有1/365的概率猜对。说「我不知道」则必定得零分。在数千道测试题中,猜测型模型最终在记分牌上的表现要优于谨慎且承认不确定的模型。对于只有一个「正确答案」的问题,可以考虑三类答案:准确答案、错误答案以及模型不愿冒险猜测的弃权答案。OpenAI表示,弃权答案是谦逊(humility)指标的一部分,而谦逊是OpenAI的核心价值观之一。大多数分数指标会根据准确度对模型进行优先排序,但错误答案比弃权答案更糟糕。OpenAI的模型规范指出,指出不确定性或要求澄清会更好,而不是自信地提供可能不正确的信息。以GPT5系统卡中的SimpleQA评估为例。在准确度方面,更早期的OpenAI o4-mini模型表现略好。然而,其错误率(即幻觉率)明显较高。在不确定的情况下进行策略性猜测可以提高准确度,但也会增加错误和幻觉。在对数十次评估的结果进行平均时,大多数基准测试都会剔除准确度指标,但这会导致对错之间的错误二分法。在像SimpleQA这样的简单评估中,一些模型的准确度接近100%,从而消除了幻觉。然而,在更具挑战性的评估和实际使用中,准确度会固定在100%以下,因为有些问题的答案由于各种原因(例如信息不可用、小型模型的思维能力有限或需要澄清的歧义)而无法确定。尽管如此,仅以准确度为衡量标准的评估指标仍然占据着排行榜和模型卡的主导地位,这就会鼓励开发者构建能够猜测而不是退缩的模型。正因为此,即使模型变得更加先进,它们仍然会产生幻觉。原因之一便是它们倾向于自信地给出错误答案,而不是承认不确定。更好的评估方法对此,OpenAI指出了一个简单的解决办法:对自信错误(confidential error)的惩罚力度大于对不确定性的惩罚力度,并对恰当表达不确定性的行为给予部分加分。这个想法并不新鲜。一些标准化测试长期以来一直使用对错误答案进行负面评分或对留空问题给予部分加分的方法来阻止盲猜。一些研究团队也探索了考虑不确定性和校准的评估方法。但OpenAI表示,仅仅增加一些新的不确定性感知测试是不够的。广泛使用的、基于准确度的评估方法需要更新,使其评分能够阻止猜测。如果主要评估指标依然继续为模型幸运的猜测给予奖励,模型就会继续学习猜测。修改评估指标可以扩大降低幻觉技术的采用范围,包括新开发的和先前研究的技术。幻觉是如何从下一个词预测中产生的前面已经讨论过为什么幻觉如此难以摆脱,但这些高度具体的事实性错误究竟从何而来?毕竟,大型预训练模型很少出现其他类型的错误,例如拼写错误和括号不匹配。OpenAI表示,区别必定在于数据中存在哪些模式。语言模型首先通过预训练进行学习,这是一个预测海量文本中下一个词的过程。与传统的机器学习问题不同,每个语句没有「真/假」标签。该模型只看到流畅语言的正面示例,并且必须去近似整体分布。当没有任何被标注为无效的示例时,区分有效语句和无效语句会更加困难。但即使有标签,一些错误也是不可避免的。为了理解原因,可以考虑一个更简单的类比。在图像识别中,如果数百万张猫狗照片被标记为「猫」或「狗」,算法可以学会可靠地对它们进行分类。但想象一下,如果用宠物的生日来标记每张宠物照片。由于生日本质上是随机的,无论算法多么先进,这项任务总是会产生错误。同样的原则也适用于预训练。拼写和括号遵循一致的模式,因此这些错误会随着规模的扩大而消失。但像宠物的生日这样任意的低频事实,无法仅凭模式预测,因此会导致幻觉。OpenAI的分析解释了哪些类型的幻觉会由下一个词预测产生。理想情况下,预训练后的后续阶段应该能够消除这些幻觉,但由于上一节中描述的原因,这并未完全实现。总结OpenAI表示:「我们希望本文中的统计学视角能够阐明幻觉的本质,并驳斥一些常见的误解」:有人宣称:幻觉可以通过提高准确度来消除,因为100%准确的模型永远不会产生幻觉。发现:准确度永远不会达到100%,因为无论模型规模、搜索和推理能力如何,有些现实世界的问题本质上是无法回答的。有人宣称:幻觉是不可避免的。发现:幻觉并非不可避免,因为语言模型在不确定时可以放弃回答。有人宣称:避免幻觉需要一定程度的智能,而这只有大型模型才能实现。发现:小型模型更容易了解自身的局限性。例如,当被要求回答毛利语问题时,一个不懂毛利语的小型模型可以直接回答「我不知道」,而一个认识一些毛利语的模型则必须确定其置信度。正如论文中所讨论的,「校准」所需的计算量远小于保持准确。有人宣称:幻觉是现代语言模型的一个神秘缺陷。发现:我们可以理解幻觉产生以及在评估中获得奖励的统计学机制。有人宣称:要测量幻觉,我们只需要一个好的幻觉评估。发现:已有研究者发表了一些幻觉评估。然而,一个好的幻觉评估与数百种传统的基于准确度的评估相比几乎没有效果,这些评估会惩罚谦逊并奖励猜测。相反,所有主要的评估指标都需要重新设计,以奖励不确定性的表达。OpenAI表示:「我们最新的模型幻觉率更低,并且我们将继续努力,进一步降低语言模型输出的置信错误率。」顺带一提,据TechCrunch报道,OpenAI正在重组其模型行为(Model Behavior)团队,这是一支规模虽小但颇具影响力的研究人员团队,他们决定着该公司的AI模型与人互动的方式。现在,该团队将向OpenAI的后期训练主管Max Schwarzer汇报。而该团队的创始负责人Joanne Jang则将在公司启动一个新项目,名为oai Labs。据她的推文介绍:「这是一个以研究为导向的团队,专注于发明和设计人们与AI协作的新界面原型。」参考链接https://openai.com/index/why-language-models-hallucinate/https://techcrunch.com/2025/09/05/openai-reorganizes-research-team-behind-chatgpts-personality/https://x.com/joannejang/status/1964107648296767820
机器之心
31分钟前
1
Anthropic突然封锁中国企业,我们该从中学到什么?
硅星人
45分钟前
13
扎克伯格起诉扎克伯格
与知名人士同名,多数情况下只是一个有趣的巧合。但对于美国印第安纳州的破产法律师马克·扎克伯格而言,与Meta创始人马克·扎克伯格同名,不仅给他带来了生活上的种种不便,更是直接造成了财产损失。据悉,这名律师平时会使用商业Facebook业务宣传他的法律业务,并与潜在客户沟通。但在过去8年里,他的宣传页面遭到禁用5次,而他的个人账号也被封停4次,因为Meta的审核体系判定他在假冒公司创始人。(马克·扎克伯格经营着自己的破产法律所)马克·扎克伯格介绍称,自己在Meta的平台上投放了超过1.1万美元的广告。当他的账户被判定“冒充扎克伯格”而被封号时,仍需为这些广告付款。他公开表示:“这可不好笑,当他们拿了我的钱的时候就更不好笑了,这真把我气坏了。”忍无可忍之下,马克·扎克伯格本周提起诉讼,要求Meta公司不要再侵害他使用自己名字的权益。他在起诉状中悲愤地表示,他开始律师从业时,Meta的扎克伯格才刚3岁。在他的诉状中,这位律师还附上一份2020年与Facebook公司沟通的邮件副本,并表示自2017年以来他一直就此与平台联系。更令他感到费解的是,虽然搞法律的扎克伯格并不是超级富豪,但他在破产法领域也小有名气。不仅多次登上国家级媒体的报道,还上过电视台采访。他还在当地大学兼职任教,并出版过大量著作。被搞到心态崩溃的扎克伯格吐槽称:“我并不想告Facebook,他们比我有更多的钱、更多的律师和更多的资源。我宁可不跟他们撕破脸,但我不知道还有什么办法让他们停手!”面对官司的威胁,Meta公司本周回应称:“公司知道世界上不止一个马克·扎克伯格,我们正在试图调查此事。”据悉,深受重名之苦困扰的马克·扎克伯格还创建了一个名叫“我是扎克伯格”的网站,展现了与名人重名有多么不方便。他介绍称,除了被官方封号外,他的Facebook账号还会不断被黑客入侵,导致系统要求他频繁修改密码。与此同时,每天都有超过100个人给他发送好友申请,而且每天都有人打电话给他的办公室,寻求使用社交媒体软件的帮助,包括重置、解锁账号和删除照片。还会有人给他寄邮件和包裹,里面都是关于“如何改进Facebook”的抱怨、建议或要求。更惨的是,他在使用其他App时,也会被当成“冒充马克·扎克伯格”封号,并经常会收到索要金钱的请求。他在自己的网站上写道:“我对马克·扎克伯格没有恶意。我祝他一切顺利,但让我告诉你:我将主导‘马克·扎克伯格破产’这一搜索。如果他真的陷入财务困境,又恰好在印第安纳州,我将很乐意以我们同名之谊为荣来代理他的案件。”
科创板日报©
51分钟前
12
原创 智谱打响中场战事
宋思杭
5小时前
217
我的宝藏AI浏览器被43亿“贱卖”了,这可能是最好的结局
AppSo
19小时前
11
OpenAI,开始对马斯克“猎巫”
字母榜
19小时前
35
原创 AI如何让获客成本直降80%,利润翻三倍?
虎嗅智库
21小时前
12
钉钉与英特尔,共享同一种革命
首席人物观
21小时前
119
新一轮AI浏览器大战,谷歌将掉队了?
硅谷101
1天前
117
李飞飞的答案:大模型之后,Agent向何处去?
划重点KeyPoints
1天前
130
AI时代的平权假象
caoz的梦呓
1天前
214
原创 再战三折叠,华为还有惊喜吗?
丸都山
1天前
416
追觅入局无人机,凭什么?
扫地机器人成功后,追觅科技将目光投向天空。8月20日,追觅科技正式宣布进军无人机业务,组建专业研发团队,试图在中国的低空经济市场中分一杯羹。现阶段,这家以智能清洁产品为主要特色的公司,正着力推进专业无人机研发团队的组建工作,且团队的核心架构已初步搭建完成。观察者网在参考相关报道后获悉,有知情人士透露,目前该项目已有来自大疆、美团等多人加入。不同于大疆,追觅科技无人机项目的前期运作模式偏向于电商,会选择“贴牌”抢市场,后续再走技术自研。此外,当前追觅科技无人机产品拟采用激光雷达+视觉的融合模式,目前该公司正在各大平台寻找相应技术人员,例如“无人机导航建模算法工程师”“无人机运营业务销售一号位”等岗位。从业务整体来看,追觅科技选择的是以自身的航空积累、智能清洁领域的技术积淀来支撑无人机业务,但在这样的跨界赛跑中,风险与机遇并存,追觅科技的“飞天”探索,可能还要面对包括品牌认知,技术转化和周期平衡在内的诸多考验。进军无人机业务,或许是“回归初心”从目前公开的招聘信息来看,追觅科技正在深圳招募“无人机导航建模算法工程师”和“无人机运营业务销售负责人”等岗位,公司还要求应聘者具备B端和G端资源。这可能表明追觅科技的布局,至少在早期,会更多聚焦于工业级市场。而工业级无人机市场在农业、测绘、安防等领域有着广阔应用前景,且价格敏感度相对较低。在地点选择上,除了把总部设在苏州外,追觅科技还在深圳设立分公司,以利用深圳成熟的无人机产业上下游资源。种种决策显示出追觅科技对无人机产业生态的理解。而这一理解也并非凭空出现。在宣布进军无人机业务时,追觅科技创始人俞浩曾在朋友圈中表示:"高三保送清华的时候,因为喜欢飞机所以毅然决然地选择了航天航空学院"。这位国内最早的四旋翼无人机开发者、全球三旋翼无人机发明者,在创立追觅科技前就带领清华大学"天空工场"团队深耕飞行器研发。这种深刻在创始人背景中的航空基因,让追觅科技的跨界更像是一次迟到的"初心回归"。而从技术上看,追觅科技的无人机战略也确有可行之处。追觅科技此前曾表示,在智能清洁领域,追觅科技已经锤炼出三项核心技术:三维空间感知、动态避障技术和高速数字马达。这些能力可直接迁移并复用于无人机的飞控与导航系统,形成技术协同效应。同时,资本布局也早已先行。早在三年前,追觅科技就投资孵化了专注混动倾转eVTOL(电动垂直起降飞行器)的追梦空天科技。这家与追觅科技创始人同样来自清华的团队在2025年连续完成多轮亿元级融资,其吨级无人eVTOLDF600"惊鸿"即将进入适航取证流程并计划年底量产,载人机型DF3000"游龙"全尺寸样机也即将下线。追觅科技通过资本纽带,已经提前锁定了低空经济这一赛道,也为今日的无人机入局埋下伏笔。基因优势能否转化为市场胜势,仍是未知尽管有着基因上的传承,也有相关布局,但追觅科技要探索天空,还面临着诸多挑战。追觅科技核心团队虽有航空背景,但过去八年的主营业务集中在地面清洁领域。从2017年成立至今,其16万转/分钟高速数字马达、三维空间感知等核心技术均服务于扫地机器人等家居产品。这些技术虽然可以迁移至无人机的飞控与导航系统,但追觅科技面临的技术挑战可能远比想象复杂。其中,最近的迁移例子就是大疆。与追觅科技想要“上天”恰恰相反,作为无人机方面的龙头企业,大疆寻求的是“落地”。8月6日,大疆推出了其首款扫地机器人DJI ROMO,正式进军扫地机器人市场。大疆的逻辑,可能与追觅科技如出一辙,也就是将无人机领域的视觉导航、运动控制等核心技术迁移至扫地机器人这一产品上。这种"你打你的,我打我的"的跨界策略,本质上都是寻求对现有技术的复用。而技术迁移产生的盲区也就此显现。此前有网友分享称,大疆旗下的扫地机器人存在在清扫时无法识别落地窗等透明障碍物,直接“撞墙”而行的情况。对此,大疆官方客服则回应称:“系算法问题,会在1-2个月内修复。”这可能也是技术复用带来众多问题的一个缩影。尽管在跨界的过程中,大疆选择的是直接面向消费者,而追觅科技可能以工业场景作为切入口,但综合对比来看,两者的跨界难度,追觅科技面临的挑战显然更大。大疆进入扫地机器人的消费级市场时,不仅带来了成熟的SLAM算法和传感器技术,更依托其全球供应链体系实现成本控制。而尽管也拥有技术沉淀,但追觅科技要面对的,还有无人机领域更高的技术壁垒和更严苛的安全标准。探索和解决则需要时间,追觅科技投资的eVTOL企业追梦空天的发展轨迹或许能提供参考。这家公司从2018年启动原型机研发,到2024年才实现旗下DF600“惊鸿”的首飞,用了七年时间才完成技术积累到商业落地的跨越。追觅科技即便有资本加持和技术协同,也难以在短期内走完自研路程,前期“贴牌”抢市场的打法可行性也尚待验证。尽管无人机业务被寄予厚望,但短期难见实效。追觅科技公告中"核心团队架构已初具雏形"的表述,表明的也是其无人机业务仍处于早期组建阶段,距离产品落地可能还有相当一段距离。最后,也是最重要的问题在于,追觅科技面对的不仅是技术迁移的挑战,更是品牌认知的鸿沟——在大众心智中,作为扫地机器人企业的追觅科技,目前与"空中飞行"的关联度几乎为零。寻找第二曲线,追觅科技布局的也不止无人机除了在无人机上布局,追觅科技近年还在多个新兴行业进行了相关投资。2024年8月,追觅科技宣布成立总规模110亿元的追创机器人产业创投基金,其中100亿元成长期基金已完成大部分募集。截至2025年4月,该基金已投资具身智能公司魔法原子、泳池机器人公司浪涌未来等4家企业,形成围绕"AI+机器人"赛道的投资矩阵。而就在宣布无人机业务启动的数天后,8月28日,追觅科技又正式官宣造车。公司还称计划在2027年推出首款车型,定位为超豪华纯电产品。频繁的资本动作背后,或许是追觅科技对新增长点的迫切需求。尽管清洁电器业务表现亮眼,2024年1-5月全球销售额同比激增178%,但行业同质化竞争加剧已是不争事实。奥维云网数据显示,中国清洁电器市场增速已从2020年的28.9%放缓至2024年的15.6%,追觅科技需要找到第二增长曲线。而但从无人机业务来看,低空经济的万亿风口确实诱人,但追觅科技想要真正起飞,可能还需要解决三个核心问题:怎样建立自己的品牌认知?如何平衡短期投入与长期回报的关系?如何将地面技术优势有效转化为空中竞争力?这些问题,恐怕比无人机的飞控算法更难破解。从清洁地面到翱翔天空,追觅科技的跨界之旅既是对创始人航空梦想的回归,也是企业发展的必然选择。但在这个充满不确定性的新赛道上,追觅科技的答案或许要等到其首款无人机产品真正飞向市场的那一天才能揭晓。
科工力量
1天前
2
120天,OpenAI能“止杀”吗?
字母榜
1天前
114
AI撬动中国经济新范式
AI为中国经济提供了历史性的窗口,既有助于跨越中等收入陷阱,也能有效应对人口老龄化挑战。展望“十五五”,我们现在不在终章,也不在第二章。我们刚刚读完序章,正站在第一章的起点,即从政策驱动、梦想驱动的“0到1”阶段,迈向业绩驱动、生产率驱动的“1到10”阶段。这个过程必然伴随着泡沫与出清,但其浪潮之汹涌,必将远超我们当前的想象。投资AI,本质上是投资中国经济的未来。中国经济正迎来新的增长范式。近日,随着寒武纪股价一路攀升,甚至一度跃升至A股“新股王”,资本市场的驱动力正转向“创新—效率”的科技主线。这一变化,折射出经济叙事的历史性转变。2025年8月26日,国务院发布《关于深入实施“人工智能+”行动的意见》(下称《意见》),对人工智能(AI)的应用提出了明确的阶段性发展目标。2024年的《政府工作报告》首次提出开展“人工智能+”行动,标志着人工智能发展已经上升为国家战略。望正资产董事长刘陈杰在2023年撰写了《人工智能、经济增长和结构性机会》一文。其建模研究显示,即便在采用非常保守的假设影响下,人工智能的发展将显著提升技术进步和规模经济,使得潜在增速下降速度趋缓,且在一定时期保持较为稳定的发展。高质量的发展是时代的内在需求,是内外压力和激励的结果。如今这一判断正在被市场逐步验证。站在数智时代的临界点上,经济观察报对话刘陈杰,从宏观趋势到行业落点,试图揭开科技投资背后的底层逻辑。从模型假设到市场验证经济观察报:如今寒武纪的股价一度超越贵州茅台,人工智能的发展上升为国家战略。这是否意味着,你的模型假设已经被市场验证?当前市场的上涨,是在交易“梦想”,还是交易“生产率提升”的现实?刘陈杰:我们的模型推演正在被市场阶段性验证,但需清醒认识到,目前市场同时交易着“梦想”与“现实”。从短期看,寒武纪登顶、成交放量,显示资本在剧烈追捧AI时代的“期权价值”,这是对未来的贴现;但从中长期看,真正的可持续行情必须建立在“生产率提升”的坚实基础上。关键的观测点不在于股价本身,而在于AI渗透率提升后,能否在企业财报的毛利率、人均效益、研发费用转化效率等核心指标上持续体现出来。目前,我们正处在从“梦想”走向“现实”的过渡期。经济观察报:能否具体阐释其底层逻辑是什么?刘陈杰:我们先看一张图,它展示了人工智能对中国潜在经济增速的影响。从2020年到2035年,无论情景如何,潜在增速整体呈下降趋势,这是人口老龄化、资本边际递减等结构性约束影响的必然趋势。但在不同AI渗透率假设下(10%、15%、20%),经济增长率均显著高于基准情景(Base)。到2035年,基准情景下的潜在增速降至约4.6%,而AI渗透率达到20%的情景下可维持潜在增速在5.8%左右,显示AI普及能够有效托底经济。两年前我提出一个假设:AI能有效延缓潜在经济增速下滑,但有两个前提:一是存在“阈值效应”——在模型设定中,当AI资本存量占国内生产总值(GDP)比重超过2%,对全要素生产率(TFP)的边际拉动会从0.1个百分点跃升至0.4~0.5个百分点;二是资本市场可能会提前12—18个月定价这一跃升,而不是等到利润表兑现。如今,两条证据链正在强化。宏观层面,根据我们基于公开投资与算力设施扩张的初步估算,中国AI相关资本(包括服务器、算力中心与模型训练投资)的存量占GDP的比重已接近2%,这意味着AI资本可能跨过模型设定中的“阈值水平”。市场层面,寒武纪股价一度超越贵州茅台,反映的并非盈利对比,而是资本将“AI算力”视作未来10年的现金流入口,提前折现潜在收益。不过,需要区分两层定价:第一层是资产重估,AI算力、数据、模型被视为新型基础设施,估值锚从市盈率(PE)转向“每美元算力对应市值”,这部分仍含有“梦想溢价”;第二层是盈利兑现,若AI资本存量未来扩张,占GDP的比重达4%,全要素生产率对GDP的拉动有望稳定在0.6~0.8个百分点,届时盈利会把估值拉回“生产率锚”。因此,目前上涨并非纯粹泡沫,而是“阈值效应”已被部分验证,但盈利尚未完全兑现的中间状态。随着新政落地和算力投资加速,梦想溢价将逐步被生产率红利消化,届时寒武纪这类公司的市值才可能真正站稳。算力财政:土地财政的历史性替代经济观察报:你强调AI会改变资本结构,让资金从房地产/基建转向实体经济——似乎意味着“算力财政”正在取代“土地财政”。这一过程是可持续的吗?刘陈杰:这是一个深刻而不可逆的趋势,但转型并非一蹴而就,还需要时间和政策合力来推动。土地财政的逻辑是,围绕稀缺土地形成金融循环;算力财政则是以算力、数据和模型为核心要素,重塑地方政府的资产负债表。从“卖土地”到“卖算力”,背后其实是中国资本结构的深层转型。经济观察报:在转型过程中,最大的挑战是什么?刘陈杰:我认为有三重约束。第一是现金流约束。土地财政靠出让金和抵押贷款滚动,依赖房价上涨消化错配;算力财政则靠算力租金、数据分成和模型许可。我们测算过,如果全国AI算力使用率从55%提升到75%,租金收入可覆盖地方债利息的42%,接近土地财政巅峰期的48%。这说明算力具备财政替代性,但可持续性依赖“算力使用强度”的不断提升。第二是资产估值约束。土地价格由供需和信用扩张支撑,而算力资产价值取决于技术迭代。如果摩尔定律继续,每年单位算力成本下降30%,地方政府的算力资产可能出现“折旧大于增值”;若国产芯片受限,算力反而可能形成稀缺溢价。因此,地方政府需要构建“算力—电力—碳排放”的成本控制体系,锁定成本端风险。第三是政府角色转变。过去政府是土地出让方;未来政府则会成为“算力做市商”。在资产端,政府不再卖地,而是持有智算中心REITs(不动产投资信托基金),获取长期租金分红;在负债端,专项债使用从“土地储备”转向“智算建设”,偿债来源也从土地出让金转变为算力租金与数据收益;在监管端,监管部门还可能设立算力交易所,使得算力使用权标准化、可流转,培育新型要素市场。经济观察报:这一模式可持续的条件是什么?刘陈杰:归根到底,就看这个不等式——AI资本深化速度>算力折旧速度+债务利息增速,能否长期成立。只有这样,地方政府才能真正完成从“土地批发商”到“算力做市商”的角色跃迁;否则,“算力财政”也可能变成一场技术周期的幻觉。破解索洛悖论:ECO指标的启示经济观察报:你也提到过“索洛悖论”。当前,AI是否已找到破解这一悖论的钥匙?我们应该关注哪些微观指标,以实时看到AI对全要素生产率的提升程度?刘陈杰:大家常说起“索洛悖论”——技术进步不一定马上带来生产率提升。那AI是不是已经找到了破解的钥匙?我的看法是,曙光已经出现,但答案还没完全揭晓。关键在于,AI要从单点提效的小工具,真正变成重构流程和组织的“生产力引擎”。怎么判断?有两个直观指标:第一,AI资本支出比率——在企业总投资中,AI投资的比重有多大。第二,营收和成本收益比——这笔AI投入,能不能带来更多收入或节省更多成本。如果回报持续超过投入,那就意味着生产率真的在提升。我们提出一个更系统的衡量方法,叫算力—产出弹性(Elasticity of Compute-to-Output,简称ECO)。公式很简单:产出的增长率,除以算力投入的增长率。从宏观看,可以用“工信部算力指数+统计局增加值”来计算;从微观看,可以用企业的“GPU(图形芯片)使用时长+产出”来计算。当然,计算的时候要进行修正:剔除价格因素,否则名义增长率会虚高;将存储、网络等配套投入做区分,否则会低估AI的贡献。此外,AI的效果通常要过1—2个季度才会显现。一句话总结:如果ECO长期大于0.25,也就是算力投入增长1%,产出能提升0.25%以上,再加上价格修正,我们就可以说,AI真的在逐步破解“索洛悖论”。市场定价:从“市梦率”到“算力锚”经济观察报:寒武纪的市盈率高达500多倍,而贵州茅台的市盈率只有20倍左右。市场似乎在用“市梦率”定价AI企业。AI企业的合理估值锚是什么?刘陈杰:传统的市盈率等估值指标已经解释不了。寒武纪的市盈率高达数百倍,这并不是因为它“贵”,而是因为当前公司的利润太小,市场在购买它的未来收益。AI企业到底值多少钱?该怎么估?我更倾向于用一个“三层估值法”来衡量。比如,现有业务——用PS(市销率)或P/FCF(股价与自由现金流比)衡量公司当前的商业化能力。可见管线(pipeline)——用PEG(市盈率增长比)衡量公司未来1—3年的成长速度。远期潜力——企业未来是否可能成为一个平台型生态,如国产AI算力的核心底座。这个层面难以量化,更多依赖定性判断。寒武纪目前的高估值,反映的正是市场对其“第三层价值”的高度预期。不过,最终的估值必须经过一个“PS→PEG→PE”的收敛过程,才能实现从想象力到现实盈利的转化。一个更稳健的锚点是算力租金贴现模型(Compute-Rent DDM)。更接地气的办法,是把想象力落到现金流上:算力租金、软件订阅和模型分成。简化成两个指标:P/AC(市值/年可出租算力);EV/AI-Revenue(企业价值/AI核心收入)。最近,高盛用EV/EBITDA(企业价值/息税折旧摊销前利润)衡量寒武纪,是为了绕开寒武纪短期盈利过小、市盈率无意义的困境,把估值锚定在2030年的经营性现金流,用更加“现金流导向”的方式衡量企业价值,并通过上调出货量预测和估值倍数,把目标价抬高到2104元。一句话总结:AI时代的真正锚点,不是“市梦率”,也不是“市酒率”,而是每一美元算力能带来多少租金收入。应用落地:谁可能率先跑出商业闭环经济观察报:你的文章强调了AI的“结构性机会”。随着《意见》出台,投资主线或正从“炒算力”向“掘应用”扩散。你认为接下来哪个应用领域最可能率先实现商业闭环和业绩爆发?刘陈杰:我们比较看好AI与垂直行业知识深度结合的领域,其护城河更深。AI+生物制药(缩短研发周期、降低失败成本)、AI+工业软件(优化生产工艺、进行预测性维护)和AI+金融风控(进行动态定价、重塑反欺诈系统)这三个领域将最快产生扎实的现金流和建立起市场壁垒。它们离钱近,降本增效的效果可量化,容易形成商业闭环。这段话可拆解成“护城河”与“现金流”两张表,再用数据一一对照,结论则是:AI+金融>AI+工业软件>AI+生物制药。把“谁能率先商业闭环”拆成三道闸门:刚性需求+可量化的ROI(投资回报率);政策买单或企业付费意愿已验证;数据壁垒和场景可复制。用这三道闸门筛一遍,“AI+金融”是过去12个月唯一同时亮三盏绿灯的领域,“AI+制造”紧随其后,两者将先后进入“业绩爆发期”。至于率先实现“业绩爆炸”,如果只能选一个赛道,那就是押注金融;如果要兼顾弹性和时间差,则是“金融+制造”双轮配置。策略应对:穿越周期,布局未来经济观察报:《意见》提出了“到2027年,新一代智能终端、智能体等应用普及率超70%”的目标。这将对AI产业的现金流和商业模式产生怎样的影响?刘陈杰:这一目标更偏向需求侧拉动,而非简单的补贴。其理想结果是再造一个如“移动互联网”般的庞大内需市场,让企业能在其中通过市场化竞争实现盈利。需要警惕的是部分领域可能出现“为了AI而AI”的项目堆砌。AI产业健康的标志是:出现不依赖补贴、能向海外输出的AI产品与商业模式。经济观察报:别人贪婪时我恐惧。当市场陷入狂热时,你会关注哪些关键信号来判断AI板块是否已出现阶段性顶部?是融资余额、监管态度,还是产业资本的减持行为?刘陈杰:我会同时观察三个层面的信号:市场层面,看融资买入占比,在8%—12%时往往意味着行情启动;当持续升至12%—15%时,杠杆资金明显活跃,需要提高警惕;若逼近20%,几乎等同于市场泡沫的顶点。还要看成交结构是否失衡,当资金高度集中在少数龙头、出现“一致化上涨”时,常是顶部信号。政策层面,看监管态度,一旦证监会或交易所开始提示风险、收紧融资、约束高换手率个股,往往意味着“政策顶”临近。产业层面,看产业资本减持,若一线AI企业的大股东或产业资本持续减持,说明最贴近真相的人选择兑现。还要看基本面兑现度,当产业订单、财报兑现与估值脱节,裂缝越大,风险越高。当然,我不会依赖单一指标,而是结合融资数据+监管动向+产业资本行为的“三重共振”情况。当这三者同时指向过热时,市场大概率已处于阶段性顶部。风险与调节:AI的三道安全网经济观察报:AI带来的红利令人兴奋,但不少人也担心其负面效应,比如就业替代、数据安全、社会焦虑等。对此,你怎么看?刘陈杰:确实,任何通用技术在改变生产率的同时,也会带来社会摩擦。AI的风险主要有三方面:就业替代,即低技能岗位最先受影响,而再培训速度未必跟得上,这可能加剧结构性失业;分配失衡,如AI成果往往集中在少数大公司和资本方,如果没有制度调节,贫富差距会被拉大;伦理与监管,如深度伪造、算法偏见、责任归属等问题都可能冲击社会信任。因此,政策设计不能只看“AI资本存量的扩张”,还必须配套三条“安全网”:教育再培训体系、收入分配机制以及法律伦理框架。否则,AI虽能提高全要素生产率,却可能削弱社会的整体稳定性。经济观察报:最后,请用一句话总结,AI对中国经济的真正意义是什么?刘陈杰:AI为中国经济提供了历史性的窗口,既有助于跨越中等收入陷阱,也能有效应对人口老龄化挑战。展望“十五五”,我们现在不在终章,也不在第二章。我们刚刚读完序章,正站在第一章的起点,即从政策驱动、梦想驱动的“0到1”阶段,迈向业绩驱动、生产率驱动的“1到10”阶段。这个过程必然伴随着泡沫与出清,但其浪潮之汹涌,必将远超我们当前的想象。投资AI,本质上是投资中国经济的未来。
经济观察报
1天前
13
特别策划
手机与 PC 的最后边界,终于被三折叠打破Safari©
1天前
1473
麒麟芯片时隔四年重回华为发布会
华为三折叠屏手机Mate XTs非凡大师正式发布,售价17999元起,将于9月12日正式开售。相较上一代三折叠屏19999元的起售价,降低了2000元。此次发布会上,余承东首次公开了华为三折叠屏手机Mate XTs非凡大师所搭载的芯片信息,为麒麟9020芯片。这也是时隔4年之后,麒麟芯片首次在发布会公开展示。在影像方面,华为把超光变主摄、超广角镜头、长焦摄像头升级为RYYB传感器,同时将超广角镜头分辨率提升至4000万像素,新增红枫原色摄像头。一名消费电子分析师对《科创板日报》记者表示,这一代三折叠屏手机属于小迭代。“硬件产品本身变化不大,主要是芯片、影像有所升级,并支持手写笔。”《科创板日报》记者在发布会上注意到,此次华为更为强调三折叠手机在软件生态方面的拓展。包括首次搭载WPS Office、Wind金融终端、东方财富等PC应用,并首次支持PC级多窗口操作。余承东还透露,搭载鸿蒙5的终端设备数量已突破1400万。据IDC的最新数据,2025上半年,中国折叠屏手机出货量达到498万台,同比增长12.6%。华为以374万台的出货量占据75%的市场份额。荣耀虽上半年无新品上市,仍以8.4%的市场份额位居第二。OPPO推出搭载旗舰芯片的折叠屏机型,以6.1%的份额位列第三。小米和vivo的新品于年中亮相,暂居第四、第五位。在具体出货量方面,上一代三折叠手机华为Mate XT截至今年上半年出货量逼近50万台。自2019年发布首款折叠屏手机以来,华为成为首个累计出货量突破1000万台的中国品牌。当安卓阵营在折叠屏市场激战正酣时,苹果也已蓄势待发,准备加入战局。天风国际证券分析师郭明錤此前透露,苹果计划于2026年推出其首款可折叠iPhone,并计划于2028年跟进发布可折叠iPad。华西证券认为,苹果加速入局折叠屏,有望带动折叠屏手机实现加速放量,并有望引领折叠屏产业链实现创新升级。看好折叠屏UTG盖板、铰链等核心增量环节以及液态金属、3D打印等新工艺。在供应链方面,《科创板日报》了解到,蓝思科技参与了华为三折叠手机的精密结构件供货。另外,东睦股份旗下子公司东莞华晶粉末公司于2018年成功进入为华为供应链体系,成为了华为柔性屏手机转轴MIM精密结构件、智能手表产品MIM精密结构件产品的主力供应商。大富科技公司子公司大富方圆深耕金属材料的研发和工艺,是华为折叠屏手机转轴核心部件的主要供应商。此外,华为屏幕供应商包括京东方、维信诺等。
财联社AI daily©
1天前
AI耗电难题,有救了
学术头条
1天前
111
量产前夜,人形机器人开启供应链卡位战
2025年的夏天,科技圈的空气中弥漫着一种熟悉的、既兴奋又焦虑的气味。主角不再是手机或电动汽车,而是一个个“铁皮人”——人形机器人。特斯拉的擎天柱在工厂里小步快走,笨拙地拧着螺丝;中国的宇树科技、智元机器人等公司的产品已经能完成后空翻、分拣快递等复杂动作。这股浪潮究竟是新一轮技术革命的序曲,还是AI泡沫下的又一场虚火?我们正处在人形机器人的“iPhone 1”发布前夜吗?答案或许比想象中更复杂。在九鼎投资看来,我们确实站在一个颠覆性产品诞生的前夜,但这个“iPhone 1”还存在成本高昂、可靠性不足等诸多问题。它更像是一个信号,宣告着一个全新赛道的开启。而在这条赛道上,一场关乎未来万亿产业主导权的供应链战争,已经悄然打响。与美国的Figure AI等公司由AI和软件算法驱动的路径不同,中国的人形机器人产业呈现出更强的“硬件先行”和“场景驱动”特色。我们认为,这并非弯道超车,而是一条植根于中国独特土壤的演进路径。在这场竞赛中,谁能率先打造出“能用、够用、便宜、能量产”的强大供应链,谁就可能掌握定义下一个时代的钥匙。一、虚火还是前夜?中国选择了一条更“硬”的路2025年是中国人形机器人从技术验证向商业化过渡的关键期,也是名副其实的“量产元年”。这个判断的核心标志是,以特斯拉Optimus为代表的头部产品,已经基本完成了行走、抓取等基础功能的闭环,并开始在工业场景进行小批量试点。这就像第一代iPhone,虽有种种不完美,但它向世界展示了一种全新的可能。这股热潮的底层驱动力是多重因素的深度耦合。我们认为,如果必须分配权重,那么:具身智能技术突破:这是最核心的引擎。大模型的出现,解决了机器人从“看懂世界”到“动手改变世界”的闭环问题,让机器人从只能执行预设程序的“机器”,升级为能够理解、决策、交互的“智能体”。特斯拉的“鲶鱼效应”:马斯克和他的擎天柱,以其激进的量产规划和强大的供应链整合能力,像一条鲶鱼搅动了整个行业。它不仅验证了商业化的可行性,更重要的是,它倒逼着中国的供应链必须快速迭代,以配合其野心勃勃的量产计划。这给了国内产业链极大的信心。国家政策扶持:2023年10月,中国工信部发布《人形机器人创新发展指导意见》,从国家层面为产业发展设定了明确的时间表,地方层面上海、深圳、北京、山东等地政府牵头制定出了详细的行动方案。北京、深圳等地百亿级别的产业基金,则为技术从实验室走向工厂提供了真金白银的支持。上海、杭州等地陆续出台对推广人形机器人应用的具体奖励政策,为人形机器人的推广普及注入强大动力。有趣的是,在这场全球竞赛中,中美走上了两条截然不同的道路。在美国,以Figure和特斯拉 Optimus为代表,更强调“软件定义硬件”,AI算法先行,试图先打造出机器人的“超级大脑”。而中国则更倾向于“硬件迭代倒逼软件”,通过不断优化机器人的“身体”,在实际场景中磨练“大脑”。九鼎投资认为,产生这种差异的本质原因,在于中美两国各自的技术优势不同。美国在AI算法、软件生态上独步天下;而中国则拥有全球最强大、最完备的制造业基础和电子供应链。这会导向两种截然不同的产业终局吗?我们的答案是“不会”。最终,软硬件必须协同发展,殊途同归。但路径的差异决定了阶段性的焦点和投资逻辑的根本不同。对于中国的零部件公司而言,这意味着他们必须更早、更深刻地思考成本和量产,而不仅仅是追求性能的“天花板”。在九鼎投资看来,“能用、够用、便宜、能量产”,这十二个字,是目前中国人形机器人供应链投资逻辑的核心。我们在关注极致性能的同时,更看重企业能够在满足现有需求的场景下,快速降本,快速规模化,并深度绑定下游大客户。二、“淘金”逻辑:为什么重仓上游,以及在上游挖什么?面对下游整机厂竞争格局的高度不确定性——谁能最终胜出,变数巨大——九鼎投资在现阶段选择向上游走,做那个“卖铲人”和“军火商”。长期来看,整机厂和零部件都有很高的投资价值。但在中短期内,零部件和模组的确定性更强,风险相对较低。事实上,这也是业内的普遍共识。但我们选择重仓上游零部件和模组,并非简单的防御性策略,而是基于对产业链价值分配的深刻洞察:价值占比高:在人形机器人的硬件成本中,减速器、丝杠、传感器、电机等核心零部件的占比超过60%。这里是价值最密集的地方。技术迭代主导权:整机性能的上限由上游零部件决定。机器人的“身体”想要进化,首先得有更强大的“关节”和“神经末梢”。多客户覆盖与抗周期能力:一家优秀的零部件公司可以同时服务于特斯拉、智元、宇树等所有玩家。无论下游谁主沉浮,他们对核心零部件的需求是刚性的。率先规模化:相比于复杂的整机,标准化的核心零部件更容易实现规模化生产,率先享受产业爆发的红利。(图片生成自ChatGPT)那么,如果将人形机器人拆解成一个“人”,投资的“金矿”具体埋在哪里?我们的答案是:“四肢”,以及与“小脑”功能相关的感知层。我们认为,“大脑”是科技巨头的必争之地,整机厂也绝不会将“灵魂”假手于人,一级市场的投资机会不大。而“躯干”的技术壁垒相对较低,商业价值有限。因此,“四肢”和“小脑”成为了价值高地。关节是成本的核心、性能的瓶颈和量产的难点;而感知层,尤其是力控和触觉,是实现机器人安全、灵巧交互的关键,且技术壁垒较高。在投资倾向上,九鼎投资现阶段的重点是:押注在单一环节做到极致的“隐形冠军”,而非平台型公司。因为技术路线还未完全收敛,百花齐放,平台型公司风险太高。而“隐形冠军”能在细分的垂直领域建立起足够深的护城河,是产业链中不可或缺的一环。等产业成熟后,平台型公司的价值才会凸显。三、核心部件深度解析:关节、手和传感器的战争1.核心关节/执行器:成本与性能的“致命”平衡关节是人形机器人身上最昂贵的部分之一,也是整机降本最重要的环节。目前市场上存在多种技术路线之争,比如:(1)“电机+减速器”驱动方案高精度方案:以谐波减速器为核心。该方案成本高、抗冲击能力稍差,但精度高、技术最成熟、供应链相对完善,预计在未来5~10年仍是主流,其目前主要应用于需要精细操作的上肢。低精度方案:以行星减速器为核心,该方案精度较差,成本低,抗冲击能力强,目前主要应用于下肢以及对精度要求稍低的部位。(2)电机直接驱动方案高精度方案:搭配高分辨率编码器和力控算法,定位误差小,动态响应快,长期潜力巨大,能简化结构、提高带宽,但受限于当前电机技术、热管理和成本,短期内难以成为主力。低精度方案:简易无刷直驱电机,无高精度传感或控制,误差大,仅用于对精度无要求的辅助关节。在不同的路线中,现阶段最核心的矛盾是什么?是降本。一个能把成本降低50%但性能只有80分的方案,与一个性能100分但成本高昂的方案,哪一个在当下更有投资价值?我们的答案是前者。因为现有的场景不需要一个性能极其优秀的产品。早期规模化落地更加依赖于成本的快速下降。投资价值体现在能否实现“够用的性能+颠覆性的成本结构+可量产性”。这意味着,对于关节供应商来说,终局不太可能是一家独大,而是多种方案并存,根据机器人不同部位的需求、成本目标和控制复杂度,进行灵活搭配。谁能率先在某条路线上实现成本和性能的最佳平衡,谁就能抢占先机。2.灵巧手与传感器:通往商业化的“最后一公里”除了行走能力,“手”的操作能力被认为是人形机器人商业化的关键。因为在工业场景里,能体现人形机器人核心价值的主要是手。要实现来回移动的功能,用轮式也能解决。但人形机器人在工业场景中的核心是要用手工作,干一些原来的自动化设备干不了的工作。比如在狭小的空间内拧螺丝、插线束、贴胶带、装配零部件等,这些过去只能由熟练工人完成的精细活,正是人形机器人价值的体现。也正因如此,灵巧手成为了技术壁垒和成本控制的“珠穆朗玛峰”。作为高度集成的精密模组,其内部密集搭载昂贵的微型电机、精密减速器、丝杠、精密齿轮、连杆和各类传感器。目前行业主流灵巧手,成本均在数万元之上。其核心壁垒在于:硬件与成本:短期内这依然是最大的挑战。在设计端,灵巧手的技术方案尚未收敛,制约上游零部件批量化能力;在成本端,电机、丝杆、腱绳、减速器、编码器和控制器等灵巧手核心零部件,受制于工艺和批量化能力等因素,成本较高,远期还有很大的降本空间。算法与融合:中长期来看,当硬件相对成熟后,“手眼脑”一体的控制算法将成为真正的价值高地。当前人形机器人的手部尚难以完成技术含量较高的精细操作,需积累足够数据才能让算法生成有效的动作指令;但就当下阶段而言,算法的优化比单纯积累数据更关键 —— 需针对人形机器人的运动特性、感知模式等优化更具适配性的大模型。而在感知层,六维力传感器无疑是皇冠上的明珠。它能让机器人感知到来自X、Y、Z三个方向的力及对应轴的扭矩,是实现精准力控的核心。但其国产化以及大规模量产之路也最为艰难,其中,最大的障碍在于:技术壁垒高:包括弹性体的结构设计、核心敏感元件的装配工艺、复杂环境下的解耦算法以及高精度自动化标定。这需要力学、材料、电子等多学科的深度交叉和长期的工程经验积累,其中解耦算法是核心中的核心,短期很难被模仿。自动化程度低:六维力传感器的应变片贴装、内部走线调试以及传感器的标定环节目前以手动装配为主,且实现自动化的难度较高,导致生产成本居高不下。截至目前,六维力传感器原有市场规模较小,主要由ATI、Kistler等国际品牌主导。国内虽然涌现出一批初创公司,但大家的技术水平和市场进展相差不大,都处在“送样”和“小批量”阶段。在九鼎投资看来,中国的六维力传感器供应商接下来要拼的,就是看谁能和真正的整机巨头建立合作,把技术稳定性和出货量做起来。我们判断,对于六维力传感器领域的初创公司而言,想要在这场替代战中胜出,必须具备几个特质:深厚的技术背景、极强的市场开拓能力、卓越的工程化和降本能力,以及与客户协同迭代的快速响应能力。四、投资哲学:在“无人区”如何下注?在一个尚无稳定收入,甚至没有成熟产品的产业早期,传统的估值模型完全失效。投资人形机器人零部件更像是一场豪赌。那么,PE机构是如何构建自己的估值模型,并平衡高估值与高风险的?我们认为,理想的投资标的,必须具备以下几个关键要素:技术方案的不可替代性与高壁垒:必须确保所投的技术路线在未来不会被轻易颠覆。软硬结合的产品,因其算法难以被抄袭,护城河更深。巨大的市场空间:寻找那些在机器人本体中价值量占比高,但原有市场空间小的零部件。这类标的将最大程度受益于产业爆发,成长弹性巨大。顶尖且互补的创始人团队:这是所有要素中最重要的。团队不仅要有深厚的技术背景,更要有强烈的工程化、商业化导向和成本意识。良好的竞争格局:细分领域中最好尚未出现强大的上市公司竞争对手。在估值上则采用“场景倒推+现金流折现”的逻辑:未来的整个市场能做多大,这个零部件能占多少份额,它能分到多少蛋糕。这场投资,在本质上是在为未来下注,关键在于技术路线的正确性和团队的执行力。但最终,赌的是中国在全球新一轮科技竞赛中的未来。五、终局思考:谁将定义下一个时代?中国人形机器人产业的“iPhone时刻”——那款能走进千行百业的标杆产品——大概会在什么时候到来?业内的预测是:“iPhone 1”时刻:可能会在2028~2030年左右出现,标志是机器人在2~3个核心工业场景实现规模化盈利。“iPhone 4”时刻:真正具备泛用性、能走进家庭的标杆产品则需要更长时间,可能在2035年之后。而在此之前,九鼎投资认为,产业还需要跨越几个关键的里程碑:核心部件成本降至临界点、具身智能取得突破性进展、在核心场景实现规模化盈利,以及建立起强大且高效的供应链。当前,制约产业爆发的最大瓶颈,短期看是成本和技术,中期看是AI的泛化能力。十年后,当我们回看今天,决定中国人形机器人产业在全球地位的,最终会是什么?九鼎投资的答案是三者的合力:市场规模、制造成本和核心技术。但长期来看,中国人形机器人必然会引领全球发展,也必然会诞生世界级的、不可替代的公司。因为中国拥有全球最大的应用市场和最强的制造成本优势,这是技术发展的“肥沃土壤”和“基础保障”。我们可以先依赖这两点,快速走量、占领市场,然后用市场换技术,反哺研发,最终孵化出具有全球统治力的核心技术和公司。毕竟技术是可以弥补的,但市场规模和制造成本的优势,国外是模仿不了的。如今,这场围绕“铁皮人”的战争才刚刚拉开序幕。它关乎的不仅是一个新兴产业的未来,更是一个国家在下一个科技时代的全球站位。而此时此刻,战争的胜负手,就隐藏在那些看似不起眼的减速器、传感器和螺丝钉之中。
九鼎投资
1天前
13
马斯克“金色擎天柱”首曝,一双“真人手”刷屏
新智元
1天前
312
Salesforce:AI到底是“救星”还是“丧钟”?
9月4日早美股盘后,SaaS龙头Salesforce公布2026财年2季度财报。当季业绩表现相对平稳。增长并无明显提速迹象,但靠优秀控费仍挤出小超预期的利润。但不改变核心问题,且对下季度指引也不亮眼,整体观感还是偏弱。详细要点如下:1. 增长看似提速,但更多只是汇率利好:增长端,核心业务——订阅性收入本季同比增长10.6%,较上季的8.3%有一定提速,小幅跑超市场预期1pct。但主要是汇率转向顺风的利好,过去四个季度,恒定汇率下订阅收入的增速实际一直在9%左右,增速波动大部分只是因汇率的影响。2. 传统业务熟透,必须向AI寻增长:细分5大云各自的表现,本季受益于汇率利好,增速全部有1%~3%的环比走高。结构上,传统的IT支出——销售、客服和营销三大板块增长依旧仅个位数,近乎熟透的传统业务难有多少亮点。与AI相关度更高的平台云和数据分析板块则表现显著更强,两者收入增速分别为17%和13%。据披露,AI和数据云贡献的年化收入已达12亿,较上季的10亿有所提升。3. 领先指标环比走弱:领先指标——cPRO的名义同比增速为11%,较上季降速约1pct,恒定汇率下的增速环比放缓幅度类似。本季cRPO同比净增额29亿,较上季也有环比近10%的收窄。这看起来暗示着Salesforce的新增需求反而有走弱的迹象。4. 汇率带动下,毛利率稳步提升:虽然增长上没有实质性亮眼之处,本季Salesforce的毛利率则表现不错,环比提高了1.1pct。背后一方面是核心订阅业务因汇率利好和规模效应的小幅提升,另外服务业务的毛亏损从上季的异常高点回落常态也有贡献。因此,本季实际毛利润额近80亿,同比增长11.6%,较收入增速有所放大。5. 优秀控费继续挤利润:本季Salesforce全部经营费用支出$56.6亿,同比增长5.2%,较上季度6.8%进一步放缓,明显低于收入和毛利的增速。靠控制费用仍是挤出近2pct的额外利润率。但趋势上,由于推广AI产品的需求,费用增速已有扩张的趋势。具体来看,占比最大的营销性支出34.4亿,同比增长6.8%,在推广AI等新产品的需求下,营销费用增速近几个月持续走高,但绝对增速仍然较低。研发费用也同比增长了9.8%,同样有提速迹象。6. 增长没亮点,利润还是优秀的:由于毛利率在汇率的利好下环比回升,控费目前也仍然优秀。本季的GAAP口径经营利润率环比提升了约4pct,到22.8%,创历史新高。经营利润额同比显著增长近31%,利润增长还是不错的。公司更关注的自由现金流利润,在季节性低点仅为$6.1亿,同比负增长20%,明显低于预期。当然由于绝对值较低,比例上看似巨大的差异,只是因为偿还了更多应付账款的影响,意义也并没那么大。海豚投研观点:由上文来看,Salesforce本季业绩表现并不算差,整体属于平稳表现。概况来看,实际增长大体平稳,更多只是受汇率的影响而上下小幅波动。在增长乏力的情况下,公司也对应降低了股权激励支出,并控制了费用的投放,释放出的利润还是不俗的。放宽视野,越过这些短期的业绩表现,目前软件行业和Salesforce面临的问题是,市场上对AI可能取代传统软件或SaaS服务的担忧在不断发酵。而2023财年以来就不断走低的收入增速,至今已连续4个季度收入增速不足10%。确实体现了Salesforce作为传统SaaS巨头,在单季百亿的收入体量下,若无潜力巨大的新市场或新服务,很难明显带动整体的增长。而问题是“雷声大、雨点小”的Agent业务仍只是在早期阶段,企业用户更多只是在试点而非大范围推广。这背后AI agent的功能和体验也还比较初级,没有明显付费点无疑是本质原因。而从本季业绩和对下季的指引也都还并不能验证AI Agent的拉动作用。对下一季度的展望上,公司预期收入同比增长8%~9%,恒定汇率增速9%,和本季依旧持平,略低于市场预期。指引下季度cPRO的恒定汇率下增为10%,也和本季度一致。因此,虽然公司宣布于8月开始对旗下多数业务的企业版本平均提价6%左右,却并没带动收入提速。也暗示着下季度内AI Agent的带动还是有限。此外,公司指引下季度的摊薄后EPS仅$1.61,同比仅仅增长不到2%。这暗示着下季度在新业务上的投入会明显增加。不同于本季还有能利润不错这个亮点,下季度属于增长不行、利润也不行的情况。因此整体来看,公司目前偏弱的主逻辑并未在本次业绩后有多少改善。虽然公司目前的估值在SaaS行业内很低,业绩前市值对应预期2026财年自由现金流仅16x~17x左右,对应2026财年PS更是仅6x,都在SaaS行业内处于均值偏低的水准。在核心业绩表现和前景都不算好的情况下,AI agent虽是一个可以讲的故事但不确定性也很高,海豚认为CRM目前只具备显著超跌后的反弹价值,并看不到能持续向上的机会。以下为财报详细解读:一、Salesforce业务&收入简要介绍Salesforce是全美乃至全球范围内的CRM行业中最早提出SaaS即software-as-a-service这一概念的开拓者。该模式最大特点即采取云端服务而非本地化部署;采取订阅制付费而非买断性付费。因此,Salesforce的业务和营收结构上主要由两大类构成:①超95%的营收是各类型的SaaS服务订阅性收入;②剩余约5%的小部分是由如项目咨询、产品培训等构成的专家服务性收入。更进一步看,占据主体的订阅性收入则由细分的5大类SaaS服务构成,且各大板块的营收体量大致相当,包括:① 销售云:CRM最核心也是公司最早的业务,主要是企业销售阶段的各类流程管理工具。如客户联系、报价、签单等功能。② 服务云:公司的另一核心业务,主要包括客户服务相关的各类功能,如客户信息管理、线上客服等。③ 营销&商业云:其中营销云即通过各类搜索、社交、电邮等渠道系统化进行营销的功能;商业云则主要是电子商务所需的虚拟商城搭建,订单管理、支付等各类功能。④ 数据&分享:Salesforce集成在内部的数据库服务和商业分析工具,主要由MuleSoft和Tableau构成。⑤ 平台云:Salesforce其他SaaS服务依赖的基础设施和服务,类似PaaS。也包含类似于微软Teams,或国内飞书此类的团办协作办公服务——Slack。二、排除汇率利好外,增长依然没有惊喜增长端,本季Salesforce的核心业务——订阅性收入约$80.5亿,同比增长10.6%,较上季的8.3%有一定提速,小幅跑超市场预期1pct。但是其中主要是汇率转向顺风的利好,过去四个季度,恒定汇率下订阅收入的增速一直在9%左右,增速波动大部分只是因汇率的影响。五大细分业务线的表现上:1. 本季所有细分业务线的增速普遍较上季度有1pct~3pct的提速,表现相对一致,没有特别出众的。可见也是主要受汇率因素的利好。2. 更具体看,依旧是商贸和营销云增长最弱,同比仅增长4%,两大最基石的销售和服务云增速则都在9%上下,算是表现平稳。3. 由于平台云是Salesforce服务的基础设施,企业采用Agentforce时会默认使用平台云,因此平台云增长依旧最强,本季增速近17%。体现出AI的一定拉动作用,但剔除汇率利好外,相比先前也并没显著的提升。而数据分析板块,则继续受益于分析工具Tableau的增速提速到15%的拉动,也有领先传统业务线的增长。本季专业服务收入约5.5亿,依旧同比萎缩约2.7%,表现和上季同样差距不大,因此Salesforce本季总营收$约102亿,同比增长9.8%,剔除汇率影响后增速为9%,较上季小幅提速约1pct。三、当季增长平稳,领先指标反而有所走弱反映了后续增长前景的领先指标——cRPO的名义同比增速本季为近11%,较上季降速约1pct,恒定汇率下的增速环比放缓幅度类似。本季cRPO同比净增额29亿,净增额上较上季也有环比近10%的收窄。在上季度创出一个阶段性高峰后,2季度内Salesforce的新增合约反而是走弱的。四、汇率顺风,带动订阅毛利率环比改善毛利层面,本季Salesforce的核心业务——订阅性收入的毛利润$80.5亿,同比增长11.6%,小幅跑超对应收入增速。可见本季订阅业务的毛利率为83%,环比小幅提升0.3pct,海豚认为其中应当主要也是归功于汇率的利好。更长视角下,毛利率仍维持着随规模提高和客单价走高而稳步小幅提升的趋势。改善更大的点是,本季服务性业务的毛亏损率由上季22%回归到更常态的9%,因此毛亏损额也从1.2亿缩窄到约0.5亿。叠加订阅业务因汇率利好和规模效应的稳步提升,以及服务业务的毛亏损的回归常态,本季Salesforce合计总毛利率为78.1%,环比提高了1.1pct。五、控费表现仍相当优秀费用角度,本季Salesforce全部经营费用支出$56.6亿,同比增长5.2%,较上季度6.8%进一步放缓,也明显低于收入和毛利的增速。因此在增长端表现并不算亮眼的情况下,靠控制费用仍是能挤出一些利润。费用率较上季环比走低近2pct。具体来看,占比最大的营销性支出34.4亿,同比增长6.8%,在推广AI等新产品的需求下,营销费用增速近几个月持续走高,但绝对增速仍然较低。研发费用则同比增长了9.8%,同样有边际提速,应当也是因研发AI agent等新功能的投入。不过管理费用则仅同比增长3.2%,是控费的主要发力点。作为SaaS类公司的重要费用组成部分,本季费用增长不高的原因之一是股权激励费用约$7.8亿,同比下降了1.8%,占收入比重达为7.7%,近几年来除4Q24以外的最低点。六、增长没亮点,利润还是能“挤出来”的利润表,上文提到毛利率在汇率的利好下环比回升,仅低个位数费用增速,也继续释放利润率。因此,本季的GAAP口径经营利润率环比提升了约4pct,到22.8%,创历史新高。在此拉动下,本季经营利润额同比显著增长近31%,虽然营收增长并无亮眼之处,利润增长还是不错的。公司更关注的自由现金流利润上,在季节性低点仅为$6.1亿,同比负增长20%,明显低于预期。当然由于绝对值较低,本季现金流的同比下降,主要是因偿还了更多应付账款的影响,也算不上具有很大意义的指导信号。
海豚投研
1天前
17
苹果自研AI搜索曝光:核心团队大流失后,要把“灵魂”交给Google
我已经算不清,苹果第几次承诺要让Siri变得更聪明了。不过,这回看起来苹果是真上心了。据彭博社今天凌晨报道,苹果内部正在研发一套代号为World Knowledge Answers的AI搜索引擎,准备整合进Siri里头。而且不只是Siri,Safari浏览器和Spotlight功能以后也都要用上这套技术。高管们给这个项目起了个挺唬人的名字——“答案引擎”,预计明年春天就要和Siri的重大升级一起发布。说白了,传统搜索引擎主要是给“链接”,靠用户自己点开。而苹果是要让Siri不仅具备全网搜索能力,同时跟ChatGPT、Google的AI概览一个路数,直接整合文字、图片、视频和本地信息,还配个AI总结系统。据消息人士称,支撑新版Siri的底层技术,部分可能来自苹果的老合作伙伴Google。两家公司本周达成了正式协议,苹果将评估并测试Google开发的AI模型来增强Siri。要知道,Google每年给苹果200亿美元,就为了让Google搜索成为iPhone的默认搜索引擎。现在苹果又要用Google的AI技术,这关系确实有点微妙。报道中提到,苹果内部给Siri的技术改造起了两个代号:Linwood和LLM Siri。负责软件工程的Craig Federighi最近在内部会议上表示,这次升级会超出预期:“这次端到端的Siri改造让我们拿到了想要的成果,不仅能兑现之前的承诺,还能带来更大幅度的提升。”现在有三个团队在推进这个项目:Federighi的Siri团队、John Giannandrea的AI部门,还有Eddy Cue的服务团队。连Vision Pro负责人Mike Rockwell都被调来救火。另外,苹果还准备完全重构Siri,预计基于三个核心组件:规划器、搜索系统和总结器。与以往完全自研不同,这次苹果同样开始考虑引入第三方模型,项目代号叫Glenwood。目前的方案是用Google定制的Gemini模型来承担总结器任务,运行在苹果的私有云服务器上。苹果还在评估是否把规划器也交给Gemini或Anthropic的Claude模型。同时,苹果会保留自己的Apple Foundation Models来处理用户本地数据,保护隐私。这里有个小插曲。据说Anthropic的Claude模型质量确实比Gemini更好,但开价太高——每年超过15亿美元,苹果最终选择了更便宜的Google方案。按计划,新版Siri会在iOS 26.4中上线。iOS 26会随下周的iPhone 17一起预装发布,但不会有重大AI新功能。除了Siri升级,苹果还在开发:新的Siri界面,明年上半年推出;健康AI助手,为2026年的付费健康订阅服务做准备;更强的对话能力,用于未来的家居设备。讲真,现在的Siri确实挺尴尬的。2011年刚发布时,大家都觉得这是革命性产品,结果十几年过去了,它反而成了苹果在AI领域落后的象征。目前Siri能回答一些基础问题,比如人物介绍、天气预报、电影信息这些,但一遇到复杂问题就抓瞎,经常要依赖Google或ChatGPT的结果。选择与Google合作的这个时间点也挺巧的。美国法官刚裁定苹果可以继续和Google保持默认搜索合作关系,但苹果服务部门主管Eddy Cue之前在庭审中透露了个关键信息:来自苹果设备的Google搜索次数开始下降,这是20年来第一次。言外之意是,AI搜索正在威胁传统搜索引擎。考虑到这一点,苹果此前还商讨过收购路线。Eddy Cue和并购负责人Adrian Perica曾讨论过收购Perplexity和法国AI初创公司Mistral。然而,苹果今年夏天认真评估过Perplexity的技术,但最终放弃收购,选择推出自家产品。而在今天,Mistral AI也宣布完成新一轮融资,估值达到140亿美元。更糟糕的是,苹果AI团队现在面临人才流失问题。Foundation Models团队创始人Ruoming Pang今年7月跳槽Meta,拿了超过2亿美元的薪酬包,随后约10名团队成员跟着离职。这种“跳槽潮”还在加速。上周甚至又有三位关键研究人员离开,两个加入OpenAI,一个去了Anthropic,预计还有更多成员正在观望,寻找新机会。在这种内外交困的情况下,苹果这次Siri大升级确实显得格外迫切。毕竟看着ChatGPT、Google AI这些后来者风生水起,自己的Siri还在原地踏步,也说不过去。新版搜索功能如果真能做到宣传的效果,对用户来说肯定是好事。但关键问题是,苹果能不能真正把这次升级做好?毕竟技术要靠Google支持,人才还在不断流失,这样的条件下能做出多颠覆性的产品,还真不好说。一切有待明年春天见分晓吧。
AppSo
2天前
2
人形机器人再现亿元级订单
又一国产机器人厂商斩获大额订单。昨晚,优必选宣布,获得国内知名企业2.5亿元具身智能人形机器人产品及解决方案采购合同,该合同以人形机器人Walker S2(具备自主热插拔换电系统)为主,将在今年内启动该合同交付。据优必选统计,剔除天工行者,目前公司Walker系列人形机器人已获得近4亿元合同。天工行者是今年3月优必选与北京人形机器人创新中心联合推出的全尺寸科研教育人形机器人。截至今年7月,优必选天工行者在手订单已达百台,预计今年将交付超过300台。在近日召开的财报电话会上,优必选方面预计今年将交付500台以上的工业人形机器人,全年产能将达到1000台。随着人形机器人迈入规模化商用时代,越来越多的厂商披露其订单情况:8月20日,天太机器人发布消息,与山东未来机器人技术有限公司、山东未来数据科技、港仔机器人集团等战略合作伙伴,共同签署全球首个具身智能人形机器人10000台订单。8月11日,智元机器人表示与富临精工股份有限公司达成数千万元标的的项目合作,近百台远征A2-W将落地富临精工工厂。今年7月,其与宇树科技共同中标中移(杭州)信息技术有限公司2025年至2027年人形双足机器人代工服务采购项目,总标包1.24亿元。数据显示,截至8月4日,今年以来智元机器人中标9个项目,宇树科技中标68个项目,优必选中标16个项目。中标数量接近或超过去年全年水平。开源证券6月研报曾指出,人形机器人商业化元年正式开启,订单浪潮正在倒逼产业扩大产能,交付能力成为企业争夺订单的关键,供应链成为制约产能的核心瓶颈。华泰证券则认为,产业初期交付订单数并非关键指标,核心仍在于能否初步形成正确模型范式和数据飞轮。中国制造业企业大规模布局人形机器人赛道有望带来硬件成本非线性下降,硬件的卡点或不是核心难题,更重要的在于AI赋能下的机器人大模型创新,即通过实现智能泛化进一步打开市场需求,最终落地空间较大的ToC市场。基于此趋势,上述机构指出,当前头部人形机器人企业一方面开始落地VLA大模型,另一方面已经在一些对精度和作业能力要求相对较高的工业厂家做探索,进行真实数据的采集和模型的训练。方正证券表示,当前人形机器人订单从教育科研延伸到工业制造、商业运营、政企服务,体现有更多应用场景在试验机器人部署的可能性。从投资层面来看,国金证券建议关注新技术迭代及零部件门票行情,预计供应链将重新启动,下半年各环节定点将陆续落地,包括:触觉传感器、谐波减速器、摆线针轮、高功率密度电机、peek以及粉末冶金工艺。
财联社©