出品|虎嗅科技组
作者|宋思杭
编辑|苗正卿
头图|大会现场拍摄
大会开场的前15分钟,张鹏迟迟没有上台演讲。他在等两个重大的签约仪式。
两个半月前,这家大模型明星公司提交了上市辅导备案。两个半月后的今天,7月2日上午,智谱CEO张鹏身着白色衬衫出现在张江科学城这座极具标志性的地标建筑中,而他今天出现在这里的最重要原因,就是宣布战略融资。
这已经是智谱今年的第五次融资了。这一次,也是国资入局。(虎嗅注:其余四次分别在3月和4月完成,分别获得由成都、珠海、杭州、北京投资。)
事实上时隔一段时间,智谱都会向外界交一份成绩单。但与以往不同的是,今天的这张成绩单是首次在上海这座城市呈现。
在张鹏上台前,现场还进行了两大重要签约,其中一个便是由浦东创投集团、张江集团和智谱三方同台完成的。据悉,智谱再获由浦东创投集团和张江集团的10亿元战略投资,并于近期完成首笔交割。另据虎嗅独家获悉,首笔交割金额为5亿元,占比达到本次融资金额的一半。该笔资金将主要用于MaaS(Model as a Service)开放平台产业生态的建设,并在上海落地行业生态、城市生态、政府生态。
实际上,对于智谱这家AI独角兽公司而言,MaaS是一个极为重要的存在。从横向来看,智谱是提供大模型能力的基座模型厂商,但从纵向来看,智谱又需要向客户提供模型能力的服务,这也就意味着,智谱不仅模型能力需要站在第一梯队,更要在服务能力上胜过其他厂商,尤其是既有基础模型又懂行业know-how的大厂。而MaaS就是补齐模型服务能力关键的一环。
而本次在上海张江落地的MaaS正体现了智谱发力MaaS的决心。今天,在上海张江科学城所见证的今年第五次融资,同时也意味着国家队对智谱的深度认可和战略绑定。在当前全球AI大模型竞争白热化的背景下,国资的入局无疑为智谱注入了强大的“定心丸”和“加速剂”。
值得一提的是,在大约四个月前,3月份,上海张江集团与智谱达成合作,共建模力社区-智谱大模型MaaS平台。截至目前,有接近智谱方面告诉虎嗅,MaaS平台已在翻译、合规审查、市场文案创作、英文口语陪练等数十个可快速复制的场景落地,并且大部分案例都落地在上海张江。
而在宣布融资之外,智谱所向外界披露的另一个重要成绩是,新模型的开源并发布——通用视觉语言模型GLM-4.1V-Thinking。
从发布会现场来看,4.1V-thinking模型与以往模型的最大不同之处在于其视觉推理能力。例如,现场演示了该模型实时解说苏超足球赛的能力,这背后体现的是模型对复杂动态图像的理解和事件逻辑的建模能力,而非简单的图像识别。
其实,从目前市面上的大语言模型和多模态模型来看,能做到将多模态理解和推理融合在一起的并不多。在现场,张鹏特意强调,GLM-4.1V-thinking之所以能做到这样的效果,也正是得益于这是一个小参数模型。通过本场发布会,能够看到的是,智谱正在尝试用新的技术路线来实现SOTA(State-of-the-art)和创新。
而这也正是本次发布会除了资本层面之外,更为重磅的消息。这不仅仅是模型版本号的迭代,更是智谱在多模态AI领域从‘感知’向‘认知’跃迁的关键一步。
GLM-4.1V-Thinking的核心优势在于其引入的“思维链推理机制(Chain-of-Thought Reasoning)”和“课程采样强化学习策略(RLCS, Reinforcement Learning with Curriculum Sampling)”。这使得模型能够像人类一样进行多步骤的逻辑思考,系统性地提升了跨模态因果推理能力与稳定性。
尤其值得关注的是,其轻量版GLM-4.1V-9B-Thinking模型,参数量控制在10B级别,却在MMStar、MMMU-Pro等28项权威评测中,有23项达到10B级模型的最佳成绩,其中18项甚至持平或超越了参数量高达72B的Qwen-2.5-VL。
可以看到,智谱本次所呈现的视觉推理能力,算是终于拿出与DeepSeek能够形成差异化的产品能力了。
其实2025年上半年,AI大模型的风向正在悄然发生转变,过高的估值已经让一些模型厂商难以跟上步伐,而目前还在第一梯队的AI独角兽,则在加快脚步突破更多的商业化落地项目。上半年所释放的另一重信号是,除了智谱在4月份提交上市辅导备案,另一家AI独角兽MiniMax也在考虑港股上市。当AI独角兽扎堆IPO时,一些新的技术突破还正在发生。
以下为智谱CEO张鹏在现场的演讲内容。由于现场的演讲内容含有大量的演示,所以笔者仅呈现了张鹏的核心观点,其中包括智谱的重要模型发布,以及智谱作为基座模型厂商,其正在突破的一些关键挑战。
下附张鹏演讲内容,有删减:
今天,是我们首次在上海举办这样的活动,并且发布最新成果。
我们通常喜欢在发布会现场做演讲,那么今天请同事在现场帮我们做非常简短的Demo。大家看到现场的演示是真实在线的,可以看到屏幕在拍摄。
(此处省略演示环节)
索性今天没有现场翻车,我们经常会碰到现场Bug的情况,但今天的演示很顺利。在演示中大家看到了两件事情:
一是,模型内容生成能力给我们带来了新的可能性,原生的模型、原生的能力就已经能够代替原来我们需要很复杂工作流等工具来辅助我们生成内容的工作。
二是,给它复杂的内容(图表、数据)能够很自然地理界、很深刻地理解推理,并且生成非常合理符合要求的文字内容。这些内容到底是如何产生的呢?
经过去年及今年上半年突飞猛进的发展,人工智能在各个行业中给我们带来了非常多的颠覆。这样的颠覆总结起来大概有三个方面的内容:
(1)知识权威的重构。
典型的大家听过一些小的故事,比如说有人去医院看病,医生诊断完之后给他开了处方和诊断,病人掏出手机来说病人你的诊断和我问了大模型之后的结果不一致,请问你们俩谁对?医生看完诊断的结果之后说对不起,我失误了,大模型的回答比我更准确。这只是一个小小的个例,但个例也表明了在医疗、法律、教育等专业领域,AI的能力已经在逼近甚至超越人类专家的水平。
(2)创意权威的重构。
大家可以看到刚才的内容检索、整理、生成,这些工作原来我们认为只有具备创意能力的人才能够完成,而且是具有非常丰富工作经验和技术知识的人才能完成的工作,今天AI也能够为你完成的还不错,并且已经向着人类专家的水平在逼近。
(3)技术权威的重构。
开发范式上的颠覆,大家可以看到刚才的PPT是怎么生成的,不是用WPS写的PPT,是用一行一行代码的方式,是用code的方式完成的整个生成,也就代表着模型在code代码编写的能力上在大大往前迈进,甚至超越人类平均水平线,同样逼近了人类顶尖专家的水平。
这样的AI能力急速进化,可以称之为“技术平权”,也可以称之为“权威的重构”。之所以能够实现这些权威的重构和AI对人类实现的挑战,其实背后是技术范式的演进。
人类大脑、人类智能水平其实是非常复杂的,包括了语言能力、视觉能力、语音能力、行动能力、思考能力、推理能力,方方面面的能力都由大脑统一完成。
但现在AI在逐一破解这些能力的密码,比如说在语言能力上,在生成文字内容的任务上,我相信在座每一个人都没有拍胸脯的信心说一定会超越现在的AI,在语言能力上,AI已经逼近了人类最顶尖的水平,达到了人类天花板90%的水平。
同样在视觉能力、推理能力等方面,我们都在大踏步前进。因此,造就了知识、创意、开发等各个领域的权威重构。
对于现在现有的大模型能力,我们不禁要问一个问题,看起来这些能力都非常强,而且都逼近人类顶尖专家的水平,这些能力已经到达了上限吗?还有更高的天花板吗?作为一个做技术出身的人,我觉得我们的感触是远没有,还有大量空间等待我们去探索。
刚才那张图上大家看到了,除了语言能力以外,大多数的能力都在人类水平的70%、60%的水平,还有少量的像运动控制等能力还在很低的20%、30%的水平上。这样的能力仍然有待极大的提升。
我们认为长期来看智能水平的提升还是要依赖于基础大模型的演进、技术的突破。
第二,我们希望大模型/AI能帮助我们解决这些问题,不光能思考,还能帮助我们解决执行的问题,在代码和执行能力上(Agent能力)也仍然还有大量的空间去提升。
第三,希望AI是受我们控制的,能帮助我们完成工作、安全的,而不是为我们造成伤害。在大模型幻觉性的解决上、自主控制上还有大量的事情等待我们去解决。
在这些方面,我们有这样的期待及突破的方向。
也因此,对于今年(2025年)大模型趋势做了如下的预判。可能有参加过之前年初活动的朋友听过。
第一,基座模型的突破为我们带来智能水平上界突破的基础工作。智谱作为最早、坚持时间最长的国内大模型研发厂商,仍然在投入大量精力、资源、技术研发力量做基础模型的研发工作、训练工作。
并且我们在持续探索有没有可能出现新的范式,从预训练到对齐到强化学习到推理,再下一个新的方式是什么?这也是我们在研究和突破的内容。
第二,智能体方面,希望现有的大模型能力能通过智能体的方式转化成真正的生产力,帮助我们在日常生活和工作当中解决实际的问题。到底是偏向于白领的创意型工作,还是偏向于蓝领的体力工作,还是偏向于顶尖研究人员的创意和研究探索型的任务更合适?这些问题仍然在不断地探索。只有让AI工人实现了代替人的一部分基础性、重复性的工作,才能够实现真正的降本增效,这是智能体能力的关键点。
第三,自主大模型,希望大模型能更听人类的话,更遵守基本的规则,不要危害我们,知道自己做的事情什么时候是有问题的,能够自我纠正。在模型自我控制、对内知识准确性、对外行动可靠性上还是要持续提高,这是我们对于当下大模型技术发展的趋势预判。
当然,也有人会问你们凭什么能够做这样的预判?那是来自于智谱对于AGI终极目标路线的规划。我们把AGI路线图划分为L1-L5,像自动驾驶一样的五个层次。从预训练大模型—对齐推理—自我学习—自我认知—意识智能,五级一步步向上迈台阶。过去几年完成了预训练基本基础的研发、突破、收敛,也解决了跟人类对齐、思维链程度的对齐,也是推理能力的实现。现在我们尝试在自我学习方面,让AI能够根据外界的反馈自我提升。这是我们在努力的方向。
未来希望它能有自我认知,甚至上升到类人意识的层面,形成更完整的智能。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4532140.html?f=wyxwapp
该文观点仅代表作者本人。发布者:深链财经,转转请注明出处:https://www.gaaao.com/14824.html