本文作者:访客

具身智能卡在触觉,一目科技布局全链路,打造机器人指尖上的感知

访客 2025-11-11 20:42:22 56159 抢沙发
一目科技公司利用具身智能卡技术,在触觉领域进行布局,致力于实现机器人指尖上的全链路感知,通过技术手段,该公司旨在打造具备高度感知能力的机器人,使其能够更精准地获取和处理触觉信息,这一创新将有助于提升机器人的智能化水平,拓宽其应用领域,为未来机器人技术的发展开辟新的道路。

过去一年,具身智能的发展堪称“狂飙”,各大机构和企业纷纷投入世界模型与VLA(视觉-语言-动作模型)的研发。但在AI行业老兵、一目科技创始人兼CEO李智强看来,这些模型仍有明显缺失。如果机器人能像人一样理解并操作这个世界,仍差关键的一感:触觉。

基于这样的判断,一目科技进行了从底层传感器到仿真算法的全链路布局,探索打造“触觉增强的世界模型”。

01

“世界模型”还缺什么?

如果将AI发展与人的五感对比,AI的“听觉”2015年已日趋成熟,视觉在过去10年也越来越发达,但嗅觉、味觉和触觉仍处于空白。

李智强博士分析,在具身智能要解决的行动力、智力和精细化操作三大问题中,尤其精细化操作,离不开闭环感知能力。“如果只有视觉,在特定场景下会失效,比如根本无法夹取薯片这类脆性物体。”

他认为,世界模型要真正理解物理世界,必须补足触觉维度,因为人对物质世界的认知,正是源于不断触摸试探,在大脑中建立与物理世界的映射。“如果有一天,机器人能通过持续触碰与探索形成类人感知,便是世界模型达成终极目标的时刻。”

而这也正是一目科技的创业初心,“把类人的五感赋予机器里”,通过感知驱动“物理AI”的发展。李智强在卡内基梅隆大学攻读博士期间,研究方向是光谱仪芯片化及AI算法,“可以类比于人类的嗅觉和味觉。因为人的嗅觉、味觉主要是分子层面的一些感受和分析”,这也自然延伸到硬科技与物理AI的结合。

一目科技2015年成立于硅谷,2016年选择回国创业,原因是“物理AI”方向对硬件依赖极高,而中国在设计、制造工艺上优势显著。“比如设计一块电路板,国内七八天就能完成,在美国可能要三四个月。”

如今,经过学术界长达十多年的研究,以及一目科技的实践,均已验证:具备触觉后,机器人可完成夹薯片、穿针引线、拿起布料等操作,动作丝滑,这正是具身智能精细化操作的起点。触觉,正是世界模型走向完整的必由之路。

02

手指尖上的触觉“觉醒”

要让世界模型拥有“触觉”,离不开触觉数据的采集与感知技术的突破。“核心卡在传感器上”。

一目科技创业的第一阶段,着眼于分子光谱仪的芯片化,实现分子分析能力的AI化。团队花了四五年进行芯片研发、设计和流片,2020年推出首个产品线,应用于实验室和水质检测等场景。该产品线现已进入稳定期,实现持续盈利,为公司提供了宝贵的“造血能力”。

凭借在传感器方面的积累,两年前,一目科技开始向“触觉增强”迈进,启动视触觉传感器的研发,希望“通过视触觉传感器,让机器人真正能够触摸这个世界”。

2025年10月,在全球机器人顶会IROS上,一目科技展示了自主研发的全球最薄可商用仿生视触觉传感器。该传感器的核心在于“通过内置摄像头捕捉弹性材料接触物体时的细微形变,获取高清的‘触觉照片’序列,并通过AI解算出触觉信号”。不同于只能感知单一压力的传统传感器,这款产品能同时“感受”物体的软硬、表面纹理乃至滑动趋势。

一目科技仿生视触觉传感器

李智强博士介绍,这一传感器实现了四个行业突破:其厚度仅为美国竞品的一半,解决了传统视触觉传感器因过厚,难以与灵巧手集成的行业痛点;克服了“温漂”问题;工业级防尘达到IP65级;传感器接触面都没有盲区,而竞品有10%到20%的盲区。此外,其响应时间仅8毫秒,可实现5毫牛级的多向力分辨,在多项性能上与全球最好水平持平。

一目科技CEO&创始人李智强

这款触觉传感器分辨率极高——可达数百万个像素,相当于手指尖拥有数百万个触点。得益于信号的高保真与数据的高准确度,能够解算出高精度的触觉信息,赋能机器人灵巧手的操作过程。

据悉,产品一经发布就获得多方合作和订单,团队预计未来一年出货量能跻身行业头部,“至少Top3的水平”。

不过,李智强博士也指出,目前许多机器人,包括人形机器人,虽然需要触觉传感硬件,但现有的世界模型和VLA模型仍未构建触觉感知的算法能力。为此,团队需要再进一步外延,“借助触觉,打通机器人精细操作的最后一环”。

03

打通触觉到世界模型的链路

“我们未必自己去开发一整套世界模型,但是我们希望用触觉来增强世界模型。”李智强博士将这种理念概括为“触觉增强的世界模型”。团队主张“站在巨人的肩膀之上”,例如基于李飞飞团队发布的世界模型、阿里发布的VLM开源模型等,一目科技会在这些模型基础上进行补充和增强。

这项工作首先要解决数据采集难与数据量不足两大难题。一目科技提出了“以真实触觉信号锚定仿真系统”的闭环路径。

“我们靠人一条条采集出来的真实数据,其实在10万条级别,这个量对处理工作量来说很大,但对于大模型来说还是远远不够。”李智强博士坦言,目前开源社区也有数十万条触觉数据,但也是杯水车薪。

为突破数据瓶颈,一目科技在真实数据基础上,引入物理仿真与生成式AI结合的策略来扩展数据。团队有专家团队,利用有限元模型,将“桌子或鼠标”等物体在形态、硬度、摩擦力等维度上,用方程式仿真出来。“同时,我们还通过生成式AI去增加更多场景,比如光照、纹理、摆放位置和方向等,去做仿真的扩大化和无序化。”

从效果反馈看,物理仿真准确度更高,“因为它背后是物理方程,误差较小”;而生成式AI则“有一些幻觉,对物理规律的理解也有一定差距”。因此,团队持续优化物理模型,并随着生成式AI的进步,引入新模型和方法,“不断改进增强模拟数据的质量”。

有了这些物理仿真数据后,相当于在虚拟空间中搭建了一个可被“触摸”的世界。接下来要做的,便是让AI在仿真环境中去“触碰”它们,采集触觉信息。

一目科技采用视触觉方式来完成这一过程。不同于传统靠压力或电阻的触觉传感器,视触觉方式不仅能“感觉”压力,内部摄像头还会捕捉到形变和光线的细微变化,从受力到光线变化再到力分布,完整还原触感生成的全过程。一目科技构建了视触觉传感器模型,输出的数字信号包含了纹理、形态、力方向等信息,来接入VLA与世界模型。

通过这种仿真增强方式,一目科技希望将触觉数据量扩展百倍以上。“只有这样,才能真正走上Scaling(规模化)的道路。”

完成数据扩展后,下一步是将触觉与视觉、语言等模态对齐,真正融入世界模型。具体而言,现有世界模型多围绕视觉与语言分配“token”,而一目科技的创新在于“引入新的触觉token”,通过训练增强模型的多模态理解能力,打通感知链路。

“其实后半部分和目前的大模型训练类似,市场上已有大量模型预训练、精调、强化学习的方法。”李智强博士介绍,“最终我们还会去做一些测试、验证方法。”

实际上,真正的挑战不在于训练方法,而在于触觉数据与其他模态的关系及对齐。当触觉、视觉等信息同时出现时,哪个可信度更高?该如何做综合决策?这些信息的关联度是什么?能否在同一域实现对齐?一目科技的创新重点正是围绕触觉信息的处理、对齐及其对决策的影响展开。

这一阶段恰似20年前视觉模型的起点。就像20前做视觉模型时摄像头还不健全一样,现在的触觉感知也刚刚起步。“随着传感器的不断迭代和性能提升,这一切都将迎来改变。”

04

在狂飙的AI浪潮中站稳

人工智能的演进速度惊人。李智强回国创业时,正逢国内视觉AI热潮。当时,技术发展迅猛,但随着市场的快速变化,许多企业也被迅速淘汰。而如何在这一轮具身智能的激烈竞争中占据一席之地?他认为,关键在于技术壁垒和市场定位。

“必须构建足够高的技术壁垒,特别是技术的不可复制性或不可替代性。”对一目科技而言,从感知传感器硬件到算法做全链路技术布局,而且要做到全球领先,技术壁垒才足够高。

市场选择也同样至关重要。“最好是找到那些巨头难以覆盖,或者不主要依赖客户关系的细分市场。”他说,“找到自己的生态位,并在技术上保持不可替代性,才是成功的关键。”

对于一目科技来说,团队投入最多的是有限元仿真和光学仿真上。“作为创业公司,我们选择将业务收敛到极其细分、高度专业化的赛道。”

放眼全球业界,目前,真正做“触觉增强世界模型”的团队仍然稀少。早期Meta做过一些工作,但主要还是纯触觉领域。“我们尚未看到真正与世界模型深度打通的案例。”李智强博士直言,“在触觉与世界模型打通这一方向上,还有大量工作要做,现在仍严重不足。”

一目科技规划了循序渐进的路径。第一阶段基于开源模型,自己进行改造。当达到良好效果后,将开放部分模型和数据集,回馈开源社区。这将是第二阶段的事情。而从长远来看,有必要与一些模型巨头企业合作,更早地将触觉增强技术结合到他们的模型训练中去,这样,效果要好于模型成型后的再调整。目前,一目科技正处于第一阶段,预估跑通整个链路,需要9至12个月时间。

李智强告诉数智前线,未来5到10年将围绕这一主题做产品规划和投资。他认为,中国在“硬件+软件”融合模式下具有显著优势,这也为身处其中的行业和企业带来了极有前景的发展机遇。

文章版权及转载声明

作者:访客本文地址:https://www.gaaao.com/gaaao/9742.html发布于 2025-11-11 20:42:22
文章转载或复制请以超链接形式并注明出处深链财经

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

验证码

评论列表 (暂无评论,56159人围观)参与讨论

还没有评论,来说两句吧...