您的位置 首页 > 新闻

启数光轮将AIGC与仿真技术深度融合 生成映射现实世界的合成数据 为人工智能发展生产“原材料”

  记者 王闲乐  随着自动驾驶、ChatGPT等名词在互联网传播,越来越多人知道了人工智能技术。那么,你知道发展人工智能技术也需要“原材料”吗?  启数光轮科...

  记者 王闲乐
  随着自动驾驶、ChatGPT等名词在互联网传播,越来越多人知道了人工智能技术。那么,你知道发展人工智能技术也需要“原材料”吗?
  启数光轮科技(上海)有限公司就是这样一家生产人工智能所需要的“原材料”——数据的公司。
  “现在人工智能大模型迅速发展,对数据的需求特别大,整个互联网的数据加一起都不够用了。”启数光轮创始人谢晨说,这时候就需要通过合成数据来推动人工智能发展。他之所以从蔚来汽车辞职创业,正是看到了这一领域的广阔前景。
  为人工智能提供海量数据
  谢晨曾在英伟达、Cruise、蔚来等企业担任自动驾驶仿真负责人。在英伟达工作期间,谢晨发现,要让自动驾驶变得更安全,需要大量的训练数据。如果完全依赖于现实世界中的数据,不仅难以采集,而且存在利用率低、标注成本高和长尾场景缺乏等问题。于是,他萌生了一个大胆的想法——能不能人工合成出这些训练数据?
  “比较通俗的类比是,人工智能就像我们养殖的动物,需要吃饲料才能长大。可是单靠自然界中的饲料是不够的,所以我们得想办法去自己生产一些饲料。”谢晨说,他想到的办法是将生成式人工智能(AIGC)与仿真技术深度融合。
  仿真技术本身并不罕见,但单靠仿真技术生成的数据真实度、泛化性与效率较低,通俗来讲就是“不够真实”,因此无法解决现有难点,还需探索如何与生成式人工智能相结合。谢晨结合自己负责的自动驾驶业务,开始验证两种技术融合的可能性。
  经过反复验证,谢晨用了5年时间,终于摸索出了生成式人工智能与仿真技术最佳融合方法,由此可以生成映射现实世界的合成数据——图像或视频,通过训练算法理解和学习现有数据便可生成3D、物理真实、可泛化的新数据。
  帮助中国企业追赶特斯拉
  2023年,带着自己的研究成果,谢晨毅然决定从蔚来汽车辞职创业。
  “我们希望,通过合成数据的应用,助力中国汽车企业在自动驾驶技术上缩小与特斯拉的差距,甚至实现超越。”谢晨解释道,特斯拉现在在全球拥有上百万辆汽车,它们源源不断地传回数据、帮助人工智能不断优化。而中国车企掌握的数据可能只有特斯拉的百分之一,长此以往,双方的人工智能差距也会拉大。
  “启数光轮可以提供海量合成数据,相当于加了一个杠杆,来填补中国车企在真实数据量上与特斯拉的差异。”谢晨说,启数光轮成立后完成的第一单业务,就很好地证明了合成数据的价值。
  在业务拓展过程中,有汽车厂商告诉谢晨,企业正在研制的自动驾驶有个问题始终难以解决,就是会将路边广告牌的人物图案识别为真人进而启动刹车。如果修改识别规则,又无法鉴别真正的行人,容易造成交通事故。
  “其实这里的问题就在于企业缺乏足够多的路况数据。”谢晨的团队拿下这一单,生成了数千个包含人像广告的各类场景,并从中挑选出带有精确标注的数据。这些数据随后被该车企用于算法训练,果然有效增强了自动驾驶模型的表现。
  由此,启数光轮在业界崭露头角,作为一家初创企业在业内迅速打响了名气。成立一年多,就获得了四轮融资,得到了多家头部创投机构的认可。
  推动人工智能相关产业发展
  从在大企业做创新研发,到自主创业,谢晨坦言,这一年多的经历给了他很大挑战,也让他感到十分兴奋。
  从一开始,他就给自己的新公司定了一个长远的目标:成为数据界的英伟达。对此,谢晨很有信心。“我们有一个很棒的团队,平均年龄28岁,来自合成数据、生成式人工智能、仿真等领域的优秀技术人员占比超过90%,还有商业领域的人才。”
  目前,启数光轮在谢晨的主导下搭建了国际领先的合成数据产线,拥有多项国内外技术专利,为多家海内外知名自动驾驶公司、国内外主机厂提供产品交付并形成合作伙伴关系,累计服务客户几十余家,交付数据上亿帧,积累场景数百万个。
  “使用合成数据训练人工智能已经是硅谷的共识,但国内对这块认识还不够。”谢晨希望,通过启数光轮的一系列成功案例,让更多人意识到合成数据的价值,推动自动驾驶、具身智能等相关产业蓬勃发展。

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考;文章版权归原作者所有!本站作为信息内容发布平台,页面展示内容的目的在于传播更多信息;本站不提供任何商业咨询服务,阁下应知本站所提供的内容不能做为操作依据。如本文内容影响到您的合法权益(含文章中内容、图片等),请及时联系本站,我们会及时删除处理。


为您推荐