AI从炫技术到创造商业价值有几步?印奇详解旷视“2+1”AIoT核心技术
鄙视:我们期望用技术改变世界,这可能分为两部分第一部分是要真正做出好的技术,第二部分是要真正让这些好的技术为客户创造价值
虽然AI应用已经渗透到人们生活的许多角落,但AI技术本身仍然笼罩着神秘色彩,吸引着科技爱好者的目光。
在MegTech 2022旷视科技开放日上,旷视科技联合创始人兼CEO殷琦携手旷视研究院的一众技术大师,分享了AI视觉最新技术的研究创新成果和未来趋势。
此外,在技术开放日现场,轻蔑地展示了20项技术AI视觉技术的最新应用,包括瞬时相机,VR徒手交互,低功率嵌入式L2自动驾驶仪方案:等一个吸引眼球的应用。
AI技术会在多大程度和深度上改变生产和生活方式作为一家深耕AI视觉技术11年的公司,旷视科技开放日上这些技术的分享和应用可见一斑
挑战科技联合创始人兼首席执行官殷琦
殷琦表示,AI是旷视一直坚持的核心能力,而IoT是商业价值的核心载体Ldquo从视觉AI技术的创新到AIoT落地应用的实现都需要创造商业价值,三要素,AI端有两个核心元素,IoT端有一个核心元素这个2+1 ,AIoT的核心技术研究是支撑AIoT商业成功的最重要基石,它藐视眼前,不断走向新的
人工智能基础模型研究的新趋势:伟大的和Rdquo
事实上,在过去的十年中,每一代基础模型的突破都极大地推动了视觉AI的发展尤其是2012年AlexNet提出后,基于深度学习的神经网络成为AI视觉发展的主要驱动力之一根据神经网络的不同用途和构造方法,大致可以分为CNN,Transformer,基于自动神经网络架构搜索的模型,轻量级模型等这些模型在一定时期内极大地推动了当时AI的发展
到了2022年,视觉AI基本模型的研究呈现出哪些新趋势。
迪法恩斯研究院基础科学研究负责人张翔宇认为:lsquo伟大的rsquo和lsquoRsquo这是视觉人工智能基础研究的新趋势lsquo伟大的rsquo是指AI大模型利用大数据,大计算能力,大参数,提高模型的表达能力,使AI模型适用于各种任务,数据和应用场景,lsquoRsquo趋势是AI视觉研究的领域很多,开发了AI视觉的基本模型,如CNN,VL模型,变形金刚等基本的视觉应用,例如检测和分割,AI算法的进化,如优化,自监督,半监督等此前,每条研究路径都衍生出一系列算法但是这两年我们发现这些算法在底层都在走向统一例如,CNN,ViT和MLP都通过在训练过程中添加先验方法而具有相似的性能这个统一的趋势就是我们的lsquoRsquoAI系统的设计奠定了基础
不过,张翔宇也强调,模型越伟大的不一定代表越好建立大AI模型时注意边际效应递减现象,即伴随着模型参数和数据的增加,收益逐渐减少研究不仅需要伟大的努力的方向,更重要的是如何让伟大的这是当今AI视觉研究的主要趋势和挑战之一
Ldquo定义的藐视模型研究,伟大的就是以创新的算法发挥大数据,大计算的力量,拓展AI认知的边界。
目前基于伟大的和Rdquo两大趋势,忽略基础模型研究分为四个主要方向:
一,一般图像大模型本文致力于构建一个通用的,统一的,高性能的图像视觉模型创新研究方法,让伟大的真正能为性能提升服务,让大模型产生和孵化更多应用
第二,视频理解的大模型克服当前视频理解和视频建模中长期困扰业界的长序列建模问题,找到一种更高效的训练,监督和应用视频模型的方法
第三,计算摄影的大模型目前,计算摄影的许多任务和模型都是通过对图像退化模式进行建模来创建高质量的图像
第四,自动驾驶感知的大模型本研究着重于简单,高效,统一,易用的自动驾驶模型的优化,训练和部署方法
如何实现AI算法的量产。
需要注意的是,在传统意义上,我们说某样东西批量生产,一般是指同一种商品批量生产这里,鄙视说AI算法量产,可以批量产生多种算法,这些算法适用于不同的应用场景
旷视研究院算法量产负责人周尔晋表示,要实现算法量产,需要攻克数据生产的复杂性,生产过程中算法模型的不确定性,模型部署硬件平台的多样性,三个挑战。
为了加快AI算法的量产,漠视搭建了AIS算法生产平台作为算法量产领域的最新进展,该平台在本次技术开放日向公众亮相
金舟介绍,AIS算法生产平台是基于多年算法生产经验的一站式MLOps算法生产平台,包括Brain++系统,自研深度学习框架MegEngine,数据管理平台MegData和计算平台MegCompute等,可提供数据清洗,智能标注,数据管理,数据质量检查,算法自动产生,模型多维能力评估,流水线部署等全流程能力。
目前,AIS已支持100多种业务模型训练,2小时即可完成,模型输出的精度指标远高于行业平均水平,ADS模型部署工具提供了将训练好的模型一键转换到不同计算平台并支持测试评分的服务,可以大大简化从训练到部署的过程。
定义算法的硬件:AI传感器
伴随着算法的量产成为现实,如何将算法部署应用到具体的生产生活空间,才是物联网的商业价值在殷琦看来,这是鄙视算法定义硬件要解决的终极问题和要创造的价值
技术开放日,旷视研究院计算摄影负责人范浩强用计算摄影通过一个实例详细说明了算法定义硬件的意义和价值。
在范浩强看来,伴随着AI,视觉算法等领域的发展,传感器将不再单独,直接提供应用价值,它们之间需要算法作为承上启下的桥梁伴随着应用的不断升级,对算法提出了越来越多的要求,而算法也对传感器需要提供什么样的信息输入提出了要求,甚至从根本上改造了传感器的形状和样式,从而产生了定义传感器这个概念
At 计算摄影算法的引入使得智能手机能够完成高质量的月光夜景照片2022年,由旷视AI技术驱动的智能手机的拍照能力已经达到明星级别,可以在人眼难以识别的环境下拍摄出高质量的照片在这个过程中,AI算法起到了非常重要的作用
范浩强透露,目前看不上8K级别的画质希望伴随着硬件的研发和产品化,在不久的将来能和大家见面。
谈及人工智能定义的传感器的未来趋势,范浩强介绍,迪法恩斯今年将发布两项新的技术愿景:
首先,在画质维度上,提出了面向16K AI超高清的AI画质概念16K带来的改变将不仅仅是像素数量,旷视希望通过AI,传感,显示的联动,实现真正沉浸式的图像体验
第二,从物联网传感的角度来看,传感器将走向更加极致的小型化和低功耗,从而实现与每个人的日常生活和每个人自身更深层次的融合。
技术开放日现场,被轻蔑地展示,瞬时相机的应用效果瞬时相机不仅可以准确捕捉高速运动物体的细节,还可以提高相机在弱光条件下的拍摄性能
在旷视科技的开放日上,殷琦总结道:lsquo技术信念,务实价值rsquo是一种轻蔑的人才观和价值观,AIoT的核心技术研究体系才是未来十年二十年要坚持的研究方向。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。