发布时间:2024-12-29 10:08:51 来源: sp20241229
视觉AI可以通过摄像头或传感器来“感知”外部世界,能将捕捉到的图像或视频数据进行特征提取和分析,最后通过机器深度学习来区分不同物体和特征。一旦系统学会了如何识别图像中的物体,视觉AI就可以根据这些信息自动作出决策或响应。
近日,厦门浩森威视科技有限公司CEO李密向科技日报记者展示了正在训练的视觉AI“大显身手”的新场景。设计团队介绍,他们将视觉传感器安装在普通电子秤上,通过先进的算法设计,使视觉AI能迅速将物品与数据库中的图像进行匹配,从而实现精准识别。这款搭载了视觉传感器和算法的智能电子秤能够在0.5秒内精准识别480余种果蔬,并自动完成称重结算。
不同于标准化产品拥有唯一的二维码信息,散称果蔬种类庞杂、颜色外形容易混淆,同类果蔬的形态也因成熟度不同而存在差异。这对算法技术提出了很高的要求。为此,该团队不断完善算法,持续训练模型,进行了数次迭代和优化。
“通过算法设计,我们让机器能够像人类一样‘看见’并理解‘看见’的世界。”李密说,其核心技术在于先进的算法中台,能以图片数量较少的图库让机器完成深度学习。
李密介绍,通常人们在菜市场购买果蔬时,都需要人工称重结算。而有了这台智能电子秤,顾客只需自行将散装商品放在秤上扫描,摄像头捕捉到图像后,便能迅速识别出商品种类,配合系统完成自动称重结算。这一场景的推广和普及将极大提高零售业的结账效率,不仅节省了人力,也优化了顾客的购物体验。
能自动识别商品的电子秤、能矫正坐姿的台灯、能精准找出工业产品微小缺陷的系统……当前,从家居到工厂生产,视觉AI在多个创新场景中展现出强大潜力。近年来,该团队将深度学习大模型与成像技术相结合,深耕工业检测、智能识别等,已开发出10余种AI应用并用于多个场景,覆盖工业及民用领域。
作为“百度AI技术生态伙伴”之一,厦门浩森威视科技有限公司目前正着手与百度共同深入探索不同领域大模型的创新应用。在李密看来,相较于文本AI,视觉AI能够处理的信息量更大、产品效果更加直观,可应用场景多,市场潜力巨大。“随着计算能力的增强和算法的不断进步,视觉AI将在更多细分领域的创新场景中发挥关键作用。无论是在复杂的工业检测中,还是在精密的医疗诊断中,视觉AI都将成为提高效率和准确性的强大工具。”李密说。
(责编:申佳平、陈键)