增强和虚拟现实AI数据:驱动下一个大事件

AI推动AR/VR前进,解锁新机遇

推特
推特
LinkedIn
分享
脸谱网
fb-share-icon

增强现实(AR/VR)和虚拟现实(AR/VR)是企业界关注的两项有前途的技术。事实上,近四分之三的行业领袖表示,他们预计这些身临其境的技术将成为现实在未来五年内成为主流高盛(Goldman Sachs)报告称,AR/VR行业将是有价值的到2025年达到950亿美元.与此同时,并行运行的是人工智能和机器学习,它们不仅正在迅速成为主流,而且现在正在被考虑关键任务现代商业。

直到最近,科技世界才开始解开AR/VR与人工智能结合背后的好处。将两者结合起来能够推动创新、新的客户体验以及与我们的世界互动的新方式。但如果没有高质量的数据,这种合作就不会成功。

增强和虚拟现实AI数据

人工智能与AR/VR:完美契合?

首先,让我们定义一下AR/VR的含义:

增强现实- 融合物理和数字环境;指使用来自摄像机,加速度计等的传感器数据的融合来覆盖物理现实的技术。口袋妖怪去是一个很常见的例子。

虚拟现实-电脑生成的模拟3D图像,使人能够与数字环境互动。

AR/VR领域传统上利用计算机视觉(不是人工智能驱动的)等技术来推进创新。但许多企业发现,这些技术和人工智能之间有着深刻的互补关系。AI擅长于许多有利于AR/VR的操作:它可以跟踪物体,创建3D世界的详细模型,了解这些模型中的特征,并据此做出判断。

AI中的深度学习模型在这里特别有用,因为它们可以识别垂直和水平平面;跟踪对象的动作和位置;在其他AR / VR同步性中,估计对象深度。换句话说,深度学习模型可以帮助AR / VR系统解释复杂的环境。自动机械师理论上可以使用AI-Powered AR系统来查看车辆的发动机,并通过该系统讲述部件需要修复的系统以及如何。

由于这些互补的特性,人工智能开始在AR/VR中取代传统的计算机视觉方法,许多行业领袖预测到这一点人工智能将有助于推动沉浸式技术的采用在消费者和商业领域。具体而言,AI可以通过应用更现实的模型来增强AR / VR经验,并给予人们更大的与场景互动的能力。

AR/VR和AI的强大合作部分得益于应用于3D模型构建的深度学习技术的进步,数据可用性和数据存储选项(如云)的提高,以及计算能力的提高。无论出于何种原因,此次整合预计将为许多行业提供令人兴奋的机遇。亚博技术支持专业的系统平台

企业如何使用人工智能和AR/VR

AI以多种方式增强AR / VR技术:通过提高内容的质量,推进和个性化用户体验,促进用户与技术之间更有效的相互作用。这是由于这些原因,许多初创公司和技术公司已经已经利用了AI动力的沉浸式技术。以下是一些令人兴奋的例子来观看:

航空航天

利用图像识别深度学习技术,人工智能和AV可以帮助工程师处理航空维修方面的问题通过精确指出飞机的哪些部件需要改进,并提供如何制造这些部件的详细说明。

零售

零售AI-Powered AR / VR的许多应用都存在于零售中。例如,包括:

  • 当购物者在商店的通道中穿行时,弹出式优惠券可能会出现在数字环境中。
  • 虚拟汽车展厅展示根据购物者的兴趣或需求定制的产品。
  • 虚拟装配室使客户能够在舒适的家中尝试衣服。
  • AR显示客户放置在自己家中的家具。

在创意产业背后,零售业可能是AR亚博技术支持专业的系统平台/VR领域的最大受益者。

军事

AI-powered VR能通过模拟危险环境指导军方成员他们的目标是在面对真实情况时降低错误率。

技术

智能眼镜最终可能会成为我们所有人的标准眼镜。这些可以给我们提供有关我们所遇到的人的有用信息。例如,如果我们遇到一位同事,我们的眼镜可以识别他在公司担任什么职位。

电信

AR/VR可能会出现在你身边的虚拟会议上。可能的应用程序包括提供身临其境的虚拟体验,让用户感觉自己是在办公室里和同事们在一起,而不是在家里的电脑前。人工智能可以添加摄像头跟踪功能(就像Facebook Portal提供的功能),这样人们的注意力就会集中在正在说话的人身上。

安全

安全部门可以利用人工智能驱动的虚拟现实技术进行身份检测和标记可疑人物的图像。

游戏

当提到AR/VR时,游戏可能是人们想到的第一个例子,特别是几年前席卷世界许多地方的Pokémon Go热潮。事实上,AR/VR技术需求强劲来自创意产业,从电子游戏开始,到现场活动和视频娱亚博技术支持专业的系统平台乐结束。AI可以帮助创造越来越逼真的游戏体验,并为玩家提供更多与数字环境互动的机会。

在上面的许多用例中,初创公司和科技公司已经在努力实现,所以这些更像是现实而不是虚构。然而,人工智能和AR/VR结合在我们的生活中真正无处不在可能还需要几年时间。

数据如何推动AI和AR/VR

生成一个基于ai的AR/VR系统需要大量的数据,这使得数据收集和标注成为构建这类技术过程中的关键步骤。数据可以从传感器(比如智能手机摄像头)、产品图片、社交网络和很多很多其他地点收集。根据用例,数据可以包括图像、视频、音频和文本,所有这些都需要用模型识别的关键特性进行标记,使这些系统成为非常复杂的项目。例如,以下是人工智能和AR/VR项目中常见的几种数据注释类型:

图像和视频

对象检测:模型学会识别图像中的对象及其位置。这可以触发命中框和侵占机,使用户能够与环境进行交互。

分类:模型学习对图像中的目标对象进行分类,然后触发显示该图像的标签。

市场细分:通常在像素级,模型学习分割图像中的目标对象。

音频

音频识别:模型处理音频,如语音,并据此进行解释。某些关键词可能会触发AR/VR效果,比如在游戏环境中。

文本

文本识别与翻译:模型学习检测和读取图像中的文本,然后将其翻译成适当的语言。增强现实技术可以将翻译后的文本覆盖到现实世界中。

在上面的例子中,你可以了解人工智能和AR/VR技术是如何整合为用户提供互动体验的。收集的数据越多,环境就可能越真实。在数据质量方面也是如此:高质量的数据将产生同样高质量的环境。此外,更多的数据,特别是关于用户本身的数据,可以为用户创建更个性化的环境。

通常,AR/VR数据由个人身份信息(PII)组成,以创建定制环境和交互。PII可能包括地理位置数据、生物特征、购买历史和其他PII。在构建这些应用程序时,数据安全性至关重要,以确保客户信息受到保护和保密。与PII合作意味着要有严格的安全协议,以实现该地区和数据类型的最高合规级别。

使用数据提供程序获得成功

虚拟世界是复杂的,构建它们不是一项简单的任务。许多公司寻求第三方数据提供商的帮助,以获得沉浸式领域的竞争优势。数据提供商可以在收集AI和AR/VR模型相关数据方面提供巨大帮助。正确的数据提供程序同样会有工具和流程来准确地注释数据,以确保生成的环境尽可能真实。

通过使用数据提供程序,您可以设置可伸缩的数据管道,以帮助您使用新的标记数据不断改进模型。模型改进将直接与增强的用户体验相关。随着现实世界的变化,您的虚拟模型也会发生变化,数据提供程序将帮助您监视系统以进行定期的再培训。

由于AI预计将成为在未来几年推动AR / VR行业的发动机,因此可以考虑以准确性提取合适的数据并以准确性注释,应将其视为为发动机提供动力的燃料。随着这项任务所需的复杂性,利用正确的数据伙伴可以为您提供竞争中的竞争优势。鉴于AI和沉浸式技术的快节奏性质,这可能是您的AI旅程的重要步骤。

唐布莱恩 - Appen高级解决方案工程师专家洞察

从根本上说,特殊的AR / VR应用程序所需的是能够理解环境以及用户如何在该环境中互动。

了解VR和AR环境

在VR中,环境是数字化创建的,这意味着环境的每个组件都可以根据环境的定义方法进行明确识别和编程交互。这里的好处是,从一开始,环境和其中的一切都是可以互换的,而无需获得任何额外的数据。此外,因为VR环境是从头开始创造的,而不是从物理世界中获取的,所以对于环境是什么有更大程度的规范。与在虚拟空间中模拟这些环境相比,捕获满足特定需求的物理环境通常是相当乏味的。

在增强现实中,环境是一个物理区域,如街道或购物通道,或您当前正在查看的区域。由于这个环境是直接从物理世界中获取的,它可能比虚拟现实环境密度大得多,必须使用一个或多个传感器来捕获数据,格式通常是(LiDAR/ Radar/ Video/ Audio/ Images/等)相互结合。

一旦从环境中捕获了数据,我们需要知道环境中是什么。这通常涉及创建一个ML模型,用于检测/分类/分割/识别与手边应用程序相关的数据中的组件。例如,如果我们有一段道路上行驶的视频,我们可能需要一个模型,给定一个视频,在视频的每一帧中识别每辆车的边界。另一个例子可能是识别写在菜单上的单词以进行自动翻译。在这两种情况下,我们首先需要创建人工标记的训练数据,其中包含从数据中检测相关区域的个体,将这些区域从完整的数据中分割出来,然后对该数据进行分类。最终的结果是,就像VR一样,我们有一个可以识别某些元素并通过编程进行交互的环境,如果我们想让用户与环境进行交互,这是必需的。

与环境互动

每个应用程序在要求用户与环境交互的方式上都是独特的。有时是智能手机,有时是智能眼镜,有时是特定的AR/VR设备。在每种情况下,用户执行的动作都必须被设备传感器捕获,然后处理/分类为该动作在AR/VR环境中的含义。举个例子,在设备摄像头前打响指;这意味着你的应用程序将需要处理视频,捕捉并识别你的手,然后检测你正在做的动作是“打响手指”。要做到这一点,您需要创建一个模型,使用人类注释的数据来标识视频中的手,以及一个模型来标识特定的手的位置。

如何开始

最好的开始方式是完全定义哪些数据可以通过编程捕获,哪些数据需要模型来处理。一旦您知道需要创建什么模型,下一步就是与数据提供者(如Appen)连接,以收集适合该用例的培训数据。收集高质量的训练数据可能与构建模型本身一样乏味,而模型的好坏取决于它所构建的数据,所以最好尽可能客观地定义您要寻找的数据,以避免任何主观混淆。

问问你自己:你如何告诉人们判断一个人是否在“打响指”?只是大拇指和中指之间的接触吗?如果没有声音产生呢?如果他们用拇指和无名指或拇指和食指折断呢?一个模型的好坏取决于它所基于的数据,这就是为什么与Appen等合作伙伴开始你的AR/VR之旅,测试和迭代项目的潜在解决方案是最好的开始方式。

我们能为你做什么

Appen收集和标签图像、文本、语音、音频和视频,用于构建和不断改进世界上最创新和最复杂的人工智能系统。拥有超过25年超过235种语言的专业知识,全球超过100万熟练的承包商,以及行业最先进的人工智能辅助数据注释平台,Appen解决方案提供技术、汽车、金融服务、零售、制造、和世界各国政府。

我们可以帮助您的组织在后期制作阶段进行数据收集、数据注释以及模型再培训和改进。机器学习助手内置在我们行业领先的注释工具中,可以节省您的时间、精力和金钱,加速您的AR/VR或其他人工智能项目的投资回报率。

了解更多有关2020欧洲杯亚博,或联系我们今天直接与某人交谈。

网站与世界级培训数据部署AI
语言