图像处理用户案例

推特
推特
linkedin
分享
脸谱网
fb-share-icon

大多数计算机视觉的商业应用都涉及到识别图像中的实际内容。因为视觉信息是如此密集的信息,有很多工作要做。然而,计算机视觉并没有取代人类,而是最普遍地增强了人类的能力。换句话说:计算机视觉项目通常是关于创建一个工作流,在这个工作流中,人们处理复杂的、创造性的或独特的人工任务,而机器处理其余的工作。但最终目标是什么呢?这些事业的实际目的是什么?我们如何从更高的层次来思考它们?虽然您可以按行业或实际的注释工具本身进行分类,但按主题进行分类可能更有趣。

您可以将绝大多数图像处理任务放入以下四个桶中:

  • 用户创造力
  • 社交联系
  • 总体效率
  • 安全

让我们从创造力开始。

创造力

我们常常认为,商业计算机视觉的目标是帮助人们做更多的事情,或者更快/更有效地完成它们。但在某些情况下,组织实际上更感兴趣的是激励客户或激发他们的想象力。

例如,在实际水平,在上面帮助人们从其巨大的数据库中找到合适的图像,但他们还建议基于客户选择的照片中的内容的特定编辑。这是人们希望与与景观相比,人们想要做不同的事情的事实。因此,虽然我们可以说在图像搜索周围有一个用例,但要更好地关注搜索,因为知道图像的内容让它们更具体地与用户所做的事情更具体。

邻近用例利用用户行为来揭示意图并激发创造力。例如,发布很多厨房图片的人Pinterest.可能计划改造。实际上,Lowe一直在探索如何将一个人的整页大头针,与劳氏的目录进行匹配,找到相似的物品,然后将所有这些碎片视觉上组装在一起。其商业意图是出售一个全新的厨房,但它的成功与劳氏如何帮助用户梦想,并将这些梦想变成现实有关。

标题:计算机视觉可以让你识别用户可能在社交媒体上发布的商品,并在你的目录中找到类似的东西;在这里,劳氏(Lowe 's)帮助组装了微软全息透镜(Microsoft HoloLens)的厨房

留在Pinterest中,他们的“店铺装备”能力可以放在创意和社会桶中 - 人们想要看起来不错,所以他们点击一件衣服并找到各种各样的版本。

计算机在一系列轴上挑选相似性的计算机可以为各种建议供电。这就是说:可以识别什么使蓝色高潮成为蓝色高潮可以使用该信息推荐视觉上类似的产品。

相似的另一面是不寻常,例如,爱德华·蒙克的《呐喊》完全不同于之前的作品但随意接下来可能发生什么。在商业领域,这是挑选突出图像或新颖风格的能力。产品地图或视觉空间中的奇数位置通常存在异常的东西,可能会告诉您一些关于客户甚至开始识别趋势的新的和重要的东西,因为这些不寻常的物品变得更加流行或更少的时间。

连接

人类是社会性动物,所以很多看似关于搜索/检索的项目实际上是关于我们如何与他人相处的。

这是最明显的Facebook的面部识别,它能找到并提示有朋友和家人的照片。与此同时,苹果使用高级计算机模型来帮助搜索你的照片,比如说,一只狗。即使你没有像在Facebook上那样注释任何图片,这个模型也会帮助你在相册中找到你最喜欢的狗狗。

现在,既然分享是人们寻找照片的核心原因,你就应该让分享成为产品设计中突出而简单的一部分。随着时间的推移,你还可以了解用户个人或集体分享的照片的质量。也就是说,您可以构建反馈循环,使用户操作成为训练数据这样你的系统就会越来越聪明。

在这个静脉中,Trulia网站记录人们在应用程序中看到各种照片的人们看看各种照片,他们将此用于intuit用户喜欢的东西以及了解用户的远程主题,下降到搪瓷和结束的级别相关联注意和房屋销售。这是一个特别好的地方:个人用户行为在更长的时间内以更高的更高,更通用的水平丰富数据。

监控照片内部信息还可以让公司在社交媒体上识别产品。相对简单的文本分析可以告诉你人们是如何提到你的产品的,视觉模型可以帮助你知道产品在Instagram或其他平台上出现的频率。了解一个人的服装和汽车风格也可以帮助他们找到相关产品。你也可以将人与地点配对——如果你去一个新城市,长得像你的人会去哪里?你可以想象,很多计算机视觉应用程序都需要仔细的道德反思,考虑它们对隐私和社会隔离的影响。

标题:如果你是一个品牌,右下角的情绪远远左下角

最后,还有许多公司喜欢Affectiva这是从照片和视频中识别情感。在一家零售店连锁店发生了多少微笑或皱眉?或者思考与客户服务代理商的视频聊天。虽然代理商出席客户的特殊需求,但计算机视觉应用程序可以看出互动,看看客户面临的挫折和救济程度。了解人们在商店或帮助呼叫中的感受如何帮助品牌与客户联系,并最终提供更好的产品和经验。

效率

计算机愿景最简单的商业应用程序来自帮助人们更高效;而不是修复问题,只需帮助人们知道在哪里看。例如,在内容审核中,您可以培训模型来查找令人反感的图像,而不必创建一堆人类内容审阅者,其中包含在网站上发布的更令人不安的事情。

效率也落后于计算机愿景的许多医疗/医疗保健应用。目标不是取代诊断人员,而是指导他们的努力。除了普通没有看不到数百个的放射学扫描,而不是看几百个,除了普通的情况下,仅显示模型发现的图像或算法不是非常自信的图像。

如果有水分配的规定,但你看到一堆翡翠绿色草坪在贝弗利山上的豪宅,你可以自信地有违规行为。一台机器通过占地面积的卫星照片而不是人类做那个 - 或者去挨家挨户的人更容易进入船只。但模特这样创造的模型OmniEarth可以用来区分池塘和卫星照片中的水池。

有多种用于空中和卫星照片的用途,也许最宽阔的是涉及砍伐森林和城市化。麻省理工学院媒体实验室已致力于找到更安全,不那么安全的城市以及理解是什么让城市繁荣.同样,使用空中照片来检测伐木道路,这些道路是登录雨林的前兆,使执法更有效。

标题:也许这对干旱来说太绿了?

安全

在某些情况下,像处理干旱一样,监视是公众的好处。大多数人还考虑到安全检查站面部识别的情况。

但在什么情况下,这就会变得过于咄咄逼人了?例如,当我们沿着街道走还是或者怎么样用面部扫描来买厕纸在公共厕所?

这里有一个黑色镜子/少数群体报告方案,用于对没有做错任何事的人进行分类。虽然当相机看起来时,有工作要让人们私下 -面漆服装这可能最终导致一些非常棒的时尚宣言除了隐私 - 这是一个日益增长的问题,我们将在未来几年内听到越来越多的问题。

结束

gpu的可用性,对图像进行标注和评分的能力,以及模型的稳步改进,这些都使计算机视觉比以往任何时候都更加可行。虽然上面的列表不是完全详尽的,但一般来说,你可以把很多计算机视觉项目分成上面的几个部分。

如果您错过了我们以前的博客文章有关范围和设计计算机视觉项目,请检查一下.下周四,我们将以计算机视觉三部曲中的第三部来结束这个系列。现在吗?感谢你的阅读。

使用世界级培训数据部署AI的网站