广告
广告

我一个机器人公司的首席执行官,我相信人工智能已经失败在很多的承诺。这是接下来会发生什么

自主车辆需要超过99.9999%的可靠性安全性至关重要的功能,而今天的AI还不足够。

我一个机器人公司的首席执行官,我相信人工智能已经失败在很多的承诺。这是接下来会发生什么
(图片来源:Viaframe /盖蒂图片社)

除了画画写实的图像和持有看似有知觉的在许多承诺对话,人工智能已经失败了。由此导致的AI怀疑让我们面临一个选择:我们可以变得过于愤世嫉俗和站在一旁观看赢家出现,或找到一个方法来过滤噪音和识别商业突破早期参与一个历史性的经济机会。

广告
广告

有一个简单的框架,用于区分短期现实从科幻小说。我们使用的一项最重要的措施在任何技术的成熟度:管理无法预料的事件的能力通常被称为边界情况。作为一个技术变硬,它变得更善于处理越来越罕见的边界情况,因此,逐渐打开新的应用程序。

衡量不同边界情况的可靠性不同的技术。云服务的正常运行时间可靠性评估的一种方法。人工智能,更好的测量是其准确性。当一个AI未能处理优势的情况下,它产生假阳性或假阴性。精度是公制测量假阳性,回忆假阴性的措施。

这是一个重要的见解:今天的AI可以达到很高的性能,如果是专注于精密,或回忆。换句话说,它优化的另一个(即。,更少的假阳性,以换取更多的假阴性,反之亦然)。但当这两个同时实现高绩效,AI模型斗争。解决这个仍然是人工智能的圣杯。

广告

低保真与高保真的人工智能

在此基础上,我们可以分类AI分为两类:高保真和低保真。人工智能与高精度或召回是低保真的很高。和一个高精度和高召回高保真。今天,AI模型用于图像识别、个性化、内容和垃圾邮件过滤是低保真的。robo-taxis要求的模型,然而,高保真。

有几个重要的见解关于低保真的和高保真AI值得注意:

  • 低保真的工作今天:大多数算法旨在优化精度为代价的回忆,反之亦然。例如,避免丢失信用卡欺诈指控(减少假阴性),一个模型可以设计积极国旗指控欺诈的丝毫迹象,从而增加假阳性。
  • 高保真=科幻:今天,不存在任何商业应用基于高保真AI。事实上,高保真AI可能是几十年,如下所示。
  • 高保真很少需要:在许多领域,智能产品和业务决策可能下调AI需要从高保真粗放,以最小的/可接受的业务影响。为此,产品领导者必须了解人工智能和的极限把它应用在他们的设计过程
  • 时序要求严格的安全需要高保真:时效性、安全决策是高保真的人工智能的一个领域是经常需要的。这就是许多自主汽车用例集中。
  • 低保真的+人类=高保真:安全用例之外,人们往往可以达到高保真的性能通过结合人工和人类智能。产品设计可以将人类的援助在合适的时刻,是否由用户或支持人员,达到他们的期望的水平精度和召回。

量化艾未未的忠诚

一个受欢迎的度量AI可靠性评价F1的分数,这是一个类型的数字平均精度和召回,因此测量假阳性和假阴性。100%的F1代表一个完美无错的人工智能处理边界情况。根据我们的估计,一些最好的AI今天执行99%的速度,虽然分数高于90%通常被认为是高。

广告

让我们计算两个应用程序的F1的分数:

  • 如果Spotify的歌曲你喜欢95%的时间(精度),但只有表面的一半的歌曲你喜欢(召回50%),其F165%。这是一个适当的分数,因为高精度成为伟大的用户体验和较低的用户流失,而低召回不注意到用户。
  • 当robo-taxi决定是否在红绿灯十字,它是时间敏感的安全决策。吹红灯(假阴性)和意外制动绿色(假阳性)有很高的碰撞的风险。我们设计了一种方法来估计人工智能水平的精度需要实现自治和人类之间的平价司机,考虑到目前的交叉碰撞速度和其他因素。我们估计robo-taxi必须实现精度超过99.9999%和99.9999%的召回检测红灯为了与人类。这是一个F1的99.9999%或者六个9

很明显从上面的例子,F1的65%由今天的AI轻而易举就能实现的,但我们有多远从F1六9 ?

路线图高保真

正如前面所讨论的,成熟度和市场准备任何技术与它如何处理边界情况。对于人工智能,F1的分数可以是一个有用的近似为成熟。同样,等前一波又一波的数字创新网络和云,我们可以用他们的正常运行时间作为成熟的一个信号。

广告

30岁的技术,web是一种最可靠的数字体验。最成熟的网站谷歌和Gmail等目的99.999%正常运行时间(5 9),这意味着服务不可用每年不超过6分钟。这是有时错过了的,如YouTube的62年的2018分钟中断或Gmail的六个小时在2020年中断。

在大约一半的网络时代,云是不可靠。大多数服务提供的Amazon AWS的正常运行时间的SLA99.99%或四个9。一个数量级小于Gmail,但仍然非常高。

一些观察:

广告
  • 它需要几十年的时间:上面的例子表明,它往往需要几十年的边界情况成熟的阶梯。
  • 一些用例是特别具有挑战性:边界情况的极高水平性能所需的robo-taxis(6 9)甚至超过了Gmail。记住,无人驾驶也运行在计算机类似于云服务。然而robo-taxis所需的操作正常运行时间必须超过当前网络和云服务实现!
  • 狭窄的应用程序击败通用狭义:Web应用程序用例对于云服务。因此,web服务可以实现无故障运行时间高于云服务,因为广义的技术越多,越难变硬。

案例研究:并不是所有的自主权都是平等的

谷歌工程师离开他们的无人驾驶汽车团队开始他们的公司有一个共同的命题:狭义的应用自治会比一般的无人驾驶容易商业化。2017年,极光成立移动货物通过长途卡车在高速公路上。大约在同一时间,Nuro成立移动货物在小型车和速度较慢。

当我们开始我们的团队也分享本文在Postmates(也是2017年)。我们也一直在关注移动货物,但与别人相反,我们选择离开汽车,而不是专注于机器人操作从大街上小形式:自主移动机器人(amr)。这些都是在受控环境中广泛采用,如工厂和仓库。

考虑红灯检测机器人交付。时不应该交叉在红色与车辆相撞的风险,保守停止格林介绍不安全的风险。因此,类似robo-taxis的召回率(99.9999%)以及一个适度的精度(80%)会适合这个AI用例。这导致一个F1的90% (9),这很容易实现。通过移动从街头到人行道上,从一个全尺寸的汽车小机器人,人工智能精度要求降低6 9比1。

广告

机器人在这里

交付amr商业化城市自治的第一个应用程序,尽管robo-taxis仍在等待一个不可能实现的高保真AI的性能。在这个行业进步的速度,以及我们的经验在过去的五年中,强化了我们的观点商业化AI的最好方法就是专注于狭窄粗放的人工智能应用程序启用,并在需要的时候使用人工干预来达到高保真的性能。在这个模型中,低保真的AI会导致早期的商业化,后来帮助推动业务kpi和增量改进。

针对更为宽容的用例,企业可以使用粗放AI早达到商业上的成功,同时保持一个现实的视图实现高保真的多年时间轴功能。毕竟,科幻没有商业计划。


阿里沙尼的创始人和首席执行官吗服务机器人

广告

广告
广告