百摩网
当前位置: 首页 生活百科

人工智能图像入门案例(人工智能看走眼的图像都长什么样)

时间:2023-06-13 作者: 小编 阅读量: 1 栏目名: 生活百科

摄动有能力愚弄一整套不同的分类器,即使没有被训练来攻击的分类器。对人类来说,这是无法识别的,但对一个检查决策边界的人工智能系统来说,这只是一只极端的狮子罢了。据我们所知,对抗性图像从未在真实世界形成过危害。目前的结论是暂时没有新技术,但关于这些攻击在真实世界中能造成多大威胁,研究者们并未达成共识。Papernot认为,广泛存在于人工智能系统中的不足并不令人惊讶

选自the Verge

作者:James Vincent

机器之心编译

参与:Ellen Han、黄小天

威廉·吉布森(William Gibson)写于 2010 年的小说《零历史(Zero History)》中有这样一个场景:一个角色穿着迄今为止「最丑陋的 T-shirt」展开了危险的突袭,T-shirt 可使其对闭路电视(CCTV)隐身。在尼尔·斯蒂芬森(Neal Stephenson)的小说《雪崩(Snow Crash)》中,一个位图图像被用来传递可扰乱黑客大脑频率的病毒,借助计算机增强的视觉神经以腐蚀目标者的心智。诸如此类的故事形成了一种循环往复的科幻比喻:一张普通的图像具有摧毁计算机的能力。

不管怎样,这个概念并非完全虚构。去年,研究者仅仅带上花式眼镜(patterned glasses),一个商用面部识别系统就做出了错误识别。花式眼镜就是在镜框上贴上迷幻色彩的贴纸,花式的扭曲和曲线在人看来是随机的,但计算机却要在带有花式眼镜的人脸上分辨出五官,而且这些人脸的轮廓很相似。花式眼镜不会像吉布森「最丑陋的 T-shirt」那般将其从闭环电视中抹去,但是它可使人工智能错认为你是教皇,或者其他人。

带有花式眼镜的研究者以及人脸识别系统的对应识别结果。

这些类型的袭击包含在被称为「对抗机器学习(adversarial machine learning)」(之所以如此称呼是由于对手之类的存在,在该情况中,对手是黑客)大量网络安全类别中。在这一领域,「最丑陋的 T-shirt」以及腐蚀大脑的位图的科幻比喻表现为「对抗性图像」或者「愚弄式图像」,但是对抗性袭击具有形式,如音频甚至是文本。2010 年早期,大量的团队各自独立发现了这一现象的存在,他们通常把可对数据进行分类的机器学习系统「分类器」作为目标,比如谷歌图片中的算法可为你的照片打上食物、假期和宠物等标签。

对于人而言,愚弄式图像就像是一个随机的扎染图案或者突发的电视噪点;但是对图像分类器而言,它却可以自信的说出:「看,那是一只长臂猿」或者「一个如此亮眼的红色摩托车」。就像花边眼镜使人脸识别系统发生了错误识别,分类器处理了混乱到人类永远无法识别的图像视觉特征。

这些图案可以各种方式绕过人工智能系统,并对未来的安全系统、工业机器人和自动驾驶汽车等需要人工智能识别物体的领域有重大意义。2015 年有关愚弄式图像论文的联合作者 Jeff Clune 告诉 The Verge:「想象一下你身处军队,正在使用一个自动锁定目标的武器系统,你绝不希望敌人把一张对抗性图像放在了医院的楼顶,系统锁定并攻击了医院;或者你正在使用同一个系统追踪敌人,你也绝不喜欢被愚弄式图像骗了,[并] 开始用你的无人机紧盯着错误的目标车辆。」

愚弄式图像以及人工智能识别的对应结果。

这些情节是假设的,但却非常具有可行性,如果继续沿着当前的人工智能路径发展。Clune 说:「没错,这是一个研究社区需要共同面对的大问题。」防御对抗性攻击的挑战有两方面:我们不仅不确定如何有效地反击现有攻击,而且更多高效的攻击变体在持续增长。Clune 及其联合作者 Jason Yosinski 和 Anh Nguyen 描述的愚弄式图像容易被人类发现,它们就像是视觉幻觉或者早期的网络艺术,满是斑驳的色彩与图案重叠,但是有更为微妙的方法运用它们。

摄动可像 Instagram 滤镜一般被用于图像

有一类被研究者称为「摄动(perturbation)」的对抗性图像几乎对人眼不可见,它作为照片表面上的像素涟漪(ripple of pixels)而存在,并可像 Instagram 滤镜一般被用于图像。这些摄动发现于 2013 年,在 2014 年一篇名为「解释和利用对抗性实例(Explaining and Harnessing Adversarial Examples)(链接:https://arxiv.org/abs/1412.6572)」的论文中,研究者演示了摄动的灵活性。摄动有能力愚弄一整套不同的分类器,即使没有被训练来攻击的分类器。一项名为「通用对抗性摄动(Universal Adversarial Perturbations)(链接:https://arxiv.org/pdf/1610.08401v1.pdf)」改进研究通过成功地在大量不同的神经网络上测试摄动,使得这一特征明确起来,上个月引起了众多研究者们的关注。

左边是原始图像,中间是摄动,右边被摄动的图像。

使用愚弄式图像黑进人工智能系统有其局限性:第一,需要花费更多时间制作加扰的图像,使得人工智能系统认为其看到的是一张特殊的图像而不是产生了随机错误。第二,为了在起初生成摄动,你经常——但不总是——需要获取你要操控的系统的内部代码。第三,攻击并不是一贯高效。就像论文「通用对抗性摄动」所述,在一个网络中成功率为 90% 的摄动也许在另外一个网络之中只有 50-60% 的成功率。(也就是说,如果一个存在问题的分类器正在指引一辆自动驾驶半式卡车,甚至 50% 的错误率都是灾难性的。)

为了更好地防御愚弄式图像,工程师开始了「对抗性训练」。这需要为分类器输入对抗性图像,从而让分类器可以学习识别并忽略它们,就像保镖通过脸面照片识别酒吧禁止入内之人。不幸的是,正如宾夕法尼亚州立大学毕业生 Nicolas Papernot(关于对抗性攻击他写了大量论文)所解释的,在「计算密集型策略」面前,即使这种训练也很脆弱(即,向系统输入足够的图像,它最终仍会出错)。

被摄动的图像,以及对应的人工智能识别的结果。

更困难的是,这类攻击奏效或失败的原因并不清晰。一种解释是对抗性图像利用一种被称为「决策边界」的特征,其在很多人工智能系统中都存在。这些边界是不可见的规则,它们调控了系统如何判别,如,狮子和豹子之间的不同。一个很简单的只区分这两类动物的人工智能项目将最终创造出一个意境地图。想像在一个 X-Y 平面内:右上角分布着所有该人工智能系统见过的豹子,而左下角分布着狮子。将这两个部分分开的直线——狮子变成豹子,豹子变成狮子的边界——称作决策边界。

Clune 说道,对于分类来说,决策边界方法的难题是它太绝对,太武断。「你对神经网络所做的所有事情仅仅是训练它们在各类数据间画线,而不是对它们建模以识别出它们代表了豹子还是狮子。」像这样的系统可以通过一个确定的、用各种方式操作。为了愚弄狮子-豹子分析器,你可以拍一张狮子的照片并把它的特征推到奇特的极端,但仍然让它变现为正常的狮子:给它如同挖掘装备的,和校车一般大小的爪子,以及如同燃烧的太阳一般的长鬃毛。对人类来说,这是无法识别的,但对一个检查决策边界的人工智能系统来说,这只是一只极端的狮子罢了。

据我们所知,对抗性图像从未在真实世界形成过危害。但谷歌大脑的研究科学家,联合著述了《解释和利用对抗性实例》的 Ian Goodfellow 认为这种潜在的威胁从未被忽视。「研究社区,尤其是谷歌,正在严肃地对待这个问题,」Goodfellow 说道。「并且我们正努力致力于发展更好的防御措施。」大量组织,如伊隆·马斯克创立的 OpenAI,目前正在进行或发起关于对抗性攻击的研究。目前的结论是暂时没有新技术,但关于这些攻击在真实世界中能造成多大威胁,研究者们并未达成共识。例如,已存在大量攻击自动驾驶汽车的方法,它们并不依赖于计算复杂的摄动。

Papernot 认为,广泛存在于人工智能系统中的不足并不令人惊讶——分类器被训练成「拥有好的平均表现,而并不总是针对最坏情况的表现——这是典型的从安全角度出发的观点。」也就是说,比起它的平均表现,研究者较少担心系统发生灾难性的错误。「一种处理棘手的决策边界的方法,」Clune 说道,「是使得影像分类器知晓它们无法分类什么目标,而不是试图将数据拟合进某一类。」

与此同时,对抗性攻击也激发了更深层与概念化的思考。相同的愚弄式图像可以扰乱谷歌、Mobileye 或 Facebook 独立开发的人工智能系统的「心智」,整体上揭示了当代人工智能特有的不足。

「仿佛所有这些不同的网络围坐一起,互相诉说为什么这些愚蠢的人类认识不到这个噪点图里实际上是一个海星,」Clune 说道。「那相当有趣且神秘;所有这些网络都同意这些疯狂和非自然的影像实际上属于同类。那种程度的收敛真让人惊讶。」

对 Clune 的同事 Jason Yosinski 来说,在愚弄式图像上的研究表明人工智能和自然界创造的智能之间存在令人惊讶的共同点。他注意到人工智能及它们的决策边界所犯的同类错误也存在于动物世界中,在这里动物们被「超常刺激」所愚弄。

这些刺激是自然界现象的人工版,怂恿动物违背它们的天性。这一行为首先于二十世纪五十年代被发现,当时研究者们用它使得鸟类忽视它们自己的蛋而更偏爱颜色更鲜艳的赝品,或者使得红肚棘鱼将垃圾当作竞争对手而进行争斗。只要有大的红肚绘在垃圾上面,鱼就将与其争斗。一些人曾认为人类成瘾行为,如快餐和色情文学,也是超常刺激的例子。鉴于此,人们可以认为人工智能犯的错误是自然而然的。但遗憾的是,我们需要人工智能有能力避免这些错误,表现得更好。

    推荐阅读
  • 教育孩子不浪费粮食心得(小智课堂认识七大浪费)

    而我们在现场需要识别进行改善的浪费更多是非必需的。认识七大浪费1搬运浪费》定义由于存在不必要的搬运距离,或由于暂时性放置导致的多次搬运所产生的浪费。6过量生产》定义指生产量超过客户的实际需求量或相对实际需求实践过早或提前生产所造成的浪费。7缺陷浪费》定义不是指缺陷本身,而是指处理缺陷往下游流动而采取的任何流程环节的设计,比如返工、找回或报废流程、挑选、质检等。

  • 万孚火花塞质量怎么样 万孚火花塞质量好吗

    万福火花塞虽然上市时间不长,但依然受到消费者的好评。万福火花塞的绝缘体采用95%氧化铝瓷,绝缘性好,导热性好,机械强度高,能承受高温热冲击和化学腐蚀,从而延长火花塞的使用寿命,提高安全系数。外壳采用钢制零件,具有符合ISO国际标准的六角螺纹,可以将火花塞稳定在气缸盖上,提高安全系数。定期保养可以延长火花塞的使用寿命,同时降低油耗。

  • 夏洛特的网简介(夏洛的网主要内容简介)

    就在这时,一个恐怖的消息传来——威尔伯将要成为人类餐桌上的美食。威尔伯绝望了,这时,看似渺小的夏洛却挺身而出。这些词语彻底改变了威尔伯的命运,使得它在集市的大赛中赢得了特别奖和一个美好的未来。当威尔伯正想向夏洛道谢时,它才发现,夏洛的生命却走到了尽头。这种奉献是不需要回报的,夏洛为了朋友,为了友情,为了爱,甚至不惜牺牲自己的生命。

  • 蹙怎么读(蹙的拼音是什么)

    下面内容希望能帮助到你,我们来一起看看吧!蹙,汉语词汇,通“蹴”,汉语拼音为cù,不属于常用字,可与部分汉字组成不同词组,有多种不同的意思,如有紧迫、皱,收缩、局促不安之意。蹙还可以组词为哀蹙,蹙起。举疾首蹙頞而相告。

  • 游泳圈怎么减 肚子上的游泳圈怎么快速减掉

    几分钟过后即使你感觉很累,肌肉发酸,但千万不要放弃,一定要坚持。高纤维食物,像是水果、蔬菜,这些食物是低卡路里之余,又可以让你有饱腹感。专家指出,要想低脂减肥食谱可行,就必须加入大量的高纤维食品才行。相反,低脂减肥食谱如果不摄入足够的纤维素,反而是摄入高糖、高盐的食物,就会导致减肥反弹。

  • 保时捷刮蹭事件说要80万(浙江小伙155万新买的保时捷突然)

    4S店的检测结果,是车子的电池出了问题。4S店方面承认,小罗车子出现的故障,确实是质量问题导致。原来,小罗买的这辆保时捷挂在他们家公司名下。小罗这辆车显然属于公司用车,并不适用三包法的规定。4S店给的补偿方案,小罗不接受,他认为,车辆维修后的折损,应该由4S店承担,他提出了20万的补偿方案,4S店拒绝了。根据律师建议,目前,小罗打算寻求第三方鉴定机构,先对车辆的折损进行评估,再寻求解决方案。

  • 微软一季度总营收417 亿美金(资讯微软第三财季营收493.60亿美元)

    资讯微软第三财季营收493.60亿美元今日微软正式公布了其2022财年第三财季财报财报显示,微软第三财季营收为493.60亿美元,与去年同期的417.06亿美元相比增长18%,不计入汇率变动的影响(不按照美国通用会计准则)为同比增长21%。

  • 白菜炖土豆的家常做法(怎么做白菜炖土豆)

    白菜炖土豆的家常做法主料:土豆(黄皮),350克;白菜150克。配料:料酒10克;盐4克;味精2克;白砂糖2克;酱油5克;大葱8克;姜8克;大蒜(白皮)8克;大红辣椒(若干);猪油(炼制)50克。将土豆去皮,切成3厘米长、1厘米见方的条,洗净后沥水。锅内加油烧热,放入葱、姜、蒜炝锅,烹入料酒、酱油,放入土豆条、白菜条,放鲜汤、白糖、大红辣椒、精盐烧开,炖至土豆、白菜熟透,加味精,出锅装汤碗即成。

  • 寓意幸福快乐的花(龙胆花花语)

    可能正是由于这种苦味才赋予了这朵花一个这么忧伤而又动人的花语。其实,龙胆草的花并不丑,生命力也十分顽强,在悬崖边、道路旁、树林中随时都可以看见龙胆草的身影。从远处看过去,它们一片一片地盛开着,整座山显得异常的好看。龙胆草历史悠久,植物学家都亲切地称它们为“植物活化石”,这种草在我国西藏自治区比较常见。

  • 感冒就是新型冠状病毒吗 感冒跟新型冠状病毒

    现在新冠病毒有开始流行,而感染新冠的一种明显症状就是感冒发烧,生活中很多人不能正确区分两者,那么感冒就是新型冠状病毒吗?普通感冒和新型肺炎的区别?