百摩网
当前位置: 首页 生活百科

清华大学论文产出效率(文本也有攻防战)

时间:2023-08-22 作者: 小编 阅读量: 1 栏目名: 生活百科

文本也有攻防战在自然语言处理领域,对抗样本的攻击与防御近来受到很多研究者的关注,我们希望构建更稳健的NLP模型在本文中,我们简要讨论了攻防的概念,并介绍了清华大学近日开源的NLP对抗样本攻防必读论文列表自然语言处理。

在自然语言处理领域,对抗样本的攻击与防御近来受到很多研究者的关注,我们希望构建更稳健的 NLP 模型。在本文中,我们简要讨论了攻防的概念,并介绍了清华大学近日开源的 NLP 对抗样本攻防必读论文列表。

自然语言处理方面的研究在近几年取得了惊人的进步,深度神经网络模型已经取代了许多传统的方法。但是,当前提出的许多自然语言处理模型并不能够反映文本的多样特征。因此,许多研究者认为应该开辟新的研究方法,特别是利用近几年较为流行的对抗样本生成和防御的相关研究方法。

使用对抗样本生成和防御的自然语言处理研究可以基本概括为以下三种:1. 用未察觉的扰动迷惑模型,并评价模型在这种情况下的表现;2. 有意的改变深度神经网络的输出;3. 检测深度神经网络是否过于敏感或过于稳定,并寻找防御攻击的方法。

Jia 和 Liang 首先考虑在深度神经网络中采用对抗样本生成(或者「对抗攻击」,两者皆可)方法完成文本处理相关任务。他们的研究在自然语言处理社区很快获得了研究方面的关注。

然而,由于图片和文本数据内在的不同,用于图像的对抗攻击方法无法直接应用与文本数据上。首先,图像数据(例如像素值)是连续的,但文本数据是离散的。其次,仅仅对像素值进行微小的改变就可以造成图像数据的扰动,而且这种扰动是很难被人眼差距的。但是对于文本的对抗攻击中,小的扰动很容易被察觉,但人类同样能「猜出」本来表达的意义。因此 NLP 模型需要对可辨识的特征鲁棒,而不像视觉只需要对「不太重要」的特征鲁棒。

DeepWordBug 的深度网络攻击示例。选自 arXiv:1902.07285

与图像领域一样,有进攻就会有防御,目前也有很多研究尝试构建更鲁棒的自然语言处理模型。例如在 CMU 的一篇对抗性拼写错误论文(arXiv:1905.11268)中,研究者通过移除、添加或调序单词内部的字符,以构建更稳健的文本分类模型。这些增减或调序都是一种扰动,就像人类也很可能出现这些笔误一样。通过这些扰动,模型能学会如何处理错别字,从而不至于对分类结果产生影响。

对抗性拼写错误导致的情感误分类,与通过字识别防御手段获得的更稳健模型。选自 arXiv:1905.11268

除了文本分类,也有很多研究者通过对抗训练构建更稳健的翻译系统。清华大学刘洋老师表示,如果我们修改原文的某个字,那么很可能译文就完全变了,目前的 NMT 系统并不是太稳健。

刘洋老师表示,目前比较多的方法是在训练中加入噪声而让 NMT 模型学会抵御随机扰动。如下图所示,X 是正确的输入,会加一些噪声以形成 X'。当我们用神经网络进行学习的时候,会生成两种内部表示 H_x 和 H_x'。我们希望这两种内部表示对于判别器 Discriminator 是不可区分的,如果不可区分,就说明噪声不会对预测做出更大的影响。

其中噪声可以是从真实数据获取的人类误差,也可以是随机生成的噪声。当机器翻译模型能抵御这些噪声,那么它就非常鲁棒了。

NLP 对抗样本攻防战必读论文

虽然,自然语言领域的对抗攻防仍然有很多困难,但目前已经有一批优秀的论文。最近清华大学杨承昊、岂凡超和臧原同学整理了一份必读论文,其从整体的综述论文到攻击、防御方法介绍了该领域的前沿研究工作。如下仅展示了论文名,具体的论文地址可查看原 GitHub 项目。

项目地址:https://github.com/thunlp/TAADpapers

综述论文

文本攻击与防御的论文概述:

  • Analysis Methods in Neural Language Processing: A Survey. Yonatan Belinkov, James Glass. TACL 2019.
  • Towards a Robust Deep Neural Network in Text Domain A Survey. Wenqi Wang, Lina Wang, Benxiao Tang, Run Wang, Aoshuang Ye. 2019.
  • Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey. Wei Emma Zhang, Quan Z. Sheng, Ahoud Alhazmi, Chenliang Li. 2019.

黑盒攻击

  • PAWS: Paraphrase Adversaries from Word Scrambling. Yuan Zhang, Jason Baldridge, Luheng He. NAACL-HLT 2019.
  • Text Processing Like Humans Do: Visually Attacking and Shielding NLP Systems. Steffen Eger, Gözde Gül ¸Sahin, Andreas Rücklé, Ji-Ung Lee, Claudia Schulz, Mohsen Mesgar, Krishnkant Swarnkar, Edwin Simpson, Iryna Gurevych.NAACL-HLT 2019.
  • Adversarial Over-Sensitivity and Over-Stability Strategies for Dialogue Models. Tong Niu, Mohit Bansal. CoNLL 2018.
  • Generating Natural Language Adversarial Examples. Moustafa Alzantot, Yash Sharma, Ahmed Elgohary, Bo-Jhang Ho, Mani Srivastava, Kai-Wei Chang. EMNLP 2018.
  • Breaking NLI Systems with Sentences that Require Simple Lexical Inferences. Max Glockner, Vered Shwartz, Yoav Goldberg ACL 2018.
  • AdvEntuRe: Adversarial Training for Textual Entailment with Knowledge-Guided Examples. Dongyeop Kang, Tushar Khot, Ashish Sabharwal, Eduard Hovy. ACL 2018.
  • Semantically Equivalent Adversarial Rules for Debugging NLP Models. Marco Tulio Ribeiro, Sameer Singh, Carlos Guestrin ACL 2018.
  • Robust Machine Comprehension Models via Adversarial Training. Yicheng Wang, Mohit Bansal. NAACL-HLT 2018.
  • Adversarial Example Generation with Syntactically Controlled Paraphrase Networks. Mohit Iyyer, John Wieting, Kevin Gimpel, Luke Zettlemoyer. NAACL-HLT 2018.
  • Black-box Generation of Adversarial Text Sequences to Evade Deep Learning Classifiers. Ji Gao, Jack Lanchantin, Mary Lou Soffa, Yanjun Qi. IEEE SPW 2018.
  • Synthetic and Natural Noise Both Break Neural Machine Translation. Yonatan Belinkov, Yonatan Bisk. ICLR 2018.
  • Generating Natural Adversarial Examples. Zhengli Zhao, Dheeru Dua, Sameer Singh. ICLR 2018.
  • Adversarial Examples for Evaluating Reading Comprehension Systems. Robin Jia, and Percy Liang. EMNLP 2017.

白盒攻击

  • On Adversarial Examples for Character-Level Neural Machine Translation. Javid Ebrahimi, Daniel Lowd, Dejing Dou. COLING 2018.
  • HotFlip: White-Box Adversarial Examples for Text Classification. Javid Ebrahimi, Anyi Rao, Daniel Lowd, Dejing Dou. ACL 2018.
  • Towards Crafting Text Adversarial Samples. Suranjana Samanta, Sameep Mehta. ECIR 2018.

同时探讨了黑盒和白盒攻击

  • TEXTBUGGER: Generating Adversarial Text Against Real-world Applications. Jinfeng Li, Shouling Ji, Tianyu Du, Bo Li, Ting Wang. NDSS 2019.
  • Comparing Attention-based Convolutional and Recurrent Neural Networks: Success and Limitations in Machine Reading Comprehension. Matthias Blohm, Glorianna Jagfeld, Ekta Sood, Xiang Yu, Ngoc Thang Vu. CoNLL 2018.
  • Deep Text Classification Can be Fooled. Bin Liang, Hongcheng Li, Miaoqiang Su, Pan Bian, Xirong Li, Wenchang Shi.IJCAI 2018.

对抗防御

  • Combating Adversarial Misspellings with Robust Word Recognition. Danish Pruthi, Bhuwan Dhingra, Zachary C. Lipton. ACL 2019.

评估

对文本攻击和防御研究提出新的评价方法:

  • On Evaluation of Adversarial Perturbations for Sequence-to-Sequence Models. Paul Michel, Xian Li, Graham Neubig, Juan Miguel Pino. NAACL-HLT 2019
    推荐阅读
  • 国产阿奇霉素副作用比进口大(你足够了解它么)

    建议当阿奇霉素与辛伐他汀合用时,必须控制辛伐他汀的日剂量在20mg以内并注意定期检查肝功能。阿奇霉素药品说明书及《抗菌药物临床应用指导原则》要求:哺乳期妇女用药期间应暂停哺乳。当与其它有肝损害作用的药物合用,应注意观察肝炎症状和体征。据调查研究表明这种现象与患者持续大剂量使用该品有关,通过对这些患者的随诊,发现大多数患者的听力可恢复。

  • gre词汇大全18个(GRE单词三遍cronyism)

    GRE单词三遍cronyismcronyism英/ˈkrəʊniɪzəm/美/ˈkroʊniɪzəm/n.任人唯亲;任用亲信考点1:n.任人唯亲,对好朋友的偏袒:favoritismshowntooldfriendswithout。

  • 小儿推拿对厌食没有效果(小儿推拿治厌食)

    小儿推拿手法:以食、中、无名三指,揉动小儿肚脐直上方4寸位置之中脘穴,反复约30--50次。小儿推拿手法:用一只手握住孩子的手腕,使其掌心向上,然后用中指、食指指腹自孩子腕横纹推向肘横纹,直推300-500次,推的方向一定是从腕到肘,不可反向操作!小儿推拿手法:用拇指指端着力按揉30-50次。

  • 明孝宗朱祐樘生平(明朝一夫一妻制的皇帝)

    然而,朱祐樘却能宽厚待人,不予追究,且温柔的对待文武百官和妻子。然而,朱祐樘登基后,不仅没有剥夺万贵妃的封号,也没有为难万贵妃的家属。曾经有大臣弹劾万喜等人,认为按照他们的罪过,以及万贵妃曾经得罪朱祐樘的行为,应当将他们处死。然而朱祐樘顾忌着张皇后,只是找张氏兄弟谈话,责其收敛,对于小的过错,基本不予追究,这是他令人诟病的一点。

  • 如何去掉毛胚余量(毛胚软化及润滑处理方法)

    毛胚软化及润滑处理方法一、冷挤压件毛坯的形状与尺寸在进行冷挤压工艺设计之前,要研究制件的挤压工艺性,并对不适合挤压加工的形状与尺寸进行修改,确定挤压件图,然后根据挤压件图计算毛坯尺寸1.毛坯形状的确定挤压件的毛坯形状设计是。

  • 杭州亚运会是什么内容(杭州亚运会是哪些内容)

    杭州亚运会是什么内容第19届亚洲运动会将于2022年09月10日至2022年09月25日在中国浙江省杭州市举行,杭州是中国第三个取得亚运会主办权的城市。北京曾于1990年举办第11届亚运会,广州曾于2010年举办第16届亚运会。截止目前,杭州亚运会拟设比赛项目40项,其中包括31个奥运项目和9个非奥项目。2019年9月10日下午,杭州2022年第19届亚运会倒计时三周年暨开闭幕式创意文案、主题口号征集启动仪式在杭州举行。

  • 得不到才是最好的爱情(来不及说我爱你爱情与人性的较量中)

    后来又因为尹静琬要解救未婚夫许建璋,再次与慕容沣相遇,两人产生感情。小说的结尾,尹静琬与慕容沣还有他们的女儿相拥而死。许建璋在进药的时候被抓捕,有生命危险。尹静琬去找慕容沣,在慕容沣的帮助下,许建璋被救出。她明知慕容沣已经与尹静琬结合,却逼迫慕容沣发布声明断绝与尹静琬的关系。他恶毒,制造车祸害死了自己的孩子。他认为尹静琬已经为他抛弃了一切,还可以继续舍弃下去。

  • 东西掉下水道用什么方法捞(东西掉下水道怎样捞)

    东西掉下水道用什么方法捞?小物品掉到下水道之后千万别急着把软管揪上来??下面希望有你要的答案,我们一起来看看吧!如果拔掉软管看地下的管道里还是没有东西的话,不论小物品有多么的珍贵请不要太着急,比如说:砸地、砸管道,或者到楼下卸顶棚切管道,那都是不可取没有根据的做法,主要是因为不确定小物品是否在里面或是不确定在管道的精确位置,大动作一砸一震动,有可能让小饰物滑进主管道当中,再想找也就是比登天了。

  • 冰冻肉拿出来解冻要多久(能在冰箱冷冻多久)

    能在冰箱冷冻多久肉可谓是餐桌上的“主角”,它不仅美味,还是人体获得能量、摄入蛋白质的主要来源再加上近期疫情反复,不少人都动了囤肉的念头那么问题来了,买回家的鲜肉,到底能储存多久呢?有没有什么讲究呢?别着急,接下来小编。

  • 炒菜怎样防止油锅起火(厨房炒菜油锅起火时用什么方法处理最好)

    冷却灭火若是油锅起火的周边有生冷的蔬菜或者其他的肉类等食物的话,可以将其放入到油锅中,迅速将锅中的油的温度降下来,使其达不到燃烧点,从而火就会被灭掉。同时在灭火的时候一定要注意自身的保护,要在安全的情况下进行灭火,否则可及时拨打火警电话119。有上可知,若是出现了起火的原因,可能是因为热锅中有水和油,发生四溅而使油遇到了火源,从而引起的起火。