百摩网
当前位置: 首页 生活百科

清华大学论文产出效率(文本也有攻防战)

时间:2023-08-22 作者: 小编 阅读量: 4 栏目名: 生活百科

文本也有攻防战在自然语言处理领域,对抗样本的攻击与防御近来受到很多研究者的关注,我们希望构建更稳健的NLP模型在本文中,我们简要讨论了攻防的概念,并介绍了清华大学近日开源的NLP对抗样本攻防必读论文列表自然语言处理。

在自然语言处理领域,对抗样本的攻击与防御近来受到很多研究者的关注,我们希望构建更稳健的 NLP 模型。在本文中,我们简要讨论了攻防的概念,并介绍了清华大学近日开源的 NLP 对抗样本攻防必读论文列表。

自然语言处理方面的研究在近几年取得了惊人的进步,深度神经网络模型已经取代了许多传统的方法。但是,当前提出的许多自然语言处理模型并不能够反映文本的多样特征。因此,许多研究者认为应该开辟新的研究方法,特别是利用近几年较为流行的对抗样本生成和防御的相关研究方法。

使用对抗样本生成和防御的自然语言处理研究可以基本概括为以下三种:1. 用未察觉的扰动迷惑模型,并评价模型在这种情况下的表现;2. 有意的改变深度神经网络的输出;3. 检测深度神经网络是否过于敏感或过于稳定,并寻找防御攻击的方法。

Jia 和 Liang 首先考虑在深度神经网络中采用对抗样本生成(或者「对抗攻击」,两者皆可)方法完成文本处理相关任务。他们的研究在自然语言处理社区很快获得了研究方面的关注。

然而,由于图片和文本数据内在的不同,用于图像的对抗攻击方法无法直接应用与文本数据上。首先,图像数据(例如像素值)是连续的,但文本数据是离散的。其次,仅仅对像素值进行微小的改变就可以造成图像数据的扰动,而且这种扰动是很难被人眼差距的。但是对于文本的对抗攻击中,小的扰动很容易被察觉,但人类同样能「猜出」本来表达的意义。因此 NLP 模型需要对可辨识的特征鲁棒,而不像视觉只需要对「不太重要」的特征鲁棒。

DeepWordBug 的深度网络攻击示例。选自 arXiv:1902.07285

与图像领域一样,有进攻就会有防御,目前也有很多研究尝试构建更鲁棒的自然语言处理模型。例如在 CMU 的一篇对抗性拼写错误论文(arXiv:1905.11268)中,研究者通过移除、添加或调序单词内部的字符,以构建更稳健的文本分类模型。这些增减或调序都是一种扰动,就像人类也很可能出现这些笔误一样。通过这些扰动,模型能学会如何处理错别字,从而不至于对分类结果产生影响。

对抗性拼写错误导致的情感误分类,与通过字识别防御手段获得的更稳健模型。选自 arXiv:1905.11268

除了文本分类,也有很多研究者通过对抗训练构建更稳健的翻译系统。清华大学刘洋老师表示,如果我们修改原文的某个字,那么很可能译文就完全变了,目前的 NMT 系统并不是太稳健。

刘洋老师表示,目前比较多的方法是在训练中加入噪声而让 NMT 模型学会抵御随机扰动。如下图所示,X 是正确的输入,会加一些噪声以形成 X'。当我们用神经网络进行学习的时候,会生成两种内部表示 H_x 和 H_x'。我们希望这两种内部表示对于判别器 Discriminator 是不可区分的,如果不可区分,就说明噪声不会对预测做出更大的影响。

其中噪声可以是从真实数据获取的人类误差,也可以是随机生成的噪声。当机器翻译模型能抵御这些噪声,那么它就非常鲁棒了。

NLP 对抗样本攻防战必读论文

虽然,自然语言领域的对抗攻防仍然有很多困难,但目前已经有一批优秀的论文。最近清华大学杨承昊、岂凡超和臧原同学整理了一份必读论文,其从整体的综述论文到攻击、防御方法介绍了该领域的前沿研究工作。如下仅展示了论文名,具体的论文地址可查看原 GitHub 项目。

项目地址:https://github.com/thunlp/TAADpapers

综述论文

文本攻击与防御的论文概述:

  • Analysis Methods in Neural Language Processing: A Survey. Yonatan Belinkov, James Glass. TACL 2019.
  • Towards a Robust Deep Neural Network in Text Domain A Survey. Wenqi Wang, Lina Wang, Benxiao Tang, Run Wang, Aoshuang Ye. 2019.
  • Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey. Wei Emma Zhang, Quan Z. Sheng, Ahoud Alhazmi, Chenliang Li. 2019.

黑盒攻击

  • PAWS: Paraphrase Adversaries from Word Scrambling. Yuan Zhang, Jason Baldridge, Luheng He. NAACL-HLT 2019.
  • Text Processing Like Humans Do: Visually Attacking and Shielding NLP Systems. Steffen Eger, Gözde Gül ¸Sahin, Andreas Rücklé, Ji-Ung Lee, Claudia Schulz, Mohsen Mesgar, Krishnkant Swarnkar, Edwin Simpson, Iryna Gurevych.NAACL-HLT 2019.
  • Adversarial Over-Sensitivity and Over-Stability Strategies for Dialogue Models. Tong Niu, Mohit Bansal. CoNLL 2018.
  • Generating Natural Language Adversarial Examples. Moustafa Alzantot, Yash Sharma, Ahmed Elgohary, Bo-Jhang Ho, Mani Srivastava, Kai-Wei Chang. EMNLP 2018.
  • Breaking NLI Systems with Sentences that Require Simple Lexical Inferences. Max Glockner, Vered Shwartz, Yoav Goldberg ACL 2018.
  • AdvEntuRe: Adversarial Training for Textual Entailment with Knowledge-Guided Examples. Dongyeop Kang, Tushar Khot, Ashish Sabharwal, Eduard Hovy. ACL 2018.
  • Semantically Equivalent Adversarial Rules for Debugging NLP Models. Marco Tulio Ribeiro, Sameer Singh, Carlos Guestrin ACL 2018.
  • Robust Machine Comprehension Models via Adversarial Training. Yicheng Wang, Mohit Bansal. NAACL-HLT 2018.
  • Adversarial Example Generation with Syntactically Controlled Paraphrase Networks. Mohit Iyyer, John Wieting, Kevin Gimpel, Luke Zettlemoyer. NAACL-HLT 2018.
  • Black-box Generation of Adversarial Text Sequences to Evade Deep Learning Classifiers. Ji Gao, Jack Lanchantin, Mary Lou Soffa, Yanjun Qi. IEEE SPW 2018.
  • Synthetic and Natural Noise Both Break Neural Machine Translation. Yonatan Belinkov, Yonatan Bisk. ICLR 2018.
  • Generating Natural Adversarial Examples. Zhengli Zhao, Dheeru Dua, Sameer Singh. ICLR 2018.
  • Adversarial Examples for Evaluating Reading Comprehension Systems. Robin Jia, and Percy Liang. EMNLP 2017.

白盒攻击

  • On Adversarial Examples for Character-Level Neural Machine Translation. Javid Ebrahimi, Daniel Lowd, Dejing Dou. COLING 2018.
  • HotFlip: White-Box Adversarial Examples for Text Classification. Javid Ebrahimi, Anyi Rao, Daniel Lowd, Dejing Dou. ACL 2018.
  • Towards Crafting Text Adversarial Samples. Suranjana Samanta, Sameep Mehta. ECIR 2018.

同时探讨了黑盒和白盒攻击

  • TEXTBUGGER: Generating Adversarial Text Against Real-world Applications. Jinfeng Li, Shouling Ji, Tianyu Du, Bo Li, Ting Wang. NDSS 2019.
  • Comparing Attention-based Convolutional and Recurrent Neural Networks: Success and Limitations in Machine Reading Comprehension. Matthias Blohm, Glorianna Jagfeld, Ekta Sood, Xiang Yu, Ngoc Thang Vu. CoNLL 2018.
  • Deep Text Classification Can be Fooled. Bin Liang, Hongcheng Li, Miaoqiang Su, Pan Bian, Xirong Li, Wenchang Shi.IJCAI 2018.

对抗防御

  • Combating Adversarial Misspellings with Robust Word Recognition. Danish Pruthi, Bhuwan Dhingra, Zachary C. Lipton. ACL 2019.

评估

对文本攻击和防御研究提出新的评价方法:

  • On Evaluation of Adversarial Perturbations for Sequence-to-Sequence Models. Paul Michel, Xian Li, Graham Neubig, Juan Miguel Pino. NAACL-HLT 2019
    推荐阅读
  • 永辉超市卡可以网上购物吗(永辉超市卡能网上购物吗)

    永辉超市卡不可以网上购物,超市卡只能用于线下实体店购买消费,而网上购物是使用的移动支付。另外,永辉超市卡的正确名称应为永辉购物卡,可在全国使用,现在永辉卡有两种,一种是可充值卡片,一种是一次性购物卡。

  • 榨菜丝的做法和配方(榨菜丝怎么做)

    榨菜丝的做法和配方榨菜1个,猪肉100克,香菜30克。将原料洗干净准备好。将干红辣椒剪成丝状,香菜梗切成寸段。将榨菜先切成薄片再切成细丝,用凉水泡5分钟,然后放入热水中焯一下捞出,用凉水冲凉后控净多余的水分。瘦肉也用同样的方法切成细丝。将炒锅烧热放油,然后倒入肉丝炒至颜色变白,然后放入葱姜末和干辣椒出香味,放入生抽炒匀。味道调好后放入香菜梗和少许香油炒匀即可关火,好了。

  • 最耐阴的多肉排行喜欢阴的多肉(什么品种多肉耐阴)

    什么品种多肉耐阴玉露想要养殖玉露,首先要选择好土壤,虽然玉露对土壤的要求不高,但是如果是排水性、透气性好的土壤,玉露会生长的更好,其实就是浇水的问题,如果土壤不干,我们就不能浇水,如果干了,就需要浇透,正常在生长期的。

  • 云顶之弈胜利喵卫怎么获得(云顶之弈胜利喵卫如何获得)

    下面内容希望能帮助到你,我们来一起看看吧!云顶之弈胜利喵卫怎么获得玩家在命运之轮赛季的任意一个赛段中,达到过荣耀黄金或者更高段位的玩家,可以获得小小英雄「胜利喵卫」。目前很多玩家反馈上个赛季的结算奖励尚未发放,可能还需要一段时间后才能后发放奖励,达成领取条件的玩家建议关注一下近期的官方更新公告。

  • 李一桐个人资料写真(男演员演感情戏无压力的李一桐)

    初识李一桐,是在2017年蒋家骏执导,郭靖宇监制的古装武侠电视剧《射雕英雄传》里,她作为新人、顶着压力饰演聪慧机灵、玲珑剔透的黄蓉,说实话,在她之前最喜欢的黄蓉还是翁美玲。光鲜从不是天生而来,正如黄蓉用柔美的舞姿使出射雕的招式,她2015年因在试戏中表现突出,主演民国玄幻网络剧《半妖倾城》,正式进入演艺圈。

  • 剑南春酒价格表大全(剑南春官网价格表)

    剑南春酒,四川省绵竹市剑南镇特产,中国国家地理标志产品,典型浓香型川酒的代表。剑南春剑南春系列下官网显示两款产品:水晶剑南春、珍藏级剑南春。金剑南金剑南系列官网显示主要有金剑南K6、24K金剑南、金剑南K3、金剑特曲四款产品。银剑南银剑南系列有银剑南A9、银剑南A3、银剑南精品A3、银剑南绵柔三星、银剑南绵柔五星五款产品。

  • 城市副中心简称(城市一体化发展中)

    据鄂州华容政府网消息:为加快推进武鄂一体化发展进程,自2020年4月8日起,在鄂州市华容区区有序推进使用027区号。而这在中西部城市最为明显。2018年国务院批复撤销地级莱芜市,将莱芜市区域划归济南市管辖。区号共用的地区由于行政区划调整的关系,也有不少地区目前仍然在共用区号。其中江苏和海南两个省,全省地区都是使用8位数的电话号。

  • 十四个癌症信号你要知道(14个癌症信号你一定要知道)

    No.3盗汗盗汗可能是肿瘤引起的全身症状,在白血病和淋巴瘤患者中常见。出现盗汗,患者需排除甲亢、糖尿病、结核、更年期综合征、系统性红斑狼疮等良性疾病原因。如果长时间盗汗合并短期内体重减轻,应及时就医,行相关检查。长期的呼吸急促容易导致呼吸衰竭,因此有必要尽早查明病因,进行针对性治疗。至少一半的膀胱癌是由吸烟引起。出现吞咽困难者,应尽早就医,明确病因。

  • 传统习俗有哪些(中国传统习俗有哪些)

    传统习俗有哪些元宵节的习俗:元宵节习俗自古以来就以热烈喜庆的观灯习俗为主。除夕人们往往通宵不眠,叫做“守岁”。人们则换上带喜庆色彩和带图案的新衣。

  • 南瓜粗粮还是细粮(南瓜是粗粮还是细粮)

    回答南瓜不是粗粮也不是细粮,它属于蔬菜。粗粮是相对于人们平时吃的精米、白面等细粮而言的,粗粮主要包括谷类中的玉米、紫米、高粱、燕麦、荞麦、麦麸以及各种豆类,如黄豆、青豆、赤豆、绿豆等,而块茎类中的粗粮有红薯、白薯等。细粮原则上是指加工后的成品粮,一般指面粉与大米等粮食。