Dzmitry Bahdanau

Generating author description...

All published works

Action	Title	Year	Authors
+ PDF Chat	TapeAgents: a Holistic Framework for Agent Development and Optimization	2024	Dzmitry Bahdanau Nicolas Gontier George Q. Huang Ehsan Kamalloo Rafael Pardinas Alex Piché Torsten Scholak Oleh Shliazhko J.P. Tremblay Karam Ghanem
+ PDF Chat	NNetscape Navigator: Complex Demonstrations for Web Agents Without a Demonstrator	2024	Shikhar Murty Dzmitry Bahdanau Christopher D. Manning
+ PDF Chat	LLMs can learn self-restraint through iterative self-reflection	2024	Alexandre Piché Aristides Milios Dzmitry Bahdanau Chris Pal
+ PDF Chat	LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders	2024	Parishad BehnamGhader Vaibhav Adlakha Marius Mosbach Dzmitry Bahdanau Nicolas Chapados Siva Reddy
+ PDF Chat	Evaluating In-Context Learning of Libraries for Code Generation	2024	Arkil Patel Siva Reddy Dzmitry Bahdanau Pradeep Dasigi
+	SantaCoder: don't reach for the stars!	2023	Loubna Ben Allal Raymond Li Denis Kocetkov Chenghao Mou Christopher Akiki Carlos Munoz Ferrandis Niklas Muennighoff Mayank Mishra Alex Gu Manan Dey
+	StarCoder: may the source be with you!	2023	Raymond Li Loubna Ben Allal Yangtian Zi Niklas Muennighoff Denis Kocetkov Chenghao Mou Marc Marone Christopher Akiki Jia Li Jenny Chim
+	RepoFusion: Training Code Models to Understand Your Repository	2023	Disha Shrivastava Denis Kocetkov Harm de Vries Dzmitry Bahdanau Torsten Scholak
+	In-Context Learning for Text Classification with Many Labels	2023	Aristides Milios Siva Reddy Dzmitry Bahdanau
+	MAGNIFICo: Evaluating the In-Context Learning Ability of Large Language Models to Generalize to Novel Interpretations	2023	Arkil Patel Satwik Bhattamishra Siva Reddy Dzmitry Bahdanau
+	PromptMix: A Class Boundary Augmentation Method for Large Language Model Distillation	2023	Gaurav Sahu Olga Vechtomova Dzmitry Bahdanau Issam Laradji
+	Evaluating In-Context Learning of Libraries for Code Generation	2023	Arkil Patel Siva Reddy Dzmitry Bahdanau Pradeep Dasigi
+ PDF Chat	PromptMix: A Class Boundary Augmentation Method for Large Language Model Distillation	2023	Gaurav Sahu Olga Vechtomova Dzmitry Bahdanau Issam Laradji
+ PDF Chat	MAGNIFICo: Evaluating the In-Context Learning Ability of Large Language Models to Generalize to Novel Interpretations	2023	Arkil Patel Satwik Bhattamishra Siva Reddy Dzmitry Bahdanau
+	In-Context Learning for Text Classification with Many Labels	2023	Aristides Milios Siva Reddy Dzmitry Bahdanau
+ PDF Chat	Compositional Generalization in Dependency Parsing	2022	Emily Goodwin Siva Reddy Timothy O’Donnell Dzmitry Bahdanau
+	Data Augmentation for Intent Classification with Off-the-shelf Large Language Models	2022	Gaurav Sahu Pau Rodríguez Issam Laradji Parmida Atighehchian David Vázquez Dzmitry Bahdanau
+	Evaluating the Text-to-SQL Capabilities of Large Language Models	2022	Nitarshan Rajkumar Raymond Li Dzmitry Bahdanau
+	LAGr: Label Aligned Graphs for Better Systematic Generalization in Semantic Parsing	2022	Dora Jambor Dzmitry Bahdanau
+	Data Augmentation for Intent Classification with Off-the-shelf Large Language Models	2022	Gaurav Sahu Pau Rodríguez Issam Laradji Parmida Atighehchian David Vázquez Dzmitry Bahdanau
+	On the Compositional Generalization Gap of In-Context Learning	2022	Arian Hosseini Ankit Vani Dzmitry Bahdanau Alessandro Sordoni Aaron Courville
+	The Stack: 3 TB of permissively licensed source code	2022	Denis Kocetkov Raymond Li Loubna Ben Allal Jia Li Chenghao Mou Carlos Muñoz Ferrandis Yacine Jernite Margaret Mitchell Sean Hughes Thomas Wolf
+	On the Compositional Generalization Gap of In-Context Learning	2022	Arian Hosseini Ankit Vani Dzmitry Bahdanau Alessandro Sordoni Aaron Courville
+ PDF Chat	Systematic Generalization with Edge Transformers	2021	Leon Bergen Timothy O’Donnell Dzmitry Bahdanau
+	LAGr: Labeling Aligned Graphs for Improving Systematic Generalization in Semantic Parsing.	2021	Dora Jambor Dzmitry Bahdanau
+	PICARD: Parsing Incrementally for Constrained Auto-Regressive Decoding from Language Models	2021	Torsten Scholak Nathan Schucher Dzmitry Bahdanau
+ PDF Chat	Combating False Negatives in Adversarial Imitation Learning	2021	Konrad Żołna Chitwan Saharia Léonard Boussioux David Yu-Tung Hui Maxime Chevalier-Boisvert Dzmitry Bahdanau Yoshua Bengio
+	Jointly Learning Truth-Conditional Denotations and Groundings using Parallel Attention	2021	Leon Bergen Dzmitry Bahdanau Timothy J. O’Donnell
+ PDF Chat	Understanding by Understanding Not: Modeling Negation in Language Models	2021	Arian Hosseini Siva Reddy Dzmitry Bahdanau R Devon Hjelm Alessandro Sordoni Aaron Courville
+ PDF Chat	DuoRAT: Towards Simpler Text-to-SQL Models	2021	Torsten Scholak Raymond Li Dzmitry Bahdanau Harm de Vries Chris Pal
+ PDF Chat	PICARD: Parsing Incrementally for Constrained Auto-Regressive Decoding from Language Models	2021	Torsten Scholak Nathan Schucher Dzmitry Bahdanau
+	LAGr: Labeling Aligned Graphs for Improving Systematic Generalization in Semantic Parsing	2021	Dora Jambor Dzmitry Bahdanau
+	Compositional Generalization in Dependency Parsing	2021	Emily Goodwin Siva Reddy Timothy J. O’Donnell Dzmitry Bahdanau
+	PICARD: Parsing Incrementally for Constrained Auto-Regressive Decoding from Language Models	2021	Torsten Scholak Nathan Schucher Dzmitry Bahdanau
+	Understanding by Understanding Not: Modeling Negation in Language Models	2021	Arian Hosseini Siva Reddy Dzmitry Bahdanau R Devon Hjelm Alessandro Sordoni Aaron Courville
+	Systematic Generalization with Edge Transformers	2021	Leon Bergen Timothy O’Donnell Dzmitry Bahdanau
+	BabyAI 1.1.	2020	David Yu-Tung Hui Maxime Chevalier-Boisvert Dzmitry Bahdanau Yoshua Bengio
+	Towards Ecologically Valid Research on Language User Interfaces	2020	Harm de Vries Dzmitry Bahdanau Christopher D. Manning
+	Combating False Negatives in Adversarial Imitation Learning	2020	Konrad Żołna Chitwan Saharia Léonard Boussioux David Yu-Tung Hui Maxime Chevalier-Boisvert Dzmitry Bahdanau Yoshua Bengio
+	BabyAI 1.1	2020	David Yu-Tung Hui Maxime Chevalier-Boisvert Dzmitry Bahdanau Yoshua Bengio
+	CLOSURE: Assessing Systematic Generalization of CLEVR Models	2019	Dzmitry Bahdanau Harm de Vries Timothy O’Donnell Shikhar Murty Philippe Beaudoin Yoshua Bengio Aaron Courville
+	CLOSURE: Assessing Systematic Generalization of CLEVR Models.	2019	Dzmitry Bahdanau Harm de Vries Timothy O’Donnell Shikhar Murty Philippe Beaudoin Yoshua Bengio Aaron Courville
+	Automated curriculum generation for Policy Gradients from Demonstrations	2019	Anirudh Srinivasan Dzmitry Bahdanau Maxime Chevalier-Boisvert Yoshua Bengio
+	CLOSURE: Assessing Systematic Generalization of CLEVR Models	2019	Dzmitry Bahdanau Harm de Vries Timothy O’Donnell Shikhar Murty Philippe Beaudoin Yoshua Bengio Aaron Courville
+	Systematic Generalization: What Is Required and Can It Be Learned?	2018	Dzmitry Bahdanau Shikhar Murty Michael Noukhovitch Thien Huu Nguyen Harm de Vries Aaron Courville
+	BabyAI: First Steps Towards Grounded Language Learning With a Human In the Loop.	2018	Maxime Chevalier-Boisvert Dzmitry Bahdanau Salem Lahlou Lucas Willems Chitwan Saharia Thien Huu Nguyen Yoshua Bengio
+	Systematic Generalization: What Is Required and Can It Be Learned?	2018	Dzmitry Bahdanau Shikhar Murty Michael Noukhovitch Thien Huu Nguyen Harm de Vries Aaron Courville
+	Learning to Follow Language Instructions with Adversarial Reward Induction	2018	Dzmitry Bahdanau Felix Hill Jan Leike Edward Hughes Pushmeet Kohli Edward Grefenstette
+	Commonsense mining as knowledge base completion? A study on the impact of novelty	2018	Stanisław Jastrzȩbski Dzmitry Bahdanau Seyedarian Hosseini Michael Noukhovitch Yoshua Bengio Jackie Chi Kit Cheung
+	Learning to Understand Goal Specifications by Modelling Reward	2018	Dzmitry Bahdanau Felix Hill Jan Leike Edward Hughes Arian Hosseini Pushmeet Kohli Edward Grefenstette
+	Commonsense mining as knowledge base completion? A study on the impact of novelty	2018	Stanisław Jastrzȩbski Dzmitry Bahdanau Seyedarian Hosseini Michael Noukhovitch Yoshua Bengio Jackie Chi Kit Cheung
+	BabyAI: A Platform to Study the Sample Efficiency of Grounded Language Learning	2018	Maxime Chevalier-Boisvert Dzmitry Bahdanau Salem Lahlou Lucas Willems Chitwan Saharia Thien Huu Nguyen Yoshua Bengio
+	Systematic Generalization: What Is Required and Can It Be Learned?	2018	Dzmitry Bahdanau Shikhar Murty Michael Noukhovitch Thien Huu Nguyen Harm de Vries Aaron Courville
+	Commonsense mining as knowledge base completion? A study on the impact of novelty	2018	Stanisław Jastrzȩbski Dzmitry Bahdanau Seyedarian Hosseini Michael Noukhovitch Yoshua Bengio Jackie Kit Cheung
+	Learning to Compute Word Embeddings On the Fly	2017	Dzmitry Bahdanau Tom Bosc Stanisław Jastrzȩbski Edward Grefenstette Pascal Vincent Yoshua Bengio
+	An Actor-Critic Algorithm for Sequence Prediction	2016	Dzmitry Bahdanau Philémon Brakel Kelvin Xu Anirudh Goyal Ryan Lowe Joëlle Pineau Aaron Courville Yoshua Bengio
+	An Actor-Critic Algorithm for Structured Prediction	2016	Dzmitry Bahdanau Philémon Brakel Kelvin Xu Anirudh Goyal Ryan Lowe Joëlle Pineau Aaron Memisevic Yoshua Bengio
+ PDF Chat	End-to-end attention-based large vocabulary speech recognition	2016	Dzmitry Bahdanau Jan Chorowski Dmitriy Serdyuk Philémon Brakel Yoshua Bengio
+	Theano: A Python framework for fast computation of mathematical expressions	2016	The Theano Development Team Rami Al‐Rfou Guillaume Alain Amjad Almahairi Christof Angermueller Dzmitry Bahdanau Nicolas Ballas Frédéric Bastien Justin Bayer Anatoly Belikov
+	Sequence Tutor: Conservative Fine-Tuning of Sequence Generation Models with KL-control	2016	Natasha Jaques Shixiang Gu Dzmitry Bahdanau José Miguel Hernández-Lobato Richard E. Turner Douglas Eck
+	An Actor-Critic Algorithm for Sequence Prediction	2016	Dzmitry Bahdanau Philémon Brakel Kelvin Xu Anirudh Goyal Ryan Lowe Joëlle Pineau Aaron Courville Yoshua Bengio
+	End-to-End Attention-based Large Vocabulary Speech Recognition	2015	Dzmitry Bahdanau Jan Chorowski Dmitriy Serdyuk Philémon Brakel Yoshua Bengio
+	Blocks and Fuel: Frameworks for deep learning	2015	Bart van Merriënboer Dzmitry Bahdanau Vincent Dumoulin Dmitriy Serdyuk David Warde-Farley Jan Chorowski Yoshua Bengio
+	Task Loss Estimation for Sequence Prediction	2015	Dzmitry Bahdanau Dmitriy Serdyuk Philémon Brakel Nan Rosemary Ke Jan Chorowski Aaron Courville Yoshua Bengio
+	Neural Machine Translation by Jointly Learning to Align and Translate	2015	Dzmitry Bahdanau Kyunghyun Cho Yoshua Bengio
+	End-to-End Attention-based Large Vocabulary Speech Recognition	2015	Dzmitry Bahdanau Jan Chorowski Dmitriy Serdyuk Philémon Brakel Yoshua Bengio
+	Blocks and Fuel: Frameworks for deep learning	2015	Bart van Merriënboer Dzmitry Bahdanau Vincent Dumoulin Dmitriy Serdyuk David Warde-Farley Jan Chorowski Yoshua Bengio
+	Attention-Based Models for Speech Recognition	2015	Jan Chorowski Dzmitry Bahdanau Dmitriy Serdyuk Kyunghyun Cho Yoshua Bengio
+	Overcoming the Curse of Sentence Length for Neural Machine Translation using Automatic Segmentation	2014	Jean Pouget-Abadie Dzmitry Bahdanau Bart van Merriënboer Kyunghyun Cho Yoshua Bengio
+	Neural Machine Translation by Jointly Learning to Align and Translate	2014	Dzmitry Bahdanau Kyunghyun Cho Yoshua Bengio
+	End-to-end Continuous Speech Recognition using Attention-based Recurrent NN: First Results	2014	Jan Chorowski Dzmitry Bahdanau Kyunghyun Cho Yoshua Bengio
+	Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation	2014	Kyunghyun Cho Bart van Merriënboer Çaǧlar Gülçehre Dzmitry Bahdanau Fethi Bougares Holger Schwenk Yoshua Bengio
+	On the Properties of Neural Machine Translation: Encoder-Decoder Approaches	2014	Kyunghyun Cho Bart van Merriënboer Dzmitry Bahdanau Yoshua Bengio
+	Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation	2014	Kyunghyun Cho Bart van Merriënboer Çaǧlar Gülçehre Dzmitry Bahdanau Fethi Bougares Holger Schwenk Yoshua Bengio
+	On the Properties of Neural Machine Translation: Encoder–Decoder Approaches	2014	Kyunghyun Cho Bart van Merriënboer Dzmitry Bahdanau Yoshua Bengio
+	Overcoming the Curse of Sentence Length for Neural Machine Translation using Automatic Segmentation	2014	Jean Pouget-Abadie Dzmitry Bahdanau Bart van Merriënboer Kyunghyun Cho Yoshua Bengio
+	Neural Machine Translation by Jointly Learning to Align and Translate	2014	Dzmitry Bahdanau Kyunghyun Cho Yoshua Bengio
+	Overcoming the Curse of Sentence Length for Neural Machine Translation using Automatic Segmentation	2014	Jean Pouget-Abadie Dzmitry Bahdanau Bart van Merriënboer Kyunghyun Cho Yoshua Bengio

Common Coauthors

Coauthor	Papers Together
Yoshua Bengio	35
Aaron Courville	14
Harm de Vries	13
Siva Reddy	12
Bart van Merriënboer	10
Kyunghyun Cho	10
Jan Chorowski	9
Dmitriy Serdyuk	8
Philémon Brakel	7
Shikhar Murty	7
Maxime Chevalier-Boisvert	7
Torsten Scholak	6
Timothy O’Donnell	6
Michael Noukhovitch	6
Raymond Li	5
Thien Huu Nguyen	5
Gaurav Sahu	4
Alessandro Sordoni	4
Kelvin Xu	4
Chitwan Saharia	4
Stanisław Jastrzȩbski	4
Arkil Patel	4
Issam Laradji	4
Denis Kocetkov	4
David Yu-Tung Hui	4
Seyedarian Hosseini	3
Çaǧlar Gülçehre	3
Philippe Beaudoin	3
Yacine Jernite	3
Aristides Milios	3
Vincent Dumoulin	3
Joëlle Pineau	3
Sean Hughes	3
Anirudh Goyal	3
Arian Hosseini	3
Kyunghyun Cho	3
Nathan Schucher	3
Chenghao Mou	3
Loubna Ben Allal	3
Edward Grefenstette	3
Jean Pouget-Abadie	3
Leandro von Werra	3
Ryan Lowe	3
Dora Jambor	3
David Warde-Farley	3
Leon Bergen	3
Jackie Chi Kit Cheung	2
Oleh Shliazhko	2
Christopher D. Manning	2
Manuel Romero	2

Commonly Cited References

Action	Title	Year	Authors	# of times referenced
+	Neural Machine Translation by Jointly Learning to Align and Translate	2015	Dzmitry Bahdanau Kyunghyun Cho Yoshua Bengio	14
+	Generating Sequences With Recurrent Neural Networks	2013	Alex Graves	9
+	ADADELTA: An Adaptive Learning Rate Method	2012	Matthew D. Zeiler	9
+	Sequence to Sequence Learning with Neural Networks	2014	Ilya Sutskever Oriol Vinyals Quoc V. Le	8
+	Sequence Transduction with Recurrent Neural Networks	2012	Alex Graves	8
+	Adam: A Method for Stochastic Optimization	2014	Diederik P. Kingma Jimmy Ba	7
+	Blocks and Fuel: Frameworks for deep learning	2015	Bart van Merriënboer Dzmitry Bahdanau Vincent Dumoulin Dmitriy Serdyuk David Warde-Farley Jan Chorowski Yoshua Bengio	7
+	Theano: new features and speed improvements	2012	Frédéric Bastien Pascal Lamblin Razvan Pascanu James Bergstra Ian J. Goodfellow Arnaud Bergeron Nicolas Bouchard David Warde-Farley Yoshua Bengio	7
+	Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation	2014	Kyunghyun Cho Bart van Merriënboer Çaǧlar Gülçehre Dzmitry Bahdanau Fethi Bougares Holger Schwenk Yoshua Bengio	7
+	Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation	2014	Kyunghyun Cho Bart van Merriënboer Çaǧlar Gülçehre Dzmitry Bahdanau Fethi Bougares Holger Schwenk Yoshua Bengio	6
+	Sequence to Sequence Learning with Neural Networks	2014	Ilya Sutskever Oriol Vinyals Quoc V. Le	6
+	First-Pass Large Vocabulary Continuous Speech Recognition using Bi-Directional Recurrent DNNs	2014	Andrew L. Maas Awni Hannun Daniel Jurafsky Andrew Y. Ng	5
+ PDF Chat	Speech recognition with deep recurrent neural networks	2013	Alex Graves Abdelrahman Mohamed Geoffrey E. Hinton	5
+	BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding	2018	Jacob Devlin Ming‐Wei Chang Kenton Lee Kristina Toutanova	4
+	Improving neural networks by preventing co-adaptation of feature detectors	2012	Geoffrey E. Hinton Nitish Srivastava Alex Krizhevsky Ilya Sutskever Ruslan Salakhutdinov	4
+	BabyAI: First Steps Towards Grounded Language Learning With a Human In the Loop.	2018	Maxime Chevalier-Boisvert Dzmitry Bahdanau Salem Lahlou Lucas Willems Chitwan Saharia Thien Huu Nguyen Yoshua Bengio	4
+	Pylearn2: a machine learning research library	2013	Ian Goodfellow David Warde-Farley Pascal Lamblin Vincent Dumoulin Mehdi Mirza Razvan Pascanu James Bergstra Frédéric Bastien Yoshua Bengio	4
+	Listen, Attend, and Walk: Neural Mapping of Navigational Instructions to Action Sequences	2015	Hongyuan Mei Mohit Bansal Matthew R. Walter	4
+ PDF Chat	SQuAD: 100,000+ Questions for Machine Comprehension of Text	2016	Pranav Rajpurkar Jian Zhang Konstantin Lopyrev Percy Liang	4
+	Generative Adversarial Imitation Learning	2016	Jonathan Ho Stefano Ermon	4
+	Grounded Language Learning in a Simulated 3D World	2017	Karl Moritz Hermann Felix Hill Simon Green Fumin Wang Ryan Faulkner Hubert Soyer David Szepesvari Wojciech Marian Czarnecki Max Jaderberg Denis Teplyashin	4
+	How to Construct Deep Recurrent Neural Networks	2014	Razvan Pascanu Çaǧlar Gülçehre Kyunghyun Cho Yoshua Bengio	4
+ PDF Chat	Inferring and Executing Programs for Visual Reasoning	2017	Justin Johnson Bharath Hariharan Laurens van der Maaten Judy Hoffman Li Fei-Fei C. Lawrence Zitnick Ross Girshick	4
+ PDF Chat	Deep Residual Learning for Image Recognition	2016	Kaiming He Xiangyu Zhang Shaoqing Ren Jian Sun	4
+ PDF Chat	Semantic Evaluation for Text-to-SQL with Distilled Test Suites	2020	Ruiqi Zhong Tao Yu Dan Klein	4
+	Compositional Generalization and Natural Language Variation: Can a Semantic Parsing Approach Handle Both?	2021	Peter Shaw Ming‐Wei Chang Panupong Pasupat Kristina Toutanova	3
+ PDF Chat	RYANSQL: Recursively Applying Sketch-based Slot Fillings for Complex Text-to-SQL in Cross-Domain Databases	2021	Donghyun Choi Myeong Cheol Shin EungGyun Kim Dong Ryeol Shin	3
+	PaLM: Scaling Language Modeling with Pathways	2022	Aakanksha Chowdhery Sharan Narang Jacob Devlin Maarten Bosma Gaurav Mishra Adam Roberts Paul Barham Hyung Won Chung Charles Sutton Sebastian Gehrmann	3
+	Efficient Intent Detection with Dual Sentence Encoders	2020	Iñigo Casanueva Tadas Temčinas Daniela Gerz Matthew Henderson Ivan Vulić	3
+	Unlocking Compositional Generalization in Pre-trained Models Using Intermediate Representations	2021	Jonathan Herzig Peter Shaw Ming‐Wei Chang Kelvin Guu Panupong Pasupat Yuan Zhang	3
+ PDF Chat	Improving Text-to-SQL Evaluation Methodology	2018	Catherine Finegan-Dollak Jonathan K. Kummerfeld Li Zhang Karthik Ramanathan Sesh Sadasivam Rui Zhang Dragomir Radev	3
+ PDF Chat	Spider: A Large-Scale Human-Labeled Dataset for Complex and Cross-Domain Semantic Parsing and Text-to-SQL Task	2018	Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman	3
+	RAT-SQL: Relation-Aware Schema Encoding and Linking for Text-to-SQL Parsers	2020	Bailin Wang Richard Shin Xiaodong Liu Oleksandr Polozov Matthew Richardson	3
+	Compositional Generalization in Semantic Parsing: Pre-training vs. Specialized Architectures	2020	Daniel Furrer Marc van Zee Nathan Scales Nathanael Schärli	3
+	OPT: Open Pre-trained Transformer Language Models	2022	Susan Zhang Stephen Roller Naman Goyal Mikel Artetxe Moya Chen Shuohui Chen Christopher Dewan Mona Diab Xian Li Xi Victoria Lin	3
+	Proximal Policy Optimization Algorithms	2017	John Schulman Filip Wolski Prafulla Dhariwal Alec Radford Oleg Klimov	3
+ PDF Chat	CLEVR: A Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning	2017	Justin Johnson Bharath Hariharan Laurens van der Maaten Li Fei-Fei C. Lawrence Zitnick Ross Girshick	3
+	End-to-end Continuous Speech Recognition using Attention-based Recurrent NN: First Results	2014	Jan Chorowski Dzmitry Bahdanau Kyunghyun Cho Yoshua Bengio	3
+	Analyzing the Behavior of Visual Question Answering Models	2016	Aishwarya Agrawal Dhruv Batra Devi Parikh	3
+	Gated-Attention Architectures for Task-Oriented Language Grounding	2017	Devendra Singh Chaplot Kanthashree Mysore Sathyendra Rama Kumar Pasumarthi Dheeraj Rajagopal Ruslan Salakhutdinov	3
+	EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks	2019	Jason Wei Kai Zou	3
+	Continuous control with deep reinforcement learning	2015	Timothy Lillicrap Jonathan J. Hunt Alexander Pritzel Nicolas Heess Tom Erez Yuval Tassa David Silver Daan Wierstra	3
+ PDF Chat	VQA: Visual Question Answering	2015	Stanislaw Antol Aishwarya Agrawal Jiasen Lu Margaret Mitchell Dhruv Batra C. Lawrence Zitnick Devi Parikh	3
+	Show, Attend and Tell: Neural Image Caption Generation with Visual Attention	2015	Kelvin Xu Jimmy Ba Ryan Kiros Kyunghyun Cho Aaron Courville Ruslan Salakhutdinov Richard S. Zemel Yoshua Bengio	3
+	On the difficulty of training Recurrent Neural Networks	2012	Razvan Pascanu Tomáš Mikolov Yoshua Bengio	3
+	Deep Speech: Scaling up end-to-end speech recognition	2014	Awni Hannun Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates	3
+	On Using Monolingual Corpora in Neural Machine Translation	2015	Çaǧlar Gülçehre Orhan Fırat Kelvin Xu Kyunghyun Cho Loïc Barrault Huei-Chi Lin Fethi Bougares Holger Schwenk Yoshua Bengio	3
+	A Reduction of Imitation Learning and Structured Prediction to No-Regret Online Learning	2010	Stéphane Ross Geoffrey J. Gordon J. Andrew Bagnell	3
+	Neural Machine Translation by Jointly Learning to Align and Translate	2014	Dzmitry Bahdanau Kyunghyun Cho Yoshua Bengio	3
+	Measuring Compositional Generalization: A Comprehensive Method on Realistic Data	2019	Daniel Keysers Nathanael Schärli Nathan Scales Hylke Buisman Daniel Furrer Sergii Kashubin Nikola Momchev Danila Sinopalnikov Łukasz Stafiniak Tibor Tihon	3