Delcroix, Marc

New Era for Robust Speech Recognition

122,75€

E-bok, PDF, Adobe DRM-skydd
ISBN: 9783319646800
DRM-begränsningar

Skriva ut	Inte tillåtet
Kopiera till urklipp	Inte tillåtet

Table of contents

Part I. Introduction

1. Preliminaries
Shinji Watanabe, Marc Delcroix, Florian Metze, John R. Hershey

Part II. Approaches to Robust Automatic Speech Recognition

2. Multichannel Speech Enhancement Approaches to DNN-Based Far-Field Speech Recognition
Marc Delcroix, Takuya Yoshioka, Nobutaka Ito, Atsunori Ogawa, Keisuke Kinoshita, Masakiyo Fujimoto, Takuya Higuchi, Shoko Araki, Tomohiro Nakatani

3. Multichannel Spatial Clustering Using Model-Based Source Separation
Michael I. Mandel, Jon P. Barker

4. Discriminative Beamforming with Phase-Aware Neural Networks for Speech Enhancement and Recognition
Xiong Xiao, Shinji Watanabe, Hakan Erdogan, Michael Mandel, Liang Lu, John R. Hershey, Michael L. Seltzer, Guoguo Chen, Yu Zhang, Dong Yu

5. Raw Multichannel Processing Using Deep Neural Networks
Tara N. Sainath, Ron J. Weiss, Kevin W. Wilson, Arun Narayanan, Michiel Bacchiani, Bo Li, Ehsan Variani, Izhak Shafran, Andrew Senior, Kean Chin, Ananya Misra, Chanwoo Kim

6. Novel Deep Architectures in Speech Processing
John R. Hershey, Jonathan Roux, Shinji Watanabe, Scott Wisdom, Zhuo Chen, Yusuf Isik

7. Deep Recurrent Networks for Separation and Recognition of Single-Channel Speech in Nonstationary Background Audio
Hakan Erdogan, John R. Hershey, Shinji Watanabe, Jonathan Roux

8. Robust Features in Deep-Learning-Based Speech Recognition
Vikramjit Mitra, Horacio Franco, Richard M. Stern, Julien Hout, Luciana Ferrer, Martin Graciarena, Wen Wang, Dimitra Vergyri, Abeer Alwan, John H. L. Hansen

9. Adaptation of Deep Neural Network Acoustic Models for Robust Automatic Speech Recognition
Khe Chai Sim, Yanmin Qian, Gautam Mantena, Lahiru Samarakoon, Souvik Kundu, Tian Tan

10. Training Data Augmentation and Data Selection
Martin Karafiát, Karel Veselý, Kateřina Žmolíková, Marc Delcroix, Shinji Watanabe, Lukáš Burget, Jan “Honza”Černocký, Igor Szőke

11. Advanced Recurrent Neural Networks for Automatic Speech Recognition
Yu Zhang, Dong Yu, Guoguo Chen

12. Sequence-Discriminative Training of Neural Networks
Guoguo Chen, Yu Zhang, Dong Yu

13. End-to-End Architectures for Speech Recognition
Yajie Miao, Florian Metze

Part III. Resources

14. The CHiME Challenges: Robust Speech Recognition in Everyday Environments
Jon P. Barker, Ricard Marxer, Emmanuel Vincent, Shinji Watanabe

15. The REVERB Challenge: A Benchmark Task for Reverberation-Robust ASR Techniques
Keisuke Kinoshita, Marc Delcroix, Sharon Gannot, Emanuël A. P. Habets, Reinhold Haeb-Umbach, Walter Kellermann, Volker Leutnant, Roland Maas, Tomohiro Nakatani, Bhiksha Raj, Armin Sehr, Takuya Yoshioka

16. Distant Speech Recognition Experiments Using the AMI Corpus
Steve Renals, Pawel Swietojanski

17. Toolkits for Robust Speech Processing
Shinji Watanabe, Takaaki Hori, Yajie Miao, Marc Delcroix, Florian Metze, John R. Hershey

Part IV. Applications

18. Speech Research at Google to Enable Universal Speech Interfaces
Michiel Bacchiani, Françoise Beaufays, Alexander Gruenstein, Pedro Moreno, Johan Schalkwyk, Trevor Strohman, Heiga Zen

19. Challenges in and Solutions to Deep Learning Network Acoustic Modeling in Speech Recognition Products at Microsoft
Yifan Gong, Yan Huang, Kshitiz Kumar, Jinyu Li, Chaojun Liu, Guoli Ye, Shixiong Zhang, Yong Zhao, Rui Zhao

20. Advanced ASR Technologies for Mitsubishi Electric Speech Applications
Yuuki Tachioka, Toshiyuki Hanazawa, Tomohiro Narita, Jun Ishii

Nyckelord: Computer Science, Artificial Intelligence (incl. Robotics), Signal, Image and Speech Processing, Language Translation and Linguistics, Linguistics, general