Wavesplit: End-to-End Speech Separation by Speaker Clustering

Neil Zeghidour, David Grangier

Type: Preprint

Publication Date: 2020-02-20

Citations: 73

Locations

arXiv (Cornell University) - View

Similar Works

Action	Title	Year	Authors
+	Wavesplit: End-to-End Speech Separation by Speaker Clustering	2020	Neil Zeghidour David Grangier
+ PDF Chat	Wavesplit: End-to-End Speech Separation by Speaker Clustering	2021	Neil Zeghidour David Grangier
+ PDF Chat	Multi-Decoder DPRNN: High Accuracy Source Counting and Separation	2020	Junzhe Zhu Raymond T. Yeh Mark Hasegawa–Johnson
+	Multi-Decoder DPRNN: High Accuracy Source Counting and Separation	2020	Junzhe Zhu Raymond A. Yeh Mark Hasegawa–Johnson
+ PDF Chat	SLOGD: Speaker Location Guided Deflation Approach to Speech Separation	2020	Sunit Sivasankaran Emmanuel Vincent Dominique Fohr
+	Single-Channel Speech Separation with Auxiliary Speaker Embeddings	2019	Shuo Liu Gil Keren Björn Schüller
+	Self-Remixing: Unsupervised Speech Separation VIA Separation and Remixing	2023	Kohei Saijo Tetsuji Ogawa
+	Permutation Invariant Training of Deep Models for Speaker-Independent Multi-talker Speech Separation	2016	Dong Yu Morten Kolbæk Zheng‐Hua Tan Jesper Jensen
+ PDF Chat	30+ Years of Source Separation Research: Achievements and Future Challenges	2025	Shoko Araki Nobutaka Ito Reinhold Haeb‐Umbach Gordon Wichern Zhong-Qiu Wang Yuki Mitsufuji
+	Self-Remixing: Unsupervised Speech Separation via Separation and Remixing	2022	Kohei Saijo Tetsuji Ogawa
+ PDF Chat	LibriheavyMix: A 20,000-Hour Dataset for Single-Channel Reverberant Multi-Talker Speech Separation, ASR and Speaker Diarization	2024	Zengrui Jin Yifan Yang Mohan Shi Wei Kang Xiaoyu Yang Zengwei Yao Fangjun Kuang Liyong Guo Lingwei Meng Long Lin
+	Deep Extractor Network for Target Speaker Recovery From Single Channel Speech Mixtures	2018	Jun Wang Jie Chen Dan Su Lianwu Chen Meng Yu Yanmin Qian Dong Yu
+ PDF Chat	Deep Extractor Network for Target Speaker Recovery from Single Channel Speech Mixtures	2018	Jun Wang Jie Chen Dan Su Lianwu Chen Meng Yu Yanmin Qian Dong Yu
+	Building Corpora for Single-Channel Speech Separation Across Multiple Domains	2018	Matthew Maciejewski Gregory Sell Paola García Shinji Watanabe Sanjeev Khudanpur
+ PDF Chat	PixIT: Joint Training of Speaker Diarization and Speech Separation from Real-world Multi-speaker Recordings	2024	Joonas Kalda Clément Pagès Ricard Marxer Tanel Alumäe Hervé Bredin
+ PDF Chat	Audioslots: A Slot-Centric Generative Model For Audio Separation	2023	Pradyumna Reddy Scott Wisdom Klaus Greff John R. Hershey Thomas Kipf
+	PixIT: Joint Training of Speaker Diarization and Speech Separation from Real-world Multi-speaker Recordings	2024	Joonas Kalda Clément Pagès Ricard Marxer Tanel Alumäe Hervé Bredin
+	Tackling the Cocktail Fork Problem for Separation and Transcription of Real-World Soundtracks	2022	Darius Petermann Gordon Wichern Aswin Shanmugam Subramanian Zhong-Qiu Wang Jonathan Le Roux
+	The Cone of Silence: Speech Separation by Localization	2020	Teerapat Jenrungrot Vivek Jayaram Steve Seitz Ira Kemelmacher-Shlizerman
+ PDF Chat	Asteroid: The PyTorch-Based Audio Source Separation Toolkit for Researchers	2020	Manuel Pariente Samuele Cornell Joris Cosentino Sunit Sivasankaran Efthymios Tzinis Jens Heitkaemper Michel Olvera Fabian-Robert Stöter Mathieu Hu Juan M. Martín-Doñas

Works That Cite This (63)

Action	Title	Year	Authors
+ PDF Chat	Points2Sound: from mono to binaural audio using 3D point cloud scenes	2022	Francesc Lluís Vasileios Chatziioannou Alex Hofmann
+ PDF Chat	Distortion-Controlled Training for end-to-end Reverberant Speech Separation with Auxiliary Autoencoding Loss	2021	Yi Luo Cong Han Nima Mesgarani
+ PDF Chat	A dual-stream deep attractor network with multi-domain learning for speech dereverberation and separation	2021	Hangting Chen Pengyuan Zhang
+	Integrating end-to-end neural and clustering-based diarization: Getting the best of both worlds	2020	Keisuke Kinoshita Marc Delcroix Naohiro Tawara
+	Convolutive Prediction for Monaural Speech Dereverberation and Noisy-Reverberant Speaker Separation	2021	Zhong-Qiu Wang Gordon Wichern Jonathan Le Roux
+	SEANet: A Multi-modal Speech Enhancement Network	2020	Marco Tagliasacchi Yunpeng Li Karolis Misiunas Dominik Roblek
+	WPD++: An Improved Neural Beamformer for Simultaneous Speech Separation and Dereverberation	2020	Zhaoheng Ni Yong Xu Meng Yu Bo Wu Shi-Xiong Zhang Dong Yu Michael Mandel
+	Tune-In: Training Under Negative Environments with Interference for Attention Networks Simulating Cocktail Party Effect	2021	Jun Wang Max W. Y. Lam Dan Su Dong Yu
+	Multi-channel Speech Enhancement with 2-D Convolutional Time-frequency Domain Features and a Pre-trained Acoustic Model	2021	Quandong Wang Junnan Wu Yan Zhao Si-chong Qian Liyong Guo Lichun Fan Weiji Zhuang Peng Gao Yujun Wang
+	Dual-Path Transformer Network: Direct Context-Aware Modeling for End-to-End Monaural Speech Separation	2020	Jingjing Chen Qirong Mao Dong Liu

Works Cited by This (22)

Action	Title	Year	Authors
+ PDF Chat	Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification	2015	Kaiming He Xiangyu Zhang Shaoqing Ren Jian Sun
+ PDF Chat	Deep clustering: Discriminative embeddings for segmentation and separation	2016	John R. Hershey Zhuo Chen Jonathan Le Roux Shinji Watanabe
+ PDF Chat	Permutation invariant training of deep models for speaker-independent multi-talker speech separation	2017	Dong Yu Morten Kolbæk Zheng‐Hua Tan Jesper Jensen
+ PDF Chat	Deep attractor network for single-microphone speaker separation	2017	Zhuo Chen Yi Luo Nima Mesgarani
+	Speaker-Independent Speech Separation With Deep Attractor Network	2018	Yi Luo Zhuo Chen Nima Mesgarani
+ PDF Chat	The Fifth 'CHiME' Speech Separation and Recognition Challenge: Dataset, Task and Baselines	2018	Jon Barker Shinji Watanabe Emmanuel Vincent Jan Trmal
+	Sokoto Coventry fingerprint dataset	2018	Yahaya Isah Shehu Ariel Ruiz-Garcia Vasile Palade Anne James
+	WaveNet: A Generative Model for Raw Audio	2016	Aäron van den Oord Sander Dieleman Heiga Zen Karen Simonyan Oriol Vinyals Alex Graves Nal Kalchbrenner Andrew Senior Koray Kavukcuoglu
+	Conv-TasNet: Surpassing Ideal Time–Frequency Magnitude Masking for Speech Separation	2019	Yi Luo Nima Mesgarani
+ PDF Chat	Single-Channel Multi-Speaker Separation Using Deep Clustering	2016	Yusuf Ziya Işık Jonathan Le Roux Zhuo Chen Shinji Watanabe John R. Hershey