Ankur Bapna

Multimodal Modeling for Spoken Language Identification

Shikhar Bharadwaj

Min Ma

Shikhar Vashishth

Ankur Bapna

Sriram (Sri) Ganapathy

Vera Axelrod

Sid Dalmia

Wei Han

Yu Zhang

Daan van Esch

Sandy Ritchie

Partha Talukdar

Jason Riesa

Proceedings of 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024) (2024)

Miipher: A Robust Speech Restoration Model Integrating Self-Supervised Speech Representation and Linguistic Features

Yuma Koizumi

Heiga Zen

Shigeki Karita

Yifan Ding

Kohei Yatabe

Nobuyuki Morioka

Yu Zhang

Wei Han

Ankur Bapna

Michiel Adriaan Unico Bacchiani

WASPAA 2023 (2023) (to appear)

Mu2SLAM: Multitask, Multilingual Speech and Language Models

Yong Cheng

Yu Zhang

Melvin Johnson

Wolfgang Macherey

Ankur Bapna

Submission to ACL 2023

LibriTTS-R: Restoration of a Large-Scale Multi-Speaker TTS Corpus

Yuma Koizumi

Heiga Zen

Shigeki Karita

Yifan Ding

Kohei Yatabe

Nobuyuki Morioka

Michiel Adriaan Unico Bacchiani

Yu Zhang

Wei Han

Ankur Bapna

Interspeech 2023 (2023)

Virtuoso: Massive Multilingual Speech-Text Joint Semi-Supervised Learning for Text-to-Speech

Takaaki Saeki

Heiga Zen

Zhehuai Chen

Nobuyuki Morioka

Gary Wang

Yu Zhang

Ankur Bapna

Andrew Rosenberg

Bhuvana Ramabhadran

ICASSP (2023)

Label Aware Speech Representation Learning For Language Identification

Ankur Bapna

Min Ma

Partha Talukdar

Shikhar Bharadwaj

Shikhar Vashishth

Sriram Ganapathy

Vera Axelrod

Wei Han

Proceedings of Interspeech 2023, pp. 5351-5355

Maestro-U: Leveraging joint speech-text representation learning for zero supervised speech ASR

Zhehuai Chen

Ankur Bapna

Andrew Rosenberg

Yu Zhang

Bhuvana Ramabhadran

Pedro Moreno Mengibar

Nanxin Chen

IEEE SLT (2022)

XTREME-S: Evaluating Cross-lingual Speech Representations

Ankur Bapna

Clara E. Rivera

Daan van Esch

Jason Riesa

Jon Clark

Melvin Johnson

Mihir Sanjay Kale

Min Ma

Orhan Firat

Sandy Ritchie

Sebastian Ruder

Simran Khanuja

Ye Jia

Yu Zhang

Proc. Interspeech 2022

FLEURS: Few-shot Learning Evaluation of Universal Representations of Speech

Alexis Conneau

Min Ma

Simran Khanuja

Yu Zhang

Vera Axelrod

Siddharth Dalmia

Jason Riesa

Clara Rivera

Ankur Bapna

IEEE Spoken Language Technology Workshop (SLT) (2022)

Building Machine Translation Systems for the Next Thousand Languages

Ankur Bapna

Isaac Caswell

Julia Kreutzer

Orhan Firat

Daan van Esch

Aditya Siddhant

Mengmeng Niu

Pallavi Nikhil Baljekar

Xavier Garcia

Wolfgang Macherey

Theresa Breiner

Vera Saldinger Axelrod

Jason Riesa

Yuan Cao

Mia Chen

Klaus Macherey

Maxim Krikun

Pidong Wang

Alexander Gutkin

Apu Shah

Yanping Huang

Zhifeng Chen

Yonghui Wu

Macduff Richard Hughes

Google Research (2022)

Defining the technology of today and tomorrow.

Philosophy

People

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Ankur Bapna

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Ankur Bapna

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us