Mostafa Dehghani

PaLI-X: On Scaling up a Multilingual Vision and Language Model

Xi Chen

Josip Djolonga

Piotr Padlewski

Basil Mustafa

Beer Changpinyo

Jialin Wu

Carlos Riquelme

Sebastian Goodman

Xiao Wang

Yi Tay

Siamak Shakeri

Mostafa Dehghani

Daniel Salz

Mario Lučić

Michael Tschannen

Arsha Nagrani

Hexiang (Frank) Hu

Mandar Joshi

Bo Pang

Ceslee Montgomery

Paulina Pietrzyk

Marvin Ritter

AJ Piergiovanni

Matthias Minderer

Filip Pavetić

Austin Waters

Gang Li

Ibrahim Alabdulmohsin

Lucas Beyer

Julien Amelot

Kenton Lee

Andreas Steiner

Yang Li

Daniel Keysers

Anurag Arnab

Yuanzhong Xu

Keran Rong

Alexander Kolesnikov

Mojtaba Seyedhosseini

Anelia Angelova

Xiaohua Zhai

Neil Houlsby

Radu Soricut

Computer Vision and Pattern Recognition Conference (CVPR) (2024)

Scaling Vision Transformers to 22 Billion Parameters

Mostafa Dehghani

Josip Djolonga

Basil Mustafa

Piotr Padlewski

Jonathan Heek

Justin Gilmer

Andreas Steiner

Mathilde Caron

Robert Geirhos

Ibrahim Alabdulmohsin

Rodolphe Jenatton

Lucas Beyer

Michael Tschannen

Anurag Arnab

Xiao Wang

Carlos Riquelme

Matthias Minderer

Joan Puigcerver

Utku Evci

Manoj Kumar

Sjoerd van Steenkiste

Gamaleldin Elsayed

Aravindh Mahendran

Fisher Yu

Avital Oliver

Fantine Huot

Jasmijn Bastings

Mark Collier

Alexey Gritsenko

Vighnesh Birodkar

Cristina Vasconcelos

Yi Tay

Thomas Mensink

Alexander Kolesnikov

Filip Pavetić

Dustin Tran

Thomas Kipf

Mario Lučić

Xiaohua Zhai

Daniel Keysers

Jeremiah Harmsen

Neil Houlsby

Arxiv (2023)

DSI++: Updating Transformer Memory with New Documents

Sanket Vaibhav Mehta

Jai Gupta

Yi Tay

Mostafa Dehghani

Vinh Tran

Jinfeng Rao

Marc Najork

Emma Strubell

Don Metzler

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing

Dual PatchNorm

Manoj Kumar

Mostafa Dehghani

Neil Houlsby

Transactions on Machine Learning Research (2023) (to appear)

UL2: Unifying Language Learning Paradigms

Yi Tay

Mostafa Dehghani

Vinh Tran

Xavier Garcia

Jason Wei

Xuezhi Wang

Hyung Won Chung

Dara Bahri

Tal Schuster

Steven Zheng

Denny Zhou

Neil Houlsby

Don Metzler

ICLR (2023)

How (not) to ensemble LVLMs for VQA

Lisa Alazraki

Lluis Castrejon

Mostafa Dehghani

Fantine Huot

Jasper Uijlings

Thomas Mensink

"I Can't Believe It's Not Better: Failure Modes in the Age of Foundation Models" at NeurIPS 2023 Workshops

Confident Adaptive Language Modeling

Tal Schuster

Adam Fisch

Jai Prakash Gupta

Mostafa Dehghani

Dara Bahri

Vinh Quoc Tran

Yi Tay

Don Metzler

NeurIPS 2022

Discrete Representations Strengthen Vision Transformer Robustness

Chengzhi Mao

Lu Jiang

Mostafa Dehghani

Carl Martin Vondrick

Rahul Sukthankar

Irfan Essa

ICLR (2022)

Exploring the Limits of Large Scale Pre-training

Samira Abnar

Mostafa Dehghani

Behnam Neyshabur

Hanie Sedghi

ICLR Spotlight (2022)

Transformer Memory as a Differentiable Search Index

Yi Tay

Vinh Q. Tran

Mostafa Dehghani

Jianmo Ni

Dara Bahri

Harsh Mehta

Zhen Qin

Kai Hui

Zhe Zhao

Jai Gupta

Tal Schuster

William W. Cohen

Don Metzler

NeurIPS 2022

Defining the technology of today and tomorrow.

Philosophy

People

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Mostafa Dehghani

Research Areas

Join us

Defining the technology of today and tomorrow.

Philosophy

People

Foundational ML & Algorithms

Computing Systems & Quantum AI

Science, AI & Society

Projects

Publications

Resources

Shaping the future, together.

Student programs

Faculty programs

Conferences & events

Mostafa Dehghani

Research Areas

Filter by:

Publications

Years

Research Areas

Teams

Join us