Gabriele Oliaro

CS PhD Student

Carnegie Mellon University

About

I am a 3rd year Ph.D. student in the Computer Science Department at Carnegie Mellon University, where I am fortunate to work with Zhihao Jia as part of the Catalyst Lab and Parallel Data Lab.

I am interested in machine learning systems, parallel computing and distributed systems, with a particular focus on large language models (LLMs).

Download my CV.

Interests

Machine Learning
Distributed Systems
Parallel Computing
Networking

Education

PhD in Computer Science, 2028

Carnegie Mellon University
MS in Advanced Computing, 2023

Tsinghua University
BS in Electrical Engineering, 2021

Harvard University

Recent Publications

Quickly discover relevant content by filtering publications.

FlexLLM: Token-Level Co-Serving of LLM Inference and Fine-Tuning with SLO Guarantee

Gabriele Oliaro, Xupeng Miao, Xinhao Cheng, Vineeth Kada, Ruohan Gao, Yingyi Huang, Remi Delacourt, April Yang, Yingcheng Wang, Mengdi Wu, Colin Unger, Zhihao Jia

NSDI 2026

SpecReason: Fast and Accurate Inference-Time Compute via Speculative Reasoning

Rui Pan, Yinwei Dai, Zhihao Zhang, Gabriele Oliaro, Zhihao Jia, Ravi Netravali

ArXiv 2025

AdaServe: SLO-Customized LLM Serving with Fine-Grained Speculative Decoding

Zikun Li, Zhuofu Chen, Remi Delacourt, Gabriele Oliaro, Zeyu Wang, Qinghan Chen, Shuhuai Lin, April Yang, Zhihao Zhang, Zhuoming Chen, Sean Lai, Xupeng Miao, Zhihao Jia

EuroSys 2026

SuffixDecoding: A Model-Free Approach to Speeding Up Large Language Model Inference

Gabriele Oliaro, Zhihao Jia, Daniel Campos, Aurick Qiao

ArXiv 2024

Quantized Side Tuning: Fast and Memory-Efficient Tuning of Quantized Large Language Models

Zhengxin Zhang, Dan Zhao, Xupeng Miao, Gabriele Oliaro, Qing Li, Yong Jiang, Zhihao Jia

ACL 2024 Oral (Outstanding paper award 🏆)

SpecInfer: Accelerating Generative Large Language Model Serving with Tree-based Speculative Inference and Verification

Xupeng Miao, Gabriele Oliaro, Zhihao Zhang, Xinhao Cheng, Zeyu Wang, Zhengxin Zhang, Rae Ying Yee Wong, Alan Zhu, Lijie Yang, Xiaoxiang Shi, Chunan Shi, Zhuoming Chen, Daiyaan Arfeen, Reyna Abhyankar, Zhihao Jia

ASPLOS 2024 (Cited 300+ times 🏆)

Optimal Kernel Orchestration for Tensor Programs with Korch

Muyan Hu, Ashwin Venkatram, Shreyashri Biswas, Balamurugan Marimuthu, Bohan Hou, Gabriele Oliaro, Haojie Wang, Liyan Zheng, Xupeng Miao, Jidong Zhai, Zhihao Jia

ASPLOS 2024

Towards Efficient Generative Large Language Model Serving: A Survey from Algorithms to Systems

Xupeng Miao, Gabriele Oliaro, Zhihao Zhang, Xinhao Cheng, Hongyi Jin, Tianqi Chen, Zhihao Jia

ACM Comput. Surv.

Direct Telemetry Access

Jonatan Langlet, Ran Ben Basat, Gabriele Oliaro, Michael Mitzenmacher, Minlan Yu, Gianni Antichi

SIGCOMM 2023

Zero-CPU Collection with Direct Telemetry Access

Jonatan Langlet, Ran Ben Basat, Sivaram Ramanathan, Gabriele Oliaro, Michael Mitzenmacher, Minlan Yu, Gianni Antichi

HotNets 2021