Efficient LLM Serving on Hybrid Real-time and Best-effort Requests

Jan 1, 2026·

Borui Wan

,

Juntao Zhao

,

Chuan Wu

,

Chuanxiong Guo

,

Et Al.

· 0 min read

PDF

Last updated on Jan 1, 2026

MegaScale-Data: Scaling DataLoader for Multisource Large Foundation Model Training Jan 1, 2026 →