MegaScale-Data: Scaling DataLoader for Multisource Large Foundation Model Training

Jan 1, 2026·

Juntao Zhao

,

Qi Lu

,

Wei Jia

,

Borui Wan

,

Lei Zuo

,

Junda Feng

,

Jianyu Jiang

,

Yangrui Chen

,

Shuaishuai Cao

,

Jialing He

,

Others

· 0 min read

PDF

Last updated on Jan 1, 2026

← Efficient LLM Serving on Hybrid Real-time and Best-effort Requests Jan 1, 2026

Sandwich: Separating Prefill-Decode Compilation for Efficient CPU LLM Serving Jan 1, 2025 →