Turbo: Efficiently Serving Long-Context Large Language Models with In-Network Aggregation

Published in SIGCOMM 2026, 2025 (CCF-A, Top 1) .
Ying Wan, Yuchen Xu, Chuwen Zhang, Yingsheng Huang, Yong Feng, Wenquan Xu, Jialin Li, Mingwei Xu, Wenfei Wu, Congcong Miao.