欢迎莅临 IEEE HotICN 中文社区,IEEE HotICN 国际学术会议网站: https://hoticn.com, https://hoticn.cn。
  • Design and implementation of NDN-based Ethereum blockchain
  • 北京大学 雷凯《区块链导论》 —郑纬民院士、李晓明教授作序
  • 会议征稿|新型网络体系与技术国际学术会议
  • 2019第二届IEEE信息中心未来网络国际学术会议(HotICN)在重庆邮电大学召开
互联网

Astral: A Datacenter Infrastructure for Large Language Model Training at Scale

Astral: A Datacenter Infrastructure for Large Language Model Training at Scale
1. 课题背景与系统目标:应对万亿参数训练挑战 随着大语言模型(LLM)向万亿级参数演进,底层基础设施面临着前所未有的压力。传统的通用数据中心架构在处理 LLM 训练时存在三个核心瓶颈:首先,高密度的算力需求导致单机柜功耗激增,传统风冷系统难以为继;其次,千卡甚至万卡级别...

hhx 16小时前