系统研究参数量、数据量、计算量与损失之间的幂律关系,奠定规模化训练方法论。
年份与会议
2020 · arXiv
作者
Jared Kaplan、Sam McCandlish、Tom Henighan
主题
Scaling Laws
收录时间
2020/01/23
https://arxiv.org/abs/2001.08361