草根蜀财网

网站首页 今日更新 > 正文

今日快讯:Yandex开源大型语言模型训练工具YaFSDP

2024-06-11 18:00:58 今日更新 来源:
导读 6月11日消息,跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。YaFSDP可用于增强GPU通信并减少LLM训练中的内存使...

6月11日消息,跨国科技公司Yandex最近推出了用于训练大型语言模型的开源方法YaFSDP。YaFSDP可用于增强GPU通信并减少LLM训练中的内存使用量,与FSDP相比,其训练速度提升最高可达26%。YaFSDP方法目前已可以在Github上免费访问。

文章转载自:界面新闻网 非本站原创


版权说明: 本文由用户上传,如有侵权请联系删除!


标签: