【资料图】
【ITBEAR科技资讯】6月27日消息,微软研究人员日前发布了一项名为ZeRO++的创新技术,该技术旨在解决训练大型AI模型时面临的数据传输成本和带宽限制等挑战,以显著缩短训练时间并节约成本。
据ITBEAR科技资讯了解,ZeRO++在现有的ZeRO传输技术基础上进行了进一步的优化,并提供了增强的通信策略,以提高训练效率,同时减少训练时间和成本。
为了减少参数通信量,ZeRO++采用了一种权重量化的方法。它利用基于块的量化技术来保持训练精度,相比原始的ZeRO传输技术,量化过程更加高效准确。此外,为了尽量减少通信开销,ZeRO++通过在每台机器上保留完整的模型副本,以换取GPU显存来增加通信带宽。在梯度通信方面,ZeRO++引入了一种名为qgZ的新型量化梯度通信方式,可降低跨节点的流量和延迟。
这些改进的通信技术极大地减少了通信量。据微软研究人员表示,与ZeRO相比,ZeRO++可以减少高达4倍的通信量,提高训练吞吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,相较于ZeRO-3,ZeRO++的吞吐量提高了28%至36%。在低带宽集群中,与ZeRO-3相比,ZeRO++实现了平均2倍的加速,使得大型模型的训练在更多种类的集群上成为可能。
ZeRO++的引入为训练大型模型带来了新的可能性,例如Turing-NLG、ChatGPT和GPT-4等。研究人员现已发布了相关技术文档,使得科研人员可以更有效地利用ZeRO++进行模型训练,进一步探索人工智能领域的新发展。
关键词:
相关的文章>>
热门搜索:
资讯
更多图说健康
更多疏风解毒胶囊的作用与功效是什么?疏风解毒胶囊可以起到解毒利咽...
艾叶的功效与作用有哪些?1、散寒止痛艾叶为菊科蒿属植物艾的叶...
治疗白发的偏方有哪些?1 桑白皮30克,五倍子15克,青葙子60...
紫癜性肾炎是什么病?所谓的紫癜性肾炎,就是由于患者对于某些东...
维生素ad是什么?维生素AD是指维生素A和D的混合制剂,是两种脂溶...
乙肝小三阳严重吗?乙肝小三阳有些比较严重,也有些不太严重的,...
常见疾病
更多体育健身
更多随着时间的推移和气候的变化,三伏的日期可能会有所调整,但它...
“未央墙西青草路,宫人斜里红妆墓。一边载出一边来,更衣不减...
直播吧6月27日讯中国足协官网消息,中超、中甲和中乙夏季转会注...
GGII依据终端零售数据统计显示,2023年5月国内新能源汽车销量约为57 9
云南信息报讯云上融媒记者徐蓉自普法强基补短板专项行动开展以...
中国青年报客户端讯(实习生周冀中青报·中青网见习记者李丹萍...