DeepSpeed 是微软Microsoft开发的一个深度学习优化软件套件,可用于训练和推理密集和稀疏模型,具有数十亿到数万亿个参数。它提供了许多创新功能,如 ZeRO、3D-Parallelism、DeepSpeed-MoE、ZeRO-Infinity 等,可大大提高训练效率和推理效率,同时降低成本。
我们使用Cookie来改善您的体验。