diff --git a/RELEASE.md b/RELEASE.md index 8836057d20405478363fb817584ccda3ef1bae0d..b2ebd875b24ee6399b80e6a071bb3609380508d2 100644 --- a/RELEASE.md +++ b/RELEASE.md @@ -1,5 +1,60 @@ # DeepSparkHub Release Notes +## DeepSparkHub 24.12 Release Notes + +### 特性和增强 + +#### 模型与算法 + +* 新增了4个PyTorch训练模型,其中2个为Multimodal模型 +* 新增了5个大模型训练示例,涉及ColossalAI,Megatron-LM和LLaMA-Factory + + + + + + + + + + + + + + + + + + + + + + + + +
PyTorch
KANMamba-YOLOLLaVA 1.5
Stable Diffusion 3
大模型
DeepSeek MoE 7B (ColossalAI)Llama3-8B SFT (ColossalAI)Mamba-2 (Megatron-LM)
Mixtral 8x7B (Megatron-LM)Qwen2.5-7B SFT (LLaMA-Factory)
+ +### 问题修复 + +* 更新了Llama2-7B (Megatron-DeepSpeed)模型的数据集链接。 +* 同步了DBNet、Fast R-CNN和GoogLeNet等PyTorch模型的代码。 +* 同步了BERT Base、FaceNet和ResNet50等TensorFlow模型的代码。 +* 同步了ClossalAI、Megatron-DeepSpeed和OpenPCDet工具箱的代码。 + +### 版本关联 + +DeepSparkHub 24.12对应天数软件栈4.1.1版本。 + +### 贡献者 + +感谢以下人员做出的贡献: + +李一力,sanghui-ilu,majorli6,honglyua,吴永乐。 + +欢迎以任何形式为DeepSparkHub项目贡献。 + +--- + ## DeepSparkHub 24.09 Release Notes ### 特性和增强