CS3311-Proj1

项目简介

简要训练与推理示例,基于 Qwen2.5-0.5B 进行微调(示例 checkpoint 存放在 output/ 下),并使用清洗后的 Alpaca 数据集进行训练与演示。

提交文件说明

  • 作业报告:自然语言处理_Proj1.pdf
  • Notebook(训练/推理):train_inference.ipynb

模型下载

训练好的模型已上传到交大云盘: https://pan.sjtu.edu.cn/web/share/deb3a077b74fc8558a0df9db1ba60a9f

或者直接使用仓库中 checkpoint: https://huggingface.co/ZTAZTAZTA/CS3311-Proj1

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support