CS3311-Proj1
项目简介
简要训练与推理示例,基于 Qwen2.5-0.5B 进行微调(示例 checkpoint 存放在 output/ 下),并使用清洗后的 Alpaca 数据集进行训练与演示。
提交文件说明
- 作业报告:自然语言处理_Proj1.pdf
- Notebook(训练/推理):train_inference.ipynb
模型下载
训练好的模型已上传到交大云盘: https://pan.sjtu.edu.cn/web/share/deb3a077b74fc8558a0df9db1ba60a9f
或者直接使用仓库中 checkpoint: https://huggingface.co/ZTAZTAZTA/CS3311-Proj1
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support