BERT 大学生创新创业项目赛道适配预测模型

本模型基于 bert-base-chinese 微调,用于根据大学生创新创业项目名称或一句话简介预测适合的参赛赛道。

任务类型

本任务属于单标签多分类文本分类任务。模型输入一段中文项目文本,输出四个赛道类别之一:

  • 产业赛道
  • 高教主赛道
  • 青年红色筑梦之旅赛道
  • 职教赛道

阶段性评估结果

验证集样本数:1659

指标 数值
Accuracy 75.41%
Precision Micro 75.41%
Recall Micro 75.41%
F1 Micro 75.41%
Precision Macro 70.53%
Recall Macro 70.72%
F1 Macro 70.44%

各类别结果:

类别 Precision Recall F1
产业赛道 0.8200 0.8146 0.8173
高教主赛道 0.8146 0.8310 0.8227
青年红色筑梦之旅赛道 0.7102 0.7976 0.7514
职教赛道 0.4764 0.3855 0.4262

使用示例

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

model_id = "你的用户名/trackBERT"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForSequenceClassification.from_pretrained(model_id)
model.eval()

text = "红色文化数字化传播与乡村振兴实践项目"
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)

with torch.no_grad():
    logits = model(**inputs).logits
    pred_id = torch.argmax(logits, dim=-1).item()

print(model.config.id2label[pred_id])

说明

当前模型主要基于项目名称训练,适合作为赛道适配预测的第一版 baseline。后续可通过加入项目简介、关键词、项目领域信息,以及优化类别不均衡问题进一步提升效果。

Downloads last month
4
Safetensors
Model size
0.1B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for XIn-9/trackBERT

Finetuned
(284)
this model