toutiao / README.md
myml's picture
Update README.md
329fcb4
|
raw
history blame
1.51 kB
metadata
license: mit
widget:
  - text: 只要关羽不捣乱,峡谷4V5也不怕
    example_title: 只要关羽不捣乱,峡谷4V5也不怕
  - text: 贵圈这场大戏真是活久见
    example_title: 贵圈这场大戏真是活久见
  - text: 职业操盘手不可外传的成交量买卖精髓,字字珠玑!
    example_title: 职业操盘手不可外传的成交量买卖精髓,字字珠玑!
  - text: 新疆呼图壁县举办第二届“渔之悦杯”垂钓比赛
    example_title: 新疆呼图壁县举办第二届“渔之悦杯”垂钓比赛
datasets:
  - fourteenBDr/toutiao
language:
  - zh
pipeline_tag: text-classification

中文新闻分类模型

介绍

基于 pytorch 使用今日头条数据集训练的中文新闻分类模型,用于学习中文文本分类使用,python 源码见 main.py

使用

from transformers import pipeline
classifier = pipeline("text-classification",  model="myml/toutiao")
classifier("只要关羽不捣乱,峡谷4V5也不怕?")
# echo [{'label': 'LABEL_16', 'score': 0.9958072900772095}]

结果映射

LABEL_0 民生 故事 
LABEL_1 文化 文化 
LABEL_2 娱乐 娱乐 
LABEL_3 体育 体育 
LABEL_4 财经 财经 
LABEL_6 房产 房产 
LABEL_7 汽车 汽车 
LABEL_8 教育 教育 
LABEL_9 科技 科技 
LABEL_10 军事 军事 
LABEL_12 旅游 旅游 
LABEL_13 国际 国际 
LABEL_14 证券 股票 
LABEL_15 农业 三农 
LABEL_16 电竞 游戏