File size: 1,509 Bytes
d043d05
 
24f39fd
329fcb4
 
 
 
 
 
 
 
 
 
 
 
 
d043d05
24f39fd
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
329fcb4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
---
license: mit
widget:
- text: 只要关羽不捣乱,峡谷4V5也不怕
  example_title: 只要关羽不捣乱,峡谷4V5也不怕
- text: 贵圈这场大戏真是活久见
  example_title: 贵圈这场大戏真是活久见
- text: 职业操盘手不可外传的成交量买卖精髓,字字珠玑!
  example_title: 职业操盘手不可外传的成交量买卖精髓,字字珠玑!
- text: 新疆呼图壁县举办第二届“渔之悦杯”垂钓比赛
  example_title: 新疆呼图壁县举办第二届“渔之悦杯”垂钓比赛
datasets:
- fourteenBDr/toutiao
language:
- zh
pipeline_tag: text-classification
---

# 中文新闻分类模型

## 介绍

基于 pytorch 使用[今日头条数据集](https://huggingface.co/datasets/fourteenBDr/toutiao)训练的中文新闻分类模型,用于学习中文文本分类使用,python 源码见 [main.py](./main.py)

## 使用

```python
from transformers import pipeline
classifier = pipeline("text-classification",  model="myml/toutiao")
classifier("只要关羽不捣乱,峡谷4V5也不怕?")
# echo [{'label': 'LABEL_16', 'score': 0.9958072900772095}]
```

## 结果映射

```txt
LABEL_0 民生 故事 
LABEL_1 文化 文化 
LABEL_2 娱乐 娱乐 
LABEL_3 体育 体育 
LABEL_4 财经 财经 
LABEL_6 房产 房产 
LABEL_7 汽车 汽车 
LABEL_8 教育 教育 
LABEL_9 科技 科技 
LABEL_10 军事 军事 
LABEL_12 旅游 旅游 
LABEL_13 国际 国际 
LABEL_14 证券 股票 
LABEL_15 农业 三农 
LABEL_16 电竞 游戏 
```