--- license: mit widget: - text: 只要关羽不捣乱,峡谷4V5也不怕 example_title: 只要关羽不捣乱,峡谷4V5也不怕 - text: 贵圈这场大戏真是活久见 example_title: 贵圈这场大戏真是活久见 - text: 职业操盘手不可外传的成交量买卖精髓,字字珠玑! example_title: 职业操盘手不可外传的成交量买卖精髓,字字珠玑! - text: 新疆呼图壁县举办第二届“渔之悦杯”垂钓比赛 example_title: 新疆呼图壁县举办第二届“渔之悦杯”垂钓比赛 datasets: - fourteenBDr/toutiao language: - zh pipeline_tag: text-classification --- # 中文新闻分类模型 ## 介绍 基于 pytorch 使用[今日头条数据集](https://huggingface.co/datasets/fourteenBDr/toutiao)训练的中文新闻分类模型,用于学习中文文本分类使用,python 源码见 [main.py](./main.py) ## 使用 ```python from transformers import pipeline classifier = pipeline("text-classification", model="myml/toutiao") classifier("只要关羽不捣乱,峡谷4V5也不怕?") # echo [{'label': 'LABEL_16', 'score': 0.9958072900772095}] ``` ## 结果映射 ```txt LABEL_0 民生 故事 LABEL_1 文化 文化 LABEL_2 娱乐 娱乐 LABEL_3 体育 体育 LABEL_4 财经 财经 LABEL_6 房产 房产 LABEL_7 汽车 汽车 LABEL_8 教育 教育 LABEL_9 科技 科技 LABEL_10 军事 军事 LABEL_12 旅游 旅游 LABEL_13 国际 国际 LABEL_14 证券 股票 LABEL_15 农业 三农 LABEL_16 电竞 游戏 ```