clhuang
/

t5-hotel-review-sentiment

Text2Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

clhuang commited on Jun 4, 2022

Commit

4d30297

•

1 Parent(s): 35acc23

Update README.md

Files changed (1) hide show

README.md +8 -4

README.md CHANGED Viewed

@@ -1,18 +1,22 @@
 ---
 license: afl-3.0
 ---
 # T5情緒面向分類多任務
 目前初步先使用"Langboat/mengzi-t5-base"簡體中文預訓練模型加以微調，
 資料集蒐集自線上訂房網站的顧客留言，目前有30150筆(資料由本實驗室成員張易筠蒐集)。
 由"Langboat/mengzi-t5-base"官網資訊得知是由簡體中文語料所訓練，因此繁體中文留言先轉成簡體中文再進行微調訓練。
-s
-使用Google colab Tesla T4 GPU進行3epochs訓練，費時55分鐘，val_loss約為0.0315，初步實驗，仍有很大的改善空間。
-下一階段會進行數據增強(由於蒐集的語料是不平衡),以及使用Google的mt5繁體簡體中文預訓練模型加以微調。
     #pip install simplet5
     from simplet5 import SimpleT5
     model = SimpleT5()
@@ -33,7 +37,7 @@ s
     model.predict(text)
     #['设施面向的负面情绪']
-# 輸入輸出改成是正體中文
     from opencc import OpenCC
     t2s = OpenCC('t2s')  # convert from Traditional Chinese to Simplified Chinese
     s2t = OpenCC('s2t')  # convert from Simplified Chinese to Traditional Chinese

 ---
 license: afl-3.0
 ---
+# Hotel review multi-aspect sentiment classification using T5
+We fine tune a T5 pretrained model to generate multi-aspect sentiment classes. The outputs are whole sentiment, aspect, and aspect+sentiment.
 # T5情緒面向分類多任務
 目前初步先使用"Langboat/mengzi-t5-base"簡體中文預訓練模型加以微調，
 資料集蒐集自線上訂房網站的顧客留言，目前有30150筆(資料由本實驗室成員張易筠蒐集)。
 由"Langboat/mengzi-t5-base"官網資訊得知是由簡體中文語料所訓練，因此繁體中文留言先轉成簡體中文再進行微調訓練。
+使用Google colab Tesla T4 GPU進行了3 epochs訓練，費時55分鐘，val_loss約為0.0315，初步實驗，仍有很大的改善空間。
+下一階段會進行數據增強(由於蒐集的語料是不平衡),以及使用Google的mt5繁體簡體中文預訓練模型加以微調。
+# 載入模型(使用的是simplet5套件)
     #pip install simplet5
     from simplet5 import SimpleT5
     model = SimpleT5()
     model.predict(text)
     #['设施面向的负面情绪']
+# 輸入輸出改成是正體中文，輸出三項分類任務資訊
     from opencc import OpenCC
     t2s = OpenCC('t2s')  # convert from Traditional Chinese to Simplified Chinese
     s2t = OpenCC('s2t')  # convert from Simplified Chinese to Traditional Chinese