Edit model card

wrime-sentimentデータセットをbertベースのモデルでfinetuningしたもの

  • ベースモデル:cl-tohoku/bert-base-japanese-whole-word-masking
  • データセット:llm-book/wrime-sentiment
  • 学習率スケジュールタイプ(lr_scheduler_type): constant
  • 学習率(learning rate): 2e-5
  • 勾配累積ステップ(gradient_accumulation_steps): なし
  • 正則化(weight_decay): なし
  • Epoch: 100
  • EarlyStopping: early_stopping_patience=3
Downloads last month
10