|
--- |
|
widget: |
|
- text: "ドクウツボはインド洋とどの海域の熱帯域に分布しますか?" |
|
context: "ドクウツボ(毒鱓)Gymnothoraxjavanicus(Bleeker,1859)は体長3メートルの記録がある大型種で、鰓孔が黒いことで近縁種と区別できる。 インド洋と太平洋の熱帯域に広く分布し、日本では琉球列島で見られる。 " |
|
--- |
|
|
|
## モデル詳細 |
|
- [cl-tohoku/bert-base-japanese](https://huggingface.co/cl-tohoku/bert-base-japanese) を JaQuAD で fine-tuning した [SkelterLabsInc/bert-base-japanese-jaquad](https://huggingface.co/SkelterLabsInc/bert-base-japanese-jaquad) に対して [TextPruner](https://github.com/airaria/TextPruner) を使って |
|
Transformer Pruning したモデル。 |
|
- 枝刈りには,JaQuAD の訓練データのうち1024件を使用し,10イテレーションで実施。 |
|
- FFNのサイズを30%,attention head の数を 10 % 削減 (ffn: 3072, head: 12 -> ffn: 2150, head: 10)。 |
|
- ※ [JaQuAD の実験コード](https://github.com/SkelterLabsInc/JaQuAD/blob/main/JaQuAD.ipynb)と同じ前処理をした上で使用してください。 |
|
- ※ 上記の理由で, hf hub の Hosted inference API 上では適切な予測が出力されません。 |
|
|
|
|
|
|
|
## JaQuAD の validation データでの性能 |
|
- フルモデル |
|
- F1 score: 0.779 |
|
- Exact Match: 0.614 |
|
- 枝刈り後のモデル |
|
- F1 score: 0.756 |
|
- Exact Match: 0.587 |