Add language tags (#2)

- Add language tags (b3e1791bcc672fbbf2bac50c402d14d7e832c272)
- Update README.md (e4d74d3e62cf7c890a6ad6fbad3a7cadf1e21d99)

Co-authored-by: Loïck BOURDOIS <lbourdois@users.noreply.huggingface.co>

Files changed (1) hide show

README.md CHANGED Viewed

@@ -1,5 +1,109 @@
 ---
-language: multilingual
 license: apache-2.0
 datasets:
 - wikipedia
@@ -22,8 +126,7 @@ datasets:
 ## Model Description
-This model is a distilled version of the [BERT base multilingual model](bert-base-multilingual-cased). The code for the distillation process can be found
-[here](https://github.com/huggingface/transformers/tree/master/examples/distillation). This model is cased: it does make a difference between english and English.
 The model is trained on the concatenation of Wikipedia in 104 different languages listed [here](https://github.com/google-research/bert/blob/master/multilingual.md#list-of-languages).
 The model has 6 layers, 768 dimension and 12 heads, totalizing 134M parameters (compared to 177M parameters for mBERT-base).

 ---
+language:
+- multilingual
+- af
+- sq
+- ar
+- an
+- hy
+- ast
+- az
+- ba
+- eu
+- bar
+- be
+- bn
+- inc
+- bs
+- br
+- bg
+- my
+- ca
+- ceb
+- ce
+- zh
+- cv
+- hr
+- cs
+- da
+- nl
+- en
+- et
+- fi
+- fr
+- gl
+- ka
+- de
+- el
+- gu
+- ht
+- he
+- hi
+- hu
+- is
+- io
+- id
+- ga
+- it
+- ja
+- jv
+- kn
+- kk
+- ky
+- ko
+- la
+- lv
+- lt
+- roa
+- nds
+- lm
+- mk
+- mg
+- ms
+- ml
+- mr
+- mn
+- min
+- ne
+- new
+- nb
+- nn
+- oc
+- fa
+- pms
+- pl
+- pt
+- pa
+- ro
+- ru
+- sco
+- sr
+- hr
+- scn
+- sk
+- sl
+- aze
+- es
+- su
+- sw
+- sv
+- tl
+- tg
+- th
+- ta
+- tt
+- te
+- tr
+- uk
+- ud
+- uz
+- vi
+- vo
+- war
+- cy
+- fry
+- pnb
+- yo
 license: apache-2.0
 datasets:
 - wikipedia
 ## Model Description
+This model is a distilled version of the [BERT base multilingual model](https://huggingface.co/bert-base-multilingual-cased/). The code for the distillation process can be found [here](https://github.com/huggingface/transformers/tree/main/examples/research_projects/distillation). This model is cased: it does make a difference between english and English.
 The model is trained on the concatenation of Wikipedia in 104 different languages listed [here](https://github.com/google-research/bert/blob/master/multilingual.md#list-of-languages).
 The model has 6 layers, 768 dimension and 12 heads, totalizing 134M parameters (compared to 177M parameters for mBERT-base).