flozi00 commited on
Commit
662b110
β€’
1 Parent(s): 6af4db3

Upload tokenizer

Browse files
Files changed (2) hide show
  1. tokenizer.json +96 -96
  2. tokenizer_config.json +2 -3
tokenizer.json CHANGED
@@ -98898,126 +98898,126 @@
98898
  "▁livre s",
98899
  "lu b",
98900
  "l ub",
98901
- "▁ ▁",
98902
  "▁▁ ▁▁",
98903
- "▁▁▁ ▁",
98904
- "▁ ▁▁▁",
 
98905
  "▁▁ ▁▁▁▁▁▁",
98906
- "▁▁▁▁ ▁▁▁▁",
98907
- "▁▁▁▁▁ ▁▁▁",
98908
- "▁▁▁▁▁▁ ▁▁",
98909
- "▁▁▁ ▁▁▁▁▁",
98910
- "▁▁▁▁▁▁▁ ▁",
98911
- "▁ ▁▁▁▁▁▁▁",
98912
- "▁▁ ▁▁▁",
98913
- "▁▁▁▁ ▁",
98914
- "▁▁▁ ▁▁",
98915
- "▁ ▁▁▁▁",
98916
  "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
98917
  "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
98918
  "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
98919
  "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
98920
  "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
98921
  "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
 
 
 
98922
  "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
 
 
 
 
98923
  "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
 
 
98924
  "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
 
 
 
 
 
 
 
98925
  "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
98926
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
98927
- "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
98928
- "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
98929
- "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
98930
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
98931
- "▁▁ ▁▁▁▁",
98932
- "▁▁▁▁ ▁▁",
98933
- "▁▁▁▁▁ ▁",
98934
  "▁▁▁ ▁▁▁",
98935
- "▁ ▁▁▁▁▁",
98936
- "▁▁ ▁▁▁▁▁▁▁▁▁▁",
98937
- "▁▁▁▁ ▁▁▁▁▁▁▁▁",
98938
- "▁▁▁▁▁▁▁▁ ▁▁▁▁",
98939
- "▁▁▁▁▁ ▁▁▁▁▁▁▁",
98940
- "▁▁▁▁▁▁ ▁▁▁▁▁▁",
98941
- "▁▁▁▁▁▁▁▁▁▁ ▁▁",
98942
  "▁▁▁ ▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
98943
  "▁▁▁▁▁▁▁▁▁ ▁▁▁",
 
 
 
 
 
98944
  "▁▁▁▁▁▁▁ ▁▁▁▁▁",
98945
- "▁▁▁▁▁▁▁▁▁▁▁ ▁",
98946
- "▁ ▁▁▁▁▁▁▁▁▁▁▁",
98947
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
98948
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
98949
- "▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
98950
- "▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
98951
- "▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
98952
- "▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
98953
- "▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
98954
- "▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
98955
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
98956
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
98957
- "▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
98958
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
98959
- "▁▁ ▁▁▁▁▁▁▁▁",
98960
- "▁▁▁▁ ▁▁▁▁▁▁",
98961
- "▁▁▁▁▁▁▁▁ ▁▁",
98962
- "▁▁▁▁▁ ▁▁▁▁▁",
98963
- "▁▁▁▁▁▁ ▁▁▁▁",
98964
- "▁▁▁ ▁▁▁▁▁▁▁",
98965
- "▁▁▁▁▁▁▁▁▁ ▁",
98966
  "▁▁▁▁▁▁▁ ▁▁▁",
98967
- "▁ ▁▁▁▁▁▁▁▁▁",
98968
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
98969
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
98970
- "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
98971
- "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
98972
- "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
98973
- "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
98974
- "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
98975
- "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
98976
- "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
98977
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
98978
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
 
 
 
 
98979
  "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
98980
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
98981
- "▁▁ ▁",
98982
  "▁ ▁▁",
98983
- "▁▁ ▁▁▁▁▁▁▁",
98984
- "▁▁▁▁ ▁▁▁▁▁",
98985
- "▁▁▁▁▁▁▁▁ ▁",
98986
- "▁▁▁▁▁ ▁▁▁▁",
98987
- "▁▁▁▁▁▁ ▁▁▁",
98988
- "▁▁▁ ▁▁▁▁▁▁",
98989
- "▁▁▁▁▁▁▁ ▁▁",
98990
  "▁ ▁▁▁▁▁▁▁▁",
98991
- "▁▁ ▁▁▁▁▁",
98992
- "▁▁▁▁ ▁▁▁",
98993
- "▁▁▁▁▁ ▁▁",
98994
- "▁▁▁▁▁▁ ▁",
98995
- "▁▁▁ ▁▁▁▁",
98996
  "▁ ▁▁▁▁▁▁",
98997
- "▁▁ ▁▁▁▁▁▁▁▁▁",
98998
- "▁▁▁▁ ▁▁▁▁▁▁▁",
98999
- "▁▁▁▁▁▁▁▁ ▁▁▁",
99000
- "▁▁▁▁▁ ▁▁▁▁▁▁",
99001
- "▁▁▁▁▁▁ ▁▁▁▁▁",
99002
- "▁▁▁▁▁▁▁▁▁▁ ▁",
99003
- "▁▁▁ ▁▁▁▁▁▁▁▁",
99004
- "▁▁▁▁▁▁▁▁▁ ▁▁",
99005
- "▁▁▁▁▁▁▁ ▁▁▁▁",
99006
  "▁ ▁▁▁▁▁▁▁▁▁▁",
99007
- "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
99008
- "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
99009
- "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
99010
- "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
99011
- "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
99012
- "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
99013
- "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
99014
- "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
99015
- "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
99016
- "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
99017
- "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
99018
- "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
99019
- "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
99020
- "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁"
99021
  ]
99022
  }
99023
  }
 
98898
  "▁livre s",
98899
  "lu b",
98900
  "l ub",
 
98901
  "▁▁ ▁▁",
98902
+ "▁▁ ▁▁▁▁",
98903
+ "▁▁ ▁▁▁▁▁▁▁▁",
98904
+ "▁▁ ▁▁▁▁▁",
98905
  "▁▁ ▁▁▁▁▁▁",
98906
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
98907
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
98908
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
98909
  "▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
98910
+ "▁▁ ▁▁▁",
98911
+ "▁▁ ▁▁▁▁▁▁▁▁▁",
98912
+ "▁▁ ▁▁▁▁▁▁▁",
98913
+ "▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
98914
+ "▁▁ ▁",
98915
+ "▁▁▁▁ ▁▁",
98916
+ "▁▁▁▁ ▁▁▁▁",
98917
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁",
98918
+ "▁▁▁▁ ▁▁▁▁▁",
98919
+ "▁▁▁▁ ▁▁▁▁▁▁",
98920
  "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
98921
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
98922
+ "▁▁▁▁ ▁▁▁",
98923
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
98924
+ "▁▁▁▁ ▁▁▁▁▁▁▁",
98925
+ "▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
98926
+ "▁▁▁▁ ▁",
98927
+ "▁▁▁▁▁▁▁▁ ▁▁",
98928
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁",
98929
  "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
98930
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
98931
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
98932
+ "▁▁▁▁▁▁▁▁ ▁▁▁",
98933
+ "▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
98934
+ "▁▁▁▁▁▁▁▁ ▁",
98935
+ "▁▁▁▁▁ ▁▁",
98936
+ "▁▁▁▁▁ ▁▁▁▁",
98937
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
98938
+ "▁▁▁▁▁ ▁▁▁▁▁",
98939
+ "▁▁▁▁▁ ▁▁▁▁▁▁",
98940
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
98941
+ "▁▁▁▁▁ ▁▁▁",
98942
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
98943
+ "▁▁▁▁▁ ▁▁▁▁▁▁▁",
98944
  "▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
98945
+ "▁▁▁▁▁ ▁",
98946
+ "▁▁▁▁▁▁ ▁▁",
98947
+ "▁▁▁▁▁▁ ▁▁▁▁",
98948
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
98949
+ "▁▁▁▁▁▁ ▁▁▁▁▁",
98950
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁",
98951
  "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
98952
+ "▁▁▁▁▁▁ ▁▁▁",
98953
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
98954
+ "▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
98955
+ "▁▁▁▁▁▁ ▁",
98956
+ "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
98957
  "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
98958
+ "▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
98959
+ "▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
98960
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
98961
  "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
98962
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
98963
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁",
98964
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
98965
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
98966
  "▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
98967
+ "▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
98968
+ "▁▁▁▁▁▁▁▁▁▁ ▁",
98969
  "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
98970
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
98971
+ "▁▁▁ ▁▁",
98972
+ "▁▁▁ ▁▁▁▁",
98973
+ "▁▁▁ ▁▁▁▁▁▁▁▁",
98974
+ "▁▁▁ ▁▁▁▁▁",
98975
+ "▁▁▁ ▁▁▁▁▁▁",
98976
+ "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
98977
  "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
98978
+ "▁▁▁ ▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
98979
  "▁▁▁ ▁▁▁",
 
 
 
 
 
 
 
98980
  "▁▁▁ ▁▁▁▁▁▁▁▁▁",
98981
+ "▁▁▁ ▁▁▁▁▁▁▁",
98982
+ "▁▁▁ ▁▁▁▁▁▁▁▁▁▁▁",
98983
+ "▁▁▁ ▁",
98984
+ "▁▁▁▁▁▁▁▁▁ ▁▁",
98985
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
98986
+ "▁▁▁▁▁▁▁��▁ ▁▁▁▁▁",
98987
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
98988
  "▁▁▁▁▁▁▁▁▁ ▁▁▁",
98989
+ "▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
98990
+ "▁▁▁▁▁▁▁▁▁ ▁",
98991
+ "▁▁▁▁▁▁▁ ▁▁",
98992
+ "▁▁▁▁▁▁▁ ▁▁▁▁",
98993
+ "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁",
98994
  "▁▁▁▁▁▁▁ ▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
 
98995
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
98996
  "▁▁▁▁▁▁▁ ▁▁▁",
98997
+ "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
 
 
 
98998
  "▁▁▁▁▁▁▁ ▁▁▁▁▁▁▁",
98999
+ "▁▁▁▁▁▁▁ ▁",
99000
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁▁",
99001
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁",
99002
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁▁▁",
99003
  "▁▁▁▁▁▁▁▁▁▁▁ ▁▁▁",
99004
+ "▁▁▁▁▁▁▁▁▁▁▁ ▁",
99005
+ "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁ ▁",
99006
  "▁ ▁▁",
99007
+ "▁ ▁▁▁▁",
 
 
 
 
 
 
99008
  "▁ ▁▁▁▁▁▁▁▁",
99009
+ "▁ ▁▁▁▁▁",
 
 
 
 
99010
  "▁ ▁▁▁▁▁▁",
99011
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁",
99012
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁",
 
 
 
 
 
 
 
99013
  "▁ ▁▁▁▁▁▁▁▁▁▁",
99014
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
99015
+ "▁ ▁▁▁",
99016
+ "▁ ▁▁▁▁▁▁▁▁▁",
99017
+ "▁ ▁▁▁▁▁▁▁",
99018
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁",
99019
+ "▁ ▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
99020
+ "▁ ▁"
 
 
 
 
 
 
 
99021
  ]
99022
  }
99023
  }
tokenizer_config.json CHANGED
@@ -1,6 +1,4 @@
1
  {
2
- "add_bos_token": true,
3
- "add_eos_token": false,
4
  "bos_token": {
5
  "__type": "AddedToken",
6
  "content": "<s>",
@@ -30,5 +28,6 @@
30
  "normalized": true,
31
  "rstrip": false,
32
  "single_word": false
33
- }
 
34
  }
 
1
  {
 
 
2
  "bos_token": {
3
  "__type": "AddedToken",
4
  "content": "<s>",
 
28
  "normalized": true,
29
  "rstrip": false,
30
  "single_word": false
31
+ },
32
+ "use_default_system_prompt": true
33
  }