m3hrdadfi commited on
Commit
82bb621
1 Parent(s): c7851c5

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +3 -2
README.md CHANGED
@@ -81,7 +81,7 @@ chars_to_mapping = {
81
  "ﻟ": "ل", "ﻡ": "م", "ﻢ": "م", "ﻪ": "ه", "ﻮ": "و", "ئ": "ی", 'ﺍ': "ا", 'ة': "ه",
82
  'ﯾ': "ی", 'ﯿ': "ی", 'ﺒ': "ب", 'ﺖ': "ت", 'ﺪ': "د", 'ﺮ': "ر", 'ﺴ': "س", 'ﺷ': "ش",
83
  'ﺸ': "ش", 'ﻋ': "ع", 'ﻤ': "م", 'ﻥ': "ن", 'ﻧ': "ن", 'ﻭ': "و", 'ﺭ': "ر", "ﮔ": "گ",
84
- "\\u200c": " ", "\\u200d": " ", "\\u200e": " ", "\\u200f": " ", "\\ufeff": " ",
85
  }
86
 
87
  def multiple_replace(text, chars_to_mapping):
@@ -224,6 +224,7 @@ import torchaudio
224
  from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
225
  from datasets import load_dataset, load_metric
226
 
 
227
  import hazm
228
  import re
229
  import string
@@ -245,7 +246,7 @@ chars_to_mapping = {
245
  "ﻟ": "ل", "ﻡ": "م", "ﻢ": "م", "ﻪ": "ه", "ﻮ": "و", "ئ": "ی", 'ﺍ': "ا", 'ة': "ه",
246
  'ﯾ': "ی", 'ﯿ': "ی", 'ﺒ': "ب", 'ﺖ': "ت", 'ﺪ': "د", 'ﺮ': "ر", 'ﺴ': "س", 'ﺷ': "ش",
247
  'ﺸ': "ش", 'ﻋ': "ع", 'ﻤ': "م", 'ﻥ': "ن", 'ﻧ': "ن", 'ﻭ': "و", 'ﺭ': "ر", "ﮔ": "گ",
248
- "\\u200c": " ", "\\u200d": " ", "\\u200e": " ", "\\u200f": " ", "\\ufeff": " ",
249
  }
250
 
251
  def multiple_replace(text, chars_to_mapping):
 
81
  "ﻟ": "ل", "ﻡ": "م", "ﻢ": "م", "ﻪ": "ه", "ﻮ": "و", "ئ": "ی", 'ﺍ': "ا", 'ة': "ه",
82
  'ﯾ': "ی", 'ﯿ': "ی", 'ﺒ': "ب", 'ﺖ': "ت", 'ﺪ': "د", 'ﺮ': "ر", 'ﺴ': "س", 'ﺷ': "ش",
83
  'ﺸ': "ش", 'ﻋ': "ع", 'ﻤ': "م", 'ﻥ': "ن", 'ﻧ': "ن", 'ﻭ': "و", 'ﺭ': "ر", "ﮔ": "گ",
84
+ "\\\\u200c": " ", "\\\\u200d": " ", "\\\\u200e": " ", "\\\\u200f": " ", "\\\\ufeff": " ",
85
  }
86
 
87
  def multiple_replace(text, chars_to_mapping):
 
224
  from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
225
  from datasets import load_dataset, load_metric
226
 
227
+ import numpy as np
228
  import hazm
229
  import re
230
  import string
 
246
  "ﻟ": "ل", "ﻡ": "م", "ﻢ": "م", "ﻪ": "ه", "ﻮ": "و", "ئ": "ی", 'ﺍ': "ا", 'ة': "ه",
247
  'ﯾ': "ی", 'ﯿ': "ی", 'ﺒ': "ب", 'ﺖ': "ت", 'ﺪ': "د", 'ﺮ': "ر", 'ﺴ': "س", 'ﺷ': "ش",
248
  'ﺸ': "ش", 'ﻋ': "ع", 'ﻤ': "م", 'ﻥ': "ن", 'ﻧ': "ن", 'ﻭ': "و", 'ﺭ': "ر", "ﮔ": "گ",
249
+ "\\\\u200c": " ", "\\\\u200d": " ", "\\\\u200e": " ", "\\\\u200f": " ", "\\\\ufeff": " ",
250
  }
251
 
252
  def multiple_replace(text, chars_to_mapping):