EC2 Default User commited on
Commit
fc25f0f
1 Parent(s): ddc02d0

calculate cer

Browse files
eval.py CHANGED
@@ -99,7 +99,7 @@ def main(args):
99
  elif args.thai_tokenizer=='syllable':
100
  tok_func = syllable_tokenize
101
  else:
102
- raise('No Thai tokenizer chosen')
103
 
104
  # map function to decode audio
105
  def map_to_pred(batch, tok_func):
@@ -128,7 +128,7 @@ if __name__ == "__main__":
128
  )
129
  parser.add_argument(
130
  "--thai_tokenizer", type=str, default="newmm",
131
- required=True, help="newmm, syllable, or deepcut"
132
  )
133
  parser.add_argument(
134
  "--dataset",
99
  elif args.thai_tokenizer=='syllable':
100
  tok_func = syllable_tokenize
101
  else:
102
+ tok_func = lambda x: x.replace(' ','')
103
 
104
  # map function to decode audio
105
  def map_to_pred(batch, tok_func):
128
  )
129
  parser.add_argument(
130
  "--thai_tokenizer", type=str, default="newmm",
131
+ required=True, help="newmm, syllable, or deepcut; if not specified, remove all spaces (used for CER calculation)"
132
  )
133
  parser.add_argument(
134
  "--dataset",
robust-speech-event/.ipynb_checkpoints/log_mozilla-foundation_common_voice_7_0_th_test_predictions_cer-checkpoint.txt ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ เ ร า เ ร ิ ่ ม ต ้ น ด ้ ว ย ว ิ ธ ี น ี ้
3
+ 1
4
+ ส ่ ง ใ ห ้ ต ร ง น ี ้ แ ห ล ะ โ ด โ ด ้ บ อ ก
5
+ 2
6
+ ห น ท า ง ท ี ่ ด ี ท ี ่ ส ุ ด ไ ป ส ู ่ ค ว า ม ม ุ ่ ง ห ว ั ง ข อ ง ฉ ั น ค ื อ อ ะ ไ ร
7
+ 3
8
+ ค ุ ณ ค ง ว ่ า ง ม า ก เ ล ย ส ิ น ะ
9
+ 4
10
+ พ ร ุ ่ ง น ี ้ เ ข า จ ะ ม า ท ำ ถ น น ห น ้ า บ ้ า น น ะ อ า จ จ ะ เ ส ี ย ง ด ั ง ห น ่ อ ย
11
+ 5
12
+ ฉ ั น พ ิ น ิ จ ใ น จ ิ น ต น า ก า ร ข อ ง ฉ ั น
13
+ 6
14
+ เ ร า ม า จ า ก จ ั ง ห ว ั ด ล ะ ย อ ง
15
+ 7
16
+ เ ค ล ว ิ น ฟ า เ ร น ไ ฮ ต ์ ห ร ื อ เ ซ ล เ ซ ี ย ส ซ ึ ่ ง เ ป ็ น ห น ่ ว ย อ ุ ณ ห ภ ู ม ิ ท ี ่ ด ี ท ี ่ ส ุ ด
17
+ 8
18
+ แ ล ะ ม ั น ก ็ เ ป ็ น ค ว า ม จ ร ิ ง
19
+ 9
20
+ ว ิ ธ ี ก า ร ส ร ้ า ง ช ่ อ ด อ ก ไ ม ้ ท ี ่ ก ิ น ไ ด ้
robust-speech-event/.ipynb_checkpoints/log_mozilla-foundation_common_voice_7_0_th_test_predictions_deepcut-checkpoint.txt ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ เรา เริ่มต้น ด้วย วิธี นี้
3
+ 1
4
+ ส่ง ให้ ตรง นี้ แหละ โดโด้ บอก
5
+ 2
6
+ หนทาง ที่ ดี ที่สุด ไป สู่ ความ มุ่ง หวัง ของ ฉัน คือ อะไร
7
+ 3
8
+ คุณคง ว่าง มาก เลย สิ นะ
9
+ 4
10
+ พรุ่ง นี้ เขา จะ มา ทำ ถนน หน้า บ้าน นะ อาจ จะ เสียง ดัง หน่อย
11
+ 5
12
+ ฉัน พินิจ ใน จินตนาการ ของ ฉัน
13
+ 6
14
+ เรา มา จาก จังหวัดละยอง
15
+ 7
16
+ เคลวินฟาเรนไฮต์ หรือ เซลเซียส ซึ่ง เป็น หน่วย อุณหภูมิ ที่ ดี ที่สุด
17
+ 8
18
+ และ มัน ก็ เป็น ความ จริง
19
+ 9
20
+ วิธี การ สร้าง ช่อ ดอก ไม้ ที่ กิน ได้
robust-speech-event/.ipynb_checkpoints/log_mozilla-foundation_common_voice_7_0_th_test_predictions_newmm-checkpoint.txt ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ เรา เริ่มต้น ด้วย วิธี นี้
3
+ 1
4
+ ส่ง ให้ ตรง นี้แหละ โด โด้ บอก
5
+ 2
6
+ หนทาง ที่ ดี ที่สุด ไป สู่ ความ มุ่งหวัง ของ ฉัน คือ อะไร
7
+ 3
8
+ คุณ คง ว่าง มาก เลย สิ นะ
9
+ 4
10
+ พรุ่งนี้ เขา จะ มา ทำ ถนน หน้าบ้าน นะ อาจจะ เสียงดัง หน่อย
11
+ 5
12
+ ฉัน พินิจ ในจินตนาการ ของ ฉัน
13
+ 6
14
+ เรา มาจาก จังหวัด ละ ยอง
15
+ 7
16
+ เค ล วิน ฟา เร น ไฮ ต์ หรือ เซลเซียส ซึ่ง เป็น หน่วย อุณหภูมิ ที่ ดี ที่สุด
17
+ 8
18
+ และ มัน ก็ เป็น ความจริง
19
+ 9
20
+ วิธีการ สร้าง ช่อดอกไม้ ที่ กิน ได้
robust-speech-event/.ipynb_checkpoints/log_mozilla-foundation_common_voice_7_0_th_test_targets_cer-checkpoint.txt ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ เ ร า เ ร ิ ่ ม ต ้ น ด ้ ว ย ว ิ ธ ี น ี ้
3
+ 1
4
+ ส ่ ง ใ ห ้ ต ร ง น ี ้ แ ห ล ะ โ ด โ ด ้ บ อ ก
5
+ 2
6
+ ห น ท า ง ท ี ่ ด ี ท ี ่ ส ุ ด ไ ป ส ู ่ ค ว า ม ม ุ ่ ง ห ว ั ง ข อ ง ฉ ั น ค ื อ อ ะ ไ ร
7
+ 3
8
+ ค ุ ณ ค ง ว ่ า ง ม า ก เ ล ย ส ิ น ะ
9
+ 4
10
+ พ ร ุ ่ ง น ี ้ เ ข า จ ะ ม า ท ำ ถ น น ห น ้ า บ ้ า น น ะ อ า จ จ ะ เ ส ี ย ง ด ั ง ห น ่ อ ย
11
+ 5
12
+ ฉ ั น พ ิ น ิ จ ใ น จ ิ น ต น า ก า ร ข อ ง ฉ ั น
13
+ 6
14
+ เ ร า ม า จ า ก จ ั ง ห ว ั ด ร ะ ย อ ง
15
+ 7
16
+ เ ค ล ว ิ น ฟ า เ ร น ไ ฮ ต ์ ห ร ื อ เ ซ ล เ ซ ี ย ส ซ ึ ่ ง เ ป ็ น ห น ่ ว ย อ ุ ณ ห ภ ู ม ิ ท ี ่ ด ี ท ี ่ ส ุ ด
17
+ 8
18
+ แ ล ะ ม ั น ก ็ เ ป ็ น ค ว า ม จ ร ิ ง
19
+ 9
20
+ ว ิ ธ ี ก า ร ส ร ้ า ง ช ่ อ ด อ ก ไ ม ้ ท ี ่ ก ิ น ไ ด ้
robust-speech-event/.ipynb_checkpoints/log_mozilla-foundation_common_voice_7_0_th_test_targets_deepcut-checkpoint.txt ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ เรา เริ่มต้น ด้วย วิธี นี้
3
+ 1
4
+ ส่ง ให้ ตรง นี้ แหละ โดโด้ บอก
5
+ 2
6
+ หนทาง ที่ ดี ที่สุด ไป สู่ ความ มุ่ง หวัง ของ ฉัน คือ อะไร
7
+ 3
8
+ คุณคง ว่าง มาก เลย สิ นะ
9
+ 4
10
+ พรุ่ง นี้ เขา จะ มา ทำ ถนน หน้า บ้าน นะ อาจ จะ เสียง ดัง หน่อย
11
+ 5
12
+ ฉัน พินิจ ใน จินตนาการ ของ ฉัน
13
+ 6
14
+ เรา มา จาก จังหวัดระยอง
15
+ 7
16
+ เคลวินฟาเรนไฮต์ หรือ เซลเซียส ซึ่ง เป็น หน่วย อุณหภูมิ ที่ ดี ที่สุด
17
+ 8
18
+ และ มัน ก็ เป็น ความ จริง
19
+ 9
20
+ วิธี การ สร้าง ช่อ ดอก ไม้ ที่ กิน ได้
robust-speech-event/.ipynb_checkpoints/log_mozilla-foundation_common_voice_7_0_th_test_targets_newmm-checkpoint.txt ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ เรา เริ่มต้น ด้วย วิธี นี้
3
+ 1
4
+ ส่ง ให้ ตรง นี้แหละ โด โด้ บอก
5
+ 2
6
+ หนทาง ที่ ดี ที่สุด ไป สู่ ความ มุ่งหวัง ของ ฉัน คือ อะไร
7
+ 3
8
+ คุณ คง ว่าง มาก เลย สิ นะ
9
+ 4
10
+ พรุ่งนี้ เขา จะ มา ทำ ถนน หน้าบ้าน นะ อาจจะ เสียงดัง หน่อย
11
+ 5
12
+ ฉัน พินิจ ในจินตนาการ ของ ฉัน
13
+ 6
14
+ เรา มาจาก จังหวัด ระยอง
15
+ 7
16
+ เค ล วิน ฟา เร น ไฮ ต์ หรือ เซลเซียส ซึ่ง เป็น หน่วย อุณหภูมิ ที่ ดี ที่สุด
17
+ 8
18
+ และ มัน ก็ เป็น ความจริง
19
+ 9
20
+ วิธีการ สร้าง ช่อดอกไม้ ที่ กิน ได้
robust-speech-event/log_mozilla-foundation_common_voice_7_0_th_test_predictions_cer.txt ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ เ ร า เ ร ิ ่ ม ต ้ น ด ้ ว ย ว ิ ธ ี น ี ้
3
+ 1
4
+ ส ่ ง ใ ห ้ ต ร ง น ี ้ แ ห ล ะ โ ด โ ด ้ บ อ ก
5
+ 2
6
+ ห น ท า ง ท ี ่ ด ี ท ี ่ ส ุ ด ไ ป ส ู ่ ค ว า ม ม ุ ่ ง ห ว ั ง ข อ ง ฉ ั น ค ื อ อ ะ ไ ร
7
+ 3
8
+ ค ุ ณ ค ง ว ่ า ง ม า ก เ ล ย ส ิ น ะ
9
+ 4
10
+ พ ร ุ ่ ง น ี ้ เ ข า จ ะ ม า ท ำ ถ น น ห น ้ า บ ้ า น น ะ อ า จ จ ะ เ ส ี ย ง ด ั ง ห น ่ อ ย
11
+ 5
12
+ ฉ ั น พ ิ น ิ จ ใ น จ ิ น ต น า ก า ร ข อ ง ฉ ั น
13
+ 6
14
+ เ ร า ม า จ า ก จ ั ง ห ว ั ด ล ะ ย อ ง
15
+ 7
16
+ เ ค ล ว ิ น ฟ า เ ร น ไ ฮ ต ์ ห ร ื อ เ ซ ล เ ซ ี ย ส ซ ึ ่ ง เ ป ็ น ห น ่ ว ย อ ุ ณ ห ภ ู ม ิ ท ี ่ ด ี ท ี ่ ส ุ ด
17
+ 8
18
+ แ ล ะ ม ั น ก ็ เ ป ็ น ค ว า ม จ ร ิ ง
19
+ 9
20
+ ว ิ ธ ี ก า ร ส ร ้ า ง ช ่ อ ด อ ก ไ ม ้ ท ี ่ ก ิ น ไ ด ้
robust-speech-event/log_mozilla-foundation_common_voice_7_0_th_test_targets_cer.txt ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ เ ร า เ ร ิ ่ ม ต ้ น ด ้ ว ย ว ิ ธ ี น ี ้
3
+ 1
4
+ ส ่ ง ใ ห ้ ต ร ง น ี ้ แ ห ล ะ โ ด โ ด ้ บ อ ก
5
+ 2
6
+ ห น ท า ง ท ี ่ ด ี ท ี ่ ส ุ ด ไ ป ส ู ่ ค ว า ม ม ุ ่ ง ห ว ั ง ข อ ง ฉ ั น ค ื อ อ ะ ไ ร
7
+ 3
8
+ ค ุ ณ ค ง ว ่ า ง ม า ก เ ล ย ส ิ น ะ
9
+ 4
10
+ พ ร ุ ่ ง น ี ้ เ ข า จ ะ ม า ท ำ ถ น น ห น ้ า บ ้ า น น ะ อ า จ จ ะ เ ส ี ย ง ด ั ง ห น ่ อ ย
11
+ 5
12
+ ฉ ั น พ ิ น ิ จ ใ น จ ิ น ต น า ก า ร ข อ ง ฉ ั น
13
+ 6
14
+ เ ร า ม า จ า ก จ ั ง ห ว ั ด ร ะ ย อ ง
15
+ 7
16
+ เ ค ล ว ิ น ฟ า เ ร น ไ ฮ ต ์ ห ร ื อ เ ซ ล เ ซ ี ย ส ซ ึ ่ ง เ ป ็ น ห น ่ ว ย อ ุ ณ ห ภ ู ม ิ ท ี ่ ด ี ท ี ่ ส ุ ด
17
+ 8
18
+ แ ล ะ ม ั น ก ็ เ ป ็ น ค ว า ม จ ร ิ ง
19
+ 9
20
+ ว ิ ธ ี ก า ร ส ร ้ า ง ช ่ อ ด อ ก ไ ม ้ ท ี ่ ก ิ น ไ ด ้
robust-speech-event/mozilla-foundation_common_voice_7_0_th_test_eval_results_cer.txt ADDED
@@ -0,0 +1,2 @@
 
 
1
+ WER: 0.003194888178913738
2
+ CER: 0.0016233766233766235