shibing624 commited on
Commit
5487885
1 Parent(s): f352b2b

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +6 -5
README.md CHANGED
@@ -21,10 +21,10 @@ Sentence Level: acc:0.81
21
 
22
  case:
23
 
24
- |input_text|target_text|pred|
25
- |:-- |:--- |:--- |
26
- |辰导中引述她的话说:核子间题的解决之道系于克什米尔纷争。|报导中引述她的话说:核子问题的解决之道系于克什米尔纷争。|报导中引述她的话说:核子问题的解决之道系于克什米尔纷争。|
27
- |报导并末说明事故发生的原因。|报导并未说明事故发生的原因。|报导并未说明事故发生的原因。|
28
 
29
  训练使用了SIGHAN+Wang271K中文纠错数据集,在SIGHAN2015的测试集上达到接近SOTA水平。
30
 
@@ -47,7 +47,8 @@ model = BartSeq2SeqModel(
47
  encoder_type='bart',
48
  encoder_decoder_type='bart',
49
  encoder_decoder_name='shibing624/bart4csc-base-chinese',
50
- tokenizer=tokenizer)
 
51
  sentences = ["少先队员因该为老人让坐"]
52
  print(model.predict(sentences))
53
  # ['少先队员应该为老人让座']
 
21
 
22
  case:
23
 
24
+ |input_text|pred|
25
+ |:-- |:--- |
26
+ |辰导中引述她的话说:核子间题的解决之道系于克什米尔纷争。|报导中引述她的话说:核子问题的解决之道系于克什米尔纷争。|
27
+ |报导并末说明事故发生的原因。|报导并未说明事故发生的原因。|
28
 
29
  训练使用了SIGHAN+Wang271K中文纠错数据集,在SIGHAN2015的测试集上达到接近SOTA水平。
30
 
 
47
  encoder_type='bart',
48
  encoder_decoder_type='bart',
49
  encoder_decoder_name='shibing624/bart4csc-base-chinese',
50
+ tokenizer=tokenizer,
51
+ args={"max_length": 128, "eval_batch_size": 128})
52
  sentences = ["少先队员因该为老人让坐"]
53
  print(model.predict(sentences))
54
  # ['少先队员应该为老人让座']