shibing624
commited on
Commit
•
5487885
1
Parent(s):
f352b2b
Update README.md
Browse files
README.md
CHANGED
@@ -21,10 +21,10 @@ Sentence Level: acc:0.81
|
|
21 |
|
22 |
case:
|
23 |
|
24 |
-
|input_text|
|
25 |
-
|:-- |:---
|
26 |
-
|
27 |
-
|
28 |
|
29 |
训练使用了SIGHAN+Wang271K中文纠错数据集,在SIGHAN2015的测试集上达到接近SOTA水平。
|
30 |
|
@@ -47,7 +47,8 @@ model = BartSeq2SeqModel(
|
|
47 |
encoder_type='bart',
|
48 |
encoder_decoder_type='bart',
|
49 |
encoder_decoder_name='shibing624/bart4csc-base-chinese',
|
50 |
-
tokenizer=tokenizer
|
|
|
51 |
sentences = ["少先队员因该为老人让坐"]
|
52 |
print(model.predict(sentences))
|
53 |
# ['少先队员应该为老人让座']
|
|
|
21 |
|
22 |
case:
|
23 |
|
24 |
+
|input_text|pred|
|
25 |
+
|:-- |:--- |
|
26 |
+
|辰导中引述她的话说:核子间题的解决之道系于克什米尔纷争。|报导中引述她的话说:核子问题的解决之道系于克什米尔纷争。|
|
27 |
+
|报导并末说明事故发生的原因。|报导并未说明事故发生的原因。|
|
28 |
|
29 |
训练使用了SIGHAN+Wang271K中文纠错数据集,在SIGHAN2015的测试集上达到接近SOTA水平。
|
30 |
|
|
|
47 |
encoder_type='bart',
|
48 |
encoder_decoder_type='bart',
|
49 |
encoder_decoder_name='shibing624/bart4csc-base-chinese',
|
50 |
+
tokenizer=tokenizer,
|
51 |
+
args={"max_length": 128, "eval_batch_size": 128})
|
52 |
sentences = ["少先队员因该为老人让坐"]
|
53 |
print(model.predict(sentences))
|
54 |
# ['少先队员应该为老人让座']
|