qgyd2021 commited on
Commit
db558eb
1 Parent(s): da35a3c
Files changed (2) hide show
  1. examples.json +4 -0
  2. examples/pattern.py +38 -0
examples.json CHANGED
@@ -6,5 +6,9 @@
6
  [
7
  "电销场景意图识别。如果不能确定,请输出 “未知意图”。\n\nExamples:\n------------\ntext: 没关系啦 知道的\nintent: 肯定答复\n------------\ntext: 怎么能联系你\nintent: 查联系方式\n------------\ntext: 恩。让我想想吧。\nintent: 考虑一下\n------------\ntext: 说点有用的\nintent: 请讲重点\n------------\ntext: 唉唉\nintent: 语气词\n------------\ntext: 说快一点\nintent: 请讲重点\n------------\ntext: 再介绍一下\nintent: 要求复述\n------------\ntext: 从哪弄到我信息\nintent: 质疑隐私安全\n------------\ntext: 哎。。不是的\nintent: 不是\n------------\ntext: 给我电话号码\nintent: 查联系方式\n------------\ntext: 先看看吧\nintent: 考虑一下\n------------\ntext: 怎么知道道我的信息\nintent: 质疑隐私安全\n------------\ntext: 哎,再说吧,我再想想\nintent: 考虑一下\n------------\ntext: 不,我清醒。\nintent: 不是\n------------\ntext: 重说一次\nintent: 要求复述\n------------\ntext: 行了,晚安\nintent: 肯定答复\n------------\ntext: 额额额额\nintent: 语气词\n------------\ntext: 恩。哎再说吧我考虑一下hiahia\nintent:\n",
8
  128, 0.75, 0.35, 1.2, "qgyd2021/few_shot_intent", true
 
 
 
 
9
  ]
10
  ]
 
6
  [
7
  "电销场景意图识别。如果不能确定,请输出 “未知意图”。\n\nExamples:\n------------\ntext: 没关系啦 知道的\nintent: 肯定答复\n------------\ntext: 怎么能联系你\nintent: 查联系方式\n------------\ntext: 恩。让我想想吧。\nintent: 考虑一下\n------------\ntext: 说点有用的\nintent: 请讲重点\n------------\ntext: 唉唉\nintent: 语气词\n------------\ntext: 说快一点\nintent: 请讲重点\n------------\ntext: 再介绍一下\nintent: 要求复述\n------------\ntext: 从哪弄到我信息\nintent: 质疑隐私安全\n------------\ntext: 哎。。不是的\nintent: 不是\n------------\ntext: 给我电话号码\nintent: 查联系方式\n------------\ntext: 先看看吧\nintent: 考虑一下\n------------\ntext: 怎么知道道我的信息\nintent: 质疑隐私安全\n------------\ntext: 哎,再说吧,我再想想\nintent: 考虑一下\n------------\ntext: 不,我清醒。\nintent: 不是\n------------\ntext: 重说一次\nintent: 要求复述\n------------\ntext: 行了,晚安\nintent: 肯定答复\n------------\ntext: 额额额额\nintent: 语气词\n------------\ntext: 恩。哎再说吧我考虑一下hiahia\nintent:\n",
8
  128, 0.75, 0.35, 1.2, "qgyd2021/few_shot_intent", true
9
+ ],
10
+ [
11
+ "意图识别。\n\nExamples:\n------------\ntext: 打开风扇\nintent: 开启\n------------\ntext: 关闭电视\nintent: 关闭\n------------\ntext: 把风扇关了吧\nintent: 关闭\n------------\ntext: 电视开开\nintent: 开启\n------------\ntext: 开灯\nintent:",
12
+ 128, 0.75, 0.35, 1.2, "qgyd2021/few_shot_intent", true
13
  ]
14
  ]
examples/pattern.py ADDED
@@ -0,0 +1,38 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ #!/usr/bin/python3
2
+ # -*- coding: utf-8 -*-
3
+ import re
4
+ import string
5
+
6
+
7
+ def remove_space_between_cn_en(text):
8
+ splits = re.split(" ", text)
9
+ if len(splits) < 2:
10
+ return text
11
+
12
+ result = ""
13
+ for t in splits:
14
+ if t == "":
15
+ continue
16
+ if re.search(f"[a-zA-Z0-9{string.punctuation}]$", result) and re.search("^[a-zA-Z0-9]", t):
17
+ result += " "
18
+ result += t
19
+ else:
20
+ if not result == "":
21
+ result += t
22
+ else:
23
+ result = t
24
+
25
+ if text.endswith(" "):
26
+ result += " "
27
+ return result
28
+
29
+
30
+ def main():
31
+ s = "sk . asdf ,"
32
+ result = remove_space_between_cn_en(s)
33
+ print(result)
34
+ return
35
+
36
+
37
+ if __name__ == '__main__':
38
+ main()