Spaces:
Runtime error
Runtime error
first POC
Browse files- app.py +82 -0
- chroma/b9368f83-cac6-4e7f-aceb-46276131053f/data_level0.bin +3 -0
- chroma/b9368f83-cac6-4e7f-aceb-46276131053f/header.bin +3 -0
- chroma/b9368f83-cac6-4e7f-aceb-46276131053f/length.bin +3 -0
- chroma/b9368f83-cac6-4e7f-aceb-46276131053f/link_lists.bin +0 -0
- chroma/chroma.sqlite3 +3 -0
- data/riddles_data +244 -0
- data_preparation.py +67 -0
- requirements.txt +2 -0
app.py
ADDED
@@ -0,0 +1,82 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# %%
|
2 |
+
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, pipeline
|
3 |
+
from langchain.vectorstores import Chroma
|
4 |
+
from langchain.embeddings import HuggingFaceEmbeddings
|
5 |
+
|
6 |
+
import gradio as gr
|
7 |
+
|
8 |
+
# %%
|
9 |
+
#Load the LLM model and pipeline directly
|
10 |
+
model="ClueAI/ChatYuan-large-v2"
|
11 |
+
|
12 |
+
pipe = pipeline("text2text-generation", model=model)
|
13 |
+
|
14 |
+
# %%
|
15 |
+
# %%
|
16 |
+
# loading the vector encoder
|
17 |
+
model_name = "shibing624/text2vec-base-chinese"
|
18 |
+
|
19 |
+
encode_kwargs = {'normalize_embeddings': False}
|
20 |
+
model_kwargs = {'device': 'cpu'}
|
21 |
+
|
22 |
+
huggingface_embeddings= HuggingFaceEmbeddings(
|
23 |
+
model_name=model_name,
|
24 |
+
model_kwargs=model_kwargs,
|
25 |
+
encode_kwargs = encode_kwargs
|
26 |
+
)
|
27 |
+
|
28 |
+
# %%
|
29 |
+
persist_directory = 'chroma/'
|
30 |
+
vectordb = Chroma(embedding_function=huggingface_embeddings,persist_directory=persist_directory)
|
31 |
+
|
32 |
+
# %%
|
33 |
+
# helper functions for prompt processing for this LLM
|
34 |
+
|
35 |
+
def preprocess(text):
|
36 |
+
text = text.replace("\n", "\\n").replace("\t", "\\t")
|
37 |
+
return text
|
38 |
+
|
39 |
+
def postprocess(text):
|
40 |
+
return text.replace("\\n", "\n").replace("\\t", "\t").replace('%20',' ')
|
41 |
+
|
42 |
+
|
43 |
+
# get answer from LLM with prompt input
|
44 |
+
def answer(text,context=""):
|
45 |
+
text = f"{context}\n{text}\n答案:"
|
46 |
+
text = text.strip()
|
47 |
+
text = preprocess(text)
|
48 |
+
out_text = pipe(text)
|
49 |
+
|
50 |
+
return postprocess(out_text[0]["generated_text"])
|
51 |
+
|
52 |
+
# helper function for RAG
|
53 |
+
def helper_rag(text):
|
54 |
+
docs_out = vectordb.similarity_search_with_relevance_scores(text,k=5)
|
55 |
+
context = ""
|
56 |
+
for doc in docs_out:
|
57 |
+
if doc[1] >= 0.8:
|
58 |
+
context += doc[0].page_content + "\n"
|
59 |
+
|
60 |
+
return context
|
61 |
+
|
62 |
+
# helper function for prompt
|
63 |
+
def helper_text(text_input):
|
64 |
+
|
65 |
+
if not any(c in text_input for c in ["猜", "打"]):
|
66 |
+
return "请给一个提示,提示格式,例子:猜一水果。"
|
67 |
+
|
68 |
+
text=f"""谜面:{text_input} 谜底:
|
69 |
+
"""
|
70 |
+
|
71 |
+
context = helper_rag(text)
|
72 |
+
|
73 |
+
return answer(text,context=context)
|
74 |
+
|
75 |
+
# %%
|
76 |
+
text_input = gr.Textbox(label="谜面", value="小家伙穿黄袍,花丛中把房造。飞到西来飞到东,人人夸他爱劳动。(猜一动物)", lines = 2)
|
77 |
+
text_output = gr.Textbox(label="谜底")
|
78 |
+
demo = gr.Interface(fn=helper_text, inputs=text_input, outputs=text_output, flagging_options=["Inappropriate"],allow_flagging="never")
|
79 |
+
|
80 |
+
demo.launch()
|
81 |
+
|
82 |
+
|
chroma/b9368f83-cac6-4e7f-aceb-46276131053f/data_level0.bin
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:a9982efe25ba84594dca572c678ac2ffa403cac0c1a02e827a5e43f2db3e8f50
|
3 |
+
size 3212000
|
chroma/b9368f83-cac6-4e7f-aceb-46276131053f/header.bin
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:0ec6df10978b056a10062ed99efeef2702fa4a1301fad702b53dd2517103c746
|
3 |
+
size 100
|
chroma/b9368f83-cac6-4e7f-aceb-46276131053f/length.bin
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:afe6e46f866341678c08ac17491fe9e82ec592b3c315957ed0199b33fcfa2391
|
3 |
+
size 4000
|
chroma/b9368f83-cac6-4e7f-aceb-46276131053f/link_lists.bin
ADDED
File without changes
|
chroma/chroma.sqlite3
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:db922fffd85b64dcd0e1f71d07c89cc394672563a5e8da754ad07175984fab86
|
3 |
+
size 1298432
|
data/riddles_data
ADDED
@@ -0,0 +1,244 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
谜面:双石为开(猜一字)谜底:砳
|
2 |
+
谜面:娴熟姑娘人人夸(猜一离合字)谜底:好女子(女子好)
|
3 |
+
谜面:丘山认父(猜一字)谜底:岳
|
4 |
+
谜面:有言在先寸土不让(猜一字)谜底:诗
|
5 |
+
谜面:疑是地上霜(三字口语)谜底:不明白
|
6 |
+
谜面:长长脖子白白毛,飞上空中自翱翔(猜一动物)谜底:天鹅
|
7 |
+
谜面:一人一心一张口(猜一字)谜底:恰
|
8 |
+
谜面:写信王国(猜一国家名)谜底:英国
|
9 |
+
谜面:欲上青天揽明月(猜一汽车品牌)谜底:凌志
|
10 |
+
谜面:哭成一团(猜一乐器)谜底:圆号
|
11 |
+
谜面:身教(猜一学科)谜底:体育
|
12 |
+
谜面:厂际挂钩搞联合(猜一字)谜底:捱
|
13 |
+
谜面:广州街头什么时候车子最多?谜底:车主开车出来的时候
|
14 |
+
谜面:上头去上头,下头是下头(猜一字)谜底:走
|
15 |
+
谜面:每日三餐有有鱼肉(猜五字常用语) 谜底:不是吃素的
|
16 |
+
谜面:水中捞月吃苦头(猜一字)谜底:湖
|
17 |
+
谜面:不要栽跟头(猜一字)谜底:根
|
18 |
+
谜面:路边邮筒(猜三字常用语)谜底:守信用
|
19 |
+
谜面:文成武德(猜一字)谜底:斌
|
20 |
+
谜面:什么话全世界都在用?谜底:电话
|
21 |
+
谜面:清江流水变桑田(猜一人事用语)谜底:青工转干
|
22 |
+
谜面:梁山伯与祝英台(猜一首歌)谜底:俩只蝴蝶
|
23 |
+
谜面:驼背公公红通通,两把剪刀挂前胸。胡须长长拖个尾,大摇大摆水里游。(猜一动物)谜底:龙虾
|
24 |
+
谜面:或重于泰山,或轻于鸿毛(四字谚语) 谜底:没大没小
|
25 |
+
谜面:语言美(猜三字常用语)谜底:漂亮话
|
26 |
+
谜面:三两木耳(猜一地理名词)谜底:森林
|
27 |
+
谜面:扇形脚丫跑不远,轻轻羽毛水上漂(猜一动物)谜底:鸭子
|
28 |
+
谜面:像鼠有翅膀,像鸟没羽毛。夜空中飞翔,超声波带路(猜一动物)谜底:蝙蝠
|
29 |
+
谜面:鼠年谈牛(猜五字常用语)谜底:丑话说在前头
|
30 |
+
谜面:晚上睡觉站树上,脸型神似小猫咪,每天晚上天空飞,爱吃老鼠和昆虫(猜一动物)谜底:猫头鹰
|
31 |
+
谜面:河边相会(猜一字)谜底:湘
|
32 |
+
谜面:浆果球形黑紫色,惹西班牙姑娘爱(猜一植物)谜底:颠茄
|
33 |
+
谜面:对牛弹琴(猜二字常用语)谜底:丑闻
|
34 |
+
谜面:好汉不疑妻(猜一字宗教用语)谜底:善男信女
|
35 |
+
谜面:长寿公公慢慢爬,爱缩脑袋穿马甲(猜一动物)谜底:乌龟
|
36 |
+
谜面:冬天一到毛变白,蹦蹦跳跳真可爱(猜一动物)谜底:雪兔
|
37 |
+
谜面:庆祝胜利的乐曲有些过时(猜一导演)谜底:陈凯歌
|
38 |
+
谜面:望神州长安(猜一央视主持人)谜底:顾长宁
|
39 |
+
谜面:皇帝从不上早朝(古人的号)谜底:卧龙
|
40 |
+
谜面:干到白头人退休(猜一字)谜底:杵
|
41 |
+
谜面:母鸡的宝宝个子高(猜一食物)谜底:蛋糕
|
42 |
+
谜面:上面一对竹,下面一撮毛(猜一字)谜底:笔
|
43 |
+
谜面:九九重阳(猜一二字常用语)谜底:旮旯
|
44 |
+
谜面:一个小儿郎,每天站桌上。肚里滚滚热,肚皮冰冰凉。一个大耳朵,穿件花衣裳。(猜一用具)谜底:暖水瓶
|
45 |
+
谜面:排斥相亲(猜一诗句)谜底:人生不相见
|
46 |
+
谜面:闭上你的嘴(猜一个字)谜底:哈(解释:合嘴就是闭上嘴,嘴是口)
|
47 |
+
谜面:言而有信可相交(猜一字)谜底:何
|
48 |
+
谜面:只有谜底未变(猜一成语) 谜底: 面目全非
|
49 |
+
谜面:炙(猜一食品名)谜底:红烧肉
|
50 |
+
谜面:新鲜空气出城名,南美大城很美丽(猜一城市)谜底:布宜诺斯艾利斯
|
51 |
+
谜面:圆又圆,扁又扁,脊梁上面生只眼(猜一日用品)谜底:锅盖
|
52 |
+
谜面:改变困境有人帮(猜一字)谜底:保
|
53 |
+
谜面:嘴里含玉(猜一字)谜底:国
|
54 |
+
谜面:辽阔水域上的清洁工(猜一动物)谜底:海鸥
|
55 |
+
谜面:桃李果脯裹层糖,发明者在御膳房(猜一食品)谜底:蜜饯
|
56 |
+
谜面:白天草里住,晚上往外飞,带着灯儿把路照,飞来飞去不怕黑。(猜一动物)谜底:萤火虫
|
57 |
+
谜面:木有门别动手(二字词)谜底:闲扯
|
58 |
+
谜面:两只眼睛长在一边(猜一动物)谜底:比目鱼
|
59 |
+
谜面:充耳不闻无话讲(猜一茶叶名)谜底:龙井
|
60 |
+
谜面:卖炭得钱何所营(猜一字)谜底:裕
|
61 |
+
谜面:为什么好马不吃回头草?谜底:因为后面的草已经吃光了
|
62 |
+
谜面:皇(猜一成语)谜底:白玉无暇
|
63 |
+
谜面:二十八人齐努力(猜一字)谜底:苏
|
64 |
+
谜面:头顶羽毛小士兵,年纪轻轻好拼命(猜一字)谜底:翠
|
65 |
+
谜面:春天种下一个和尚,秋天收获一堆和尚。(猜一药材植物)谜底:罗汉果
|
66 |
+
谜面:猴子每分钟能掰一个玉米,在果园里,一只猴子分钟能掰几个玉米?谜底:没掰到一个
|
67 |
+
谜面:长方老木屋,泥土往上盖(猜一物品)谜底:棺材
|
68 |
+
谜面:像鱼不是鱼,个子比鱼大,热血哺乳类,水柱头上扎。(猜一动物)谜底:鲸鱼
|
69 |
+
谜面:背着房子走路(猜一动物)谜底:蜗牛
|
70 |
+
谜面:牛牛多了两条腿(猜一字)谜底:朱
|
71 |
+
谜面:狼牙棒儿土中生(猜一植物)谜底:仙人球
|
72 |
+
谜面:敢为天下先(猜一字)谜底:一
|
73 |
+
谜面:一旦拥有,天长地久(猜一字)谜底:亘
|
74 |
+
谜面:多少心血得一言(猜一字)谜底:谧
|
75 |
+
谜面:十加八(猜一字)谜底:架
|
76 |
+
谜面:划船小调(猜一音乐用语)谜底:流行曲
|
77 |
+
谜面:长腿女人(猜一物)谜底:唇膏(高)
|
78 |
+
谜面:小小脑袋三角形,酷似蜥蜴爱爬行;伪装高手避天敌,变为红色护自己(猜一动物)谜底:变色龙
|
79 |
+
谜面:按这样子裁衣裙,只需一米(象棋大师)谜底:李来群
|
80 |
+
谜面:你争他抢都有份(猜一字)谜底:人(你和他里都有单立人,即人字)
|
81 |
+
谜面:干活诀窍(猜一法律用语)谜底:劳动法
|
82 |
+
谜面:三月一直你领先(猜一字)谜底:倩
|
83 |
+
谜面:半个春天(猜一字)谜底:奏
|
84 |
+
谜面:一年到头总在唱(猜一歌名)谜底:四季歌
|
85 |
+
谜面:小雨一夜寒(猜二字常用语)谜底:冷落
|
86 |
+
谜面:小家伙穿黄袍,花丛中把房造。飞到西来飞到东,人人夸他爱劳动。(猜一动物)谜底:蜜蜂
|
87 |
+
谜面:千古牵连刀难割(猜一字)谜底:刮
|
88 |
+
谜面:扁担玩自闭(猜一字)谜底:匾(把自己框起来,玩自闭)
|
89 |
+
谜面:全部当掉(猜一古代著作)谜底:通典
|
90 |
+
谜面:板桥作诗众人称好(猜一香港女明星)谜底:郑秀文
|
91 |
+
谜面:全面开荒(猜一成语)谜底:不留余地
|
92 |
+
谜面:黯(猜一成语)谜底:有声有色
|
93 |
+
谜面:红娘子,上高楼。心里疼,眼泪流(猜一日常用品)谜底:蜡烛
|
94 |
+
谜面:身穿红衣,常年哨放,遇紧急事,往火里闯(猜一日常用品)谜底:灭火器
|
95 |
+
谜面:左手五个,右手五个。拿去十个,还剩十个(猜一日常用品)谜底:手套
|
96 |
+
谜面:到了长城放声唱(猜一歌曲名)谜底:好汉歌
|
97 |
+
谜面:嫦娥三号去哪了(流行歌曲)谜底:月亮之上
|
98 |
+
谜面:一群黄鸡娘,生蛋进船舱。烤后一声响,个个大过娘(猜一食物)谜底:爆米花
|
99 |
+
谜面:站着百分高,躺着十寸长。裁衣做数学,它会帮你忙(猜一日常用品)谜底:尺
|
100 |
+
谜面:一物三口,有腿无手。谁要没它,难见亲友(猜一日常用品)谜底:裤子
|
101 |
+
谜面:左手五个,左手五个。拿去十个,还剩十个(猜一日常用品)谜底:手套
|
102 |
+
谜面:四角方方,常随常往。伤风咳嗽,数它最忙(猜一日常用品)谜底:手帕
|
103 |
+
谜面:半个西瓜样,口朝上面搁。上头不怕水,下头不怕火(猜一日常用品)谜底:锅
|
104 |
+
谜面:中间是火山,四边是大海。海里宝贝多,快快捞上来(猜一日常用品)谜底:火锅
|
105 |
+
谜面:红娘子,上高楼,心里疼,眼泪流(猜一日常用品名)谜底:蜡烛
|
106 |
+
谜面:猛将百余人,无事不出城。出城就放火,引火自烧身(猜一日常用品)谜底:火柴
|
107 |
+
谜面:一只八宝袋,样样都能装。能装棉和纱,能装铁和钢(猜一日常用品)谜底: 针线包
|
108 |
+
谜面:远看两个零,近看两个零。有人用了行不得,有人不用不得行(猜一日常用品)谜底:眼镜
|
109 |
+
谜面:有面无口,有脚无手。听人讲话,陪人吃酒(猜一日常用品)谜底:桌子
|
110 |
+
谜面:带着平顶帽,身穿圆筒袄,虽然一只眼,暗中逞英豪(猜一日常用品)谜底:手电筒
|
111 |
+
谜面:前面来只船,舵手在上边,来时下小雨,走后路已干(猜一日常用品)谜底:熨斗
|
112 |
+
谜面:小小东西,放在腋底。有病没病,看它肚皮(猜一日常用品)谜底:温度计
|
113 |
+
谜面:一只雀,飞上桌,捏尾巴,跳下河(猜日常用品)谜底:汤匙
|
114 |
+
谜面:鼻子朝天,嘴巴朝地。敲它一锤,惊天动地(猜一日常用品)谜底:大钟
|
115 |
+
谜面:金钩吊银圈,姐妹隔座山。若要来相会,需到天色晚(猜一日常用品)谜底:耳环
|
116 |
+
谜面:生在山崖,落在人家,凉水浇背,千刀万剐(猜一日用品)谜底:磨刀石
|
117 |
+
谜面:薄薄一张口,能啃硬骨头。吃肉不喝汤,吃瓜不嚼豆(猜一日常用品)谜底:菜刀
|
118 |
+
谜面:外面冷冰冰,里面热心肠,一夜到天亮,肚里还不凉(猜一日常用品)谜底:暖壶
|
119 |
+
谜面:有硬有软,有长有宽。白天空闲,夜晚上班(猜一日常用品)谜底:床
|
120 |
+
谜面:有风吹不动,它动就生风,若要不动它,待到起秋风(猜一日常用品)谜底:扇子
|
121 |
+
谜面:一间小药房,药品里面藏。房子涂白色,十字画中(猜一日常用品)谜底:医药箱
|
122 |
+
谜面:一物生得巧,地位比人高。戴上御风寒,脱下有礼貌(猜一日常用品)谜底:帽子
|
123 |
+
谜面:一颗小红枣��一屋盛不了。只要一开门,枣儿往外跑 打一日常用品)谜底:油灯
|
124 |
+
谜面:屋里一座亭,亭中有个人,天天荡秋千,不荡就有病(猜一日常用品)谜底:钟摆
|
125 |
+
谜面:不是点心不是糖,软软凉凉肚里藏,不能吃来不能喝,每天也要尝一尝(猜一日常用品)谜底:牙膏
|
126 |
+
谜面:红艳艳,飘胸前。像火苗,暖心间(猜一日常用品)谜底:红领巾
|
127 |
+
谜面:头上亮光光,出门就成双。背上缚绳子,驮人走四方(猜一日常用品)谜底:皮鞋
|
128 |
+
谜面:口比肚子大,给啥就吃啥。它吃为了你,你吃端着它(猜一日常用品)谜底:饭碗
|
129 |
+
谜面:楼台接楼台,一层一层接起来,上面冒白气,下面水开花(猜一日常用品)谜底:蒸笼
|
130 |
+
谜面:平日不思,中秋想你。有方有圆,又甜又蜜(猜一日常用品)谜底:月饼
|
131 |
+
谜面:一只黑鞋子,黑帮黑底子。挂破鞋子口,漏出白衬子(猜一日常用品)谜底:西瓜子
|
132 |
+
谜面:一把刀,顺水漂,有眼睛,没眉毛。(猜一动物名)谜底:鱼
|
133 |
+
谜面:两眼外秃大嘴巴,有个尾巴比身大,青草假山来相伴,绽放朵朵大红花谜底:金鱼
|
134 |
+
谜面:像鱼不是鱼,终生住海里。远看是喷泉,近看像岛屿(猜一动物名)谜底:鲸
|
135 |
+
谜面:小时像豆号,在水中玩耍。长大跳得高,是捉虫冠军(猜一动物名)谜底:青蛙
|
136 |
+
谜面:为你打我,为我打你。打到你皮开,打得我出血(猜一动物名)谜底:蚊子
|
137 |
+
谜面:似鸟又非鸟,有翅身无毛,一脸丑模样,专爱 夜遨游谜底:蝙蝠
|
138 |
+
谜面:肥腿子,尖鼻子。穿裙子,背屋子(猜一动物名)谜底:蜗牛
|
139 |
+
谜面:身穿绿衣裳,肩扛两把刀。庄稼地里走,害虫吓得跑(猜一动物名)谜底:螳螂
|
140 |
+
谜面:娘子娘子,身似盒子。麒麟剪刀,八个钗子(猜一动物名)谜底:螃蟹
|
141 |
+
谜面:黑脸包丞相,坐在大堂上(猜一动物)谜底:蜘蛛
|
142 |
+
谜面:身小力不小,团结又勤劳。有时搬粮食,有时挖地道(猜一动物名)谜底:蚂蚁
|
143 |
+
谜面:白天一起玩,夜间一块眠,到老不分散,人间好姻缘(猜一动物)谜底:鸳鸯
|
144 |
+
谜面:个儿高又大,脖子似吊塔。和气又善良,从来不打架(猜一动物名)谜底:长颈鹿
|
145 |
+
谜面:脚儿小,腿儿高,戴红帽,穿白袍(猜一动物名)谜底:丹顶鹤
|
146 |
+
谜面:有位小姑娘,身穿黄衣裳。谁要欺负她,她就戳一枪(猜一动物名)谜底:马蜂
|
147 |
+
谜面:脚像细牛脚,身像大狗重。行象后生子,须象老大人(猜一动物名)谜底:羊
|
148 |
+
谜面:脚着暖底靴,口边山胡须。夜里当巡捕,日夜把眼眯(猜一动物名)谜底:猫
|
149 |
+
谜面:无脚也无手,身穿鸡皮皱。谁若碰着它,吓得连忙走(猜一动物名)谜底:蛇
|
150 |
+
谜面:身长约一丈,鼻生头顶上。背黑肚皮白,安家在海岸(猜一动物名)谜底:海豚
|
151 |
+
谜面:身上滑腻腻,喜欢钻河底。张嘴吐泡泡,可以测天气(猜一动物名)谜底:泥鳅
|
152 |
+
谜面:姑娘真辛苦,晚上还织布。天色蒙蒙亮,机声才停止(猜一动物名)谜底:纺织娘
|
153 |
+
谜面:身子轻如燕,飞在天地间,不怕相隔远,也能把话传(猜一动物名)谜底:信鸽
|
154 |
+
谜面:吃进的是草,挤出的是宝。舍己为人类,功劳可不小(猜一动物名)谜底:奶牛
|
155 |
+
谜面:长胳膊,猴儿脸。大森林里玩得欢。摘野果,捣鹊蛋,抓住树枝荡秋千(猜一动物名)谜底:长臂猿
|
156 |
+
谜面:爱好旅游(猜一成语)谜底:喜出望外
|
157 |
+
谜面:盲人摸象(猜一成语)谜底:不识大体
|
158 |
+
谜面:蜜饯黄连(猜一成语)谜底:同甘共苦
|
159 |
+
谜面:会计(猜一成语)谜底:足智多谋
|
160 |
+
谜面:逆水划船(猜一成语谜底:力争上游
|
161 |
+
谜面:快刀斩乱麻(猜一成语谜底:迎刃而解
|
162 |
+
谜面:翘翘板(猜一成语)谜底:此起彼落
|
163 |
+
谜面:遇事不求人(猜一成语)谜底:自力更生
|
164 |
+
谜面:脱粒机(猜一成语)谜底:吞吞吐吐
|
165 |
+
谜面:四通八达(猜一成语)谜底:头头是道
|
166 |
+
谜面:一块变九块(猜一成语)谜底:四分五裂
|
167 |
+
谜面:节日的焰火(猜一成语)谜底:五彩缤纷
|
168 |
+
谜面:乖(猜一成语)谜底:乘人不备
|
169 |
+
谜面:相声(猜一成语)谜底:装腔作势
|
170 |
+
谜面:逆水划船(猜一成语)谜底:激流勇进
|
171 |
+
谜面:伞兵(猜一成语)谜底:从天而降
|
172 |
+
谜面:兔子请老虎(猜一成语)谜底:寅吃卯粮
|
173 |
+
谜面:照相底片谜底:颠倒黑白
|
174 |
+
谜面:平原门下客三千谜底:胜友如云
|
175 |
+
谜面:圆寂(猜一成语)谜底:坐以待毙
|
176 |
+
谜面:哑巴打手势(猜一成语)谜底:不言而喻
|
177 |
+
谜面:仙乐(猜一成语)谜底:不同凡响
|
178 |
+
谜面:零存整取(猜一成语)谜底:积少成多
|
179 |
+
谜面:初一(猜一成语)谜底:日新月异
|
180 |
+
��面:暗中下围棋(猜一成语)谜底:皂白不分
|
181 |
+
谜面:并重(猜一成语)谜底:恰如其分
|
182 |
+
谜面:八十八(猜一成语)谜底:入木三分
|
183 |
+
谜面:超好牙刷(猜一成语)谜底:一毛不拔
|
184 |
+
谜面:打边鼓(猜一成语)谜底:旁敲侧击
|
185 |
+
谜面:感冒通(猜一成语)谜底:有伤风化
|
186 |
+
谜面:鲁达当和尚(猜一成语)谜底:半路出家
|
187 |
+
谜面:皇(猜一成语)谜底:白玉无暇
|
188 |
+
谜面:举重比赛(猜一成语)谜底:斤斤计较
|
189 |
+
谜面:纸老虎(猜一成语)谜底:外强中干
|
190 |
+
谜面:美梦(猜一成语)谜底:好景不长
|
191 |
+
谜面:农产品(猜一成语)谜底:土生土长
|
192 |
+
谜面:无底洞(猜一成语)谜底:深不可测
|
193 |
+
谜面:山水之间,一方独 立(猜重庆一地名)谜底:涪陵
|
194 |
+
谜面:掌声经久不息(猜北京一地名)谜底:延庆
|
195 |
+
谜面:沫若乡间住处(猜北京一地名)谜底:郭公庄
|
196 |
+
谜面:重点干起,秋前方成(猜天津一地名)谜底:和平
|
197 |
+
谜面:安得后羿弓谜底:射阳
|
198 |
+
谜面:雄踞山寨(猜吉林一地名)谜底:公主岭
|
199 |
+
谜面:潘仁美卖国谜底:通辽
|
200 |
+
谜面:固若金汤(猜河北一地名)谜底:保定
|
201 |
+
谜面:中国界首(猜河北一地名)谜底:玉田
|
202 |
+
谜面:金乌西坠白头看(河南地名)谜底:洛阳
|
203 |
+
谜面:上下四方都无险(安徽地名)谜底:六安
|
204 |
+
谜面:发扬大协作精神(青海地名)谜底:互助
|
205 |
+
谜面:刘关张结义区(台湾一地名)谜底:桃园
|
206 |
+
谜面:又到鸡西市(黑龙江地名)谜底:双城
|
207 |
+
谜面:庙建成菩萨到(猜上海一地名)谜底:静安寺
|
208 |
+
谜面:财源茂盛达三江(猜广西一地名)谜底:富川
|
209 |
+
谜面:情投意合(猜宁夏一地名)谜底:同心
|
210 |
+
谜面:公开赞助(猜湖北一地名)谜底:襄阳
|
211 |
+
谜面:公私仓廪皆丰实(猜海南一地名)谜底:屯昌
|
212 |
+
谜面:花和尚鲁智深(猜四川一地名)谜底:色达
|
213 |
+
谜面:刘邦登基诏书(猜四川一地名)谜底:宣汉
|
214 |
+
谜面:南人不复反矣(猜四川一地名)谜底:南充
|
215 |
+
谜面:举起鞭儿又紧缰(猜一地名)谜底:策勒
|
216 |
+
谜面:介胄之士(猜湖北一地名)谜底:武汉
|
217 |
+
谜面:全面整顿(猜云南一地名)谜底:大理
|
218 |
+
谜面:美哉嘉陵(猜云南一地名)谜底:丽江
|
219 |
+
谜面:惩恶扬善(猜云南一地名)谜底:楚雄
|
220 |
+
谜面:山花红烂漫(猜内蒙古一地名)谜底:赤峰
|
221 |
+
谜面:一去无音讯(猜一字)谜底:查
|
222 |
+
谜面:木字加一撇,莫当禾字猜(猜一字)谜底:朱
|
223 |
+
谜面:一去就变坏(猜一字)谜底:坯
|
224 |
+
谜面:差点就黑了(猜一字)谜底:鸟
|
225 |
+
谜面:一口咬掉牛尾巴(猜一字)谜底:告
|
226 |
+
谜面:一月一日非今天(猜一字)谜底:明
|
227 |
+
谜面:水落石出(猜一字)谜底:泵
|
228 |
+
谜面:剥去画皮(猜一字)谜底:田
|
229 |
+
谜面:双“十一”(猜一字)谜底:圭
|
230 |
+
谜面:如鱼得水(猜一字)谜底:渔
|
231 |
+
谜面:桃李满天下(猜一成语)谜底:遍地开花
|
232 |
+
谜面:笑死人(猜一成语)谜底:乐极生悲
|
233 |
+
谜面:纸老虎(猜一成语)谜底:外强中干
|
234 |
+
谜面:改动百分之九十(猜一成语)谜底:一成不变
|
235 |
+
谜面:合起来五句话 (打一成语)谜底:三言两语
|
236 |
+
谜面:又是星期一(猜一成语)谜底:周而复始
|
237 |
+
谜面:爱好旅游(猜一成语)谜底:喜出望外
|
238 |
+
谜面:二三四五六七八(猜一成语)谜底:缺衣少食
|
239 |
+
谜面:全面开荒(猜一成语)谜底:不留余地
|
240 |
+
谜面:反腐倡廉一壮士(猜三个朝代名)谜底:清明汉
|
241 |
+
谜面:心底无私天地宽(猜一手机用语)谜底:内存容量大
|
242 |
+
谜面:不忘初心(猜一字)谜底:怀
|
243 |
+
谜面:一年四季花如锦(猜一中国地名)谜底:长春
|
244 |
+
谜面:比猫大只,比熊可爱,爱吃竹子。(猜一动物)谜底:熊猫
|
data_preparation.py
ADDED
@@ -0,0 +1,67 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# %%
|
2 |
+
import shutil
|
3 |
+
import os
|
4 |
+
|
5 |
+
from langchain.document_loaders import TextLoader
|
6 |
+
from langchain.text_splitter import CharacterTextSplitter
|
7 |
+
from langchain.embeddings import HuggingFaceEmbeddings
|
8 |
+
from langchain.vectorstores import Chroma
|
9 |
+
|
10 |
+
# %%
|
11 |
+
# loading the riddle data into docs
|
12 |
+
data_file = "data/riddles_data"
|
13 |
+
loader = TextLoader(data_file)
|
14 |
+
docs = loader.load()
|
15 |
+
|
16 |
+
# create the text splitter, splitted exactly line-by-line
|
17 |
+
text_splitter = CharacterTextSplitter(
|
18 |
+
separator = "\n",
|
19 |
+
chunk_size = 0,
|
20 |
+
chunk_overlap = 0,
|
21 |
+
length_function = len,
|
22 |
+
is_separator_regex = False,
|
23 |
+
)
|
24 |
+
|
25 |
+
# get the splits
|
26 |
+
splits = text_splitter.split_documents(docs)
|
27 |
+
|
28 |
+
# %%
|
29 |
+
# loading the vector encoder
|
30 |
+
|
31 |
+
model_name = "shibing624/text2vec-base-chinese"
|
32 |
+
|
33 |
+
encode_kwargs = {'normalize_embeddings': False}
|
34 |
+
model_kwargs = {'device': 'cpu'}
|
35 |
+
|
36 |
+
huggingface_embeddings= HuggingFaceEmbeddings(
|
37 |
+
model_name=model_name,
|
38 |
+
model_kwargs=model_kwargs,
|
39 |
+
encode_kwargs = encode_kwargs
|
40 |
+
)
|
41 |
+
|
42 |
+
# %%
|
43 |
+
# vectordb with Chroma
|
44 |
+
persist_directory = 'chroma/'
|
45 |
+
|
46 |
+
# %%
|
47 |
+
# remove the old one when rebuilt the database
|
48 |
+
if os.path.exists(persist_directory):
|
49 |
+
shutil.rmtree(persist_directory) # remove old database files if any
|
50 |
+
|
51 |
+
# %%
|
52 |
+
# load the riddles documents to vectordb
|
53 |
+
vectordb = Chroma.from_documents(
|
54 |
+
documents=splits,
|
55 |
+
embedding=huggingface_embeddings,
|
56 |
+
persist_directory=persist_directory,
|
57 |
+
collection_metadata={"hnsw:space": "cosine"}
|
58 |
+
)
|
59 |
+
|
60 |
+
# %%
|
61 |
+
vectordb.persist()
|
62 |
+
|
63 |
+
print(vectordb._collection.count())
|
64 |
+
|
65 |
+
|
66 |
+
|
67 |
+
# %%
|
requirements.txt
ADDED
@@ -0,0 +1,2 @@
|
|
|
|
|
|
|
1 |
+
transformers
|
2 |
+
langchain
|