Spaces:

taishi-i
/

awesome-japanese-nlp-resources-search

Running

taishi-i commited on Jun 9, 2024

Commit

650b6f6

1 Parent(s): ec98b0b

update app.py

Files changed (4) hide show

app.py CHANGED Viewed

@@ -2,37 +2,41 @@ import json
 import gradio as gr
 import pandas as pd
-from pyserini.search.lucene import LuceneSearcher
-searcher = LuceneSearcher("indexes/docs")
-searcher.set_language("ja")
-def show_search_results(query):
-    search_results = searcher.search(query, k=100)
-    data = {"project_name": [], "description": []}
-    for result in search_results:
-        docid = result.docid
-        doc = searcher.doc(docid)
-        data_json = json.loads(doc.raw())
-        url = data_json["url"]
-        description = data_json["description"]
-        project_name = data_json["project_name"]
-        data["project_name"].append(f"[{project_name}]({url})")
-        data["description"].append(description)
-    data = pd.DataFrame(data)
-    return data
 with gr.Blocks() as demo:
     gr.Markdown(
         """
     # Awesome Japanese NLP resources search 🔎
-    You can search for open-source software from [500+ Japanese NLP repositories](https://github.com/taishi-i/awesome-japanese-nlp-resources).
     """
     )

 import gradio as gr
 import pandas as pd
+def read_json(file_name):
+    with open(file_name, "r") as f:
+        json_data = json.load(f)
+    return json_data
+json_file = "awesome-japanese-nlp-resources-search.json"
+json_data = read_json(json_file)
+data = {"project_name": [], "source": [], "description": []}
+for data_json in json_data:
+    url = data_json["url"]
+    description = data_json["description"]
+    project_name = data_json["project_name"]
+    source = data_json["source"]
+    data["project_name"].append(f"[{project_name}]({url})")
+    data["source"].append(source)
+    data["description"].append(description)
+data = pd.DataFrame(data)
+def show_search_results(query):
+    contained = data["description"].str.contains(query)
+    df_search = data[contained]
+    return df_search
 with gr.Blocks() as demo:
     gr.Markdown(
         """
     # Awesome Japanese NLP resources search 🔎
+    You can search for open-source software from [1000+ Japanese NLP repositories](https://github.com/taishi-i/awesome-japanese-nlp-resources).
     """
     )

awesome-japanese-nlp-resources-search.json ADDED Viewed

The diff for this file is too large to render. See raw diff

packages.txt DELETED Viewed

	@@ -1 +0,0 @@
1	- default-jdk

requirements.txt CHANGED Viewed

@@ -1,4 +1 @@
-pyserini
-faiss-cpu
-torch
-altair<5