Spaces:

TRMT
/

test

Build error

App Files Files Community

TRMT commited on Nov 16, 2023

Commit

3ff02f5

•

1 Parent(s): 9365924

update files

Browse files

Files changed (24) hide show

Dockerfile +28 -0
data/all_BirdDBnode.tsv +0 -0
data/en_aliases_vecs_all.bin +3 -0
data/en_name_vecs.bin +3 -0
data/ja_aliases_vecs.bin +3 -0
data/ja_name_vecs.bin +3 -0
data/sound_vecs.json +0 -0
main.py +496 -0
model/en_model/config.json +26 -0
model/en_model/pytorch_model.bin +3 -0
model/en_tokenizer/special_tokens_map.json +7 -0
model/en_tokenizer/tokenizer_config.json +15 -0
model/en_tokenizer/vocab.txt +0 -0
model/ja_model/config.json +26 -0
model/ja_model/pytorch_model.bin +3 -0
model/ja_tokenizer/special_tokens_map.json +7 -0
model/ja_tokenizer/tokenizer_config.json +19 -0
model/ja_tokenizer/vocab.txt +0 -0
model/wav2vec2-bird-jp-all/config.json +108 -0
model/wav2vec2-bird-jp-all/pytorch_model.bin +3 -0
requirements.txt +15 -0
static/style.css +87 -0
templates/sound_search.html +155 -0
templates/word_search.html +83 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,28 @@

+# Use the official Python 3.9 image
+FROM python:3.9
+# Set the working directory to /code
+WORKDIR /code
+# Copy the current directory contents into the container at /code
+COPY ./requirements.txt /code/requirements.txt
+# Install requirements.txt
+RUN pip install --no-cache-dir --upgrade -r /code/requirements.txt
+# Set up a new user named "user" with user ID 1000
+RUN useradd -m -u 1000 user
+# Switch to the "user" user
+USER user
+# Set home to the user's home directory
+ENV HOME=/home/user \\
+    PATH=/home/user/.local/bin:$PATH
+# Set the working directory to the user's home directory
+WORKDIR $HOME/app
+# Copy the current directory contents into the container at $HOME/app setting the owner to the user
+COPY --chown=user . $HOME/app
+# Start the FastAPI app on port 7860, the default port expected by Spaces
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

data/all_BirdDBnode.tsv ADDED Viewed

The diff for this file is too large to render. See raw diff

data/en_aliases_vecs_all.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17b6dfb3d08beadc7913fbfe29fe0fd8e173cb11cfc82ba35e255c1529bbed63
+size 437145400

data/en_name_vecs.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:743340b070341d71a2aad32f66aedf77e49ef5ff6b2de62b5c7a5c1f206a37f3
+size 1511197579

data/ja_aliases_vecs.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ed3354357c7e92ef697e5c847d1bed4985aaa3ffc93532ab0bcd934e89424317
+size 25826631

data/ja_name_vecs.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c14efd3a6523251838e3962235f124554f036649e84e6ee82a776b7597fefca
+size 251726597

data/sound_vecs.json ADDED Viewed

The diff for this file is too large to render. See raw diff

main.py ADDED Viewed

	@@ -0,0 +1,496 @@

+from fastapi import FastAPI,UploadFile,File,Form
+from typing import List,Dict
+import difflib
+import librosa
+from collections import defaultdict
+from pykakasi import kakasi
+from dotenv import load_dotenv
+import openai
+from fastapi import FastAPI,Request
+from fastapi.staticfiles import StaticFiles
+from fastapi.templating import Jinja2Templates
+from fastapi.responses import HTMLResponse,JSONResponse
+#鍵関連
+from fastapi import Depends, HTTPException
+from starlette.middleware.sessions import SessionMiddleware
+import numpy as np
+import json
+import pickle
+import csv
+import os
+import ast
+import shutil
+import torch
+from transformers import Wav2Vec2ForPreTraining,Wav2Vec2Processor
+from transformers import BertModel,BertJapaneseTokenizer,BertTokenizer
+from sklearn.metrics.pairwise import cosine_similarity
+# =============アプリケーション
+app = FastAPI()
+app.mount("/static", StaticFiles(directory="static"), name="static")
+templates = Jinja2Templates(directory="templates")
+app.add_middleware(SessionMiddleware, secret_key="your_secret_key")
+# =============知識グラフ
+nodes=dict()
+p2c=defaultdict(list)
+with open('data/all_BirdDBnode.tsv', mode='r', newline='', encoding='utf-8') as f:
+    for row in csv.DictReader(f, delimiter = '\t'):
+        nodes[row["id"]] = row
+        p2c[row["parent_taxon"]].append(row["id"])
+print("knowledge data loading is complete !")
+# =============音声モデル
+w2v2 = Wav2Vec2ForPreTraining.from_pretrained("model/wav2vec2-bird-jp-all")
+print("sound model loading is complete !")
+# =============音声埋め込み
+with open('data/sound_vecs.json') as f:
+    sound_vecs = json.load(f)
+print("sound vec data loading is complete !")
+# =============言語モデル
+# ローカルから日英BERTのモデル・トークナイザーを読み込み
+en_model = BertModel.from_pretrained('model/en_model')
+en_tokenizer = BertTokenizer.from_pretrained('model/en_tokenizer')
+ja_model = BertModel.from_pretrained('model/ja_model')
+ja_tokenizer = BertJapaneseTokenizer.from_pretrained('model/ja_tokenizer')
+print("language model loading is complete !")
+# # リモートから日英BERTのモデル・トークナイザーを読み込み
+# en_tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
+# en_model = BertModel.from_pretrained('bert-base-uncased')
+# ja_tokenizer = BertJapaneseTokenizer.from_pretrained('cl-tohoku/bert-base-japanese-whole-word-masking')
+# ja_model = BertModel.from_pretrained('cl-tohoku/bert-base-japanese-whole-word-masking')
+# =============言語埋め込み
+with open('data/en_name_vecs.bin','rb') as bf:
+    en_name_vecs = pickle.load(bf)
+print("en_name_vecs data loading is complete !")
+with open('data/ja_name_vecs.bin','rb') as bf:
+    ja_name_vecs = pickle.load(bf)
+print("ja_name_vecs data loading is complete !")
+with open('data/en_aliases_vecs_all.bin','rb') as bf:
+    en_aliases_vecs = pickle.load(bf)
+print("en_aliases_vecs_all data loading is complete !")
+with open('data/ja_aliases_vecs.bin','rb') as bf:
+    ja_aliases_vecs = pickle.load(bf)
+print("ja_aliases_vecs data loading is complete !")
+print("language vec data loading is complete !")
+# =============queryとwordを引数にとり，類似度を返す関数=>これはBERTにしなければならない
+def raito(query,word):
+    raito = difflib.SequenceMatcher(None, query, word).ratio()
+    return raito
+# =============queryとwordを引数にとり，BERT類似度を返す関数
+# def raito_bert_en(q_vec, word, aliases):
+#     # 文をBERTの分散表現に変換する
+#     tokenizer = en_tokenizer
+#     model = en_model
+#     if aliases == False:w_vec = en_name_vecs[word]# wordの分散表現
+#     else:w_vec = en_aliases_vecs[word]
+#     similarity = cosine_similarity(q_vec.unsqueeze(0).numpy(), w_vec.unsqueeze(0).numpy())
+#     return similarity[0][0]# Cosine類似度
+# def raito_bert_ja(q_vec, word, aliases):
+#     # 文をBERTの分散表現に変換する
+#     tokenizer = ja_tokenizer
+#     model = ja_model
+#     if aliases == False:w_vec = ja_name_vecs[word]
+#     else:w_vec = ja_aliases_vecs[word]
+#     similarity = cosine_similarity(q_vec.unsqueeze(0).numpy(), w_vec.unsqueeze(0).numpy())
+#     return similarity[0][0]# Cosine類似度
+# 日英両対応
+def raito_b(q_vec, w_vec):
+    # 文をBERTの分散表現に変換する
+    similarity = cosine_similarity(q_vec.unsqueeze(0).numpy(), w_vec.unsqueeze(0).numpy())
+    return similarity[0][0]# Cosine類似度
+def raito_bert(q_vec, word, en, aliases):
+    # 文をBERTの分散表現に変換する
+    if en == True:
+        tokenizer = en_tokenizer
+        model = en_model
+        if aliases == False:w_vec = en_name_vecs[word]# wordの分散表現
+        else:w_vec = en_aliases_vecs[word]
+    else:
+        tokenizer = ja_tokenizer
+        model = ja_model
+        if aliases == False:w_vec = ja_name_vecs[word]
+        else:w_vec = ja_aliases_vecs[word]
+    similarity = cosine_similarity(q_vec.unsqueeze(0).numpy(), w_vec.unsqueeze(0).numpy())
+    return similarity[0][0]# Cosine類似度
+# ============= id=>必要な項目のみを含む自身，親，子の辞書を返す関数
+def small_d(d):
+    if d != None:
+        small_d = {"id":d["id"],
+                    "en_name":d["en_name"],
+                    "ja_name":d["ja_name"],
+                    "en_aliases":d["en_aliases"],
+                    "ja_aliases":d["ja_aliases"],
+                    "img_urls":d["img_urls"],
+                    "taxon_name":d["taxon_name"],
+                    "BR_id":d["BirdResearchDB_label01_32k_audio_id"],
+                    "JP_id":d["BirdJPBookDB__data_audio_id"]
+                    }
+    else:
+        small_d == None
+    return small_d
+def id2ans(myself_id):
+    ans = {"myself":dict(),"my_parent":None,"my_children":None}
+    myself_d  = nodes[myself_id]
+    parent_id = nodes[myself_id]["parent_taxon"]
+    parent_d  = nodes[parent_id]
+    ans["myself"] = small_d(myself_d)
+    # 指定したノードidのWikiData隣接ノードを取得
+    if parent_id in nodes:
+        ans["my_parent"] = small_d(parent_d)
+    if myself_id in p2c:
+        ans["my_children"] = [small_d(nodes[chile_id]) for chile_id in p2c[myself_id]]
+    return ans
+# ============= 2つのnumpy.arrayデータの類似度算出関数
+def cos_sim(v1, v2):
+    return np.dot(v1, v2) / (np.linalg.norm(v1) * np.linalg.norm(v2))
+# ============= 漢字および平仮名をカタカナに修正する関数
+def to_katakana(text):
+    # kakasiオブジェクトを作成
+    kakasi_instance = kakasi()
+    kakasi_instance.setMode("J", "K")  # J（漢字）をH（ひらがな）に変換
+    kakasi_instance.setMode("H", "K")  # H（ひらがな）をK（カタカナ）に変換
+    # カタカナに変換
+    conv = kakasi_instance.getConverter()
+    katakana_text = conv.do(text)
+    return katakana_text
+# =============OpenAI APIキー手動入力画面設定
+@app.middleware("http")
+async def some_middleware(request: Request, call_next):
+    response = await call_next(request)
+    session = request.cookies.get('session')
+    if session:
+        response.set_cookie(key='session', value=request.cookies.get('session'), httponly=True)
+    return response
+# ============= ChatGPT応答用関数
+# OpenAI APIキーを初期化(.envから読込む場合)
+# load_dotenv()
+# openai.api_key = os.getenv("API_KEY")
+# debug_mode = os.getenv("DEBUG")
+# ChatGPTに質問を送信する関数
+def ask_gpt3(question,api_key,max_tokens=2600):
+    # bird_prompt = "次のjsonがどのような情報を持っているかを「お探しの鳥はこれかも：」から始まる簡潔な話し言葉で伝えてください。"
+    # bird_prompt = "このjsonデータについて，何が分かりますか？"
+    bird_prompt = "このデータを基にこの鳥について解説して:"
+    load_dotenv()
+    openai.api_key = api_key
+    debug_mode = True
+    json_string = json.dumps(question)
+    response = openai.Completion.create(
+        engine="text-davinci-003",
+        # prompt=bird_prompt+f"{question}\n",
+        prompt=bird_prompt+json_string,
+        max_tokens=max_tokens,
+        stop=None,
+        temperature=0.7,
+    )
+    return response.choices[0].text.strip()
+# =============# 辞書→WebサイトHTML生成関数
+def aliases_str(d_aliases):
+    if d_aliases == "{}":
+        return ""
+    else:
+        # print("d_aliases:",d_aliases)
+        d_aliases = ast.literal_eval(d_aliases)
+        aliases = ""
+        for k,v in d_aliases.items():
+            aliases = aliases+v+"/"
+        aliases = aliases[:-1]
+        if aliases != "":
+            aliases = "("+aliases+")"
+        return aliases
+def imgs_list(d_img_urls):
+    img_urls = []
+    if d_img_urls == "{}":
+        pass
+    else:
+        d_img_urls = json.loads(d_img_urls.replace("'",'"'))
+        for k,v in d_img_urls.items():
+            img_urls.append(v)
+    return img_urls
+def d4html(myself_d,self_or_parent,n):#word検索ではnは無し，sound検索では_1,_2,_3
+    print(self_or_parent+"_taxon_name"+n)
+    new_d ={
+    self_or_parent+"_taxon_name"+n:myself_d["taxon_name"],
+    self_or_parent+"_ja_name"+n:myself_d["ja_name"],
+    self_or_parent+"_ja_aliases"+n:aliases_str(myself_d["ja_aliases"]),
+    self_or_parent+"_en_name"+n:myself_d["en_name"],
+    self_or_parent+"_en_aliases"+n:aliases_str(myself_d["en_aliases"]),
+    self_or_parent+"_link"+n:"https://www.wikidata.org/wiki/"+myself_d["id"],
+    self_or_parent+"_imgs_list"+n:imgs_list(myself_d["img_urls"])
+    }
+    return new_d
+def self_d4html(myself_d,n):#word検索ではnは無し，sound検索では_1,_2,_3
+    new_d ={"self_taxon_name"+n:myself_d["taxon_name"],
+    "self_ja_name"+n:myself_d["ja_name"],
+    "self_ja_aliases"+n:aliases_str(myself_d["ja_aliases"]),
+    "self_en_name"+n:myself_d["en_name"],
+    "self_en_aliases"+n:aliases_str(myself_d["en_aliases"]),
+    "self_link"+n:"https://www.wikidata.org/wiki/"+myself_d["id"],
+    "self_imgs_list"+n:imgs_list(myself_d["img_urls"])
+    }
+    print(new_d)
+    return new_d
+def parent_d4html(parent_d,n):#word検索ではnは無し，sound検索では_1,_2,_3
+    new_d ={"parent_taxon_name"+n:parent_d["taxon_name"],
+    "parent_ja_name"+n:parent_d["ja_name"],
+    "parent_ja_aliases"+n:aliases_str(parent_d["ja_aliases"]),
+    "parent_en_name"+n:parent_d["en_name"],
+    "parent_en_aliases"+n:aliases_str(parent_d["en_aliases"]),
+    "parent_link"+n:"https://www.wikidata.org/wiki/"+parent_d["id"],
+    "parent_imgs_list"+n:imgs_list(parent_d["img_urls"])
+    }
+    return new_d
+# =============# 自然言語クエリに最も近いnameを検索,対応するノードのidを取得=>自身，親，子を辞書で返す
+@app.get("/word_search", response_class=HTMLResponse)
+async def read_root(request:Request, api_key:str=""):
+    api_key = request.session.get("api_key", "please_input_your_api_key")
+    return templates.TemplateResponse("word_search.html", {"request": request,"api_key":api_key})
+@app.post("/word_search", response_class=HTMLResponse)
+async def search_adjacent_nodes(request:Request, api_key: str = Form(...), query: str = Form(...)):
+    form_data = await request.form()
+    query = form_data["query"]
+    query = to_katakana(query)
+    max_cos_in_wikidata = 0.0     # Wikidata内で最大の類似度格納変数
+    max_id_in_wikidata = None # Wikidata内で最大の類似度のID格納変数
+    #for bert
+    en_tokens = en_tokenizer(query, return_tensors="pt", padding=True, truncation=True)#日本語埋め込みと英語埋め込みが必要
+    ja_tokens = ja_tokenizer(query, return_tensors="pt", padding=True, truncation=True)#日本語埋め込みと英語埋め込みが必要
+    with torch.no_grad():
+        en_model.eval()
+        en_output = en_model(**en_tokens)
+        ja_model.eval()
+        ja_output = ja_model(**ja_tokens)
+    en_q_vec = en_output.last_hidden_state[0][0]# queryの分散表現
+    ja_q_vec = ja_output.last_hidden_state[0][0]# queryの分散表現
+    #bertによる完全一致
+    for node_id,node in nodes.items():
+        #英語名,日本語名,英語名・日本語名のエイリアスとの類似のクエリとの類似
+        # r_in_node: rait in node,該当ノードに含まれる関連語全般とクエリの類似度を格納
+        r_in_node = set()
+        en_name_vec = en_name_vecs[node["en_name"]]
+        ja_name_vec = ja_name_vecs[node["ja_name"]]
+        r_in_node.add(raito_b(en_q_vec,en_name_vec))#途中！
+        r_in_node.add(raito_b(ja_q_vec,ja_name_vec))
+        if isinstance(node["en_aliases"], dict):
+            for k,v in node["en_aliases"].items():
+                en_aliases_vec = en_aliases_vecs[v]
+                r_in_node.add(raito_b(en_q_vec,en_aliases_vec,en=True,aliases=True))
+        if isinstance(node["ja_aliases"], dict):
+            for k,v in node["ja_aliases"].items():
+                ja_aliases_vec = ja_aliases_vecs[v]
+                r_in_node.add(raito_b(ja_q_vec,ja_aliases_vec,en=False,aliases=True))
+        if max(r_in_node) != 0.0:
+            if max(r_in_node) > max_cos_in_wikidata:
+                max_cos_in_wikidata = max(r_in_node)
+                max_id_in_wikidata = node_id
+    #シンプルな完全一致
+    # for node_id,node in nodes.items():#英語名,日本語名,英語名・日本語名のエイリアスとの類似のクエリとの類似
+    #     r_in_node = set()#rait in node,該当ノードに含まれる関連語全般とクエリの類似度を格納
+    #     r_in_node.add(raito(query,node["en_name"]))
+    #     r_in_node.add(raito(query,node["ja_name"]))
+    #     if isinstance(node["en_aliases"], dict):
+    #         for k,v in node["en_aliases"].items():
+    #             r_in_node.add(raito(query,v))
+    #     if isinstance(node["ja_aliases"], dict):
+    #         for k,v in node["ja_aliases"].items():
+    #             r_in_node.add(raito(query,v))
+    #     if max(r_in_node) != 0.0:
+    #         if max(r_in_node) > max_cos_in_wikidata:
+    #             max_cos_in_wikidata = max(r_in_node)
+    #             max_id_in_wikidata = node_id
+    if max_id_in_wikidata!=None:
+        ans_json = id2ans(max_id_in_wikidata)
+        #一旦
+        # gpt_ans_self = "ツルは、鳥類の中でも特に大きい鳥であり、ツル科（Gruidae）に属する鳥です。英語名は「Crane」となっており、体長は1.5-1.8メートル、体重は4-6キログラムとなっています。頭部の色は褐色から黒色まで変化し、胸部から尾部にかけて白色の模様が見られます。翼は非常に大きく、飛行時には振り子のような動きをします。ツルは、草原や湿地などに生息する大型の鳥であり、ミヤマツルやオオツルなどが有名です。宿泊地は冬期に南へ移動し、豊かな水源や草原を求めて���にインドや中国などの亜熱帯地域を中心に広く移動します。ツルは餌を釣り上げる行動をとり、草原の他にも沼沢地などの水辺にも行きます。ツルは繁殖期には集団で繁殖し、巣を枝、葉、茎などで作ります。ツルは、家禽類として古来から飼育され、食用、羽毛、肉などの用途に使われてきました。また、風俗習慣や文化表現などにも使用されてきました。"
+        # gpt_ans_parent = "ツル目とは、鳥類の一綱であるグルイフォーム（Gruiformes）に属します。グルイフォームとは、主として水辺に住む、鷺科（草原鶴）、カモ科（カモ）、コウノトリ科（コウノトリ）などの林鳥の他、カナリア科（カナリア）、サギ科（サギ）、カラス科（カラス）などの鳥類を含む綱です。グルイフォームには、大きさが大きいものから小さいものまで様々な種類の鳥がいますが、一般的には、大きな翼を持つ、とても美しい鳥として知られています。グルイフォームの鳥の標準的な外見は、長い頭、短い頭部、長い首、茶色の全身、細長い尾などが特徴的です。また、特徴的な形をしていることから、グルイフォームの鳥は、大規模な湖沼などで見かけられることが多いです。"
+        # gpt_ans_children = "ツル属（Grus）は、カンムリヅル属（Balearica）に分類される鳥類の総称です。ツル属は、ツル、カンムリヅル、レウコジェラヌス（Leucogeranus）、ゲラノプシス（Geranopsis）、アンスロポイデス（Anthropoides）、イオバレリカ（Eobalearica）、ブゲラヌス（Bugeranus）、カンムリヅル亜科（Balearicinae）、グリ亜科（Gruinae）などの亜科があります。 ツル属の鳥は、体長60cm前後の遠くの草原を尋ね回る大型の鳥です。また、その鳥は、褐色の上背部と、胸部には白い斑点が見られます。ツル属の鳥は、その力強い鳴き声でも知られており、多くの生息地を持つため、地域によって分布が異なります。特に、アジア、アフリカ、ヨーロッパなど、多くの国で見られます。ツル属の鳥は、家畜の餌や農作物などを食べて生活し、繁殖期間中には、川や沼津などの水場を訪れ、水辺の地形を利用して繁殖します。"
+        # 真のコード
+        gpt_ans_self = ask_gpt3(ans_json["myself"],api_key)
+        gpt_ans_parent = ask_gpt3(ans_json["my_parent"],api_key)
+        gpt_ans_children = ask_gpt3(ans_json["my_children"],api_key)
+        print(max_cos_in_wikidata)
+        return templates.TemplateResponse("word_search.html",
+            {**{"request": request,
+            "api_key":api_key,
+            "max_cos_in_wikidata":round(max_cos_in_wikidata,4),
+            "gpt_ans_self": gpt_ans_self,
+            "gpt_ans_parent": gpt_ans_parent,
+            "gpt_ans_children": gpt_ans_children},
+            **d4html(ans_json["myself"],"self",""),
+            **d4html(ans_json["my_parent"],"parent","")
+            })
+    else:
+        return None
+# =============音声 => 再類似ノード(記事の欠陥により複数あり)・その親と子を含む辞書をリストに格納し返す関数
+@app.get("/sound_search", response_class=HTMLResponse)
+async def read_root(request:Request, api_key:str=""):
+    api_key = request.session.get("api_key", "please_input_your_api_key")
+    return templates.TemplateResponse("sound_search.html", {"request": request,"api_key":api_key})
+@app.post("/sound_search",response_class=HTMLResponse)
+async def sound_search(request: Request, api_key: str = Form(...), file: UploadFile = File(...)):
+# async def sound_search(request: Request,file: UploadFile = File(...)):
+    uploaded_dir = "uploaded"
+    shutil.rmtree(uploaded_dir)
+    os.mkdir(uploaded_dir)
+    with open(uploaded_dir+"/"+file.filename, "wb") as f:
+        f.write(await file.read())
+    sound_data,_ = librosa.load("uploaded/"+file.filename, sr=16000)
+    result = w2v2(torch.tensor([sound_data]))
+    hidden_vecs = result.projected_states
+    input_vecs = np.mean(hidden_vecs[0].cpu().detach().numpy(), axis=0)
+    max_cos_sim = 0.0
+    max_in_sounddata = None
+    id_cos_d = dict()
+    for d in sound_vecs:
+        cos = cos_sim(input_vecs,d["vector"])
+        id_cos_d[d["id"][0]]=cos
+    id_cos_sorted = sorted(id_cos_d.items(), key=lambda x:x[1],reverse=True)
+    try:
+        ans_json_1 = id2ans(id_cos_sorted[0][0])
+        ans_json_2 = id2ans(id_cos_sorted[1][0])
+        ans_json_3 = id2ans(id_cos_sorted[2][0])
+        #真のコード
+        gpt_ans_self_1 = ask_gpt3(ans_json_1["myself"],api_key)
+        gpt_ans_parent_1 = ask_gpt3(ans_json_1["my_parent"],api_key)
+        gpt_ans_children_1 = ask_gpt3(ans_json_1["my_children"],api_key)
+        gpt_ans_self_2 = ask_gpt3(ans_json_2["myself"],api_key)
+        gpt_ans_parent_2 = ask_gpt3(ans_json_2["my_parent"],api_key)
+        gpt_ans_children_2 = ask_gpt3(ans_json_2["my_children"],api_key)
+        gpt_ans_self_3 = ask_gpt3(ans_json_3["myself"],api_key)
+        gpt_ans_parent_3 = ask_gpt3(ans_json_3["my_parent"],api_key)
+        gpt_ans_children_3 = ask_gpt3(ans_json_3["my_children"],api_key)
+        #一旦
+        # gpt_ans_self_1 = "test"
+        # gpt_ans_parent_1 = "testtest"
+        # gpt_ans_children_1 = "testtesttest"
+        # gpt_ans_self_2 = "test"
+        # gpt_ans_parent_2 = "testtest"
+        # gpt_ans_children_2 = "testtesttest"
+        # gpt_ans_self_3 = "test"
+        # gpt_ans_parent_3 = "testtest"
+        # gpt_ans_children_3 = "testtesttest"
+        return templates.TemplateResponse("sound_search.html",
+            {**{"request": request,
+            "api_key":api_key,
+            "max_cos_in_wikidata_1":round(id_cos_sorted[0][1],4),#類似度
+            "max_cos_in_wikidata_2":round(id_cos_sorted[1][1],4),
+            "max_cos_in_wikidata_3":round(id_cos_sorted[2][1],4),
+            "gpt_ans_self_1": gpt_ans_self_1,
+            "gpt_ans_parent_1": gpt_ans_parent_1,
+            "gpt_ans_children_1": gpt_ans_children_1,
+            "gpt_ans_self_2": gpt_ans_self_2,
+            "gpt_ans_parent_2": gpt_ans_parent_2,
+            "gpt_ans_children_2": gpt_ans_children_2,
+            "gpt_ans_self_3": gpt_ans_self_3,
+            "gpt_ans_parent_3": gpt_ans_parent_3,
+            "gpt_ans_children_3": gpt_ans_children_3},
+            **d4html(ans_json_1["myself"],"self","_1"),
+            **d4html(ans_json_1["my_parent"],"parent","_1"),
+            **d4html(ans_json_2["myself"],"self","_2"),
+            **d4html(ans_json_2["my_parent"],"parent","_2"),
+            **d4html(ans_json_3["myself"],"self","_3"),
+            **d4html(ans_json_3["my_parent"],"parent","_3")
+            })
+    except:
+        return None

model/en_model/config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "_name_or_path": "bert-base-uncased",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.30.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

model/en_model/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ff8e66bc015553d84e94959a0b84aa7386b59a83ae74b49189f735b107b01afc
+size 437997357

model/en_tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

model/en_tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

model/en_tokenizer/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model/ja_model/config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "_name_or_path": "cl-tohoku/bert-base-japanese-whole-word-masking",
+  "architectures": [
+    "BertModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "tokenizer_class": "BertJapaneseTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.30.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 32000
+}

model/ja_model/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:050afbbe947c1ad144388cb5614ae92bc3ebe4489eed2789797bd569dddf20a2
+size 442537773

model/ja_tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

model/ja_tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "do_subword_tokenize": true,
+  "do_word_tokenize": true,
+  "jumanpp_kwargs": null,
+  "mask_token": "[MASK]",
+  "mecab_kwargs": null,
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "subword_tokenizer_type": "wordpiece",
+  "sudachi_kwargs": null,
+  "tokenizer_class": "BertJapaneseTokenizer",
+  "unk_token": "[UNK]",
+  "word_tokenizer_type": "mecab"
+}

model/ja_tokenizer/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model/wav2vec2-bird-jp-all/config.json ADDED Viewed

	@@ -0,0 +1,108 @@

+{
+  "_name_or_path": "./wav2vec2-bird-jp-all",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForPreTraining"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 5,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.65,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "output_hidden_size": 768,
+  "pad_token_id": 0,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.24.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32,
+  "xvector_output_dim": 512
+}

model/wav2vec2-bird-jp-all/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:49ae524d3dd798da7e6d1506daf3bc51475a08491f03cc50b4d80da278dff9e9
+size 380295745

requirements.txt ADDED Viewed

	@@ -0,0 +1,15 @@

+transformers==4.30.2
+torch==2.0.1
+fastapi==0.95.2
+uvicorn==0.22.0
+librosa==0.10.0
+json5==0.9.5
+numpy==1.24.3
+openai==0.28.0
+python-dotenv==1.0.0
+pykakasi==2.2.1
+jinja2==3.0.1
+MarkupSafe==2.0.1
+starlette==0.27.0
+fugashi==1.0.5
+ipadic==1.0.0

static/style.css ADDED Viewed

	@@ -0,0 +1,87 @@

+body {
+  background-color: #f0f0f0;
+  border: none;
+/*  font-size: 10pt;*/
+  color: #333;
+  margin: 0;
+  padding: 0;
+  margin-top: 40px;
+  margin-bottom: 40px;
+  margin-left: 70px;
+  margin-right: 70px;
+}
+header {
+  background-color: #333;
+  color: #fff;
+  padding: 1rem;
+  text-align: center;
+}
+main {
+  max-width: 800px;
+  margin: 2rem auto;
+  padding: 1rem;
+  background-color: #fff;
+  border-radius: 8px;
+  box-shadow: 0 0 10px rgba(0, 0, 0, 0.1);
+}
+/* ボタンのスタイリング */
+button {
+  background-color: #333;
+  color: #fff;
+  border: none;
+  cursor: pointer;
+  transition: background-color 0.2s;
+}
+.long-input {
+  width: 243px;
+  padding: 0.2rem;
+}
+button:hover {
+  background-color: #555;
+}
+footer {
+  background-color: #333;
+  color: #fff;
+  text-align: center;
+  padding: 1rem;
+}
+blockquote {
+  margin-top: -20px;
+  margin-bottom: 40px;
+  margin-left: 0px;
+  margin-right: 0px;
+  padding-top: 1px;
+  padding-bottom: 40px;
+  padding-left: 10px;
+  padding-right: 10px;
+/*  padding: 0.5rem;*/
+}
+p {
+  font-size: 10pt;
+}
+.smallArea {
+  /* 基本的なサイズの設定 */
+  background-color: #e8e8e8;
+}
+/* レスポンシブデザイン */
+@media (max-width: 600px) {
+  main {
+/*    font-size: 10pt;*/
+    margin: 1rem;
+    padding: 0.5rem;
+  }
+}

templates/sound_search.html ADDED Viewed

	@@ -0,0 +1,155 @@

+<!DOCTYPE html>
+<html>
+<head>
+    <title>Multimodal Bird Search</title>
+    <link rel="stylesheet" type="text/css" href="/static/style.css">
+</head>
+<body>
+<!--     <form action="/sound_search" method="post">
+        <div>
+            <label for="api_key">ChatGPT API Key:</label>
+            <input type="text" id="api_key" name="api_key" value="{{ api_key }}" required>
+            <button type="submit">入力</button>
+        </div>
+    </form> -->
+    <!-- <br> -->
+<!--     <a href="/word_search">単語検索へ</a>
+    <form action="/sound_search" method="post" enctype="multipart/form-data">
+        <div>
+            <label>音声検索：</label>
+            <input type="file" name="file" placeholder="Input bird song file">
+            <button type="submit">検索</button>
+        </div>
+    </form> -->
+    <a href="/word_search">単語検索へ</a>
+    <form id="api_key_form" action="/sound_search" method="post" enctype="multipart/form-data">
+        <div>
+            <label for="api_key">ChatGPT API Key&nbsp;</label>
+            <input type="text" id="api_key" name="api_key" value="{{ api_key }}" required>
+    <br>
+            <label>音声検索</label>
+            <input type="file" name="file" placeholder="Input bird song file">
+            <button type="submit" id="submit-button">検索</button>
+        </div>
+    </form>
+<!--
+"self_taxon_name"
+"self_ja_name"
+"self_ja_aliases"
+"self_en_name"
+"self_en_aliases"
+"self_link"
+"self_imgs_list"-->
+    <br>
+    <h3>類似度:{{ max_cos_in_wikidata_1 }}</h3>
+    <blockquote class=smallArea>
+        <h3>和名:<a href="{{ self_link_1 }}">{{ self_ja_name_1 }}</a> {{ self_ja_aliases_1 }}
+            <br>英名:<a href="{{ self_link_1 }}">{{ self_en_name_1 }}</a> {{ self_en_aliases_1 }}</h3>
+        {% for img in self_imgs_list_1 %}
+        <iframe src="{{ img }}" width="500" height="300" frameborder="0"></iframe>
+        {% endfor %}
+        <h3>解説:</h3>
+        <p>{{ gpt_ans_self_1 }}</p>
+    <hr>
+    <h3>上位概念</h3>
+        <h4>和名:<a href="{{ parent_link_1 }}">{{ parent_ja_name_1 }}</a> {{ parent_ja_aliases_1 }}
+            <br>英名:<a href="{{ parent_link_1 }}">{{ parent_en_name_1 }}</a> {{ parent_en_aliases_1 }}</h4>
+        {% for img in parent_imgs_list_1 %}
+        <iframe src="{{ img }}" width="500" height="300" frameborder="0"></iframe>
+        {% endfor %}
+        <h4>解説:</h4>
+        <p>{{ gpt_ans_parent_1 }}</p>
+    <hr>
+    <h3>下位概念</h3>
+        <h4>解説:</h4>
+        <p>{{ gpt_ans_children_1 }}</p>
+    </blockquote>
+<!-- ================================================================================== -->
+    <h3>類似度:{{ max_cos_in_wikidata_2 }}</h3>
+    <blockquote class=smallArea>
+        <h3>和名:<a href="{{ self_link_2 }}">{{ self_ja_name_2 }}</a> {{ self_ja_aliases_2 }}
+            <br>英名:<a href="{{ self_link_2 }}">{{ self_en_name_2 }}</a> {{ self_en_aliases_2 }}</h3>
+        {% for img in self_imgs_list_2 %}
+        <iframe src="{{ img }}" width="500" height="300" frameborder="0"></iframe>
+        {% endfor %}
+        <h3>解説:</h3>
+        <p>{{ gpt_ans_self_2 }}</p>
+    <hr>
+    <h3>上位概念</h3>
+        <h4>和名:<a href="{{ parent_link_2 }}">{{ parent_ja_name_2 }}</a> {{ parent_ja_aliases_2 }}
+            <br>英名:<a href="{{ parent_link_2 }}">{{ parent_en_name_2 }}</a> {{ parent_en_aliases_2 }}</h4>
+        {% for img in parent_imgs_list_2 %}
+        <iframe src="{{ img }}" width="500" height="300" frameborder="0"></iframe>
+        {% endfor %}
+        <h4>解説:</h4>
+        <p>{{ gpt_ans_parent_2 }}</p>
+    <hr>
+    <h3>下位概念</h3>
+        <h4>解説:</h4>
+        <p>{{ gpt_ans_children_2 }}</p>
+    </blockquote>
+<!-- ================================================================================== -->
+    <h3>類似度:{{ max_cos_in_wikidata_3 }}</h3>
+    <blockquote class=smallArea>
+        <h3>和名:<a href="{{ self_link_3 }}">{{ self_ja_name_3 }}</a> {{ self_ja_aliases_3 }}
+            <br>英名:<a href="{{ self_link_3 }}">{{ self_en_name_3 }}</a> {{ self_en_aliases_3 }}</h3>
+        {% for img in self_imgs_list_3 %}
+        <iframe src="{{ img }}" width="500" height="300" frameborder="0"></iframe>
+        {% endfor %}
+        <h3>解説:</h3>
+        <p>{{ gpt_ans_self_3 }}</p>
+    <hr>
+    <h3>上位概念</h3>
+        <h4>和名:<a href="{{ parent_link_3 }}">{{ parent_ja_name_3 }}</a> {{ parent_ja_aliases_3 }}
+            <br>英名:<a href="{{ parent_link_3 }}">{{ parent_en_name_3 }}</a> {{ parent_en_aliases_3 }}</h4>
+        {% for img in parent_imgs_list_3 %}
+        <iframe src="{{ img }}" width="500" height="300" frameborder="0"></iframe>
+        {% endfor %}
+        <h4>解説:</h4>
+        <p>{{ gpt_ans_parent_3 }}</p>
+    <hr>
+    <h3>下位概念</h3>
+        <h4>解説:</h4>
+        <p>{{ gpt_ans_children_3 }}</p>
+    </blockquote>
+</body>
+</html>

templates/word_search.html ADDED Viewed

	@@ -0,0 +1,83 @@

+<!DOCTYPE html>
+<html>
+<head>
+    <title>Multimodal Bird Search</title>
+    <link rel="stylesheet" type="text/css" href="/static/style.css">
+</head>
+<body>
+    <a href="/sound_search">音声検索へ</a>
+    <form id="api_key_form" action="/word_search" method="post">
+        <div>
+            <label for="api_key">ChatGPT API Key&nbsp;</label><!-- 追加 -->
+            <input type="text" id="api_key" name="api_key" value="{{ api_key }}" required><!-- 追加 -->
+            <!-- <button type="button" id="submit-button">入力</button> -->
+        <!-- </div> -->
+    <!-- </form> -->
+    <br>
+    <!-- <a href="/sound_search">音声検索へ</a> -->
+    <!-- <form action="/word_search" method="post"> -->
+        <!-- <div> -->
+            <label>単語検索</label>
+            <input class=long-input type="text" name="query" placeholder="Input bird name">
+            <!-- <button type="submit">検索</button> -->
+            <button type="submit" id="submit-button">検索</button>
+        </div>
+    </form>
+<!--
+"self_taxon_name"
+"self_ja_name"
+"self_ja_aliases"
+"self_en_name"
+"self_en_aliases"
+"self_link"
+"self_imgs_list"-->
+    <br>
+    <!-- <h1>Welcome to the Test Page, {{ dammy_data }}!</h1> -->
+    <h3>類似度:{{max_cos_in_wikidata}}</h3>
+    <blockquote class=smallArea>
+        <h3>和名:<a href="{{ self_link }}">{{ self_ja_name }}</a> {{ self_ja_aliases }}
+            <br>英名:<a href="{{ self_link }}">{{ self_en_name }}</a> {{ self_en_aliases }}</h3>
+        {% for img in self_imgs_list %}
+        <iframe src="{{ img }}" width="500" height="300" frameborder="0"></iframe>
+        {% endfor %}
+        <h3>解説:</h3>
+        <p>{{ gpt_ans_self }}</p>
+    <hr>
+    <h3>上位概念</h3>
+        <h4>和名:<a href="{{ parent_link }}">{{ parent_ja_name }}</a> {{ parent_ja_aliases }}
+            <br>英名:<a href="{{ parent_link }}">{{ parent_en_name }}</a> {{ parent_en_aliases }}</h4>
+        {% for img in parent_imgs_list %}
+        <iframe src="{{ img }}" width="500" height="300" frameborder="0"></iframe>
+        {% endfor %}
+        <h4>解説:</h4>
+        <p>{{ gpt_ans_parent }}</p>
+    <hr>
+    <h3>下位概念</h3>
+        <h4>解説:</h4>
+        <p>{{ gpt_ans_children }}</p>
+    </blockquote>
+<!--     <script>
+        // Submitボタンがクリックされたときの処理
+        document.getElementById("submit-button").addEventListener("click", function () {
+            const apiKey = document.getElementById("api_key").value;
+            const form = document.getElementById("api_key_form");
+            form.action = `/word_search/?api_key=${apiKey}`;
+            form.submit();
+        });
+    </script> -->
+</body>
+</html>