Spaces:
Running
Running
Remove outdated anchor name sentence embeddings file, update cached embeddings with new sizes, and refactor sub subject and name mapping in the prediction process.
Browse files- data/anchor_name_sentence_embeddings_cl-nagoya-sup-simcse-ja-nss-v_1_0_7_10_float16.pkl +0 -3
- data/cached_embeddings_abstract.pkl +2 -2
- data/cached_embeddings_name.pkl +2 -2
- data/cached_embeddings_unit.pkl +2 -2
- data/nameMapData.csv +0 -0
- data/outputData.csv +0 -0
- data/subSubjectAndNameMapData.csv +1 -40
- data/subSubjectMapData.csv +6 -6
- routes/predict.py +4 -6
- services/sentence_transformer_service.py +12 -19
data/anchor_name_sentence_embeddings_cl-nagoya-sup-simcse-ja-nss-v_1_0_7_10_float16.pkl
DELETED
|
@@ -1,3 +0,0 @@
|
|
| 1 |
-
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:a4689a144a7bb1d3e8dd7f5cfb52a152f001514215b46d59ff2fe61b672bd0de
|
| 3 |
-
size 11788964
|
|
|
|
|
|
|
|
|
|
|
|
data/cached_embeddings_abstract.pkl
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
-
size
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:9228f5a3d3a1e87ae1cc3bead894275c1c72f0235db187191d96aefe24519bef
|
| 3 |
+
size 15165877
|
data/cached_embeddings_name.pkl
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
-
size
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:4ff02d38b5244171b7546bb884be57200d4c20f0fd23fdd7b1d2636ec2f34fce
|
| 3 |
+
size 31974360
|
data/cached_embeddings_unit.pkl
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
-
size
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:296c8e2fa98330d9f7df7f02f14b1e5e1d8e2a27e2bdfb181a50b8017f67da80
|
| 3 |
+
size 372392
|
data/nameMapData.csv
CHANGED
|
The diff for this file is too large to render.
See raw diff
|
|
|
data/outputData.csv
CHANGED
|
The diff for this file is too large to render.
See raw diff
|
|
|
data/subSubjectAndNameMapData.csv
CHANGED
|
@@ -1,47 +1,8 @@
|
|
| 1 |
-
|
| 2 |
地業,工事費,既製コンクリート杭,既製コンクリート杭工事費
|
| 3 |
地業,杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
| 4 |
地業,施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
| 5 |
地業,試験杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
| 6 |
-
囲障,囲障手摺,外部,外部 囲障手摺
|
| 7 |
-
囲障,囲障手摺,内部,内部 囲障手摺
|
| 8 |
-
既製コンクリート,壁ALC板下り壁下端金物,外部,外壁ALC板下り壁下端金物
|
| 9 |
-
既製コンクリート,壁ALC板下り壁下端金物,内部,内壁ALC板下り壁下端金物
|
| 10 |
-
既製コンクリート,壁ALC板足元金物,外部,外壁ALC板足元金物
|
| 11 |
-
既製コンクリート,壁ALC板足元金物,内部,内壁ALC板足元金物
|
| 12 |
-
既製コンクリート,壁ALC板開口補強,外部,外壁ALC板開口補強
|
| 13 |
-
既製コンクリート,壁ALC板開口補強,内部,内壁ALC板開口補強
|
| 14 |
-
既製コンクリート,壁ALC板取付金物,外部,外壁ALC板取付金物
|
| 15 |
-
既製コンクリート,壁ALC板取付金物,内部,内壁ALC板取付金物
|
| 16 |
-
既製コンクリート,壁ALC板頂部金物,外部,外壁ALC板頂部金物
|
| 17 |
-
既製コンクリート,壁ALC板頂部金物,内部,内壁ALC板頂部金物
|
| 18 |
-
既製コンクリート,壁押出成形セメント板,外部,外壁押出成形セメント板
|
| 19 |
-
既製コンクリート,壁押出成形セメント板,内部,内壁押出成形セメント板
|
| 20 |
-
既製コンクリート,壁押出成形セメント板コーナー金物,外部,外壁押出成形セメント板コーナー金物
|
| 21 |
-
既製コンクリート,壁押出成形セメント板コーナー金物,内部,内壁押出成形セメント板コーナー金物
|
| 22 |
-
既製コンクリート,壁押出成形セメント板足元金物,外部,外壁押出成形セメント板足元金物
|
| 23 |
-
既製コンクリート,壁押出成形セメント板足元金物,内部,内壁押出成形セメント板足元金物
|
| 24 |
-
既製コンクリート,壁押出成形セメント板開口補強金物,外部,外壁押出成形セメント板開口補強金物
|
| 25 |
-
既製コンクリート,壁押出成形セメント板開口補強金物,内部,内壁押出成形セメント板開口補強金物
|
| 26 |
-
既製コンクリート,壁押出成形セメント板取付金物,外部,外壁押出成形セメント板取付金物
|
| 27 |
-
既製コンクリート,壁押出成形セメント板頂部金物,外部,外壁押出成形セメント板頂部金物
|
| 28 |
-
既製コンクリート,壁押出成形セメント板頂部金物,内部,内壁押出成形セメント板頂部金物
|
| 29 |
-
既製コンクリート,壁ALC板,外部,外壁ALC板
|
| 30 |
-
既製コンクリート,壁ALC板,内部,内壁ALC板
|
| 31 |
-
既製コンクリート,壁ALC板開口補強金物,外部,外壁ALC板開口補強金物
|
| 32 |
-
既製コンクリート,壁ALC板開口補強金物,内部,内壁ALC板開口補強金物
|
| 33 |
-
金属,階段ノンスリップ,外部,外部 階段ノンスリップ
|
| 34 |
-
金属,階段ノンスリップ,内部,内部 階段ノンスリップ
|
| 35 |
-
金属,手摺,外部,外部 手摺
|
| 36 |
-
金属,手摺,内部,内部 手摺
|
| 37 |
-
金属,仮設手摺,外部,外部 仮設手摺
|
| 38 |
-
金属,仮設手摺,内部,内部 仮設手摺
|
| 39 |
-
金属,階段手摺,外部,外部 階段手摺
|
| 40 |
-
金属,階段手摺,内部,内部 階段手摺
|
| 41 |
-
金属,階段壁付手摺,外部,外部 階段壁付手摺
|
| 42 |
-
金属,階段壁付手摺,内部,内部 階段壁付手摺
|
| 43 |
-
左官,建具防水モルタル充填,外部,外部 建具防水モルタル充填
|
| 44 |
-
左官,建具防水モルタル充填,内部,内部 建具防水モルタル充填
|
| 45 |
建具,ガラスドア,ガラスドア(内部),内部 鋼製建具
|
| 46 |
建具,ガラスドア,ガラスドア(外部),外部 鋼製建具
|
| 47 |
建具,ガラスドア,ガラス(内部),内部 ガラス
|
|
|
|
| 1 |
+
標準科目,入力_項目名,標準中科目,出力_項目名
|
| 2 |
地業,工事費,既製コンクリート杭,既製コンクリート杭工事費
|
| 3 |
地業,杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
| 4 |
地業,施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
| 5 |
地業,試験杭施工費,現場打ちコンクリート杭,現場打ちコンクリート杭施工費
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 6 |
建具,ガラスドア,ガラスドア(内部),内部 鋼製建具
|
| 7 |
建具,ガラスドア,ガラスドア(外部),外部 鋼製建具
|
| 8 |
建具,ガラスドア,ガラス(内部),内部 ガラス
|
data/subSubjectMapData.csv
CHANGED
|
@@ -60,7 +60,7 @@
|
|
| 60 |
建具,アルミニウム製建具(運搬取付),アルミニウム製建具(運搬取付),
|
| 61 |
建具,アルミニウム製建具(外部),アルミニウム製建具(外部),外部
|
| 62 |
建具,アルミニウム製建具(内部),アルミニウム製建具(内部),内部
|
| 63 |
-
|
| 64 |
建具,エンジン装置,自動ドア開閉装置(内部・外部不明),不明
|
| 65 |
建具,エンジン装置(外部),自動ドア開閉装置(外部),外部
|
| 66 |
建具,エンジン装置(内部),自動ドア開閉装置(内部),内部
|
|
@@ -166,8 +166,8 @@
|
|
| 166 |
鉄筋,その他,その他,
|
| 167 |
鉄筋,解体,解体,
|
| 168 |
鉄筋,解体(躯体),解体,
|
| 169 |
-
|
| 170 |
-
|
| 171 |
鉄筋,外部仕上,外部仕上,外部
|
| 172 |
鉄筋,躯体,躯体,
|
| 173 |
鉄筋,直接仮設,その他,
|
|
@@ -180,7 +180,7 @@
|
|
| 180 |
鉄骨,アルミハニカム庇吊り鉄骨,付帯鉄骨,
|
| 181 |
鉄骨,キャットウォーク鉄骨,付帯鉄骨,
|
| 182 |
鉄骨,デッキプレート,デッキプレート,
|
| 183 |
-
|
| 184 |
鉄骨,バックスタンド階段鉄骨,付帯鉄骨,
|
| 185 |
鉄骨,バックスタンド南側トイレ鉄骨,付帯鉄骨,
|
| 186 |
鉄骨,バックスタンド北側トイレ鉄骨,付帯鉄骨,
|
|
@@ -197,8 +197,8 @@
|
|
| 197 |
鉄骨,屋上目隠しフェンス下地鉄骨,付帯鉄骨,
|
| 198 |
鉄骨,屋内練習場階段鉄骨,付帯鉄骨,
|
| 199 |
鉄骨,階段鉄骨,付帯鉄骨,
|
| 200 |
-
|
| 201 |
-
|
| 202 |
鉄骨,建具下地鉄骨,付帯鉄骨,
|
| 203 |
鉄骨,光ダクト下地鉄骨,付帯鉄骨,
|
| 204 |
鉄骨,勾配屋根下地鉄骨,付帯鉄骨,
|
|
|
|
| 60 |
建具,アルミニウム製建具(運搬取付),アルミニウム製建具(運搬取付),
|
| 61 |
建具,アルミニウム製建具(外部),アルミニウム製建具(外部),外部
|
| 62 |
建具,アルミニウム製建具(内部),アルミニウム製建具(内部),内部
|
| 63 |
+
建具,アルミニウム製建具(不明),アルミニウム製建具(運搬取付),
|
| 64 |
建具,エンジン装置,自動ドア開閉装置(内部・外部不明),不明
|
| 65 |
建具,エンジン装置(外部),自動ドア開閉装置(外部),外部
|
| 66 |
建具,エンジン装置(内部),自動ドア開閉装置(内部),内部
|
|
|
|
| 166 |
鉄筋,その他,その他,
|
| 167 |
鉄筋,解体,解体,
|
| 168 |
鉄筋,解体(躯体),解体,
|
| 169 |
+
鉄筋,解体(内部),解体(内部),内部
|
| 170 |
+
鉄筋,解体(外部),解体(外部),外部
|
| 171 |
鉄筋,外部仕上,外部仕上,外部
|
| 172 |
鉄筋,躯体,躯体,
|
| 173 |
鉄筋,直接仮設,その他,
|
|
|
|
| 180 |
鉄骨,アルミハニカム庇吊り鉄骨,付帯鉄骨,
|
| 181 |
鉄骨,キャットウォーク鉄骨,付帯鉄骨,
|
| 182 |
鉄骨,デッキプレート,デッキプレート,
|
| 183 |
+
鉄骨,バック-屋内接続鉄骨,付帯鉄骨,
|
| 184 |
鉄骨,バックスタンド階段鉄骨,付帯鉄骨,
|
| 185 |
鉄骨,バックスタンド南側トイレ鉄骨,付帯鉄骨,
|
| 186 |
鉄骨,バックスタンド北側トイレ鉄骨,付帯鉄骨,
|
|
|
|
| 197 |
鉄骨,屋上目隠しフェンス下地鉄骨,付帯鉄骨,
|
| 198 |
鉄骨,屋内練習場階段鉄骨,付帯鉄骨,
|
| 199 |
鉄骨,階段鉄骨,付帯鉄骨,
|
| 200 |
+
鉄骨,外部,その他,
|
| 201 |
+
鉄骨,外部階段鉄骨,付帯鉄骨,
|
| 202 |
鉄骨,建具下地鉄骨,付帯鉄骨,
|
| 203 |
鉄骨,光ダクト下地鉄骨,付帯鉄骨,
|
| 204 |
鉄骨,勾配屋根下地鉄骨,付帯鉄骨,
|
routes/predict.py
CHANGED
|
@@ -17,7 +17,7 @@ from mapping_lib.standard_subject_data_mapper import StandardSubjectDataMapper
|
|
| 17 |
from mapping_lib.subject_similarity_mapper import SubjectSimilarityMapper
|
| 18 |
from mapping_lib.sub_subject_similarity_mapper import SubSubjectSimilarityMapper
|
| 19 |
from mapping_lib.name_similarity_mapper import NameSimilarityMapper
|
| 20 |
-
from mapping_lib.
|
| 21 |
from mapping_lib.abstract_similarity_mapper import AbstractSimilarityMapper
|
| 22 |
from mapping_lib.name_and_abstract_mapper import NameAndAbstractDataMapper
|
| 23 |
from mapping_lib.unit_mapper import UnitMapper
|
|
@@ -160,15 +160,13 @@ async def predict(
|
|
| 160 |
try:
|
| 161 |
# Sub subject and name mapping
|
| 162 |
if sentence_service.df_sub_subject_and_name_map_data is not None:
|
| 163 |
-
sub_subject_and_name_mapper =
|
| 164 |
df_map_data=sentence_service.df_sub_subject_and_name_map_data
|
| 165 |
)
|
| 166 |
-
|
| 167 |
-
df_input_data=df_output_data
|
| 168 |
-
)
|
| 169 |
|
| 170 |
except Exception as e:
|
| 171 |
-
print(f"Error processing
|
| 172 |
raise HTTPException(status_code=500, detail=str(e))
|
| 173 |
|
| 174 |
try:
|
|
|
|
| 17 |
from mapping_lib.subject_similarity_mapper import SubjectSimilarityMapper
|
| 18 |
from mapping_lib.sub_subject_similarity_mapper import SubSubjectSimilarityMapper
|
| 19 |
from mapping_lib.name_similarity_mapper import NameSimilarityMapper
|
| 20 |
+
from mapping_lib.sub_subject_and_name_data_mapper import SubSubjectAndNameDataMapper
|
| 21 |
from mapping_lib.abstract_similarity_mapper import AbstractSimilarityMapper
|
| 22 |
from mapping_lib.name_and_abstract_mapper import NameAndAbstractDataMapper
|
| 23 |
from mapping_lib.unit_mapper import UnitMapper
|
|
|
|
| 160 |
try:
|
| 161 |
# Sub subject and name mapping
|
| 162 |
if sentence_service.df_sub_subject_and_name_map_data is not None:
|
| 163 |
+
sub_subject_and_name_mapper = SubSubjectAndNameDataMapper(
|
| 164 |
df_map_data=sentence_service.df_sub_subject_and_name_map_data
|
| 165 |
)
|
| 166 |
+
sub_subject_and_name_mapper.map_data(df_input_data=df_output_data)
|
|
|
|
|
|
|
| 167 |
|
| 168 |
except Exception as e:
|
| 169 |
+
print(f"Error processing SubSubjectAndNameDataMapper: {e}")
|
| 170 |
raise HTTPException(status_code=500, detail=str(e))
|
| 171 |
|
| 172 |
try:
|
services/sentence_transformer_service.py
CHANGED
|
@@ -212,6 +212,18 @@ class SentenceTransformerService:
|
|
| 212 |
self.df_name_map_data = pd.read_csv(name_map_file)
|
| 213 |
print(f"Loaded name map data: {len(self.df_name_map_data)} entries")
|
| 214 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 215 |
# Load abstract map data
|
| 216 |
abstract_map_file = os.path.join(DATA_DIR, "abstractMapData.csv")
|
| 217 |
if os.path.exists(abstract_map_file):
|
|
@@ -219,13 +231,6 @@ class SentenceTransformerService:
|
|
| 219 |
print(
|
| 220 |
f"Loaded abstract map data: {len(self.df_abstract_map_data)} entries"
|
| 221 |
)
|
| 222 |
-
print(
|
| 223 |
-
f"DEBUG: Abstract map data columns: {list(self.df_abstract_map_data.columns)}"
|
| 224 |
-
)
|
| 225 |
-
print(f"DEBUG: Abstract map data sample:")
|
| 226 |
-
print(self.df_abstract_map_data.head(3).to_string())
|
| 227 |
-
else:
|
| 228 |
-
print(f"DEBUG: Abstract map file not found: {abstract_map_file}")
|
| 229 |
|
| 230 |
# Load name and subject map data
|
| 231 |
name_and_subject_map_file = os.path.join(
|
|
@@ -239,18 +244,6 @@ class SentenceTransformerService:
|
|
| 239 |
f"Loaded name and subject map data: {len(self.df_name_and_subject_map_data)} entries"
|
| 240 |
)
|
| 241 |
|
| 242 |
-
# Load sub subject and name map data
|
| 243 |
-
sub_subject_and_name_map_file = os.path.join(
|
| 244 |
-
DATA_DIR, "subSubjectAndNameMapData.csv"
|
| 245 |
-
)
|
| 246 |
-
if os.path.exists(sub_subject_and_name_map_file):
|
| 247 |
-
self.df_sub_subject_and_name_map_data = pd.read_csv(
|
| 248 |
-
sub_subject_and_name_map_file
|
| 249 |
-
)
|
| 250 |
-
print(
|
| 251 |
-
f"Loaded sub subject and name map data: {len(self.df_sub_subject_and_name_map_data)} entries"
|
| 252 |
-
)
|
| 253 |
-
|
| 254 |
except Exception as e:
|
| 255 |
print(f"Error loading map data: {e}")
|
| 256 |
|
|
|
|
| 212 |
self.df_name_map_data = pd.read_csv(name_map_file)
|
| 213 |
print(f"Loaded name map data: {len(self.df_name_map_data)} entries")
|
| 214 |
|
| 215 |
+
# Load sub subject and name map data
|
| 216 |
+
sub_subject_and_name_map_file = os.path.join(
|
| 217 |
+
DATA_DIR, "subSubjectAndNameMapData.csv"
|
| 218 |
+
)
|
| 219 |
+
if os.path.exists(sub_subject_and_name_map_file):
|
| 220 |
+
self.df_sub_subject_and_name_map_data = pd.read_csv(
|
| 221 |
+
sub_subject_and_name_map_file
|
| 222 |
+
)
|
| 223 |
+
print(
|
| 224 |
+
f"Loaded sub subject and name map data: {len(self.df_sub_subject_and_name_map_data)} entries"
|
| 225 |
+
)
|
| 226 |
+
|
| 227 |
# Load abstract map data
|
| 228 |
abstract_map_file = os.path.join(DATA_DIR, "abstractMapData.csv")
|
| 229 |
if os.path.exists(abstract_map_file):
|
|
|
|
| 231 |
print(
|
| 232 |
f"Loaded abstract map data: {len(self.df_abstract_map_data)} entries"
|
| 233 |
)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 234 |
|
| 235 |
# Load name and subject map data
|
| 236 |
name_and_subject_map_file = os.path.join(
|
|
|
|
| 244 |
f"Loaded name and subject map data: {len(self.df_name_and_subject_map_data)} entries"
|
| 245 |
)
|
| 246 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 247 |
except Exception as e:
|
| 248 |
print(f"Error loading map data: {e}")
|
| 249 |
|