Spaces:

OpenLab-NLP
/

TestModel

Sleeping

App Files Files Community

OpenLab-NLP commited on 10 days ago

Commit

40c9160

verified ·

1 Parent(s): 8616c88

Update app.py

Browse files

Files changed (1) hide show

app.py +43 -29

app.py CHANGED Viewed

@@ -62,45 +62,59 @@ if os.path.exists(weights_path):
 else:
     print(f"오류: {weights_path} 파일을 찾을 수 없습니다. 먼저 학습을 수행하세요.")
 # 3. 예측 함수 정의
 def classify_alphabet(sketchpad):
-    if sketchpad is None:
-        return "글씨를 써주세요."
-    # 3-1. 이미지 데이터 추출 (Gradio의 Sketchpad는 dict 형태일 수 있음)
-    # 배경은 검은색(0), 글씨는 흰색(255)인 그레이스케일로 변환
-    img = sketchpad["composite"][:, :, 3] # Alpha 채널 사용
-    # 3-2. 전처리 (EMNIST 특유의 회전/반전 해결)
-    img = tf.convert_to_tensor(img, dtype=tf.float32)
-    img = tf.image.resize(tf.expand_dims(img, axis=-1), (28, 28))
-    # 중요: EMNIST는 이미지가 전치(transpose)되어 있음
-    # 사용자가 똑바로 쓴 글씨를 모델이 학습한 방향으로 돌려줍니다.
-    img = tf.image.transpose(img)
-    img = img / 255.0  # 정규화
-    img = tf.expand_dims(img, axis=0) # (1, 28, 28, 1)
-    # 3-3. 추론
-    preds = model.predict(img, verbose=0)[0]
-    # 결과 생성 (A-Z)
-    results = {}
-    for i in range(26):
-        char = chr(ord('A') + i)
-        results[char] = float(preds[i])
-    return results
-# 4. Gradio 인터페이스 구성
 interface = gr.Interface(
     fn=classify_alphabet,
     inputs=gr.Sketchpad(label="알파벳을 그려보세요 (A-Z)", type="numpy"),
     outputs=gr.Label(num_top_classes=3, label="예측 결과"),
     title="Dynamic Conv Alphabet Recognizer",
-    description="2D Dynamic Convolution 레이어를 사용한 알파벳 인식기입니다.",
-    live=True # 실시간 인식 활성화
 )
 if __name__ == "__main__":
-    interface.launch()

 else:
     print(f"오류: {weights_path} 파일을 찾을 수 없습니다. 먼저 학습을 수행하세요.")
 # 3. 예측 함수 정의
+# ... (상단 모델 정의 및 로드 부분은 동일)
 def classify_alphabet(sketchpad):
+    # 수정: sketchpad가 None이거나 데이터가 없는 경우 처리
+    if sketchpad is None or (isinstance(sketchpad, dict) and sketchpad.get("composite") is None):
+        return {"상태": "글씨를 기다리는 중..."}
+    try:
+        # 3-1. 이미지 데이터 추출
+        # Gradio 버전에 따라 구조가 다를 수 있으므로 안전하게 접근
+        img_data = sketchpad["composite"]
+        # 만약 이미지가 투명도가 없는 3채널이라면 흑백 전환, 4채널이면 Alpha 사용
+        if img_data.shape[-1] == 4:
+            img = img_data[:, :, 3] # Alpha 채널 (글씨 부분)
+        else:
+            img = tf.image.rgb_to_grayscale(img_data)[:, :, 0]
+        # 3-2. 전처리
+        img = tf.cast(img, tf.float32)
+        img = tf.image.resize(tf.expand_dims(img, axis=-1), (28, 28))
+        # EMNIST 데이터 방향에 맞게 전치(Transpose)
+        img = tf.image.transpose(img)
+        img = img / 255.0
+        img = tf.expand_dims(img, axis=0)
+        # 3-3. 추론
+        preds = model.predict(img, verbose=0)[0]
+        results = {}
+        for i in range(26):
+            char = chr(ord('A') + i)
+            results[char] = float(preds[i])
+        return results
+    except Exception as e:
+        return {"에러": str(e)}
+# 4. Gradio 인터페이스 설정 수정
 interface = gr.Interface(
     fn=classify_alphabet,
     inputs=gr.Sketchpad(label="알파벳을 그려보세요 (A-Z)", type="numpy"),
     outputs=gr.Label(num_top_classes=3, label="예측 결과"),
     title="Dynamic Conv Alphabet Recognizer",
+    live=True
 )
 if __name__ == "__main__":
+    # 수정: SSR 모드와 Hot Reload 관련 에러를 방지하기 위해 설정을 추가합니다.
+    interface.launch(
+        server_name="0.0.0.0",
+        ssr_mode=False  # 로그에 나온 SSR 관련 이슈 방지
+    )