Spaces:

Antharee
/

OCR_BY_INK

Runtime error

App Files Files Community

Antharee commited on Jul 21

Commit

0d1f6bf

verified ·

1 Parent(s): e964fb0

Delete app.py

Browse files

Files changed (1) hide show

app.py +0 -415

app.py DELETED Viewed

@@ -1,415 +0,0 @@
-from flask import Flask, request, render_template, jsonify
-import easyocr
-import google.generativeai as genai
-import os
-import re
-app = Flask(__name__)
-# ตั้งค่า Gemini API Key
-genai.configure(api_key="AIzaSyCK_4YXWSEaZf6_E0RS_kNIsvHRBbAz8rQ")  # เปลี่ยนตรงนี้ให้เป็น API Key ของคุณ
-# โหลดโมเดล OCR
-reader = easyocr.Reader(['th', 'en'])
-# โหลดโมเดล Gemini
-model = genai.GenerativeModel("gemini-2.0-flash")
-# สร้างโฟลเดอร์สำหรับเก็บไฟล์อัปโหลด
-if not os.path.exists('static'):
-    os.makedirs('static')
-# ฟังก์ชันให้ Gemini ช่วยแก้ข้อความ OCR
-def refine_text_with_gemini(text):
-    try:
-        prompt = f"""
-        ด้านล่างนี้คือข้อความดิบที่ได้จาก OCR ซึ่งอาจมีคำผิดหรือรูปแบบไม่ถูกต้อง:
-        {text}
-        กรุณาช่วยแก้ไขให้ข้อความถูกต้องตามความเป็นจริงของบัตรประชาชนไทย:
-        - แก้คำสะกดผิด
-        - หากข้อความหายไปหรือผิดพลาดจาก OCR กรุณาเติมให้สมบูรณ์ โดยอิงจากบริบทของข้อความที่เหลือ
-        - ข้อมูลใดไม่ทราบข้อมูลได้ไม่ต้องแสดง
-        - ไม่ต้องอธิบายการทำงานเเค่ถอดข้อความออกมาให้อ่านเข้าใจ
-        - ไม่ต้องเเปลภาษา
-        """
-        response = model.generate_content(prompt)
-        return response.text
-    except Exception as e:
-        print(f"Error in Gemini processing: {e}")
-        return text  # Return original text if Gemini fails
-# ฟังก์ชันแยกข้อมูลจากการตอบของ Gemini
-def parse_gemini_response(text):
-    """
-    แยกข้อมูลสำคัญจากข้อความที่ Gemini แก้ไขแล้ว
-    """
-    data = {
-        'fullname': '',
-        'idnumber': '',
-        'birthdate': '',
-        'religion': '',
-        'address': '',
-        'issuedate': '',
-        'expiredate': ''
-    }
-    try:
-        # ใช้ regex patterns หาข้อมูล
-        lines = text.split('\n')
-        for line in lines:
-            line = line.strip()
-            # หาชื่อ-นามสกุล (มักจะเป็นบรรทัดที่มีคำว่า "นาย" "นาง" "นางสาว" หรือเป็นชื่อภาษาไทย)
-            if re.search(r'(นาย|นาง|นางสาว|Mr\.|Mrs\.|Miss)', line):
-                data['fullname'] = line
-            # หาเลขประจำตัวประชาชน (13 หลัก)
-            id_match = re.search(r'(\d{1}\s*\d{4}\s*\d{5}\s*\d{2}\s*\d{1}|\d{13})', line)
-            if id_match:
-                data['idnumber'] = id_match.group().replace(' ', '')
-            # หาวันเกิด
-            if re.search(r'(เกิด|born)', line.lower()):
-                date_match = re.search(r'(\d{1,2}[\s/.-]\d{1,2}[\s/.-]\d{4})', line)
-                if date_match:
-                    data['birthdate'] = date_match.group()
-            # หาศาสนา
-            if re.search(r'(ศาสนา|religion)', line.lower()):
-                religion_match = re.search(r'(พุทธ|คริสต์|อิสลาม|ฮินดู|ซิกข์)', line)
-                if religion_match:
-                    data['religion'] = religion_match.group()
-            # หาที่อยู่ (บรรทัดที่มีเลขที่ หมู่ ถนน)
-            if re.search(r'(เลขที่|หมู่|ถนน|ตำบล|อำเภอ|จังหวัด)', line):
-                if not data['address']:  # เก็บที่อยู่บรรทัดแรกที่เจอ
-                    data['address'] = line
-                else:
-                    data['address'] += ' ' + line
-            # หาวันออกบัตร
-            if re.search(r'(ออกบัตร|issued)', line.lower()):
-                date_match = re.search(r'(\d{1,2}[\s/.-]\d{1,2}[\s/.-]\d{4})', line)
-                if date_match:
-                    data['issuedate'] = date_match.group()
-            # หาวันหมดอายุ
-            if re.search(r'(หมดอายุ|expire)', line.lower()):
-                date_match = re.search(r'(\d{1,2}[\s/.-]\d{1,2}[\s/.-]\d{4})', line)
-                if date_match:
-                    data['expiredate'] = date_match.group()
-    except Exception as e:
-        print(f"Error parsing Gemini response: {e}")
-    return data
-# หน้าเริ่มต้น
-@app.route("/", methods=["GET"])
-def index():
-    return render_template("index.html")
-# เมื่อมีการอัปโหลดภาพ
-@app.route("/upload", methods=["POST"])
-def upload():
-    try:
-        if "image" not in request.files:
-            return jsonify({"error": "ไม่พบไฟล์"}), 400
-        file = request.files["image"]
-        if file.filename == '':
-            return jsonify({"error": "ไม่ได้เลือกไฟล์"}), 400
-        # ตรวจสอบว่ามีนามสกุลไฟล์หรือไม่
-        if '.' not in file.filename:
-            return jsonify({"error": "ไฟล์ต้องมีนามสกุล"}), 400
-        file_extension = file.filename.rsplit('.', 1)[1].lower()
-        # ไฟล์ที่อันตรายที่ไม่ควรอนุญาต (blacklist)
-        dangerous_extensions = {
-            'exe', 'bat', 'cmd', 'scr', 'vbs', 'jar', 'com', 'pif',
-            'application', 'gadget', 'msi', 'msp', 'hta', 'cpl', 'msc',
-            'wsf', 'wsh', 'ps1', 'ps1xml', 'ps2', 'ps2xml', 'psc1', 'psc2'
-        }
-        # ป้องกันไฟล์อันตราย
-        if file_extension in dangerous_extensions:
-            return jsonify({"error": f"ไฟล์ประเภท .{file_extension} อาจเป็นอันตราย"}), 400
-        # ตรวจสอบขนาดไฟล์ (10MB = 10 * 1024 * 1024 bytes)
-        file.seek(0, 2)  # ไปที่ท้ายไฟล์
-        file_size = file.tell()  # ได้ขนาดไฟล์
-        file.seek(0)  # กลับไปต้นไฟล์
-        if file_size > 10 * 1024 * 1024:  # 10MB
-            return jsonify({"error": "ไฟล์ใหญ่เกินไป (สูงสุด 10MB)"}), 400
-        # สร้างชื่อไฟล์ใหม่เพื่อป้องกันชื่อซ้ำ
-        import time
-        timestamp = str(int(time.time()))
-        safe_filename = f"{timestamp}_{file.filename}"
-        file_path = os.path.join("static", safe_filename)
-        # บันทึกไฟล์
-        file.save(file_path)
-        # ตรวจสอบว่าไฟล์เป็นรูปภาพหรือ PDF ก่อนทำ OCR
-        image_extensions = {'png', 'jpg', 'jpeg', 'gif', 'bmp', 'tiff', 'webp'}
-        pdf_extensions = {'pdf'}
-        raw_text = ""
-        refined_text = ""
-        data = {}
-        if file_extension in image_extensions or file_extension in pdf_extensions:
-            # OCR อ่านข้อความจากภาพหรือ PDF
-            try:
-                results = reader.readtext(file_path, detail=0)
-                raw_text = "\n".join(results)
-                if not raw_text.strip():
-                    return render_template("index.html",
-                                         error="ไม่สามารถอ่านข้อความจากไฟล์ได้ กรุณาลองใหม่ด้วยไฟล์ที่ชัดขึ้น",
-                                         file_info={"name": file.filename, "size": file_size, "type": file_extension})
-            except Exception as e:
-                print(f"OCR Error: {e}")
-                return render_template("index.html",
-                                     error="เกิดข้อผิดพลาดในการอ่านไฟล์ กรุณาลองใหม่อีกครั้ง",
-                                     file_info={"name": file.filename, "size": file_size, "type": file_extension})
-            # แก้ไขปัญหาการอ่านเลข 1 เป็น /
-            def fix_common_ocr_errors(text):
-                # แก้เฉพาะ / ที่น่าจะเป็นเลข 1 เช่น 2/3 → 213
-                return re.sub(r'(?<=\d)/(?=\d)', '1', text)
-            raw_text = fix_common_ocr_errors(raw_text)
-            # ส่งข้อความดิบให้ Gemini แก้ไข
-            try:
-                refined_text = refine_text_with_gemini(raw_text)
-            except Exception as e:
-                print(f"Gemini Error: {e}")
-                refined_text = raw_text  # ใช้ข้อความต้นฉบับถ้า Gemini ล้มเหลว
-            # แยกข้อมูลที่สำคัญออกมา
-            try:
-                data = parse_gemini_response(refined_text)
-            except Exception as e:
-                print(f"Parse Error: {e}")
-                data = {}
-        else:
-            # ไฟล์ประเภทอื่นที่ไม่ใช่รูปภาพหรือ PDF
-            raw_text = f"อัปโหลดไฟล์ {file.filename} สำเร็จ"
-            refined_text = f"ไฟล์ประเภท .{file_extension} ได้รับการอัปโหลดเรียบร้อยแล้ว"
-            data = {
-                "filename": file.filename,
-                "file_type": file_extension,
-                "file_size": f"{file_size / 1024:.2f} KB"
-            }
-        # ลบไฟล์ที่อัปโหลดเพื่อประหยัดพื้นที่ (ถ้าไม่ต้องการเก็บไว้)
-        try:
-            os.remove(file_path)
-        except:
-            pass
-        # ส่งข้อมูลไปหน้าเว็บ
-        return render_template("index.html",
-                             raw_text=raw_text,
-                             refined_text=refined_text,
-                             data=data,
-                             file_info={
-                                 "name": file.filename,
-                                 "size": f"{file_size / 1024:.2f} KB",
-                                 "type": file_extension
-                             })
-    except Exception as e:
-        print(f"Unexpected error: {e}")
-        return render_template("index.html",
-                             error="เกิดข้อผิดพลาดที่ไม่คาดคิด กรุณาลองใหม่อีกครั้ง")
-@app.route("/api/lucky-draw", methods=["POST"])
-def lucky_draw():
-    try:
-        if "image" not in request.files:
-            return jsonify({"success": False, "message": "ไม่พบไฟล์"}), 400
-        file = request.files["image"]
-        if file.filename == '':
-            return jsonify({"success": False, "message": "ไม่ได้เลือกไฟล์"}), 400
-        if '.' not in file.filename:
-            return jsonify({"success": False, "message": "ไฟล์ต้องมีนามสกุล"}), 400
-        file_extension = file.filename.rsplit('.', 1)[1].lower()
-        allowed_extensions = {'png', 'jpg', 'jpeg', 'gif', 'bmp', 'tiff', 'webp', 'pdf'}
-        if file_extension not in allowed_extensions:
-            return jsonify({"success": False, "message": "รองรับเฉพาะไฟล์รูปภาพและ PDF เท่านั้น"}), 400
-        file.seek(0, 2)
-        file_size = file.tell()
-        file.seek(0)
-        if file_size > 10 * 1024 * 1024:
-            return jsonify({"success": False, "message": "ไฟล์ใหญ่เกินไป (สูงสุด 10MB)"}), 400
-        # บันทึกไฟล์ชั่วคราว
-        import time
-        timestamp = str(int(time.time()))
-        safe_filename = f"{timestamp}_{file.filename}"
-        file_path = os.path.join("static", safe_filename)
-        file.save(file_path)
-        # OCR อ่านข้อความ
-        results = []
-        try:
-            if file_extension == 'pdf':
-                # ถ้า PDF อาจต้องแปลงเป็นรูปก่อน (ง่ายๆ ใช้ pdf2image หรือ library อื่น)
-                # แต่ถ้าอยากง่าย ให้บอกว่ารองรับเฉพาะรูปภาพก่อน
-                return jsonify({"success": False, "message": "ยังไม่รองรับ PDF สำหรับฟังก์ชันสุ่มชื่อ"}), 400
-            else:
-                results = reader.readtext(file_path, detail=0)
-        except Exception as e:
-            print(f"OCR Error: {e}")
-            return jsonify({"success": False, "message": "เกิดข้อผิดพลาดในการอ่านไฟล์"}), 500
-        raw_text = "\n".join(results)
-        # ฟังก์ชันช่วยแก้ปัญหาการอ่านเลข 1 ผิดเป็น /
-        def fix_common_ocr_errors(text):
-            return re.sub(r'(?<=\d)/(?=\d)', '1', text)
-        raw_text = fix_common_ocr_errors(raw_text)
-        # สร้าง prompt สำหรับให้ Gemini สุ่มชื่อผู้โชคดี 3 ราย
-        prompt = f"""
-        ข้อความด้านล่างเป็นรายชื่อผู้เข้าร่วมกิจกรรม (อาจมีหลายบรรทัด):
-        {raw_text}
-        กรุณาสุ่มเลือกชื่อผู้โชคดีจำนวน 3 คน และตอบกลับเป็นรายการชื่อแยกบรรทัดใหม่โดยไม่ต้องมีข้อความอื่น
-        """
-        # เรียก Gemini เพื่อสุ่มชื่อ
-        response = model.generate_content(prompt)
-        lucky_names_text = response.text.strip()
-        # แปลงข้อความชื่อผู้โชคดีเป็น list
-        lucky_names = [line.strip() for line in lucky_names_text.split('\n') if line.strip()]
-        # ลบไฟล์หลังใช้งาน
-        try:
-            os.remove(file_path)
-        except:
-            pass
-        return jsonify({
-            "success": True,
-            "lucky_names": lucky_names,
-            "raw_text": raw_text
-        })
-    except Exception as e:
-        print(f"Unexpected error in lucky_draw: {e}")
-        return jsonify({"success": False, "message": "เกิดข้อผิดพลาดที่ไม่คาดคิด"}), 500
-# ===== ทางเลือกอื่น: รองรับทุกไฟล์โดยไม่มีข้อจำกัด =====
-@app.route("/upload_no_limit", methods=["POST"])
-def upload_no_limit():
-    """เวอร์ชันที่รองรับทุกประเภทไฟล์โดยไม่มีข้อจำกัด"""
-    try:
-        if "image" not in request.files:
-            return jsonify({"error": "ไม่พบไฟล์"}), 400
-        file = request.files["image"]
-        if file.filename == '':
-            return jsonify({"error": "ไม่ได้เลือกไฟล์"}), 400
-        # ตรวจสอบขนาดไฟล์เท่านั้น (50MB)
-        file.seek(0, 2)
-        file_size = file.tell()
-        file.seek(0)
-        if file_size > 50 * 1024 * 1024:  # 50MB
-            return jsonify({"error": "ไฟล์ใหญ่เกินไป (สูงสุด 50MB)"}), 400
-        # สร้างชื่อไฟล์ใหม่
-        import time
-        timestamp = str(int(time.time()))
-        safe_filename = f"{timestamp}_{file.filename}"
-        file_path = os.path.join("static", safe_filename)
-        # บันทึกไฟล์
-        file.save(file_path)
-        # ได้นามสกุลไฟล์ (ถ้ามี)
-        file_extension = ""
-        if '.' in file.filename:
-            file_extension = file.filename.rsplit('.', 1)[1].lower()
-        # ลบไฟล์หลังอัปโหลด
-        try:
-            os.remove(file_path)
-        except:
-            pass
-        # ส่งข้อมูลกลับ
-        return render_template("index.html",
-                             raw_text=f"อัปโหลด {file.filename} สำเร็จ",
-                             refined_text=f"ไฟล์ {file.filename} ได้รับการอัปโหลดเรียบร้อย",
-                             data={
-                                 "filename": file.filename,
-                                 "file_type": file_extension if file_extension else "ไม่มีนามสกุล",
-                                 "file_size": f"{file_size / 1024:.2f} KB"
-                             },
-                             file_info={
-                                 "name": file.filename,
-                                 "size": f"{file_size / 1024:.2f} KB",
-                                 "type": file_extension if file_extension else "unknown"
-                             })
-    except Exception as e:
-        print(f"Unexpected error: {e}")
-        return render_template("index.html",
-                             error="เกิดข้อผิดพลาดที่ไม่คาดคิด กรุณาลองใหม่อีกครั้ง")
-# API สำหรับบันทึกข้อมูล
-@app.route("/save", methods=["POST"])
-def save_data():
-    try:
-        data = request.get_json()
-        # ที่นี่คุณสามารถบันทึกข้อมูลลงฐานข้อมูลได้
-        # เช่น บันทึกลง SQLite, MySQL, MongoDB เป็นต้น
-        print("Saving data:", data)
-        return jsonify({"success": True, "message": "บันทึกข้อมูลสำเร็จ"})
-    except Exception as e:
-        print(f"Save error: {e}")
-        return jsonify({"success": False, "error": "ไม่สามารถบันทึกข้อมูลได้"}), 500
-# Error handlers
-@app.errorhandler(404)
-def not_found(error):
-    return render_template("index.html", error="ไม่พบหน้าที่ต้องการ"), 404
-@app.errorhandler(500)
-def internal_error(error):
-    return render_template("index.html", error="เกิดข้อผิดพลาดภายในเซิร์ฟเวอร์"), 500
-@app.errorhandler(413)
-def too_large(error):
-    return render_template("index.html", error="ไฟล์ใหญ่เกินไป (สูงสุด 10MB)"), 413
-# รัน Flask app
-if __name__ == "__main__":
-    app.run(debug=True, host="0.0.0.0", port=7860)