Spaces:

m8chaa
/

re-sheet

Running

App Files Files Community

m8chaa commited on Aug 11

Commit

e9922e5

•

1 Parent(s): a5cf43f

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -126

app.py CHANGED Viewed

@@ -198,7 +198,10 @@ async def request_gpt4o_completion(image_id: str, user_credit: int):
         #Guideline
         -strictly adhere to the given content of OCR text.
         -it could be of receipt(s) or business card(s) but not both
-        -any other info that couldn't be classified is sorted into "기타"
         #Example
         ##Receipts
@@ -243,17 +246,17 @@ async def request_gpt4o_completion(image_id: str, user_credit: int):
         2502230078357
         Output
-        -발행일: 2024/02/23 20:10
-        -상호: 은성마켓
-        -사업자번호: 727-27-01455
-        -합계금액: 2,800
-        -내역:
             느타리버섯 1,000원 1개
             양배추 1,800원 1개
-        -카드번호: 4673-09**-****-515*
-        -카드종류: KB국민체크
-        -승인번호: 30014507
-        -기타: 대표자: 허유성, 주소: 경기 시흥시 배곧3로 96, 전화 번호: 031-431-1544, 면세물품: 2,800, 합계: 2,800, 신용카드지불:2,800, 전표No:201036, 제출 VAN: JTNET-리더기, 거래NO:0223007835 계산원: 관리자(001)
         ##Business Cards
         Input
@@ -270,16 +273,16 @@ async def request_gpt4o_completion(image_id: str, user_credit: int):
         www.iprima.com
         Output
-        -이름: 박장원
-        -회사명: 아이프리마
-        -소속 및 직위: 팀장/정책사업팀 R&D사업실
-        -주소: 경기도 화성시 정남면 만년로 98번길 55 (우편번호) 18523
-        -전화: (031) 000-0000
-        -휴대폰: (031) 000-0000
-        -팩스: 010-0000-0000
-        -e-mail: iprima@gmail.com
-        -홈페이지: www.iprima.com
-        -기타: Over the MIRACLE
         Image content: {extracted_text}
         '''
@@ -343,112 +346,6 @@ async def move_file_to_folder(file_id, current_parents, new_parents):
     except Exception as e:
         logging.error(f"Failed to move file {file_id} to new folders: {e}")
-# async def update_user_sheet(spreadsheet_id:str, sheet_id:int, sheet_name, data: List[List[str]], is_reset: Optional[bool] = False):
-#     print(f"Spreadsheet ID: {spreadsheet_id}, Sheet ID: {sheet_id}, sheet name: {sheet_name}, Data: {data}")
-#     # first identify the area to insert the data
-#     no_of_rows = len(data)
-#     no_of_cols = len(data[0])
-#     if is_reset:
-#         # sheet_name = f"{sheet_name} {datetime.now(kst).strftime("%Y-%m-%d %H:%M:%S")}"
-#         sheet_name = f"{sheet_name} {datetime.now(kst).strftime('%Y-%m-%d %H:%M')}"
-#         duplicate_requests = [{
-#             "duplicateSheet": {
-#                 "sourceSheetId": contacts_ss,
-#                 "newSheetName": sheet_name
-#             }
-#         }]
-#         duplicate_response = sheet_service.spreadsheets().batchUpdate(
-#             spreadsheetId=spreadsheet_id,
-#             body={
-#                 'requests': duplicate_requests
-#             }
-#         ).execute()
-#         sheet_id = duplicate_response['replies'][0]['duplicateSheet']['properties']['sheetId']
-#     # Insert new rows
-#     requests = [
-#         {
-#         "updateSheetProperties": {
-#             "properties": {
-#                 "sheetId": sheet_id,
-#                 "hidden": False
-#             },
-#             "fields": "hidden"
-#         }
-#     },
-#         {
-#         "insertDimension": {
-#             "range": {
-#                 "sheetId": sheet_id,
-#                 "dimension": "ROWS",
-#                 "startIndex": 1,
-#                 "endIndex": no_of_rows + 1
-#             },
-#             "inheritFromBefore": False,
-#         }
-#     }]
-#     response = sheet_service.spreadsheets().batchUpdate(
-#         spreadsheetId=spreadsheet_id,
-#         body={
-#             'requests': requests
-#         }
-#     ).execute()
-#     update_body = {
-#         'values': data
-#     }
-#     start_column = 'A'
-#     end_column = chr(ord(start_column) + no_of_cols - 1)
-#     range_to_update = f'{sheet_name}!{start_column}2:{end_column}{no_of_rows + 1}'
-#     result = sheet_service.spreadsheets().values().update(
-#         spreadsheetId=spreadsheet_id,
-#         range=range_to_update,
-#         valueInputOption='USER_ENTERED',
-#         body=update_body
-#     ).execute()
-#     # Format the cells
-#     for row_index, row in enumerate(data):
-#         for col_index, cell_value in enumerate(row):
-#             if cell_value.startswith('=HYPERLINK'):
-#                 color = {"red": 0, "green": 0, "blue": 1}  # Blue for hyperlinks
-#             else:
-#                 color = {"red": 0, "green": 0, "blue": 0}  # Black for other text
-#             requests = [
-#                 {
-#                     "repeatCell": {
-#                         "range": {
-#                             "sheetId": sheet_id,
-#                             "startRowIndex": row_index + 1,
-#                             "endRowIndex": row_index + 2,
-#                             "startColumnIndex": col_index,
-#                             "endColumnIndex": col_index + 1
-#                         },
-#                         "cell": {
-#                             "userEnteredFormat": {
-#                                 "textFormat": {
-#                                     "foregroundColor": color
-#                                 }
-#                             }
-#                         },
-#                         "fields": "userEnteredFormat.textFormat.foregroundColor"
-#                     }
-#                 }
-#             ]
-#             response = sheet_service.spreadsheets().batchUpdate(
-#                 spreadsheetId=spreadsheet_id,
-#                 body={
-#                     'requests': requests
-#                 }
-#             ).execute()
 async def update_user_sheet(spreadsheet_id:str, sheet_name:str, data: List[List[str]], is_reset: Optional[bool] = False):
     print(f"Spreadsheet ID: {spreadsheet_id}, Sheet Name: {sheet_name}, Data: {data}")

         #Guideline
         -strictly adhere to the given content of OCR text.
         -it could be of receipt(s) or business card(s) but not both
+        -sort any other info that couldn't be classified as "기타"
+        -format the extracted information as a JSON object with two main keys: 'receipts' and 'busi_cards'.
+        -ensure the total number of receipts and business cards combined does not exceed 500.
         #Example
         ##Receipts
         2502230078357
         Output
+        발행일: 2024/02/23 20:10
+        상호: 은성마켓
+        사업자번호: 727-27-01455
+        합계금액: 2,800
+        내역:
             느타리버섯 1,000원 1개
             양배추 1,800원 1개
+        카드번호: 4673-09**-****-515*
+        카드종류: KB국민체크
+        승인번호: 30014507
+        기타: 대표자: 허유성, 주소: 경기 시흥시 배곧3로 96, 전화 번호: 031-431-1544, 면세물품: 2,800, 합계: 2,800, 신용카드지불:2,800, 전표No:201036, 제출 VAN: JTNET-리더기, 거래NO:0223007835 계산원: 관리자(001)
         ##Business Cards
         Input
         www.iprima.com
         Output
+        이름: 박장원
+        회사명: 아이프리마
+        소속 및 직위: 팀장/정책사업팀 R&D사업실
+        주소: 경기도 화성시 정남면 만년로 98번길 55 (우편번호) 18523
+        전화: (031) 000-0000
+        휴대폰: (031) 000-0000
+        팩스: 010-0000-0000
+        e-mail: iprima@gmail.com
+        홈페이지: www.iprima.com
+        기타: Over the MIRACLE
         Image content: {extracted_text}
         '''
     except Exception as e:
         logging.error(f"Failed to move file {file_id} to new folders: {e}")
 async def update_user_sheet(spreadsheet_id:str, sheet_name:str, data: List[List[str]], is_reset: Optional[bool] = False):
     print(f"Spreadsheet ID: {spreadsheet_id}, Sheet Name: {sheet_name}, Data: {data}")