Spaces:

Ritvik19
/

marker-io

Running

Ritvik19 commited on May 16

Commit

9ddf80f

•

1 Parent(s): 5737a5c

Refactor image extraction logic in server.py

Files changed (1) hide show

server.py CHANGED Viewed

@@ -12,15 +12,14 @@ def parse_pdf_and_return_markdown(pdf_file: bytes , extract_images: bool):
     full_text, images, out_meta = convert_single_pdf(pdf_file, model_list)
     image_data = {}
     if extract_images:
-        for i, (filename, image) in enumerate(images.items()):
-            # image_filepath = f"image_{i+1}.png"
             image.save(filename, "PNG")
             with open(filename, "rb") as f:
                 image_bytes = f.read()
             image_base64 = base64.b64encode(image_bytes).decode('utf-8')
-            image_data[f'image_{i+1}'] = image_base64
             os.remove(filename)

     full_text, images, out_meta = convert_single_pdf(pdf_file, model_list)
     image_data = {}
     if extract_images:
+        for filename, image in images.items():
             image.save(filename, "PNG")
             with open(filename, "rb") as f:
                 image_bytes = f.read()
             image_base64 = base64.b64encode(image_bytes).decode('utf-8')
+            image_data[filename] = image_base64
             os.remove(filename)