Spaces:

make789
/

OCRdeepSeekService

Sleeping

make789 commited on Oct 29

Commit

855f6ac

verified ·

1 Parent(s): d59ba4a

Upload ocr_service.py

Files changed (1) hide show

ocr_service.py CHANGED Viewed

@@ -259,6 +259,15 @@ async def get_ocr_model():
                 else:
                     _ocr_model = _ocr_model.to(dtype=torch.float32)
                     print("  - DeepSeek-OCR on CPU (float32)")
     return _ocr_model, _ocr_tokenizer

                 else:
                     _ocr_model = _ocr_model.to(dtype=torch.float32)
                     print("  - DeepSeek-OCR on CPU (float32)")
+                # Configure generation to silence warnings
+                gc = _ocr_model.generation_config
+                gc.do_sample = False  # Greedy decoding
+                gc.temperature = 1.0  # Don't mix temperature=0 with do_sample=False
+                if _ocr_tokenizer.pad_token_id is None:
+                    _ocr_tokenizer.pad_token = _ocr_tokenizer.eos_token or _ocr_tokenizer.unk_token
+                _ocr_model.generation_config.pad_token_id = _ocr_tokenizer.pad_token_id
+                print("  - Generation config set (do_sample=False, temperature=1.0, pad_token_id set)")
     return _ocr_model, _ocr_tokenizer