PaddleOCR / README.md
Toughen1's picture
CPU
aefc59c verified
|
raw
history blame
1.87 kB
metadata
title: PaddleOCR
emoji: 
colorFrom: pink
colorTo: green
sdk: gradio
sdk_version: 5.23.1
app_file: app.py
pinned: false
license: apache-2.0
short_description: Extract text from images in multiple languages

PaddleOCR 智能文字识别

基于PaddleOCR的多语言文字识别应用,支持自动语言检测和Base64图像识别。

功能特点

  • 多语言支持:自动检测并识别中文、英文、法语、德语、韩语和日语
  • 自动语言检测:无需手动选择语言,系统会自动检测图像中的文字语言
  • Base64图像支持:支持直接处理Base64编码的图像数据
  • 双重输出:同时提供文本结果和标注后的图像
  • 美观界面:优化的Gradio界面,提供良好的用户体验

安装与运行

安装依赖

# 安装Python依赖
pip install -r requirements.txt

# 安装系统依赖
apt-get update && apt-get install -y ffmpeg libsm6 libxext6

运行应用

python app.py

应用将在 http://localhost:7860 启动

API使用方法

1. 图像上传API

curl -X POST "http://localhost:7860/api/predict" \
     -F "fn_index=0" \
     -F "data=@/path/to/your/image.jpg"

2. Base64图像API

curl -X POST "http://localhost:7860/api/predict" \
     -H "Content-Type: application/json" \
     -d '{
          "fn_index": 1,
          "data": ["YOUR_BASE64_STRING_HERE"]
        }'

示例

系统提供了三个示例图像:

  • 英文示例 (en_example.jpg)
  • 中文示例 (cn_example.jpg)
  • 日语示例 (jp_example.jpg)

注意事项

  • 首次运行时,系统会自动下载所需的OCR模型,这可能需要一些时间
  • 为获得最佳识别效果,请确保图像清晰且文字部分对比度良好
  • 自动语言检测功能可能对于混合语言或特殊字体的文本效果不佳