Toughen1 commited on
Commit
aefc59c
·
verified ·
1 Parent(s): be2e9c5
Files changed (1) hide show
  1. README.md +66 -0
README.md CHANGED
@@ -10,3 +10,69 @@ pinned: false
10
  license: apache-2.0
11
  short_description: Extract text from images in multiple languages
12
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
10
  license: apache-2.0
11
  short_description: Extract text from images in multiple languages
12
  ---
13
+
14
+ # PaddleOCR 智能文字识别
15
+
16
+ 基于PaddleOCR的多语言文字识别应用,支持自动语言检测和Base64图像识别。
17
+
18
+ ## 功能特点
19
+
20
+ - **多语言支持**:自动检测并识别中文、英文、法语、德语、韩语和日语
21
+ - **自动语言检测**:无需手动选择语言,系统会自动检测图像中的文字语言
22
+ - **Base64图像支持**:支持直接处理Base64编码的图像数据
23
+ - **双重输出**:同时提供文本结果和标注后的图像
24
+ - **美观界面**:优化的Gradio界面,提供良好的用户体验
25
+
26
+ ## 安装与运行
27
+
28
+ ### 安装依赖
29
+
30
+ ```bash
31
+ # 安装Python依赖
32
+ pip install -r requirements.txt
33
+
34
+ # 安装系统依赖
35
+ apt-get update && apt-get install -y ffmpeg libsm6 libxext6
36
+ ```
37
+
38
+ ### 运行应用
39
+
40
+ ```bash
41
+ python app.py
42
+ ```
43
+
44
+ 应用将在 http://localhost:7860 启动
45
+
46
+ ## API使用方法
47
+
48
+ ### 1. 图像上传API
49
+
50
+ ```bash
51
+ curl -X POST "http://localhost:7860/api/predict" \
52
+ -F "fn_index=0" \
53
+ -F "data=@/path/to/your/image.jpg"
54
+ ```
55
+
56
+ ### 2. Base64图像API
57
+
58
+ ```bash
59
+ curl -X POST "http://localhost:7860/api/predict" \
60
+ -H "Content-Type: application/json" \
61
+ -d '{
62
+ "fn_index": 1,
63
+ "data": ["YOUR_BASE64_STRING_HERE"]
64
+ }'
65
+ ```
66
+
67
+ ## 示例
68
+
69
+ 系统提供了三个示例图像:
70
+ - 英文示例 (en_example.jpg)
71
+ - 中文示例 (cn_example.jpg)
72
+ - 日语示例 (jp_example.jpg)
73
+
74
+ ## 注意事项
75
+
76
+ - 首次运行时,系统会自动下载所需的OCR模型,这可能需要一些时间
77
+ - 为获得最佳识别效果,请确保图像清晰且文字部分对比度良好
78
+ - 自动语言检测功能可能对于混合语言或特殊字体的文本效果不佳