python识别整数、浮点数、特殊符号,最简单的方式
最近有一个小需求想要识别一下浮点数字,因为需求很小就懒得训练想找一些别人成熟的项目,找了一圈竟然没有能满足的。
最后在ai的帮助下,快速解决了问题,python竟然自带了可以识别的库,这是骑驴找驴了。
首先要下载一个Tesseract,win用户安装可能麻烦些,我这里是mac直接用命令就可以
brew install tesseract
然后安装python库
pip install pytesseract pillow
直接用python代码即可
from PIL import Image
import pytesseract# 设置 Tesseract 路径(仅 Windows 用户需要)
# pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'# 打开图片(支持 .png, .jpg, .bmp 等格式)
image_path = 'your_image.png'
image = Image.open(image_path).convert('L') # 转为灰度图,提高识别率# 设置仅识别数字和小数点,tessedit_char_whitelist可以增加-或者_等特殊符号,增加上就可以识别
custom_config = r'--oem 3 --psm 7 -c tessedit_char_whitelist=0123456789.'# 开始识别
text = pytesseract.image_to_string(image, config=custom_config)# 清理识别结果(去除空格、换行等)
number_str = text.strip()print("识别出的数字是:", number_str)
Tesseract很强大还可以识别英文,中文简体、繁体等,不过需要下载对应的字体库,有需要可以进行研究。