百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法:
首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下:
创建后会获得如下信息:
APP_ID = '******' API_KEY = '************' SECRET_KEY = '**************'
下面就是百度API包的安装,在终端cmd输入如下语句直接pip方式安装,注意是 baidu-api 哦!
pip install --user baidu-aip
接下来上python代码,图片修改为你的图片就可以直接运行了:
from aip import AipOcr # 定义常量 APP_ID = '21372704' API_KEY = 'YKpXQwN5zj79g99fZK8i4Kn1' SECRET_KEY = 'RTIAaFrvvgHbej7eALMKmjR0uF93rHCQ' # 初始化AipFace对象 aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 读取图片 filePath = "test.JPG" def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() # 定义参数变量 options = { 'detect_direction': 'true', 'language_type': 'CHN_ENG', } # 调用通用文字识别接口 result = aipOcr.basicGeneral(get_file_content(filePath), options) print(result) words_result=result['words_result'] for i in range(len(words_result)): print(words_result[i]['words']) #代码参考了:https://blog.csdn.net/u013421629/article/details/79500336
图片不咋清晰就会出现识别出来不太准确的现象,但是对比pytesseract的OCR结果已经好了非常多,百度OCR识别出来原始的是字典格式。下面上例子: