前几天有朋友想做一个网站,要用到图片识别,本来想直接调用API,说是每天要调用次数太多,最好自行搭建接口,然后搜索了一下,为防止以后忘掉,特意写个教程,作为备用!

1、准备工作

我用的是CentOS 7,宝塔面板,要用到composer(确认版本在2.0以上)。

2、安装Tesseract-OCR

step1: yum search tesseract

step2: yum install tesseract.x86_64

step3:yum install tesseract-devel.x86_64 tesseract-osd.x86_64

step4:yum install tesseract-langpack-chi_sim.noarch

3、Tesseract-OCR的使用

检查tesseract支持的语言:tesseract –list-langs

进行基于中文的OCR:tesseract chin-ocr.png chin-out -l chi_sim(tesseract 图片名称 输出文本名称 -l 语言)

4、安装PHP辅助包

composer require thiagoalessio/tesseract_ocr

5、实现远程图片识别

functionget_img_text($img){
require_once__DIR__.'/vendor/autoload.php';
$imageUrl=$img;
$imageTempName=tempnam(sys_get_temp_dir(),'image-from-kartaterazu');
file_put_contents($imageTempName,file_get_contents($imageUrl));
$text=(newTesseractOCR($imageTempName))->lang('chi_sim')->run();
return$text;
}

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注