性色xxx-性色欧美xo影院-性性欧美-性夜影院爽黄a爽免费看网站-久青草国产观看在线视频-久青草国产免费观看

推廣 熱搜: 廣場  Java  app  Word  營業  微信公眾號  北京代理記賬  商城  代理記賬  商標交易 

一小時徒手從0到1搭建一套圖片文字識別的OCR平臺

   2024-07-04 轉載網絡4200
核心提示:(2)面向程序;在編碼的過程中,需要實現自動識別圖片中的文字功能,常見有供應商有阿里的OCR文字識別、百度的OCR文字識別等等,當然也可以自己使用Tesseract搭建一套圖片文字識別的服務。下面我們將使用Tesseract搭建一套自己的圖

在我們日常的工作學習中,圖片中的文件識別功能是非常常用的(如用戶上傳的圖片做風控)。我們根據面向的對象不同,一般可以分成兩類:

(1)面向普通用戶;現有的圖片文件識別工具有很多,常見有的微信截圖工具中的自帶的文字識別功能、專業OCR文字識別軟件(如AI識別王、迅捷OCR識別軟件);

(2)面向程序;在編碼的過程中,需要實現自動識別圖片中的文字功能,常見有供應商有阿里的OCR文字識別、百度的OCR文字識別等等,當然也可以自己使用搭建一套圖片文字識別的服務。

下面我們將使用搭建一套自己的圖片文字識別的服務平臺。本平臺中使用的技術有: + + + + 。

是一個開源的光學字符識別(OCR)引擎,是一個基于 OCR引擎的Java接口。

1、-OCR環境搭建

(1)基礎依賴安裝

放在上搭建的,以下是搭建的如下:

#1、基礎依賴yum -y install gcc-c++ makeyum install -y autoconf automake libtool libjpeg libpng libtiff zlib libjpeg-devel libpng-devel libtiff-devel zlib-devel
#2、下載pkg-configwget https://pkg-config.freedesktop.org/releases/pkg-config-0.29.tar.gz#解壓tar -zxvf pkg-config-0.29.tar.gz#編譯cd pkg-config-0.29/ ./configure --with-internal-glibmakemake checkmake install

完成基礎依賴安裝后可以看到

文件下載網站搭建_搭建一個下載網站_搭建下載網站的軟件

(2)上傳的壓縮包和相關的文件

搭建下載網站的軟件_搭建一個下載網站_文件下載網站搭建

依賴可以到官方網站下載(我這里下載好,直接可以使用,需要的軟件的可以私信我)

上傳文件到上

(3)安裝

#1、解壓文件tar -zxvf leptonica-1.79.0.tar.gz#2、編譯./autogen.sh./configure --prefix=/usr/local/makemake install

編譯完成之后的效果:

搭建下載網站的軟件_搭建一個下載網站_文件下載網站搭建

配置:

vi /etc/profile-----------------添加配置------------------------export LD_LIBRARY_PATH=$LD_LIBRARY_PAYT:/usr/local/libexport LIBLEPT_HEADERSDIR=/usr/local/includeexport PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
#刷新生效source /etc/profile

(4)安裝

#1、解壓文件tar?-zxvf?tesseract-1.1.tar.gz#2、編譯./autogen.sh./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/includemakemake?install

編譯之后的效果:

文件下載網站搭建_搭建下載網站的軟件_搭建一個下載網站

(5)測試安裝是否成功

tesseract --version

安裝成功的效果:

搭建一個下載網站_搭建下載網站的軟件_文件下載網站搭建

(6)語言庫放到-OCR指定的目錄中

搭建下載網站的軟件_搭建一個下載網站_文件下載網站搭建

將這兩個文件放在/usr///文件夾下

以上就完成了-OCR基礎環境的搭建。在這個過程中可能出現如下的問題:

configure: error: Leptonica 1.74 or higher is required. Try to install libleptonica-dev package.

問題的原因是沒有安裝pkg-。

2、搭建-OCR平臺服務

(1)搭建基礎的工程(不詳細介紹)

(2)添加依賴

<dependency>    <groupId>net.sourceforge.tess4jgroupId>    <artifactId>tess4jartifactId>    <version>4.5.4version>dependency>

(3)配置yml文件

server:  port: 8081
#指定識別語言庫的位置tess4j: datapath: /usr/local/share/tessdata

(4)配置

@Configurationpublic class TesseractOcrConfig {    @Value("${tess4j.datapath}")    private String dataPath;
@Bean public Tesseract tesseract() {
Tesseract tesseract = new Tesseract(); //設置數據文件夾路徑 tesseract.setDatapath(dataPath); //設置為中文簡體 tesseract.setLanguage("chi_sim"); return tesseract; }
}

(5)編寫識別的圖片的服務

@Service@Slf4jpublic class OcrService {
@Resource private Tesseract tesseract;
public String recognizeText(MultipartFile imageFile) throws IOException, TesseractException { // 轉換 InputStream sbs = new ByteArrayInputStream(imageFile.getBytes()); BufferedImage bufferedImage = ImageIO.read(sbs);
// 對圖片進行文字識別 return tesseract.doOCR(bufferedImage); }}

(6)編寫識別的圖片的服務

@RestController@RequestMapping("/api")@Slf4j@Api(description = "OCR服務")public class OcrController {
@Resource private OcrService ocrService;
@PostMapping(value = "/recognize") public String recognizeImage(@RequestParam("file") MultipartFile file) throws TesseractException, IOException { // 調用OcrService中的方法進行文字識別 String result = ocrService.recognizeText(file); log.info("識別圖片的結果:{}", result);
return result; }}

(7)本平臺就不寫頁面了,直接使用展示效果,配置

#1、添加依賴        io.springfox??????springfox-swagger2??????2.7.0???          io.springfox???????springfox-swagger-ui???????2.7.0      #2、配置swagger@Configuration@EnableSwagger2public class SwaggerConfig {
@Bean public Docket webApiConfig(){ System.out.println("啟動swagger"); return new Docket(documentationType.SWAGGER_2) .groupName("webApi") .apiInfo(webApiInfo()) .select() //接口中由/admin /error就不顯示 .paths(Predicates.not(PathSelectors.regex("/admin/.*"))) .paths(Predicates.not(PathSelectors.regex("/error.*"))) //掃描指定的包????????????????.apis(RequestHandlerSelectors.basePackage("com")) .build(); }
private ApiInfo webApiInfo(){ return new ApiInfoBuilder() .title("OCR-API文檔") //swagger頁面上大標題 .description("OCR微服務接口定義") //描述 .version("1.0") .contact(new Contact("java", "http://baidu.com", "1733150517@qq.com")) .build(); }}

搭建完成之后的整體項目架構:

搭建下載網站的軟件_文件下載網站搭建_搭建一個下載網站

3、測試搭建的 OCR平臺

(1)上傳服務的jar包到了上

(2)啟動項目(需要預先安裝jdk和)

java -jar ocr-test-1.0-SNAPSHOT.jar

啟動成功的效果:

搭建下載網站的軟件_文件下載網站搭建_搭建一個下載網站

(3)啟動(:port/-ui.html)

搭建一個下載網站_搭建下載網站的軟件_文件下載網站搭建

至此整個平臺就搭建完成。

下面進行圖片測試:

文件下載網站搭建_搭建下載網站的軟件_搭建一個下載網站

后端打印的日志:

搭建一個下載網站_搭建下載網站的軟件_文件下載網站搭建

我們的圖片文字識別的平臺就搭建好了。

 
標簽: b 標簽 a 標簽 9 標簽 d 標簽
反對 0舉報 0 收藏 0 打賞 0評論 0
 
更多>同類資訊
推薦圖文
推薦資訊
點擊排行
合作伙伴
網站首頁  |  關于我們  |  聯系方式  |  使用協議  |  版權隱私  |  網站地圖  |  排名推廣  |  廣告服務  |  積分換禮  |  網站留言  |  RSS訂閱  |  違規舉報  |  冀ICP備2023006999號-8
 
主站蜘蛛池模板: 欧美一区精品 | 91精品国产自产在线观看 | h片免费 | 免费看真人a一级毛片 | 国产高清在线精品二区一 | 日本三级香港三级人妇网站 | 亚洲视频第一页 | 亚洲福利视频网站 | 婷婷久久综合九色综合98 | 日日碰日日摸日日澡视频播放 | 欧美性free极品另类 | 国产视频h | 成人国产一区二区三区 | 精品免费tv久久久久久久 | 99re视频在线| 在线免费国产视频 | 我想看一级黄色大片 | 国产午夜精品久久理论片小说 | 一个人免费看的视频 | 欧美激情网址 | 亚洲日本天堂 | 日日摸夜夜添夜夜添aa | 成人18网址在线观看 | 天天射日日干 | 欧美色图日韩 | 一级成人生活片免费看 | 欧美日韩在线观看视频 | 成人福利片| 97人人爽| 欧美日韩性视频一区二区三区 | 免费乱理伦片在线观看八戒 | 人人做人人爽 | 色黄啪啪18周岁以下禁止观看 | japanoldman老头同性 | 日本xxxxx高清免费观看 | 日本夜夜夜 | a级毛片免费 | 狠狠干97| 一级全黄毛片 | 国产免费一区2区3区4区 | 国产伦一区二区三区高清 |