推廣 熱搜： 廣場 Java app Word 營業微信公眾號北京代理記賬商城代理記賬商標交易

一小時徒手從0到1搭建一套圖片文字識別的OCR平臺

2024-07-04 轉載網絡4200

核心提示：（2）面向程序；在編碼的過程中，需要實現自動識別圖片中的文字功能，常見有供應商有阿里的OCR文字識別、百度的OCR文字識別等等，當然也可以自己使用Tesseract搭建一套圖片文字識別的服務。下面我們將使用Tesseract搭建一套自己的圖

在我們日常的工作學習中，圖片中的文件識別功能是非常常用的（如用戶上傳的圖片做風控）。我們根據面向的對象不同，一般可以分成兩類：

（1）面向普通用戶；現有的圖片文件識別工具有很多，常見有的微信截圖工具中的自帶的文字識別功能、專業OCR文字識別軟件（如AI識別王、迅捷OCR識別軟件）；

（2）面向程序；在編碼的過程中，需要實現自動識別圖片中的文字功能，常見有供應商有阿里的OCR文字識別、百度的OCR文字識別等等，當然也可以自己使用搭建一套圖片文字識別的服務。

下面我們將使用搭建一套自己的圖片文字識別的服務平臺。本平臺中使用的技術有： + + + + 。

是一個開源的光學字符識別（OCR）引擎，是一個基于 OCR引擎的Java接口。

1、-OCR環境搭建

（1）基礎依賴安裝

放在上搭建的，以下是搭建的如下：

#1、基礎依賴yum -y install gcc-c++ makeyum install -y autoconf automake libtool libjpeg libpng libtiff zlib libjpeg-devel libpng-devel libtiff-devel zlib-devel
#2、下載pkg-configwget https://pkg-config.freedesktop.org/releases/pkg-config-0.29.tar.gz#解壓tar -zxvf pkg-config-0.29.tar.gz#編譯cd pkg-config-0.29/ ./configure --with-internal-glibmakemake checkmake install

完成基礎依賴安裝后可以看到

文件下載網站搭建_搭建一個下載網站_搭建下載網站的軟件

（2）上傳的壓縮包和相關的文件

搭建下載網站的軟件_搭建一個下載網站_文件下載網站搭建

依賴可以到官方網站下載（我這里下載好，直接可以使用，需要的軟件的可以私信我）

上傳文件到上

（3）安裝

#1、解壓文件tar -zxvf leptonica-1.79.0.tar.gz#2、編譯./autogen.sh./configure --prefix=/usr/local/makemake install

編譯完成之后的效果：

搭建下載網站的軟件_搭建一個下載網站_文件下載網站搭建

配置：

vi /etc/profile-----------------添加配置------------------------export LD_LIBRARY_PATH=$LD_LIBRARY_PAYT:/usr/local/libexport LIBLEPT_HEADERSDIR=/usr/local/includeexport PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
#刷新生效source /etc/profile

（4）安裝

#1、解壓文件tar?-zxvf?tesseract-1.1.tar.gz#2、編譯./autogen.sh./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/includemakemake?install

編譯之后的效果：

文件下載網站搭建_搭建下載網站的軟件_搭建一個下載網站

（5）測試安裝是否成功

tesseract --version

安裝成功的效果：

搭建一個下載網站_搭建下載網站的軟件_文件下載網站搭建

（6）語言庫放到-OCR指定的目錄中

搭建下載網站的軟件_搭建一個下載網站_文件下載網站搭建

將這兩個文件放在/usr///文件夾下

以上就完成了-OCR基礎環境的搭建。在這個過程中可能出現如下的問題：

configure: error: Leptonica 1.74 or higher is required. Try to install libleptonica-dev package.

問題的原因是沒有安裝pkg-。

2、搭建-OCR平臺服務

（1）搭建基礎的工程（不詳細介紹）

（2）添加依賴

<dependency>    <groupId>net.sourceforge.tess4jgroupId>    <artifactId>tess4jartifactId>    <version>4.5.4version>dependency>

（3）配置yml文件

server:  port: 8081
#指定識別語言庫的位置tess4j:  datapath: /usr/local/share/tessdata

（4）配置

@Configurationpublic class TesseractOcrConfig {    @Value("${tess4j.datapath}")    private String dataPath;
    @Bean    public Tesseract tesseract() {
        Tesseract tesseract = new Tesseract();        //設置數據文件夾路徑        tesseract.setDatapath(dataPath);        //設置為中文簡體        tesseract.setLanguage("chi_sim");        return tesseract;    }
}

（5）編寫識別的圖片的服務

@Service@Slf4jpublic class OcrService {
    @Resource    private Tesseract tesseract;
        public String recognizeText(MultipartFile imageFile) throws IOException, TesseractException {        // 轉換        InputStream sbs = new ByteArrayInputStream(imageFile.getBytes());        BufferedImage bufferedImage = ImageIO.read(sbs);
        // 對圖片進行文字識別        return tesseract.doOCR(bufferedImage);    }}

（6）編寫識別的圖片的服務

@RestController@RequestMapping("/api")@Slf4j@Api(description = "OCR服務")public class OcrController {
    @Resource    private OcrService ocrService;
    @PostMapping(value = "/recognize")    public String recognizeImage(@RequestParam("file") MultipartFile file) throws TesseractException, IOException {        // 調用OcrService中的方法進行文字識別        String result = ocrService.recognizeText(file);        log.info("識別圖片的結果:{}", result);
        return result;    }}

（7）本平臺就不寫頁面了，直接使用展示效果，配置

#1、添加依賴        io.springfox??????springfox-swagger2??????2.7.0???          io.springfox???????springfox-swagger-ui???????2.7.0      #2、配置swagger@Configuration@EnableSwagger2public class SwaggerConfig {
    @Bean    public Docket webApiConfig(){        System.out.println("啟動swagger");        return new Docket(documentationType.SWAGGER_2)                .groupName("webApi")                .apiInfo(webApiInfo())                .select()                //接口中由/admin   /error就不顯示                .paths(Predicates.not(PathSelectors.regex("/admin/.*")))                .paths(Predicates.not(PathSelectors.regex("/error.*")))                //掃描指定的包????????????????.apis(RequestHandlerSelectors.basePackage("com"))                .build();    }
    private ApiInfo webApiInfo(){        return new ApiInfoBuilder()                .title("OCR-API文檔")     //swagger頁面上大標題                .description("OCR微服務接口定義")    //描述                .version("1.0")                .contact(new Contact("java", "http://baidu.com", "1733150517@qq.com"))                .build();    }}

搭建完成之后的整體項目架構：

搭建下載網站的軟件_文件下載網站搭建_搭建一個下載網站

3、測試搭建的 OCR平臺

（1）上傳服務的jar包到了上

（2）啟動項目（需要預先安裝jdk和）

java -jar ocr-test-1.0-SNAPSHOT.jar

啟動成功的效果：

搭建下載網站的軟件_文件下載網站搭建_搭建一個下載網站

（3）啟動（:port/-ui.html）

搭建一個下載網站_搭建下載網站的軟件_文件下載網站搭建

至此整個平臺就搭建完成。

下面進行圖片測試：

文件下載網站搭建_搭建下載網站的軟件_搭建一個下載網站

后端打印的日志：

搭建一個下載網站_搭建下載網站的軟件_文件下載網站搭建

我們的圖片文字識別的平臺就搭建好了。

標簽： b 標簽 a 標簽 9 標簽 d 標簽

點贊 0反對 0舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

推薦圖文

通過寶塔面板搭建服務	做一個網站大概需要多
建筑招工平臺，建筑急	網絡干貨｜3分鐘教你

推薦資訊

點擊排行

合作伙伴

詩詞
電商運營
茶葉批發網
中藥材
保健食品
春季養生
中醫養生
四川地暖安裝廠家
四川石墨烯地暖
四川發熱線廠家
四川石墨烯發熱線
江蘇地暖安裝廠家
江蘇石墨烯地暖
江蘇石墨烯發熱線
內蒙古地暖安裝廠家
內蒙古石墨烯地暖
內蒙古發熱線廠家
內蒙古石墨烯發熱線
河南地暖安裝廠家
河南石墨烯地暖
河南發熱線廠家
河南石墨烯發熱線
山東地暖安裝廠家
山東石墨烯地暖
山東發熱線廠家
山東石墨烯發熱線
黑龍江地暖安裝廠家
黑龍江石墨烯地暖
黑龍江發熱線廠家
黑龍江石墨烯發熱線
遼寧地暖安裝廠家
遼寧石墨烯地暖
遼寧發熱線廠家
遼寧石墨烯發熱線
吉林地暖安裝廠家
吉林石墨烯地暖
吉林發熱線廠家
吉林石墨烯發熱線
河北地暖安裝廠家
河北石墨烯地暖
河北發熱線廠家
河北石墨烯發熱線
銀杏供應求購信息
園林綠化苗木價格
苗木求購信息
最新苗木供應信息
苗木網
資治通鑒在線閱讀
資治通鑒翻譯
資治通鑒
豫劇下載
黃梅戲下載
戲曲下載
河南豫劇大全下載
戲曲視頻下載
配音神器
免費配音
真人配音
在線配音
智能語音
文字轉語音
ai語音轉換
專業配音
托特包
單肩包
奢侈品包包
拉桿箱
旅行箱
女生書包
書包品牌
小學生書包
兒童書包
兒童書包品牌排行榜
書包品牌十大排名
書包網
免費心理測試
心理健康測試
免費在線心理測試
心理咨詢中心
人格心理測試
婚姻挽救咨詢師
道德經原文
道德經
名學網
女孩起名
周易起名
寶寶取名
男孩取名
周易取名
女孩取名
男孩起名
寶寶起名
成語
詞典
國學網
英語詞典
漢語字典
易學網
易經
周易
個人二手車
二手車估價
二手車報價
二手車交易網
事故車
二手車
事故車出售
二手車買賣市場
石家莊點痣
石家莊點痣價格
石家莊祛痣
石家莊去痣哪里好
鋼琴考級
鋼琴入門指法教程
鋼琴入門簡單曲子
鋼琴曲
鋼琴指法教程
鋼琴譜
景觀雕塑
玻璃鋼雕塑
雕塑藝術
浮雕
雕刻網
雕塑網
不銹鋼雕塑
石雕
銅雕
女性網
女性世界
化妝護膚
女性時尚
女性購物
女性健康
鮮花禮品
鮮花
網上訂花
同城鮮花
鮮花速遞網
易經全文
易經入門
易學網
六十四卦詳解
六十四卦
周易網
易經網
精雕教程
精雕圖下載
精雕圖
網址導航
電商之家
電商運營
直播電商
內容電商
電商網
海報設計
廣告設計
photoshop
ps教程
ps素材庫
黃金回收價格
石家莊黃金回收
黃金回收
寵物美容
寵物托運
寵物用品
寵物狗
寵物貓
寵物網
寵物交易
英語培訓機構
書包網
鮮花
心理測試
采購批發網
家庭教育
雅思培訓
在線新華字典
箱包網
商務英語培訓
電地暖
標準件
秦皇島人才網
沐盛傳媒
唐山人才網
公司注冊
承德人才網
道德經
紅樓夢
美文欣賞
中國機械網
漢語詞典
好玩的手機游戲推薦
雕塑網
苗木網
少兒培訓
藝術培訓
英語培訓
成語大全
資格考試
職業培訓
網賺
短視頻劇本
魯迅全集
石家莊論壇
單機游戲大全
手機游戲下載
手機軟件下載
安卓手機游戲
綠色軟件
民間借貸律師
養生
創業賺錢
包裝網
優秀個人博客
短視頻培訓
ps素材庫
苗木供應
女性健康
暖通,電地暖，
手機游戲推薦排行榜
IT教程
舟舟培訓
工作計劃
兒童文學
PS修圖
高考作文
男士發型
游戲推薦
語料庫
文玩
勵志名言
chatGPT官網
chatGPT國內版
法律咨詢
企業服務
玄機派
讀后感
詞典
鋼琴入門指法教程
石墨烯地暖
搜搜作文
女士發型
石家莊代理記賬
名酒回收
養花
石家莊點痣
實用范文
二手車估價
工作總結
優質范文
經典范文
Chat GPT中文版
搜救犬
律師咨詢
服裝服飾
免費發布信息
電商設計
范文網
寶寶起名
短視頻代運營
單機游戲下載
商標交易
十大品牌排行榜
網絡知識
興趣愛好
手游安卓版下載
心理咨詢
漢語知識
考研真題
石家莊人才網
心理測試
游戲攻略
好書推薦
河北生活網
常用文書
散文
奇石
雕塑
雕龍客
抖音運營
國學網
在線題庫
短視頻運營
代理記賬
網絡游戲
云南旅游網
抖音帶貨
工商注冊
詩詞
成語
互聯網資訊
易學網
抖音代運營
戲曲下載
精雕圖
查字典
非物質文化遺產
旅游攻略
網絡營銷
二手車
代理招生
易經
周易
小本創業項目

• PR怎么去掉背景音樂保留人聲？PR只保留人聲的操	• 如何使用阿里云服務器搭建Discuz論壇網站（圖文
• Vulnhub-DOLI: 1滲透	• Tanida Demo Builder(Flash影片剪輯)V9.3.0.4
• 美邦x抖音，既要流量變現也要變身網紅店~	• PHP本地web服務器搭建教程（通俗易懂版）
• 抖音運營：抖音夏季“水系”美食創作靈感	• 什么是裂變營銷模式?作用是什么?
• Pr軟件 Adobe Premiere Pro(pr) 破解版(全家桶	• nba素材都是哪里找的 nba籃球視頻素

性色xxx-性色欧美xo影院-性性欧美-性夜影院爽黄a爽免费看网站-久青草国产观看在线视频-久青草国产免费观看

一小時徒手從0到1搭建一套圖片文字識別的OCR平臺