詳細描述

類
類	cv::text::BaseOCR

類	cv::text::OCRBeamSearchDecoder
	OCRBeamSearchDecoder 類提供了使用束搜尋演算法進行OCR的介面。更多...

類	cv::text::OCRHMMDecoder
	OCRHMMDecoder 類提供了使用隱馬爾可夫模型進行OCR的介面。更多...

類	cv::text::OCRHolisticWordRecognizer
	OCRHolisticWordRecognizer 類提供了分段詞彙識別（wordspotting）的功能。給定一個預定義的詞彙表，透過 DictNet 選擇給定輸入影像中最有可能的詞。更多...

類	cv::text::OCRTesseract
	OCRTesseract 類提供了 C++ 中與 tesseract-ocr API (v3.02.02) 的介面。更多...

列舉
列舉	{ cv::text::OCR_LEVEL_WORD , cv::text::OCR_LEVEL_TEXTLINE }

列舉	cv::text::classifier_type { cv::text::OCR_KNN_CLASSIFIER = 0 , cv::text::OCR_CNN_CLASSIFIER = 1 }

列舉	cv::text::decoder_mode { cv::text::OCR_DECODER_VITERBI = 0 }

列舉	cv::text::ocr_engine_mode { cv::text::OEM_TESSERACT_ONLY , cv::text::OEM_CUBE_ONLY , cv::text::OEM_TESSERACT_CUBE_COMBINED , cv::text::OEM_DEFAULT }
	Tesseract.OcrEngineMode 列舉。更多...

列舉	cv::text::page_seg_mode { cv::text::PSM_OSD_ONLY , cv::text::PSM_AUTO_OSD , cv::text::PSM_AUTO_ONLY , cv::text::PSM_AUTO , cv::text::PSM_SINGLE_COLUMN , cv::text::PSM_SINGLE_BLOCK_VERT_TEXT , cv::text::PSM_SINGLE_BLOCK , cv::text::PSM_SINGLE_LINE , cv::text::PSM_SINGLE_WORD , cv::text::PSM_CIRCLE_WORD , cv::text::PSM_SINGLE_CHAR }
	Tesseract.PageSegMode 列舉。更多...

函式
Mat	cv::text::createOCRHMMTransitionsTable (const String &vocabulary, std::vector< cv::String > &lexicon)

void	cv::text::createOCRHMMTransitionsTable (std::string &vocabulary, std::vector< std::string > &lexicon, OutputArray transition_probabilities_table)
	用於從給定詞彙列表（詞典）建立定製語言模型轉換表的實用函式。

Ptr< OCRBeamSearchDecoder::ClassifierCallback >	cv::text::loadOCRBeamSearchClassifierCNN (const String &filename)
	允許在建立 OCRBeamSearchDecoder 物件時隱式載入預設字元分類器。

Ptr< OCRHMMDecoder::ClassifierCallback >	cv::text::loadOCRHMMClassifier (const String &filename, int classifier)
	允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。

Ptr< OCRHMMDecoder::ClassifierCallback >	cv::text::loadOCRHMMClassifierCNN (const String &filename)
	允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。

Ptr< OCRHMMDecoder::ClassifierCallback >	cv::text::loadOCRHMMClassifierNM (const String &filename)
	允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。

列舉型別文件

◆ 匿名列舉

匿名列舉

#include <opencv2/text/ocr.hpp>

列舉器
OCR_LEVEL_WORD Python: cv.text.OCR_LEVEL_WORD
OCR_LEVEL_TEXTLINE Python: cv.text.OCR_LEVEL_TEXTLINE

◆ 分類器型別

列舉 cv::text::classifier_type

#include <opencv2/text/ocr.hpp>

列舉器
OCR_KNN_CLASSIFIER Python: cv.text.OCR_KNN_CLASSIFIER
OCR_CNN_CLASSIFIER Python: cv.text.OCR_CNN_CLASSIFIER

◆ 解碼器模式

列舉 cv::text::decoder_mode

#include <opencv2/text/ocr.hpp>

列舉器
OCR_DECODER_VITERBI Python: cv.text.OCR_DECODER_VITERBI

◆ OCR引擎模式

列舉 cv::text::ocr_engine_mode

#include <opencv2/text/ocr.hpp>

Tesseract.OcrEngineMode 列舉。

列舉器
OEM_TESSERACT_ONLY Python: cv.text.OEM_TESSERACT_ONLY
OEM_CUBE_ONLY Python: cv.text.OEM_CUBE_ONLY
OEM_TESSERACT_CUBE_COMBINED Python: cv.text.OEM_TESSERACT_CUBE_COMBINED
OEM_DEFAULT Python: cv.text.OEM_DEFAULT

◆ 頁面分割模式

列舉 cv::text::page_seg_mode

#include <opencv2/text/ocr.hpp>

Tesseract.PageSegMode 列舉。

列舉器
PSM_OSD_ONLY Python: cv.text.PSM_OSD_ONLY
PSM_AUTO_OSD Python: cv.text.PSM_AUTO_OSD
PSM_AUTO_ONLY Python: cv.text.PSM_AUTO_ONLY
PSM_AUTO Python: cv.text.PSM_AUTO
PSM_SINGLE_COLUMN Python: cv.text.PSM_SINGLE_COLUMN
PSM_SINGLE_BLOCK_VERT_TEXT Python: cv.text.PSM_SINGLE_BLOCK_VERT_TEXT
PSM_SINGLE_BLOCK Python: cv.text.PSM_SINGLE_BLOCK
PSM_SINGLE_LINE Python: cv.text.PSM_SINGLE_LINE
PSM_SINGLE_WORD Python: cv.text.PSM_SINGLE_WORD
PSM_CIRCLE_WORD Python: cv.text.PSM_CIRCLE_WORD
PSM_SINGLE_CHAR Python: cv.text.PSM_SINGLE_CHAR

函式文件

◆ createOCRHMMTransitionsTable() [1/2]

Mat cv::text::createOCRHMMTransitionsTable	(	const String &	詞彙表,
		std::vector< cv::String > &	lexicon )

Python
	cv.text.createOCRHMMTransitionsTable(	vocabulary, lexicon	) ->	retval

#include <opencv2/text/ocr.hpp>

◆ createOCRHMMTransitionsTable() [2/2]

void cv::text::createOCRHMMTransitionsTable	(	std::string &	詞彙表,
		std::vector< std::string > &	lexicon,
		OutputArray	transition_probabilities_table )

Python
	cv.text.createOCRHMMTransitionsTable(	vocabulary, lexicon	) ->	retval

#include <opencv2/text/ocr.hpp>

用於從給定詞彙列表（詞典）建立定製語言模型轉換表的實用函式。

引數

詞彙表	語言詞彙表（當為 ASCII 英文文字時為字元）。
lexicon	預計在特定影像中找到的單詞列表。
transition_probabilities_table	字元對之間的轉換機率輸出表。cols == rows == vocabulary.size()。

此函式計算給定詞典中字元對的頻率統計資訊，並用它們填充輸出 transition_probabilities_table。transition_probabilities_table 可用作 OCRHMMDecoder::create() 和 OCRBeamSearchDecoder::create() 方法的輸入。

注意

(C++) 另一種方法是載入文字模組示例資料夾中提供的預設通用語言轉換表（由 ispell 42869 英文單詞列表建立）：https://github.com/opencv/opencv_contrib/blob/master/modules/text/samples/OCRHMM_transitions_table.xml

◆ loadOCRBeamSearchClassifierCNN()

Ptr< OCRBeamSearchDecoder::ClassifierCallback > cv::text::loadOCRBeamSearchClassifierCNN ( const String & filename )

Python
	cv.text.loadOCRBeamSearchClassifierCNN(	filename	) ->	retval

#include <opencv2/text/ocr.hpp>

允許在建立 OCRBeamSearchDecoder 物件時隱式載入預設字元分類器。

引數

filename 包含分類器模型的 XML 或 YAML 檔案（例如 OCRBeamSearch_CNN_model_data.xml.gz）

CNN 預設分類器基於 Adam Coates 和 Andrew NG 在 [Coates11a] 中提出的場景文字識別方法。該字元分類器由單層卷積神經網路和線性分類器組成。它以滑動視窗的方式應用於輸入影像，在每個視窗位置提供一組識別結果。

◆ loadOCRHMMClassifier()

Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifier	(	const String &	filename,
		int	classifier )

Python
	cv.text.loadOCRHMMClassifier(	filename, classifier	) ->	retval

#include <opencv2/text/ocr.hpp>

允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。

引數

filename	包含分類器模型的 XML 或 YAML 檔案（例如 OCRBeamSearch_CNN_model_data.xml.gz）
classifier	可以是 classifier_type 列舉值之一。

◆ loadOCRHMMClassifierCNN()

Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierCNN ( const String & filename )

Python
	cv.text.loadOCRHMMClassifierCNN(	filename	) ->	retval

#include <opencv2/text/ocr.hpp>

允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。

引數

filename 包含分類器模型的 XML 或 YAML 檔案（例如 OCRBeamSearch_CNN_model_data.xml.gz）

CNN 預設分類器基於 Adam Coates 和 Andrew NG 在 [Coates11a] 中提出的場景文字識別方法。該字元分類器由單層卷積神經網路和線性分類器組成。它以滑動視窗的方式應用於輸入影像，在每個視窗位置提供一組識別結果。

已棄用: 使用 loadOCRHMMClassifier 代替

◆ loadOCRHMMClassifierNM()

Ptr< OCRHMMDecoder::ClassifierCallback > cv::text::loadOCRHMMClassifierNM ( const String & filename )

Python
	cv.text.loadOCRHMMClassifierNM(	filename	) ->	retval

#include <opencv2/text/ocr.hpp>

允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。

引數

filename 包含分類器模型的 XML 或 YAML 檔案（例如 OCRHMM_knn_model_data.xml）

KNN 預設分類器基於 Lukás Neumann 和 Jiri Matas 在 [Neumann11b] 中提出的場景文字識別方法。基本上，輸入影像中的區域（輪廓）被歸一化為固定大小，同時保留其質心和縱橫比，以便提取基於其周長鏈碼的梯度方向的特徵向量。然後，使用透過不同標準字型型別的渲染字元的合成數據訓練的 KNN 模型對該區域進行分類。

已棄用: loadOCRHMMClassifier 代替