類
類	BaseOCR

類	ERFilter
	Neumann和Matas場景文字檢測演算法 [207] 的第一和第二階段的基類。：更多...

結構體	ERStat
	ERStat 結構表示一個類特定的極值區域（ER）。更多...

類	OCRBeamSearchDecoder
	OCRBeamSearchDecoder 類提供了使用束搜尋演算法進行OCR的介面。更多...

類	OCRHMMDecoder
	OCRHMMDecoder 類提供了使用隱馬爾可夫模型進行OCR的介面。更多...

類	OCRHolisticWordRecognizer
	OCRHolisticWordRecognizer 類提供了分段詞識別功能。給定一個預定義的詞彙表，透過 DictNet 選擇給定輸入影像最有可能的詞。更多...

類	OCRTesseract
	OCRTesseract 類提供了與 tesseract-ocr API (v3.02.02) 在 C++ 中的介面。更多...

類	TextDetector
	一個為文字檢測演算法提供介面的抽象類。更多...

類	TextDetectorCNN
	TextDetectorCNN 類提供了文字邊界框檢測功能。該類用於查詢給定輸入影像的文字詞的邊界框。該類使用 OpenCV dnn 模組載入在 [168] 中描述的預訓練模型。包含修改後的 SSD Caffe 版本的原始倉庫：https://github.com/MhLiao/TextBoxes。模型可以從 DropBox 下載。包含模型描述的修改後的 .prototxt 檔案可以在 `opencv_contrib/modules/text/samples/textbox.prototxt` 中找到。更多...

列舉
列舉	{ ERFILTER_NM_RGBLGrad , ERFILTER_NM_IHSGrad }
	computeNMChannels 操作模式更多...

列舉	{ OCR_LEVEL_WORD , OCR_LEVEL_TEXTLINE }

列舉	classifier_type { OCR_KNN_CLASSIFIER = 0 , OCR_CNN_CLASSIFIER = 1 }

列舉	decoder_mode { OCR_DECODER_VITERBI = 0 }

列舉	erGrouping_Modes { ERGROUPING_ORIENTATION_HORIZ , ERGROUPING_ORIENTATION_ANY }
	text::erGrouping 操作模式更多...

列舉	ocr_engine_mode { OEM_TESSERACT_ONLY , OEM_CUBE_ONLY , OEM_TESSERACT_CUBE_COMBINED , OEM_DEFAULT }
	Tesseract.OcrEngineMode 列舉。更多...

列舉	page_seg_mode { PSM_OSD_ONLY , PSM_AUTO_OSD , PSM_AUTO_ONLY , PSM_AUTO , PSM_SINGLE_COLUMN , PSM_SINGLE_BLOCK_VERT_TEXT , PSM_SINGLE_BLOCK , PSM_SINGLE_LINE , PSM_SINGLE_WORD , PSM_CIRCLE_WORD , PSM_SINGLE_CHAR }
	Tesseract.PageSegMode 列舉。更多...

函式
void	computeNMChannels (InputArray _src, OutputArrayOfArrays _channels, int _mode=ERFILTER_NM_RGBLGrad)
	計算 N&M 演算法 [207] 中需獨立處理的不同通道。

Ptr< ERFilter >	createERFilterNM1 (const Ptr< ERFilter::Callback > &cb, int thresholdDelta=1, float minArea=(float) 0.00025, float maxArea=(float) 0.13, float minProbability=(float) 0.4, bool nonMaxSuppression=true, float minProbabilityDiff=(float) 0.1)
	為 N&M 演算法 [207] 的第一階段分類器創建極值區域濾波器。

Ptr< ERFilter >	createERFilterNM1 (const String &filename, int thresholdDelta=1, float minArea=(float) 0.00025, float maxArea=(float) 0.13, float minProbability=(float) 0.4, bool nonMaxSuppression=true, float minProbabilityDiff=(float) 0.1)
	從提供的路徑（例如 /path/to/cpp/trained_classifierNM1.xml）讀取用於 N&M 演算法第一階段分類器的極值區域濾波器。

Ptr< ERFilter >	createERFilterNM2 (const Ptr< ERFilter::Callback > &cb, float minProbability=(float) 0.3)
	為 N&M 演算法 [207] 的第二階段分類器創建極值區域濾波器。

Ptr< ERFilter >	createERFilterNM2 (const String &filename, float minProbability=(float) 0.3)
	從提供的路徑（例如 /path/to/cpp/trained_classifierNM2.xml）讀取用於 N&M 演算法第二階段分類器的極值區域濾波器。

Mat	createOCRHMMTransitionsTable (const String &vocabulary, std::vector< cv::String > &lexicon)

void	createOCRHMMTransitionsTable (std::string &vocabulary, std::vector< std::string > &lexicon, OutputArray transition_probabilities_table)
	一個實用函式，用於從給定的詞列表（詞典）建立定製的語言模型轉換表。

void	detectRegions (InputArray image, const Ptr< ERFilter > &er_filter1, const Ptr< ERFilter > &er_filter2, std::vector< Rect > &groups_rects, int method=ERGROUPING_ORIENTATION_HORIZ, const String &filename=String(), float minProbability=(float) 0.5)
	從影像中提取文字區域。

void	detectRegions (InputArray image, const Ptr< ERFilter > &er_filter1, const Ptr< ERFilter > &er_filter2, std::vector< std::vector< Point > > &regions)

void	detectTextSWT (InputArray input, std::vector< cv::Rect > &result, bool dark_on_light, OutputArray &draw=noArray(), OutputArray &chainBBs=noArray())
	應用筆畫寬度變換運算元，然後對具有相似筆畫寬度的連通分量進行過濾，以返回字母候選。它還根據鄰近度和大小對它們進行連結，並將結果儲存在 chainBBs 中。

void	erGrouping (InputArray image, InputArray channel, std::vector< std::vector< Point > > regions, std::vector< Rect > &groups_rects, int method=ERGROUPING_ORIENTATION_HORIZ, const String &filename=String(), float minProbablity=(float) 0.5)

void	erGrouping (InputArray img, InputArrayOfArrays channels, std::vector< std::vector< ERStat > > &regions, std::vector< std::vector< Vec2i > > &groups, std::vector< Rect > &groups_rects, int method=ERGROUPING_ORIENTATION_HORIZ, const std::string &filename=std::string(), float minProbablity=0.5)
	查詢組織成文字塊的極值區域組。

Ptr< ERFilter::Callback >	loadClassifierNM1 (const String &filename)
	允許在建立 ERFilter 物件時隱式載入預設分類器。

Ptr< ERFilter::Callback >	loadClassifierNM2 (const String &filename)
	允許在建立 ERFilter 物件時隱式載入預設分類器。

Ptr< OCRBeamSearchDecoder::ClassifierCallback >	loadOCRBeamSearchClassifierCNN (const String &filename)
	允許在建立 OCRBeamSearchDecoder 物件時隱式載入預設字元分類器。

Ptr< OCRHMMDecoder::ClassifierCallback >	loadOCRHMMClassifier (const String &filename, int classifier)
	允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。

Ptr< OCRHMMDecoder::ClassifierCallback >	loadOCRHMMClassifierCNN (const String &filename)
	允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。

Ptr< OCRHMMDecoder::ClassifierCallback >	loadOCRHMMClassifierNM (const String &filename)
	允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。

void	MSERsToERStats (InputArray image, std::vector< std::vector< Point > > &contours, std::vector< std::vector< ERStat > > &regions)
	將 MSER 輪廓 (vector<Point>) 轉換為 ERStat 區域。

函式文件

◆ detectTextSWT()

void cv::text::detectTextSWT	(	InputArray	input,
		std::vector< cv::Rect > &	result,
		bool	dark_on_light,
		OutputArray &	draw = noArray(),
		OutputArray &	chainBBs = noArray() )

Python
	cv.text.detectTextSWT(	input, dark_on_light[, draw[, chainBBs]]	) ->	result, draw, chainBBs

應用筆畫寬度變換運算元，然後對具有相似筆畫寬度的連通分量進行過濾，以返回字母候選。它還根據鄰近度和大小對它們進行連結，並將結果儲存在 chainBBs 中。

引數

input	具有3個通道的輸入影像。
result	一個包含文字查詢機率高的結果邊界框的向量
dark_on_light	一個布林值，表示文字是比背景暗還是亮，觀察到它會反轉從Scharr運算元獲得的梯度，並顯著影響結果。
draw	一個可選的 Mat，型別為 CV_8UC3，用於使用邊界框視覺化檢測到的字母。
chainBBs	一個可選引數，根據論文中的啟發式方法連結字母候選，並返回可能出現文字的所有區域。

類

列舉

函式

函式文件

◆ detectTextSWT()