OpenCV 4.12.0
開源計算機視覺
載入中...
搜尋中...
無匹配項
cv::text 名稱空間參考

類  BaseOCR
 
類  ERFilter
 Neumann和Matas場景文字檢測演算法 [207] 的第一和第二階段的基類。:更多...
 
結構體  ERStat
 ERStat 結構表示一個類特定的極值區域(ER)。 更多...
 
類  OCRBeamSearchDecoder
 OCRBeamSearchDecoder 類提供了使用束搜尋演算法進行OCR的介面。 更多...
 
類  OCRHMMDecoder
 OCRHMMDecoder 類提供了使用隱馬爾可夫模型進行OCR的介面。 更多...
 
類  OCRHolisticWordRecognizer
 OCRHolisticWordRecognizer 類提供了分段詞識別功能。給定一個預定義的詞彙表,透過 DictNet 選擇給定輸入影像最有可能的詞。 更多...
 
類  OCRTesseract
 OCRTesseract 類提供了與 tesseract-ocr API (v3.02.02) 在 C++ 中的介面。 更多...
 
類  TextDetector
 一個為文字檢測演算法提供介面的抽象類。 更多...
 
類  TextDetectorCNN
 TextDetectorCNN 類提供了文字邊界框檢測功能。該類用於查詢給定輸入影像的文字詞的邊界框。該類使用 OpenCV dnn 模組載入在 [168] 中描述的預訓練模型。包含修改後的 SSD Caffe 版本的原始倉庫:https://github.com/MhLiao/TextBoxes。模型可以從 DropBox 下載。包含模型描述的修改後的 .prototxt 檔案可以在 opencv_contrib/modules/text/samples/textbox.prototxt 中找到。 更多...
 

列舉

列舉  {
  ERFILTER_NM_RGBLGrad ,
  ERFILTER_NM_IHSGrad
}
 computeNMChannels 操作模式 更多...
 
列舉  {
  OCR_LEVEL_WORD ,
  OCR_LEVEL_TEXTLINE
}
 
列舉  classifier_type {
  OCR_KNN_CLASSIFIER = 0 ,
  OCR_CNN_CLASSIFIER = 1
}
 
列舉  decoder_mode { OCR_DECODER_VITERBI = 0 }
 
列舉  erGrouping_Modes {
  ERGROUPING_ORIENTATION_HORIZ ,
  ERGROUPING_ORIENTATION_ANY
}
 text::erGrouping 操作模式 更多...
 
列舉  ocr_engine_mode {
  OEM_TESSERACT_ONLY ,
  OEM_CUBE_ONLY ,
  OEM_TESSERACT_CUBE_COMBINED ,
  OEM_DEFAULT
}
 Tesseract.OcrEngineMode 列舉。 更多...
 
列舉  page_seg_mode {
  PSM_OSD_ONLY ,
  PSM_AUTO_OSD ,
  PSM_AUTO_ONLY ,
  PSM_AUTO ,
  PSM_SINGLE_COLUMN ,
  PSM_SINGLE_BLOCK_VERT_TEXT ,
  PSM_SINGLE_BLOCK ,
  PSM_SINGLE_LINE ,
  PSM_SINGLE_WORD ,
  PSM_CIRCLE_WORD ,
  PSM_SINGLE_CHAR
}
 Tesseract.PageSegMode 列舉。 更多...
 

函式

void computeNMChannels (InputArray _src, OutputArrayOfArrays _channels, int _mode=ERFILTER_NM_RGBLGrad)
 計算 N&M 演算法 [207] 中需獨立處理的不同通道。
 
Ptr< ERFiltercreateERFilterNM1 (const Ptr< ERFilter::Callback > &cb, int thresholdDelta=1, float minArea=(float) 0.00025, float maxArea=(float) 0.13, float minProbability=(float) 0.4, bool nonMaxSuppression=true, float minProbabilityDiff=(float) 0.1)
 為 N&M 演算法 [207] 的第一階段分類器創建極值區域濾波器。
 
Ptr< ERFiltercreateERFilterNM1 (const String &filename, int thresholdDelta=1, float minArea=(float) 0.00025, float maxArea=(float) 0.13, float minProbability=(float) 0.4, bool nonMaxSuppression=true, float minProbabilityDiff=(float) 0.1)
 從提供的路徑(例如 /path/to/cpp/trained_classifierNM1.xml)讀取用於 N&M 演算法第一階段分類器的極值區域濾波器。
 
Ptr< ERFiltercreateERFilterNM2 (const Ptr< ERFilter::Callback > &cb, float minProbability=(float) 0.3)
 為 N&M 演算法 [207] 的第二階段分類器創建極值區域濾波器。
 
Ptr< ERFiltercreateERFilterNM2 (const String &filename, float minProbability=(float) 0.3)
 從提供的路徑(例如 /path/to/cpp/trained_classifierNM2.xml)讀取用於 N&M 演算法第二階段分類器的極值區域濾波器。
 
Mat createOCRHMMTransitionsTable (const String &vocabulary, std::vector< cv::String > &lexicon)
 
void createOCRHMMTransitionsTable (std::string &vocabulary, std::vector< std::string > &lexicon, OutputArray transition_probabilities_table)
 一個實用函式,用於從給定的詞列表(詞典)建立定製的語言模型轉換表。
 
void detectRegions (InputArray image, const Ptr< ERFilter > &er_filter1, const Ptr< ERFilter > &er_filter2, std::vector< Rect > &groups_rects, int method=ERGROUPING_ORIENTATION_HORIZ, const String &filename=String(), float minProbability=(float) 0.5)
 從影像中提取文字區域。
 
void detectRegions (InputArray image, const Ptr< ERFilter > &er_filter1, const Ptr< ERFilter > &er_filter2, std::vector< std::vector< Point > > &regions)
 
void detectTextSWT (InputArray input, std::vector< cv::Rect > &result, bool dark_on_light, OutputArray &draw=noArray(), OutputArray &chainBBs=noArray())
 應用筆畫寬度變換運算元,然後對具有相似筆畫寬度的連通分量進行過濾,以返回字母候選。它還根據鄰近度和大小對它們進行連結,並將結果儲存在 chainBBs 中。
 
void erGrouping (InputArray image, InputArray channel, std::vector< std::vector< Point > > regions, std::vector< Rect > &groups_rects, int method=ERGROUPING_ORIENTATION_HORIZ, const String &filename=String(), float minProbablity=(float) 0.5)
 
void erGrouping (InputArray img, InputArrayOfArrays channels, std::vector< std::vector< ERStat > > &regions, std::vector< std::vector< Vec2i > > &groups, std::vector< Rect > &groups_rects, int method=ERGROUPING_ORIENTATION_HORIZ, const std::string &filename=std::string(), float minProbablity=0.5)
 查詢組織成文字塊的極值區域組。
 
Ptr< ERFilter::CallbackloadClassifierNM1 (const String &filename)
 允許在建立 ERFilter 物件時隱式載入預設分類器。
 
Ptr< ERFilter::CallbackloadClassifierNM2 (const String &filename)
 允許在建立 ERFilter 物件時隱式載入預設分類器。
 
Ptr< OCRBeamSearchDecoder::ClassifierCallbackloadOCRBeamSearchClassifierCNN (const String &filename)
 允許在建立 OCRBeamSearchDecoder 物件時隱式載入預設字元分類器。
 
Ptr< OCRHMMDecoder::ClassifierCallbackloadOCRHMMClassifier (const String &filename, int classifier)
 允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。
 
Ptr< OCRHMMDecoder::ClassifierCallbackloadOCRHMMClassifierCNN (const String &filename)
 允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。
 
Ptr< OCRHMMDecoder::ClassifierCallbackloadOCRHMMClassifierNM (const String &filename)
 允許在建立 OCRHMMDecoder 物件時隱式載入預設字元分類器。
 
void MSERsToERStats (InputArray image, std::vector< std::vector< Point > > &contours, std::vector< std::vector< ERStat > > &regions)
 MSER 輪廓 (vector<Point>) 轉換為 ERStat 區域。
 

函式文件

◆ detectTextSWT()

void cv::text::detectTextSWT ( InputArray input,
std::vector< cv::Rect > & result,
bool dark_on_light,
OutputArray & draw = noArray(),
OutputArray & chainBBs = noArray() )
Python
cv.text.detectTextSWT(input, dark_on_light[, draw[, chainBBs]]) -> result, draw, chainBBs

應用筆畫寬度變換運算元,然後對具有相似筆畫寬度的連通分量進行過濾,以返回字母候選。它還根據鄰近度和大小對它們進行連結,並將結果儲存在 chainBBs 中。

引數
input具有3個通道的輸入影像。
result一個包含文字查詢機率高的結果邊界框的向量
dark_on_light一個布林值,表示文字是比背景暗還是亮,觀察到它會反轉從Scharr運算元獲得的梯度,並顯著影響結果。
draw一個可選的 Mat,型別為 CV_8UC3,用於使用邊界框視覺化檢測到的字母。
chainBBs一個可選引數,根據論文中的啟發式方法連結字母候選,並返回可能出現文字的所有區域。