您好,登錄后才能下訂單哦!
這篇文章主要講解了“C++ OpenCV怎么實現數字識別功能”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“C++ OpenCV怎么實現數字識別功能”吧!
原圖如圖所示:總共有0~9數字類別,每個數字共20個。現在需要將下面圖片切分成訓練數據圖片、測試數據圖片。該圖片尺寸為560x280,故將其切割成28x28大小數據圖片。具體請看源碼注釋。
const int classNum = 10; //總共有0~9個數字類別 const int picNum = 20;//每個類別共20張圖片 const int pic_w = 28;//圖片寬 const int pic_h = 28;//圖片高 //將數據集分為訓練集、測試集 double totalNum = classNum * picNum;//圖片總數 double per = 0.8; //百分比--修改百分比可改變訓練集、測試集比重 double trainNum = totalNum * per;//訓練圖片數量 double testNum = totalNum * (1.0 - per);//測試圖片數量
下面需要將整張圖像一一切割成28x28小尺寸圖片作為數據集,填充至訓練集與測試集。
Mat Train_Data, Train_Label;//用于訓練 vector<MyNum>TestData;//用于測試 for (int i = 0; i < picNum; i++) { for (int j = 0; j < classNum; j++) { //將所有圖片數據都拷貝到Mat矩陣里 Mat temp; gray(Range(j*pic_w, j*pic_w + pic_w), Range(i*pic_h, i*pic_h + pic_h)).copyTo(temp); Train_Data.push_back(temp.reshape(0, 1)); //將temp數字圖像reshape成一行數據,然后一一追加到Train_Data矩陣中 Train_Label.push_back(j); //而外用于測試 if (i * classNum + j >= trainNum) { TestData.push_back({ temp,Rect(i*pic_w,j*pic_h,pic_w,pic_h),j }); } } }
接下來就是要將數據集進行格式轉換。
//準備訓練數據集 Train_Data.convertTo(Train_Data, CV_32FC1); //轉化為CV_32FC1類型 Train_Label.convertTo(Train_Label, CV_32FC1); Mat TrainDataMat = Train_Data(Range(0, trainNum), Range::all()); //只取trainNum行訓練 Mat TrainLabelMat = Train_Label(Range(0, trainNum), Range::all());
這里使用OpenCV中的KNN算法進行訓練。
//KNN訓練 const int k = 3; //k值,取奇數,影響最終識別率 Ptr<KNearest>knn = KNearest::create(); //構造KNN模型 knn->setDefaultK(k);//設定k值 knn->setIsClassifier(true);//KNN算法可用于分類、回歸。 knn->setAlgorithmType(KNearest::BRUTE_FORCE);//字符匹配算法 knn->train(TrainDataMat, ROW_SAMPLE, TrainLabelMat);//模型訓練
//預測及結果顯示 double count = 0.0; Scalar color; for (int i = 0; i < TestData.size(); i++) { //將測試圖片轉成CV_32FC1,單行形式 Mat data = TestData[i].mat.reshape(0, 1); data.convertTo(data, CV_32FC1); Mat sample = data(Range(0, data.rows), Range::all()); float f = knn->predict(sample); //預測 if (f == TestData[i].label) { color = Scalar(0, 255, 0); //如果預測正確,繪制綠色,并且結果+1 count++; } else { color = Scalar(0, 0, 255);//如果預測錯誤,繪制紅色 } rectangle(src, TestData[i].rect, color, 2); } //將繪制結果拷貝到一張新圖上 Mat result(Size(src.cols, src.rows + 50), CV_8UC3, Scalar::all(255)); src.copyTo(result(Rect(0, 0, src.cols, src.rows))); //將得分在結果圖上顯示 char text[10]; int score = (count / testNum) * 100; sprintf_s(text, "%s%d%s", "Score:", score, "%"); putText(result, text, Point((result.cols / 2) - 80, result.rows - 15), FONT_HERSHEY_SIMPLEX, 1, Scalar(0, 255, 0), 2);
如圖為不同比重訓練集與測試集識別結果。
#include<iostream> #include<opencv2/opencv.hpp> #include<opencv2/ml.hpp> using namespace std; using namespace cv; using namespace cv::ml; //**自定義結構體 struct MyNum { cv::Mat mat; //數字圖片 cv::Rect rect;//相對整張圖所在矩形 int label;//數字標簽 }; int main() { Mat src = imread("digit.png"); if (src.empty()) { cout << "No Image..." << endl; system("pause"); return -1; } Mat gray; cvtColor(src, gray, COLOR_BGR2GRAY); const int classNum = 10; //總共有0~9個數字類別 const int picNum = 20;//每個類別共20張圖片 const int pic_w = 28;//圖片寬 const int pic_h = 28;//圖片高 //將數據集分為訓練集、測試集 double totalNum = classNum * picNum;//圖片總數 double per = 0.8; //百分比--修改百分比可改變訓練集、測試集比重 double trainNum = totalNum * per;//訓練圖片數量 double testNum = totalNum * (1.0 - per);//測試圖片數量 Mat Train_Data, Train_Label;//用于訓練 vector<MyNum>TestData;//用于測試 for (int i = 0; i < picNum; i++) { for (int j = 0; j < classNum; j++) { //將所有圖片數據都拷貝到Mat矩陣里 Mat temp; gray(Range(j*pic_w, j*pic_w + pic_w), Range(i*pic_h, i*pic_h + pic_h)).copyTo(temp); Train_Data.push_back(temp.reshape(0, 1)); //將temp數字圖像reshape成一行數據,然后一一追加到Train_Data矩陣中 Train_Label.push_back(j); //額外用于測試 if (i * classNum + j >= trainNum) { TestData.push_back({ temp,Rect(i*pic_w,j*pic_h,pic_w,pic_h),j }); } } } //準備訓練數據集 Train_Data.convertTo(Train_Data, CV_32FC1); //轉化為CV_32FC1類型 Train_Label.convertTo(Train_Label, CV_32FC1); Mat TrainDataMat = Train_Data(Range(0, trainNum), Range::all()); //只取trainNum行訓練 Mat TrainLabelMat = Train_Label(Range(0, trainNum), Range::all()); //KNN訓練 const int k = 3; //k值,取奇數,影響最終識別率 Ptr<KNearest>knn = KNearest::create(); //構造KNN模型 knn->setDefaultK(k);//設定k值 knn->setIsClassifier(true);//KNN算法可用于分類、回歸。 knn->setAlgorithmType(KNearest::BRUTE_FORCE);//字符匹配算法 knn->train(TrainDataMat, ROW_SAMPLE, TrainLabelMat);//模型訓練 //預測及結果顯示 double count = 0.0; Scalar color; for (int i = 0; i < TestData.size(); i++) { //將測試圖片轉成CV_32FC1,單行形式 Mat data = TestData[i].mat.reshape(0, 1); data.convertTo(data, CV_32FC1); Mat sample = data(Range(0, data.rows), Range::all()); float f = knn->predict(sample); //預測 if (f == TestData[i].label) { color = Scalar(0, 255, 0); //如果預測正確,繪制綠色,并且結果+1 count++; } else { color = Scalar(0, 0, 255);//如果預測錯誤,繪制紅色 } rectangle(src, TestData[i].rect, color, 2); } //將繪制結果拷貝到一張新圖上 Mat result(Size(src.cols, src.rows + 50), CV_8UC3, Scalar::all(255)); src.copyTo(result(Rect(0, 0, src.cols, src.rows))); //將得分在結果圖上顯示 char text[10]; int score = (count / testNum) * 100; sprintf_s(text, "%s%d%s", "Score:", score, "%"); putText(result, text, Point((result.cols / 2) - 80, result.rows - 15), FONT_HERSHEY_SIMPLEX, 1, Scalar(0, 255, 0), 2); imshow("test", result); imwrite("result.jpg", result); waitKey(0); system("pause"); return 0; }
感謝各位的閱讀,以上就是“C++ OpenCV怎么實現數字識別功能”的內容了,經過本文的學習后,相信大家對C++ OpenCV怎么實現數字識別功能這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。