文章目录
- 0 简介
- 课题简介
- 什么是机器视觉
- 实现步骤
- 详细设计
- 图片读取
- canny边缘检测
- 四点变换 划出区域
- 处理选择题区域
- 提取选项轮廓
- 判断选项
- 读取正确结果
- 最后
0 简介
今天学长向大家分享一个毕业设计项目
毕业设计 基于python的答题卡识别评分系统
项目运行效果:
毕业设计 基于opencv的答题卡识别
项目获取:
https://gitee.com/assistant-a/project-sharing
课题简介
今天我们来介绍一个与机器视觉相关的毕业设计
基于机器视觉的答题卡识别系统
多说一句, 现在越来越多的学校以及导师选题偏向于算法类, 这几年往往做web系统的同学很难通过答辩, 仔细一想这也在情理之中, 毕业设计是大学四年技术水平的体现, 只做出个XXX管理系统未免太寒酸, 而且web系统选题每年都是那几个老师看着也吐了, 不卡学生才怪
所以同学们, 毕设选题要慎重, 最好先找已经毕业了的学长学姐们了解一下, 至少弄清自己做的系统会被老师问到什么问题, 不然只会为自己的毕业挖坑而已
什么是机器视觉
答题卡识别使用的是机器视觉识别算法, 那什么是机器视觉算法呢?
机器视觉,并不是视觉,他不具有人类的视觉理解能力,说穿了他只是图像处理技术的工程应用,都是由工程师开发的算法来完成任务,并且是特定的算法完成特定的任务,互相之间没有通用性。
废话不多说, 学长到大家看看, 这项技术实现的效果如何.
实现步骤
答题卡识别步骤:
- Step #1: 检测到图片中的答题卡
- Step #2: 应用透视变换来提取图中的答题卡(以自上向下的鸟瞰视图)
- Step #3: 从透视变换后的答题卡中提取 the set of 气泡/圆点 (答案选项)
- Step #4: 将题目/气泡排序成行
- Step #5: 判断每行中被标记/涂的答案
- Step #6: 在我们的答案字典中查找正确的答案来判断答题是否正确
- Step #7: 为其它题目重复上述操作
首先,打开摄像头扫描答题卡
对摄像头获取到的答题卡图片进行二值化腐蚀膨胀边缘检测
轮廓计算,进行顶点对齐,得到下图
对图像进行倾斜变换和仿射变换,得到下图
开始对图像进行二值化,边缘检测等操作,最终得到结果
详细设计
图片读取
主要采用了python+opencv
因为要做后续分割,所以肯定要用到边缘检测,所以先灰度化再二值化
#读取图片 img=cv2.imread('images/5.png') #转换为灰度图 gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #高斯滤波 blurred=cv2.GaussianBlur(gray,(3,3),0) #增强亮度 blurred=imgBrightness(blurred,1.5,3) #自适应二值化 blurred=cv2.adaptiveThreshold(blurred,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,51,2) ''' adaptiveThreshold函数:第一个参数src指原图像,原图像应该是灰度图。 第二个参数x指当像素值高于(有时是小于)阈值时应该被赋予的新的像素值 第三个参数adaptive_method 指: CV_ADAPTIVE_THRESH_MEAN_C 或 CV_ADAPTIVE_THRESH_GAUSSIAN_C 第四个参数threshold_type 指取阈值类型:必须是下者之一 • CV_THRESH_BINARY, • CV_THRESH_BINARY_INV 第五个参数 block_size 指用来计算阈值的象素邻域大小: 3, 5, 7, ... 第六个参数param1 指与方法有关的参数。对方法CV_ADAPTIVE_THRESH_MEAN_C 和 CV_ADAPTIVE_THRESH_GAUSSIAN_C, 它是一个从均值或加权均值提取的常数, 尽管它可以是负数。 ''' blurred=cv2.copyMakeBorder(blurred,5,5,5,5,cv2.BORDER_CONSTANT,value=(255,255,255))
处理结果如下
canny边缘检测
根据轮廓大小,将要处理的几部分分割出来
如果提取效果不好,可能是因为拍摄光线原因,导致图片亮度不好,增强一下亮度,二值化后的图片效果会好一点,这样canny边缘检测结果也会好一点
#增强亮度 def imgBrightness(img1, c, b): rows, cols= img1.shape blank = np.zeros([rows, cols], img1.dtype) rst = cv2.addWeighted(img1, c, blank, 1-c, b) return rst
#canny边缘检测 edged = cv2.Canny(blurred,0,255) cnts,hierarchy=cv2.findContours(edged,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE) docCnt = [] count=0 #确保至少有一个轮廓被找到 if len(cnts)>0: #将轮廓按照大小排序 cnts=sorted(cnts,key=cv2.contourArea,reverse=True) #对排序后的轮廓进行循环处理 for c in cnts: #获取近似的轮廓 peri = cv2.arcLength(c,True) approx = cv2.approxPolyDP(c,0.02*peri,True) #如果近似轮廓有四个顶点,那么就认为找到了答题卡 if len(approx) == 4: docCnt.append(approx) count+=1 if count==3: break
处理结果如下:
四点变换 划出区域
直接用imutils包中的four_point_transform将需要的区域提取出来
彩色图便于展示
灰度图用来处理
#四点变换,划出选择题区域 paper = four_point_transform(img,np.array(docCnt[0]).reshape(4,2)) warped = four_point_transform(gray,np.array(docCnt[0]).reshape(4,2)) #四点变换,划出准考证区域 ID_Area = four_point_transform(img,np.array(docCnt[1]).reshape(4,2)) ID_Area_warped = four_point_transform(gray,np.array(docCnt[1]).reshape(4,2)) #四点变换,划出科目区域 Subject_Area = four_point_transform(img,np.array(docCnt[2]).reshape(4,2)) Subject_Area_warped = four_point_transform(gray,np.array(docCnt[2]).reshape(4,2))
处理结果如下:
处理选择题区域
提取选项轮廓
''' 处理选择题区域统计答题结果 ''' thresh = cv2.threshold(warped,0,255,cv2.THRESH_BINARY_INV|cv2.THRESH_OTSU)[1] thresh = cv2.resize(thresh,(2400,2800),cv2.INTER_LANCZOS4) paper = cv2.resize(paper,(2400,2800),cv2.INTER_LANCZOS4) warped = cv2.resize(warped,(2400,2800),cv2.INTER_LANCZOS4) cnts,hierarchy = cv2.findContours(thresh.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE) questionCnts=[] answers=[] #对每一个轮廓进行循环处理 for c in cnts: #计算轮廓的边界框,然后利用边界框数据计算宽高比 (x,y,w,h) = cv2.boundingRect(c) ar = w/float(h) #判断轮廓是否是答题框 if w>=40 and h>=15 and ar>=1 and ar<=1.8: M = cv2.moments(c) cX = int(M["m10"]/M["m00"]) cY = int(M["m01"]/M["m00"]) questionCnts.append(c) answers.append((cX,cY)) cv2.circle(paper,(cX,cY),7,(255,255,255),-1) ID_Answer=judge_point(answers,mode="point") cv2.drawContours(paper,questionCnts,-1,(255,0,0),3)
处理结果如下:
判断选项
def judgeX(x,mode): if mode=="point": if x<600: return int(x/100)+1 elif x>600 and x<1250: return int((x-650)/100)+6 elif x>1250 and x<1900: return int((x-1250)/100)+11 elif x>1900: return int((x-1900)/100)+16 elif mode=="ID": return int((x-110)/260)+1 elif mode=="subject": if x<1500: return False
def judge(x,y,mode): if judgeY(y,mode)!=False and judgeX(x,mode)!=False: if mode=="point": return (int(y/560)*20+judgeX(x,mode),judgeY(y,mode)) elif mode=="ID": return (judgeX(x,mode),judgeY(y,mode)) elif mode=="subject": return judgeY(y,mode) else: return 0 def judge_point(answers,mode): IDAnswer=[] for answer in answers: if(judge(answer[0],answer[1],mode)!=0): IDAnswer.append(judge(answer[0],answer[1],mode)) else: continue IDAnswer.sort() return IDAnswer def judge_ID(IDs,mode): student_ID=[] for ID in IDs: if(judge(ID[0],ID[1],mode)!=False): student_ID.append(judge(ID[0],ID[1],mode)) else: continue student_ID.sort() return student_ID def judge_Subject(subject,mode): return judge(subject[0][0],subject[0][1],mode)
读取正确结果
''' 读取结果 ''' df = pd.read_excel("answer.xlsx") index_list = df[["题号"]].values.tolist() true_answer_list = df[["答案"]].values.tolist() index=[] true_answer=[] score=0 #去括号 for i in range(len(index_list)): index.append(index_list[i][0]) for i in range(len(true_answer_list)): true_answer.append(true_answer_list[i][0]) answer_index=[] answer_option=[] for answer in ID_Answer: answer_index.append(answer[0]) answer_option.append(answer[1]) for i in range(len(index)): if answer_option[i]==true_answer[i]: score+=1 if i+1==len(answer_option): break
最后
实现效果:
毕业设计 基于opencv的答题卡识别
项目获取:
https://gitee.com/assistant-a/project-sharing
猜你喜欢
网友评论
- 搜索
- 最新文章
- 热门文章