OpenCV之图形学的腐蚀与膨胀_图形学膨胀-程序员宅基地

技术标签: OpenCV  

一、理论与概念讲解——从现象到本质


1.1 形态学概述

形态学(morphology)一词通常表示生物学的一个分支,该分支主要研究动植物的形态和结构。而我们图像处理中指的形态学,往往表示的是数学形态学。下面一起来了解数学形态学的概念。

数学形态学(Mathematical morphology) 是一门建立在格论和拓扑学基础之上的图像分析学科,是数学形态学图像处理的基本理论。其基本的运算包括:二值腐蚀和膨胀、二值开闭运算、骨架抽取、极限腐蚀、击中击不中变换、形态学梯度、Top-hat变换、颗粒分析、流域变换、灰值腐蚀和膨胀、灰值开闭运算、灰值形态学梯度等。

 

简单来讲,形态学操作就是基于形状的一系列图像处理操作。OpenCV为进行图像的形态学变换提供了快捷、方便的函数。最基本的形态学操作有二种,他们是:膨胀与腐蚀(Dilation与Erosion)。

膨胀与腐蚀能实现多种多样的功能,主要如下:

  • 消除噪声
  • 分割(isolate)出独立的图像元素,在图像中连接(join)相邻的元素。
  • 寻找图像中的明显的极大值区域或极小值区域
  • 求出图像的梯度

在进行腐蚀和膨胀的讲解之前,首先需要注意,腐蚀和膨胀是对白色部分(高亮部分)而言的,不是黑色部分。膨胀就是图像中的高亮部分进行膨胀,“领域扩张”,效果图拥有比原图更大的高亮区域。腐蚀就是原图中的高亮部分被腐蚀,“领域被蚕食”,效果图拥有比原图更小的高亮区域。


个人笔记:图像的腐蚀与膨胀,其实就是一个核结构(矩形、圆形或十字形)从头到尾进行图像矩阵遍历,并将锚点所在像素赋予核区域内像素最大值或最小值的过程;腐蚀操作即以核结构的锚点(默认为中心点)为像素点依次遍历图像所有像素点,取核结构区域内的最小值赋给锚点所在的像素点,这样就达到了腐蚀效果(将图像高像素值(高亮)区域缩小),具体腐蚀范围(缩小范围)以核矩阵区域大小及锚点位置为准(若3*3矩形,锚点在中心,则图像缩小了1个像素,以此类推核区域越大腐蚀效果越明显);膨胀操作与腐蚀操作相反,将最大值赋给锚点,膨胀范围原理与腐蚀相同。


1.2 膨胀

 

其实,膨胀就是求局部最大值的操作。

按数学方面来说,膨胀或者腐蚀操作就是将图像(或图像的一部分区域,我们称之为A)与核(我们称之为B)进行卷积。

核可以是任何的形状和大小,它拥有一个单独定义出来的参考点,我们称其为锚点(anchorpoint)。多数情况下,核是一个小的中间带有参考点和实心正方形或者圆盘,其实,我们可以把核视为模板或者掩码。

 

而膨胀就是求局部最大值的操作,核B与图形卷积,即计算核B覆盖的区域的像素点的最大值,并把这个最大值赋值给参考点指定的像素。这样就会使图像中的高亮区域逐渐增长。如下图所示,这就是膨胀操作的初衷。



膨胀的数学表达式:

 

照片膨胀效果图:



1.3 腐蚀


再来看一下腐蚀,大家应该知道,膨胀和腐蚀是一对好基友,是相反的一对操作,所以腐蚀就是求局部最小值的操作。

我们一般都会把腐蚀和膨胀对应起来理解和学习。下文就可以看到,两者的函数原型也是基本上一样的。

 

原理图:

 

腐蚀的数学表达式:

 

照片腐蚀效果图:



二、深入——OpenCV源码分析溯源

 

直接上源码吧,在…\opencv\sources\modules\imgproc\src\ morph.cpp路径中 的第1353行开始就为erode(腐蚀)函数的源码,1361行为dilate(膨胀)函数的源码。

[cpp]  view plain   copy
  1. //-----------------------------------【erode()函数中文注释版源代码】----------------------------   
  2. //    说明:以下代码为来自于计算机开源视觉库OpenCV的官方源代码   
  3. //    OpenCV源代码版本:2.4.8   
  4. //    源码路径:…\opencv\sources\modules\imgproc\src\ morph.cpp   
  5. //    源文件中如下代码的起始行数:1353行   
  6. //    中文注释by浅墨   
  7. //--------------------------------------------------------------------------------------------------------    
  8. void cv::erode( InputArray src, OutputArraydst, InputArray kernel,  
  9.                 Point anchor, int iterations,  
  10.                 int borderType, constScalar& borderValue )  
  11. {  
  12. //调用morphOp函数,并设定标识符为MORPH_ERODE  
  13.    morphOp( MORPH_ERODE, src, dst, kernel, anchor, iterations, borderType,borderValue );  
  14. }  

[cpp]  view plain   copy
  1. //-----------------------------------【dilate()函数中文注释版源代码】----------------------------   
  2. //    说明:以下代码为来自于计算机开源视觉库OpenCV的官方源代码   
  3. //    OpenCV源代码版本:2.4.8   
  4. //    源码路径:…\opencv\sources\modules\imgproc\src\ morph.cpp   
  5. //    源文件中如下代码的起始行数:1361行   
  6. //    中文注释by浅墨   
  7. //--------------------------------------------------------------------------------------------------------   
  8. void cv::dilate( InputArray src,OutputArray dst, InputArray kernel,  
  9.                  Point anchor, int iterations,  
  10.                  int borderType, constScalar& borderValue )  
  11. {  
  12. //调用morphOp函数,并设定标识符为MORPH_DILATE  
  13.    morphOp( MORPH_DILATE, src, dst, kernel, anchor, iterations, borderType,borderValue );  
  14. }  


可以发现erode和dilate这两个函数内部就是调用了一下morphOp,只是他们调用morphOp时,第一个参数标识符不同,一个为MORPH_ERODE(腐蚀),一个为MORPH_DILATE(膨胀)。

morphOp函数的源码在…\opencv\sources\modules\imgproc\src\morph.cpp中的第1286行。

 三、浅出——API函数快速上手

 

3.1  形态学膨胀——dilate函数

erode函数,使用像素邻域内的局部极大运算符来膨胀一张图片,从src输入,由dst输出。支持就地(in-place)操作。

函数原型:

[cpp]  view plain   copy
  1. C++: void dilate(  
  2.     InputArray src,  
  3.     OutputArray dst,  
  4.     InputArray kernel,  
  5.     Point anchor=Point(-1,-1),  
  6.     int iterations=1,  
  7.     int borderType=BORDER_CONSTANT,  
  8.     const Scalar& borderValue=morphologyDefaultBorderValue()   
  9. );  

参数详解:

  • 第一个参数,InputArray类型的src,输入图像,即源图像,填Mat类的对象即可。图像通道的数量可以是任意的,但图像深度应为CV_8U,CV_16U,CV_16S,CV_32F或 CV_64F其中之一。
  • 第二个参数,OutputArray类型的dst,即目标图像,需要和源图片有一样的尺寸和类型。
  • 第三个参数,InputArray类型的kernel,膨胀操作的核。若为NULL时,表示的是使用参考点位于中心3x3的核。

我们一般使用函数 getStructuringElement配合这个参数的使用。getStructuringElement函数会返回指定形状和尺寸的结构元素(内核矩阵)。

其中,getStructuringElement函数的第一个参数表示内核的形状,我们可以选择如下三种形状之一:

  • 矩形: MORPH_RECT
  • 交叉形: MORPH_CROSS
  • 椭圆形: MORPH_ELLIPSE

而getStructuringElement函数的第二和第三个参数分别是内核的尺寸以及锚点的位置。

我们一般在调用erode以及dilate函数之前,先定义一个Mat类型的变量来获得getStructuringElement函数的返回值。对于锚点的位置,有默认值Point(-1,-1),表示锚点位于中心。且需要注意,十字形的element形状唯一依赖于锚点的位置。而在其他情况下,锚点只是影响了形态学运算结果的偏移。

getStructuringElement函数相关的调用示例代码如下:

[cpp]  view plain   copy
  1.  int g_nStructElementSize = 3; //结构元素(内核矩阵)的尺寸  
  2.    
  3. //获取自定义核  
  4. Mat element = getStructuringElement(MORPH_RECT,  
  5.     Size(2*g_nStructElementSize+1,2*g_nStructElementSize+1),  
  6.     Point( g_nStructElementSize, g_nStructElementSize ));  


调用这样之后,我们便可以在接下来调用erode或dilate函数时,第三个参数填保存了getStructuringElement返回值的Mat类型变量。对应于我们上面的示例,就是填element变量。

  • 第四个参数,Point类型的anchor,锚的位置,其有默认值(-1,-1),表示锚位于中心。
  • 第五个参数,int类型的iterations,迭代使用erode()函数的次数,默认值为1。
  • 第六个参数,int类型的borderType,用于推断图像外部像素的某种边界模式。注意它有默认值BORDER_DEFAULT。
  • 第七个参数,const Scalar&类型的borderValue,当边界为常数时的边界值,有默认值morphologyDefaultBorderValue(),一般我们不用去管他。需要用到它时,可以看官方文档中的createMorphologyFilter()函数得到更详细的解释。
  •  

使用erode函数,一般我们只需要填前面的三个参数,后面的四个参数都有默认值。而且往往结合getStructuringElement一起使用。

调用范例:

[cpp]  view plain   copy
  1.         //载入原图   
  2.         Mat image = imread("1.jpg");  
  3. //获取自定义核  
  4.         Mat element = getStructuringElement(MORPH_RECT, Size(15, 15));  
  5.         Mat out;  
  6.         //进行膨胀操作  
  7.         dilate(image, out, element);  

3.2 形态学腐蚀——erode函数

erode函数,使用像素邻域内的局部极小运算符来腐蚀一张图片,从src输入,由dst输出。支持就地(in-place)操作。

 

看一下函数原型:

[cpp]  view plain   copy
  1. C++: void erode(  
  2.     InputArray src,  
  3.     OutputArray dst,  
  4.     InputArray kernel,  
  5.     Point anchor=Point(-1,-1),  
  6.     int iterations=1,  
  7.     int borderType=BORDER_CONSTANT,  
  8.     const Scalar& borderValue=morphologyDefaultBorderValue()  
  9.  );  

参数详解:

  • 第一个参数,InputArray类型的src,输入图像,即源图像,填Mat类的对象即可。图像通道的数量可以是任意的,但图像深度应为CV_8U,CV_16U,CV_16S,CV_32F或 CV_64F其中之一。
  • 第二个参数,OutputArray类型的dst,即目标图像,需要和源图片有一样的尺寸和类型。
  • 第三个参数,InputArray类型的kernel,腐蚀操作的内核。若为NULL时,表示的是使用参考点位于中心3x3的核。我们一般使用函数 getStructuringElement配合这个参数的使用。getStructuringElement函数会返回指定形状和尺寸的结构元素(内核矩阵)。(具体看上文中浅出部分dilate函数的第三个参数讲解部分)
  • 第四个参数,Point类型的anchor,锚的位置,其有默认值(-1,-1),表示锚位于单位(element)的中心,我们一般不用管它。
  • 第五个参数,int类型的iterations,迭代使用erode()函数的次数,默认值为1。
  • 第六个参数,int类型的borderType,用于推断图像外部像素的某种边界模式。注意它有默认值BORDER_DEFAULT。
  • 第七个参数,const Scalar&类型的borderValue,当边界为常数时的边界值,有默认值morphologyDefaultBorderValue(),一般我们不用去管他。需要用到它时,可以看官方文档中的createMorphologyFilter()函数得到更详细的解释。

同样的,使用erode函数,一般我们只需要填前面的三个参数,后面的四个参数都有默认值。而且往往结合getStructuringElement一起使用。

调用范例:

[cpp]  view plain   copy
  1.         //载入原图   
  2.         Mat image = imread("1.jpg");  
  3. //获取自定义核  
  4.         Mat element = getStructuringElement(MORPH_RECT, Size(15, 15));  
  5.         Mat out;  
  6.         //进行腐蚀操作  
  7.         erode(image,out, element);   

 四、综合示例——在实战中熟稔

// erodeANDdilate.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"
#include <iostream>
#include<opencv2/opencv.hpp>

using namespace cv;
using namespace std;

int _tmain(int argc, _TCHAR* argv[])
{
	int i;
	cout<<"请输入数字(0、1或2):"<<endl;
	cout<<"0表示进行腐蚀和膨胀操作"<<endl;
	cout<<"1表示进行腐蚀操作"<<endl;
	cout<<"2表示进行膨胀操作"<<endl;
	cin>>i;
	Mat src=imread("./1.png",1);
	Mat dst_erode,dst_dilate;
	if (i!=0 && i!=1 && i!=2)
	{
		cout<<"数值输入错误,请输入0、1、2!"<<endl;
		return -1;
	}
	if (i==1)
	{
		Mat element_erode=getStructuringElement(MORPH_RECT,Size(50,50));
		erode(src,dst_erode,element_erode);
		imshow("src",src);
		imshow("dst_erode",dst_erode);
		waitKey(0);
	}
	if (i==2)
	{
		Mat element_dilate=getStructuringElement(MORPH_RECT,Size(50,50));
		dilate(src,dst_dilate,element_dilate);
		imshow("src",src);
		imshow("dst_dilate",dst_dilate);
		waitKey(0);
	}
	if (i==0)
	{
		Mat element_erode=getStructuringElement(MORPH_RECT,Size(50,50));
		Mat element_dilate=getStructuringElement(MORPH_RECT,Size(50,50));
		erode(src,dst_erode,element_erode);
		dilate(src,dst_dilate,element_dilate);

		imshow("src",src);
		imshow("dst_erode",dst_erode);
		imshow("dst_dilate",dst_dilate);

		waitKey(0);
		return 0;
	}
	
}

本文摘自:《OpenCV3 编程入门》一书,详情访问作者博客 http://blog.csdn.net/poem_qianmo

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/u011028345/article/details/76152243

智能推荐

高频交易及化资策与区_hudson river trading-程序员宅基地

文章浏览阅读406次。转 高频交易及量化投资的策略与误区一、高频交易公司和量化投资公司的区别一般来说,高频交易公司和量化投资公司既有联系,又有区别。在美国,人们常说的高频交易公司一般都是自营交易公司,这些公司主要有Getco、Tower Research、Hudson River Trading、SIG、Virtu Financial、Jump Trading、RGM Advisor、Chopper Tradi..._hudson river trading

C语言文件操作相关的函数_c语言与文件处理有关的函数-程序员宅基地

文章浏览阅读865次。文件的打开和关闭文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件 的关系。ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。FILE * fopen ( const char * filename, const char * mode ); int fcl..._c语言与文件处理有关的函数

java 无法读取文件_java 读取文件,无法显示文件内容,如何解决? 谢谢。-程序员宅基地

文章浏览阅读1.1k次。从来没见过进行文件读取写入时,在写入中需要随机数的,你读取文件就是从一个地方获取输入流,然后将这个输入流写到别的地方,根本不要随机数。给你一个示例://copyafiletoanotherfilebyusingFileReader/FileWriterimportjava.io.*;publicclassTFileRead{publicstaticvoidmain(S..._java复制文件文件没有内容显示

vue引入原生高德地图_前端引入原生地图-程序员宅基地

文章浏览阅读556次,点赞2次,收藏3次。由于工作上的需要,今天捣鼓了半天高德地图。如果定制化开发需求不太高的话,可以用vue-amap,这个我就不多说了,详细就看官网 https://elemefe.github.io/vue-amap/#/zh-cn/introduction/install然而我们公司需要英文版的高德,我看vue-amap中好像没有这方面的配置,而且还有一些其他的定制化开发需求,然后就只用原生的高德。其实原生的引入也不复杂,但是有几个坑要填一下。1. index.html注意,引入的高德js一定要放在头部而_前端引入原生地图

ViewGroup重写大法 (一)-程序员宅基地

文章浏览阅读104次。本文介绍ViewGroup重写,我们所熟知的LinearLayout,RelativeLayout,FrameLayout等等,所有的容器类都是ViewGroup的子类,ViewGroup又继承View。我们在熟练应用这些现成的系统布局的时候可能有时候就不能满足我们自己的需求了,这是我们就要自己重写一个容器来实现效果。ViewGroup重写可以达到各种效果,下面写一个简单的重写一个Vi..._viewgroup 重写

Stm32学习笔记,3万字超详细_stm32笔记-程序员宅基地

文章浏览阅读1.8w次,点赞279次,收藏1.5k次。本文章主要记录本人在学习stm32过程中的笔记,也插入了不少的例程代码,方便到时候CV。绝大多数内容为本人手写,小部分来自stm32官方的中文参考手册以及网上其他文章;代码部分大多来自江科大和正点原子的例程,注释是我自己添加;配图来自江科大/正点原子/中文参考手册。笔记内容都是平时自己一点点添加,不知不觉都已经这么长了。其实每一个标题其实都可以发一篇,但是这样搞太琐碎了,所以还是就这样吧。_stm32笔记

随便推点

Java从零开始 第10.5讲 面向对象的习题课_编写一个测试类booktest,创建几个book对象,并打印它们的字符串表示,同时判断-程序员宅基地

文章浏览阅读197次。面向对象的习题课类的定义员工类Employee求和类Sum类与对象书籍类BookBook类的测试类BookTest异常能扩容的MyList类剪刀石头布转载请注明出处在这一讲中我会给出一些关于面向对象部分的习题,同样希望在不看答案的情况下自己编写,即使看过了答案,也要能够在不看答案的情况下写出来。类的定义员工类Employee定义在同一个公司工作的Employee类,要求其中含有属性:员工的名字,员工的年龄,员工的爱好,员工的公司名(注意当公司更名时,所有员工的公司名都需要更名),工作地点默认为中国(_编写一个测试类booktest,创建几个book对象,并打印它们的字符串表示,同时判断

Spark伪分布安装(依赖Hadoop)_下载spark的hadoop依赖-程序员宅基地

文章浏览阅读6.7k次,点赞7次,收藏14次。一、伪分布安装Spark安装环境:Ubuntu 14.04 LTS 64位+Hadoop2.7.2+Spark2.0.0+jdk1.7.0_761、安装jdk1.7(1)下载jdk-7u76-linux-x64.tar.gz;(2)解压jdk-7u76-linux-x64.tar.gz,并将其移动到/opt/java/jdk路径下(自建);命令:tar -zxvf jdk-_下载spark的hadoop依赖

TCP/IP 是用于因特网 (Internet) 的通信协议_广泛应用在internet中的tcp/ip的网络管理主要使用的是 ____协议。 (填空题)-程序员宅基地

文章浏览阅读6.7k次。计算机通信协议计算机通信协议是对那些计算机必须遵守以便彼此通信的规则的描述。什么是 TCP/IP?TCP/IP 是供已连接因特网的计算机进行通信的通信协议。TCP/IP 指传输控制协议/网际协议 (Transmission Control Protocol / Internet Protocol)。TCP/IP 定义了电子设备(比如计算机)如何连入因特网,以及数据如何在它们之间传输的标准..._广泛应用在internet中的tcp/ip的网络管理主要使用的是 ____协议。 (填空题)

java中的一些经典算法_java中temsize+=1运算-程序员宅基地

文章浏览阅读360次。转自:落尘曦的博客:http://blog.csdn.net/qq_23994787 原文链接:https://blog.csdn.net/qq_23994787/article/details/77951244#_Toc9101经典算法的Java实现(1)河内塔问题: 42(2)费式数列 43(3)巴斯卡(Pascal)三角形 44(4)蒙地卡罗法求 PI 45(..._java中temsize+=1运算

Linux习题简答题_linux中,第一个普通用户的uid为____。-程序员宅基地

文章浏览阅读3.1k次,点赞6次,收藏27次。第一章Q1 简述Linux系统的应用领域 Linux服务器;嵌入式Linux系统;软件开发平台;桌面应用Q2 简述Linux系统的特点 开放性、多用户、多任务、良好的用户界面、设备独立性、丰富的网络功能、可靠的系统安全、良好的可移植性Q3 简述Linux系统的组成 内核、shell、文件系统、应用程序Q4 简述主流的Linux发行版本 Redhat SUSE Oracle CentOS Ubuntu Debian Mandriva Gentoo Slackware Fe_linux中,第一个普通用户的uid为____。

【路径规划】基于matlab粒子群算法新型概率密度无人机作战路径规划【含Matlab源码 2620期】_已知目标出现概率热图matlab无人机路径规划-程序员宅基地

文章浏览阅读183次。粒子群算法新型概率密度无人机作战路径规划完整的代码,方可运行;可提供运行操作视频!适合小白!_已知目标出现概率热图matlab无人机路径规划