基于支持向量机的人脸识别技术研究
以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
密 惠 保
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
密 惠 保
资料介绍:
支持向量机的基本理论和算法
3.1 支持向量机的特点与应用
基于数据的机器学习是现代智能技术中的重要方面, 研究从观测数据(样本) 出发寻找规律, 利用这些规律对未来数据或无法观测的数据进行预测. 包括模式识别、神经网络等在内, 现有机器学习方法共同的重要理论基础之一是统计学. 传统统计学研究的是样本数目趋于无穷大时的渐近理论, 现有学习方法也多是基于此假设. 但在实际问题中, 样本数往往是有限的, 因此一些理论上很优秀的学习方法实际中表现却可能不尽人意.与传统统计学相比, 统计学习理论(Statistical Learning Theory,SLT) 是一种专门研究小样本情况下机器学习规律的理论. Vapnik 等人从六、七十年代开始致力于此方面研究, 到九十年代中期, 随着其理论的不断发展和成熟, 也由于神经网络等学习方法在理论上缺乏实质性进展, 统计学习理论开始受到越来越广泛的重视.统计学习理论是建立在一套较坚实的理论基础之上的, 为解决有限样本学习问题提供了一个统一的框架. 它能将很多现有方法纳入其中, 有望帮助解决许多原来难以解决的问题(比如神经网络结构选择问题、局部极小点问题等);同时, 在这一理论基础上发展了一种新的通用学习方法——支持向量机(Support Vector Machine,SVM ) , 它已初步表现出很多优于已有方法的性能. 一些学者认为, SVM 正在成为继神经网络研究之后新的研究热点, 并将有力地推动机器学习理论和技术的发展。 think58.com [版权所有:http://think58.com]
由于支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(Generalizatin Ability)。
支持向量机方法的几个主要优点是:
1、可以解决小样本情况下的机器学习问题;
2、可以提高泛化性能:
泛化准则对于学习算法附加了另一种约束。这一点可以由一种极端情形下的机械式学习来充分说明。许多经典的机器学习算法能够表示任意函数,并且对于困难得训练数据集会得到一个类似机械式学习器的假设。所谓机械式学习器是指能够正确分类训练数据,但对于所有未见数据会做出根本无关性的预测。例如,决策树有可能过度增长直至针对每个训练样例有一叶子节点。为了得到一致假设而使假设变得过度复杂称为过拟合。控制此问题的一种方法是限制假设的规模,例如对于决策树可进行修剪操作。奥卡姆(Ockham)剃刀是该类方法中的准则之一,它建议如无必要,不必增加复杂性,或者说更精细的复杂性必须有利于显著提高训练数据的分类正确率。
如果不对所有的可能假设(即从输入空间到输出域的所有可能的目标函数)的集合加以限制,学习是不可能完成的。因为训练数据本身无法对未见样例进行分类例。如果放宽限制,使得可以在看到数据之后再自由地选择假设集合,这同样也会产生问题,因为可能会简单地假定正确的假设具有任意先验概率。在此意义上所有学习系统必须做出贝叶斯模型的先验假定,它常称为学习偏置。 本文来自think58
3、可以解决高维问题;
4、可以解决非线性问题;
SVM已被应用到很多的领域:
1、 文本分类:
文本分类的任务是将自然文本(超文本)文件根据内容分为预先定义的几个类别。很多领域都有这种问题,包括邮件过滤、网页搜索、办公自动化、主题索引和新闻故事的分类。因为一个文件可以分给不止一个类别,所以尽管这不是一个多分类问题,但可以视作一系列两分类问题,分别属于各类。
用于信息检索(IR,information retrieval)的文本的一种标准表示形式为构造Mercer核提供了一个理想的特征映射。因此,在其他领域得到的先验知识启发了核的设计,事实上核以某种方式结合了距离的相似性度量。因此可以假定特定应用领域的专家已经发现了一些合理的相似性度量,尤其是在信息检索和生成模型领域。
2、 图像识别:
大批量的数字图像容易从因特网或者某个数据库获得。而且,图像的产生越来越廉价,已在很多应用中使用。图像的自动分类在许多应用领域都是一项关键任务,这些领域包括信息检索、因特网数据过滤、医学应用、可视场景的目标检测等。图像分类中的研究多数集中于图像高层次特征的提取,比如使用边缘检测技术和形状描述技术来获取图像的相关属性而不增加过多特征。然而,只采用低层次特征的快速信息检索技术也已经得到研究。 [资料来源:http://www.THINK58.com]
当直接在图像上操作时,传统的分类方法由于数据的高维特性表现较差,但是SVM可以克服极高维表示的缺陷。一个类似文本分类技术的方法同样用于图像分类任务,并且在这种情况下,线形硬间隔学习器通常具有很好的泛化能力。在图像检索任务中,通常使用灰度或颜色直方图这样的低层次特征。它们捕捉了图像的全局低层次特征,概念上同文本分类例子中使用的相似。像词干那样,直方图也不能保留位置信息,直方图之间的距离则可用 或者其他描述分布间差异的测度来估计。
在其他情况下,图像可以直接用位图矩阵表示,这是手写数字识别的表示方法。
仍需要探索使用更复杂的核,以便得到更好的结果。
3.1 支持向量机的特点与应用
基于数据的机器学习是现代智能技术中的重要方面, 研究从观测数据(样本) 出发寻找规律, 利用这些规律对未来数据或无法观测的数据进行预测. 包括模式识别、神经网络等在内, 现有机器学习方法共同的重要理论基础之一是统计学. 传统统计学研究的是样本数目趋于无穷大时的渐近理论, 现有学习方法也多是基于此假设. 但在实际问题中, 样本数往往是有限的, 因此一些理论上很优秀的学习方法实际中表现却可能不尽人意.与传统统计学相比, 统计学习理论(Statistical Learning Theory,SLT) 是一种专门研究小样本情况下机器学习规律的理论. Vapnik 等人从六、七十年代开始致力于此方面研究, 到九十年代中期, 随着其理论的不断发展和成熟, 也由于神经网络等学习方法在理论上缺乏实质性进展, 统计学习理论开始受到越来越广泛的重视.统计学习理论是建立在一套较坚实的理论基础之上的, 为解决有限样本学习问题提供了一个统一的框架. 它能将很多现有方法纳入其中, 有望帮助解决许多原来难以解决的问题(比如神经网络结构选择问题、局部极小点问题等);同时, 在这一理论基础上发展了一种新的通用学习方法——支持向量机(Support Vector Machine,SVM ) , 它已初步表现出很多优于已有方法的性能. 一些学者认为, SVM 正在成为继神经网络研究之后新的研究热点, 并将有力地推动机器学习理论和技术的发展。 think58.com [版权所有:http://think58.com]
由于支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(Generalizatin Ability)。
支持向量机方法的几个主要优点是:
1、可以解决小样本情况下的机器学习问题;
2、可以提高泛化性能:
泛化准则对于学习算法附加了另一种约束。这一点可以由一种极端情形下的机械式学习来充分说明。许多经典的机器学习算法能够表示任意函数,并且对于困难得训练数据集会得到一个类似机械式学习器的假设。所谓机械式学习器是指能够正确分类训练数据,但对于所有未见数据会做出根本无关性的预测。例如,决策树有可能过度增长直至针对每个训练样例有一叶子节点。为了得到一致假设而使假设变得过度复杂称为过拟合。控制此问题的一种方法是限制假设的规模,例如对于决策树可进行修剪操作。奥卡姆(Ockham)剃刀是该类方法中的准则之一,它建议如无必要,不必增加复杂性,或者说更精细的复杂性必须有利于显著提高训练数据的分类正确率。
如果不对所有的可能假设(即从输入空间到输出域的所有可能的目标函数)的集合加以限制,学习是不可能完成的。因为训练数据本身无法对未见样例进行分类例。如果放宽限制,使得可以在看到数据之后再自由地选择假设集合,这同样也会产生问题,因为可能会简单地假定正确的假设具有任意先验概率。在此意义上所有学习系统必须做出贝叶斯模型的先验假定,它常称为学习偏置。 本文来自think58
[来源:http://think58.com]
3、可以解决高维问题;
4、可以解决非线性问题;
SVM已被应用到很多的领域:
1、 文本分类:
文本分类的任务是将自然文本(超文本)文件根据内容分为预先定义的几个类别。很多领域都有这种问题,包括邮件过滤、网页搜索、办公自动化、主题索引和新闻故事的分类。因为一个文件可以分给不止一个类别,所以尽管这不是一个多分类问题,但可以视作一系列两分类问题,分别属于各类。
用于信息检索(IR,information retrieval)的文本的一种标准表示形式为构造Mercer核提供了一个理想的特征映射。因此,在其他领域得到的先验知识启发了核的设计,事实上核以某种方式结合了距离的相似性度量。因此可以假定特定应用领域的专家已经发现了一些合理的相似性度量,尤其是在信息检索和生成模型领域。
2、 图像识别:
大批量的数字图像容易从因特网或者某个数据库获得。而且,图像的产生越来越廉价,已在很多应用中使用。图像的自动分类在许多应用领域都是一项关键任务,这些领域包括信息检索、因特网数据过滤、医学应用、可视场景的目标检测等。图像分类中的研究多数集中于图像高层次特征的提取,比如使用边缘检测技术和形状描述技术来获取图像的相关属性而不增加过多特征。然而,只采用低层次特征的快速信息检索技术也已经得到研究。 [资料来源:http://www.THINK58.com]
当直接在图像上操作时,传统的分类方法由于数据的高维特性表现较差,但是SVM可以克服极高维表示的缺陷。一个类似文本分类技术的方法同样用于图像分类任务,并且在这种情况下,线形硬间隔学习器通常具有很好的泛化能力。在图像检索任务中,通常使用灰度或颜色直方图这样的低层次特征。它们捕捉了图像的全局低层次特征,概念上同文本分类例子中使用的相似。像词干那样,直方图也不能保留位置信息,直方图之间的距离则可用 或者其他描述分布间差异的测度来估计。
在其他情况下,图像可以直接用位图矩阵表示,这是手写数字识别的表示方法。
仍需要探索使用更复杂的核,以便得到更好的结果。