流形学习中的若干问题研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

流形学习中的若干问题研究【摘要】:流形学习是近年来机器学习与数据挖掘中的一个新的研究热点,其本质在于根据有限的离散样本学习和发现嵌入在高维空间中的低维光滑流形,从而揭示隐藏在高维数据中的内在低维结构,以实现非线性降维。本论文围绕流形学习中邻域图建构和增量学习的若干问题展开研究,主要包括动态邻域构建、流形上“孤立点”的扩展、等维度独立多流形的分解一组合以及批量处理新数据的算法。具体来说,本论文的创新之处在于:1.提出了基于采样密度和流形曲率的动态邻域算法。该算法能够更准确地重构流形的拓扑结构,有效地解决“短路”问题以及ISOMAP不能处理非凸数据的问题。基于人造数据和实际数据的实验结果都验证了该算法能够有效地得到流形数据的低维表示,且提高分类器的平均分类率。2.提出了基于动态邻域扩展切空间的P-ISOMAP算法。该算法主要适用于在流形边缘或者采样稀疏部位由于采样不均衡造成的“孤立点”数据。基于人造数据和实际数据的实验结果说明,P-ISOMAP算法通过扩展切空间的方法有效地解决了“孤立点”造成的“短路”问题,提高了动态邻域算法的能力。3.提出了基于等维度独立多流形的DC-ISOMAP算法。该算法能够准确地分解等维度独立多流形,有效地转化并组合各子流形的局部低维嵌入,实现了等维度多流形的非线性维数约简。基于人造数据和实际数据的实验结果都验证了该算法的有效性。4.提出了批量增量学习算法DKI-ISOMAP。该算法能够有效地实现大批量新增样本数据的增量学习,在损失较小精度的前提下大幅降低运行时间,实现了邻域图、测地距离矩阵和低维嵌入结果的更新,提高了实际应用价值。本论文的研究成果将进一步丰富流形学习的算法研究,为图像识别、Web信息检索、生物医学等相关领域的大规模数据处理和数据流处理提供了新的技术支持。【关键词】:流形学习非线性维数约简ISOMAP切空间动态邻域D-ISOMAPP-ISOMAP本征维数等维度独立多流形DC-ISOMAP增量学习DKI-ISOMAP【学位授予单位】:山西大学【学位级别】:博士【学位授予年份】:2011【分类号】:TP181【目录】:摘要8-9Abstract9-11第1章绪论11-171.1引言11-121.2流形学习的研究进展12-151.3研究内容与组织结构15-17第2章流形学习算法17-292.1引言172.2主要算法及分析17-262.2.1等距映射算法ISOMAP18-202.2.2局部线性嵌入算法LLE20-222.2.3拉普拉斯特阵映射算法LE22-232.2.4海赛局部线性嵌入算法HLLE23-252.2.5局部切空间排列算法LTSA25-262.3小结26-29第3章基于动态邻域的D-ISOMAP算法29-413.1引言29-303.2基于采样密度和流形曲率的动态邻域算法30-323.3基于动态邻域的D-ISOMAP算法32-333.4实验结果及分析33-393.4.1人造数据上的实验33-363.4.2实际数据上的实验36-383.4.3时问复杂度分析38-393.5小结39-41第4章基于动态邻域扩展切空间的P-ISOMAP算法41-494.1引言414.2基于动态邻域扩展切空间的P-ISOMAP算法41-444.3实验结果及分析44-484.3.1人造数据上的实验44-464.3.2实际数据上的实验46-484.3.3时间复杂度分析484.4小结48-49第5章基于等维度独立多流形的DC-ISOMAP算法49-595.1引言49-505.2基于等维度独立多流形的DC-ISOMAP算法50-555.2.1分解过程50-525.2.2组合过程52-555.3实验结果及分析55-575.3.1人造数据上的实验56-575.3.2实际数据上的实验575.4小结57-59第6章批量增量算法DKI-ISOMAP59-796.1引言59-606.2基于ISOMAP的批量增量算法I-ISOMAP60-646.2.1更新邻域图606.2.2计算和更新测地距离60-636.2.3重构嵌入结果63-646.3基于D-ISOMAP的批量增量算法ID-ISOMAP64-656.4两种批量增量算法的分析比较65-706.4.1时间复杂度的分析比较65-676.4.2精度的分析比较67-696.4.3参数n和m对运行时间的影响69-706.5批量增量算法DKI-ISOMAP70-786.5.1基于k-NN的动态邻域算法70-736.5.2有选择性更新测地距离矩阵73-756.5.3实验结果及分析75-786.6小结78-79总结与展望79-81参考文献81-89致谢89-91攻读博士期间研究成果91-93个人简况93-97本论文购买请联系页眉网站。

1 / 3
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功