信息技术的快速发展导致了数据规模的爆炸式增长,传统的机器学习、数据挖掘算法面临新的挑战.流形学习克服了传统线性降维算法的不足,成为十年来降维研究的热点领域.然而流形学习算法复杂度高,对于大规模的数据集并不适用.针对大规模数据集下的流形学习降维问题,提出了基于MapReduce的分布式流形学习算法.该算法采用局部敏感哈希函数将相似点映射到同一个桶中,利用流形具有局部欧氏同胚的性质,在每个桶内采用欧氏距离度量点之间的测地距离,桶之间采用中心点及边缘点来计算修正的测地距离.在大规模的人工合成数据集和真实数据集上的实验表明,该算法能有效地估计数据点间的测地距离,适用于处理大规模数据集的降维问题估计示意图-蔬菜大棚扩管机折弯机缩管机价格低全自动弯管机多少钱. 结构的一个局部欧氏空间的估计.每个哈希桶内的数据通过3.1节所描述的步骤可以构建桶内的距离矩阵1)$=1,2, 本文由张家港市泰宇机械有限公司弯管机网站采集网络资源整理! http://www.wanguanji.name…,B.考虑到本文所处理的数据具有分布式、大规模的特点,所以构建哈希桶之间的边连接可以采用中心点ex和边缘点pa;(同时以ncc;,nx\表示i和j两个桶之间的最近边缘点)来近似估计哈希桶之间的数据测地距离.利用流形具有局部欧氏同胚的性质.边缘点的估计可以选择哈希到同一个桶中距离最大的f对数据点作为边缘点.中心点即为哈希桶的几何中心.高维空间中两相邻的,域点集经过哈希函数簇分别映射到两个哈希桶中,如图2所示,两邻域中心点间}估计示意图-蔬菜大棚扩管机折弯机缩管机价格低全自动弯管机多少钱。。. 本文由张家港市泰宇机械有限公司弯管机网站采集网络资源整理! http://www.wanguanji.name更多
- [2019-08-06]自适应补偿控制-电动液压弯管机
- [2019-08-06]与能效优化策略-数控滚圆机滚弧
- [2019-08-05]动力响应数值研究-数控滚圆机滚
- [2019-08-05]电抗器的振动研究-数控滚圆机滚
- [2019-08-04]结构温度场解析解-数控滚圆机滚
- [2019-08-04]发电功率平滑控制-数控滚圆机滚
- [2019-08-03]功率控制方法研究-数控滚圆机滚
- [2019-08-03]体积测量方法研究-数控滚圆机滚
- [2019-08-02]沉降控制应用研究-数控滚圆机滚
- [2019-08-02]必要性的初步探究-数控滚圆机滚