首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   2篇
  免费   0篇
综合类   2篇
  2004年   2篇
排序方式: 共有2条查询结果,搜索用时 62 毫秒
1
1.
数据ETL过程中的模式集成技术研究   总被引:2,自引:0,他引:2  
阐述了在数据ETL(Data Extractlon,Transformation and Loading)中造成模式冲突的主要原因是不同的数据源可能采用不同的数据模型来表达;分析了常用模式集成方法,并比较了它们的优缺点;结合常用集成方法中的优点,设计了交互式的模式集成框架。该框架解决了较难的语义冲突问题,获得了良好的集成效果。  相似文献   
2.
针对数据预处理中的遗失值填充问题,运用策略模式设计了一种可扩展的遗失值填充算法;构造了SimpleImputation,KNNImputation和DTBImputation 3个具体的策略类,分别封装了简单遗失值填充算法、KNN遗失值填充算法以及DTB遗失值填充算法.实验结果表明:简单填充算法执行速度最快但精度最低,DTB算法执行速度较慢但精度较高,KNN算法执行速度最慢但精度最高.该算法允许用户根据自身对速度和精度的需求来选取相应的填充算法,并通过添加新策略类的方式来扩展其遗失值填充功能,从而解决了遗失值造成的数据质量问题,提高了数据预处理程序的通用性和可扩展性.  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号