基于Hadoop云计算平台的图像分类与标注 |
| |
作者姓名: | 陆寄远 黄承慧 侯昉 李斌 |
| |
作者单位: | 广东金融学院计算机科学与技术系;甲骨文研究开发中心(深圳)有限公司; |
| |
基金项目: | 国家自然科学基金资助项目(No.61173081);广东省自然科学基金资助项目(No.S2011020001215,No.S2012040007847) |
| |
摘 要: | 为有效处理并利用互联网海量的图像和视频数据,提出了一种基于Hadoop云平台的图像分类和标注解决方案。针对如何高效地进行训练集提取这一重要问题,搭建了基于云计算的图像抓取平台,利用互联网的图像资源作为原始数据集,为提取训练集图像提供足够的数据;实现了基于概率潜在语义分析模型的训练集图像提取功能,对原始数据集进行基于主题的聚类,帮助用户快速选取训练集图像;加入了SVM分类模型,利用提取出来的训练集对未标注图像进行分类标注,实现了完整的系统。实验结果表明,该方案能够满足海量图像数据分类和标注的功能和性能需求。
|
关 键 词: | 云计算 训练集提取 支持向量机 视觉特征提取 |
本文献已被 CNKI 等数据库收录! |
|