基于MapReduce模式的多表联查算法 |
| |
作者单位: | ;1.华北计算技术研究所 |
| |
摘 要: | 多表关联查询是进行数据挖掘与分析的有效技术手段。随着大数据时代的到来,当前的数据分析技术在进行海量数据多表联查操作时存在明显的性能瓶颈,为此提出一种基于Map Reduce计算模型的多表联查算法UGS用以提升多表关联查询效率。实验表明,在海量数据背景下,该算法的查询效率明显优于大数据领域的Spark SQL,Hive及关系型数据库的My SQL。
|
关 键 词: | MapReduce 多表联查 关联空间剪枝 Spark |
A multi-table joint query algorithm based on MapReduce |
| |
Abstract: | |
| |
Keywords: | |
|
|