基于海量煤炭采集文本数据的可扩展SVM算法的研究与应用

学报栏目

期刊信息

过刊浏览

2010 第12期

您现在所在位置：首页 > 期刊导读 > 2013 > 05 > 信息摘要

【出处】：

【作者】：

【摘要】文本分类是指在给定的分类系统下,根据文本的内容或属性,将大量文本归到一个或多个类别的过程。随着煤炭产业的高速发展,煤炭数据库中保存了大量煤炭采集文本数据,针对如此大规模的文本信息,传统的SVM算法不能很好地对大规模海量煤炭文本数据进行有效的处理。文中基于现有流行的Hadoop分布式计算平台,提出了分布式SVM文本分类算法。通过实验表明,文中提出的算法能够明显减小文本分类时间,并且具有很好的可扩展性。

相关热词搜索： Hadoop SVM 文本分类分布式计算煤炭数据采集

上一篇：云平台下的基于项目的KNN协同过滤算法在煤炭系统中的研究与应用
下一篇：基于CUDA的数字影像处理算法在煤炭领域中的研究与实现