基于海量煤炭采集文本数据的可扩展SVM算法的研究与应用
【出 处】:
【作 者】:
【摘 要】文本分类是指在给定的分类系统下,根据文本的内容或属性,将大量文本归到一个或多个类别的过程。随着煤炭产业的高速发展,煤炭数据库中保存了大量煤炭采集文本数据,针对如此大规模的文本信息,传统的SVM算法不能很好地对大规模海量煤炭文本数据进行有效的处理。文中基于现有流行的Hadoop分布式计算平台,提出了分布式SVM文本分类算法。通过实验表明,文中提出的算法能够明显减小文本分类时间,并且具有很好的可扩展性。
相关热词搜索: Hadoop SVM 文本分类 分布式计算 煤炭数据采集
上一篇:云平台下的基于项目的KNN协同过滤算法在煤炭系统中的研究与应用
下一篇:基于CUDA的数字影像处理算法在煤炭领域中的研究与实现