首页 > 学术论文

设计与实现基于支持向量机的水电故障分类器

来源:论文学术网
时间:2024-08-18 22:01:35
热度:

设计与实现基于支持向量机的水电故障分类器【摘要】:随着通信技术、计算机技术尤其是Internet技术高速发展的今天,对于网络上海量信息的处理,传统的人工分类整理方式已不合时宜,因而

【摘要】: 随着通信技术、计算机技术尤其是Internet技术高速发展的今天,对于网络上海量信息的处理,传统的人工分类整理方式已不合时宜,因而更有效的文本分类方法应运而生。文本分类对于提高网上信息检索的效果和效率很有帮助,是推进个性化服务,改进信息获取模式的重要方面,也是内容安全的基础。而将统计学习理论中的支持向量机方法来进行文本分类的优化并将其应用与水电故障文本分类中具有重要的现实意义。 本文首先介绍了文本分类领域的相关技术,利用向量空间模型以及中文分词技术并根据TF-IDF权值算法将文本描述为以词为单位的加权向量形式。然后,针对文本的向量形式描述,采用支持向量机技术进行文本分类。设计了一个中文文本分类器,利用ICTCLAS分词可将大量文本进行切词划分,从而达到分类的目的,并介绍了其算法。 介绍了统计学习理论以及支持向量机的相关技术,阐述了支持向量机研究和应用现状,以及所面临的问题,特别针对支持向量机的核函数的选择进行了详细研究比较,详细分析了针对多分类的支持向量机算法,并将多分类支持向量机方法应用于文本分类。 最后本文设计并实现了一个基于支持向量机的水电故障文本分类器,该分类器的查准率和查全率等评价指标均达到应用要求,通过将其应用于水电故障的文本分类领域具有良好的前景,而且可以预见其在其他相关领域也会有很大的应用空间。 【关键词】:文本分类 支持向量机 向量空间模型 水电故障分类 核函数
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TV738;TP18
【目录】:
  • 内容提要4-7
  • 第一章 绪论7-11
  • 1.1 课题研究的目的与意义7-8
  • 1.1.1 课题目的7
  • 1.1.2 课题意义7-8
  • 1.2 文本挖掘的研究现状8
  • 1.3 支持向量机的研究现状8-9
  • 1.4 本文组织结构9-11
  • 第二章 本文分类技术11-23
  • 2.1 文本分类概念11-12
  • 2.2 文本分类的过程12-16
  • 2.2.1 文本的表示12
  • 2.2.2 向量空间模型12-13
  • 2.2.3 特征项的提取13-16
  • 2.3 文本分类的性能评估16-18
  • 2.4 文本分类算法18-23
  • 2.4.1 朴素贝叶斯分类19-20
  • 2.4.2 最近邻KNN算法20-21
  • 2.4.3 决策树21
  • 2.4.4 支持向量机21-22
  • 2.4.5 基于投票的方法22-23
  • 第三章 中文文本分类器的设计23-30
  • 3.1 水电故障分类器的需求分析23
  • 3.1.1 业务分析23
  • 3.2 设计思想23-24
  • 3.3 基于支持向量机的中文文本分类器的总体设计24-25
  • 3.4 中文文本分词技术25-28
  • 3.4.1 中文分词的必要性25-26
  • 3.4.2 中文分词技术26-27
  • 3.4.3 ICTCLAS分词27-28
  • 3.5 文本的特征向量化算法28-29
  • 3.6 中文文本分类其算法实现29-30
  • 第四章 统计学习理论与支持向量机30-41
  • 4.1 机器学习的基本方法30-31
  • 4.1.1 问题的一般表示30
  • 4.1.2 经验风险最小化30-31
  • 4.2 统计学习理论31-33
  • 4.2.1 VC维31-32
  • 4.2.2 结构风险最小化32-33
  • 4.3 支持向量机33-37
  • 4.3.1 最优超平面33-35
  • 4.3.2 线性支持向量机35-36
  • 4.3.3 非线性支持向量机36-37
  • 4.4 核函数理论37-39
  • 4.5 多分类支持向量机39-41
  • 4.5.1 一对一SVM分类39-40
  • 4.5.2 一对多SVM分类40-41
  • 第五章 基于支持向量机的水电故障分类器的实现41-48
  • 5.1 实验环境搭建41-42
  • 5.1.1 实现环境41-42
  • 5.1.2 文本数据来源42
  • 5.2 分类结果评价42-43
  • 5.3 水电故障文本分类器的实现43-48
  • 第六章 总结与展望48-49
  • 6.1 本文工作总结48
  • 6.2 下一步工作展望48-49
  • 参考文献49-51
  • 摘要51-53
  • ABSTRACT53-57
  • 致谢57


您可以在本站搜索以下学术论文文献来了解更多相关内容

基于领域知识的文本分类    朱靖波,陈文亮

基于VSM的中文文本分类系统的设计与实现    张东礼,汪东升,郑纬民

多子群粒子群集成神经网络    潘希姣;

基于最大似然法集成的黄曲条跳甲预警模型    李亭;杨敬锋;彭晓琴;陈志民;

集成学习技术在农业中的应用    时雷;虎晓红;席磊;段其国;

基于支持向量机的农业数据分类研究    时雷;席磊;虎晓红;段其国;

基于Naive Bayes算法的大豆病害诊断研究    时雷;虎晓红;席磊;

带专业词库的特征选择    刘晓志;黄厚宽;尚文倩;

基于两阶段集成学习的分类器集成    李文斌;刘椿年;钟宁;

一种基于集成学习与类指示器的文本分类方法    蒋宗礼;徐学可;

基于随机森林算法的高维脑电特征优选    李飞;高小榕;高上凯;

基于K-最近距离的自动文本分类的研究    孙健,王伟,钟义信

一种混合型集成学习演化决策树算法    叶红云;倪志伟;陈恩红;

K均值聚类优化集成学习    杜方键;杨宏晖;

FloatBag选择性神经网络集成及其在人脸检测中的应用    杜晓凤;丁友东;

一种电子邮件敏感信息检测算法    刘子豪;庄毅;

分词结果的再搭配对文本分类效果的增强    侯松;周斌;贾焰;

一种基于元泛化的Bagged Boosting算法    陈华杰;韦巍;

基于中心词位置的VSM文本分类算法    李卫东;杨炳儒;李龙星;曲文龙;

Adaptive multi-LSSVR based soft sensing for cobalt oxalate synthesis process    

Multiple ANNs Combined Scheme for Fault Diagnosis of Power Transformers    

蚁群算法及粒子群算法对比及在VRP中的应用    师凯;蔡延光;邹谷山;王涛;

基于DNA微阵列数据的癌症分类技术研究    于化龙

B2C在线评论中的客户知识管理研究    邓斌

基于SCF范式的在线P300脑机接口研究    苏煜

文档碎片取证关键技术研究    李炳龙

复杂网络系统间相似性识别及其应用    杜方

核学习算法与集成方法研究    甘良志

Deep Web数据获取问题研究    闫中敏

高光谱图像分类方法研究    陈进

文本挖掘技术研究及其在综合风险信息网络中的应用    张翔

入侵检测分类器设计及其融合技术研究    王飞

Deep Web数据库的选择研究    樊敬川

地理案例的空间相似性计算    王丽敬

集成学习算法研究    马冉冉

中文文本分类技术研究    吕万里

支持向量机在冲击地压预测模型中的应用研究    朱耿峰

基于规则的组合分类器的研究    石国强

利用PCA和AdaBoost建立基于贝叶斯的组合分类器    陈松峰

特征变换在组合分类中的应用研究    吴正娟

基于支持向量机的特征选择及其集成方法的研究    曹彦

数据流上概念漂移的检测和分类    周驰

文本内容主题的识别方法    朱靖波,姚天顺

基于向量空间模型的文本自动分类系统的研究与实现    庞剑锋,卜东波,白硕

文档中词语权重计算方法的改进    鲁松,李晓黎,白硕,王实

网络文本数据分类技术与实现算法    李勇,桑艳艳

基于SVM的中文文本分类算法    冀胜利;李波;

一种动态调整训练集的中文文本分类系统    欧阳勇;马忠宝;

一种基于正例的SVM分类方法    张伟;邹汉斌;雷红艳;刘琼;

基于特征贡献度的特征选择方法在文本分类中应用    孟佳娜;林鸿飞;李彦鹏;

一种文本多级分类方法研究    肖红;刘淑华;

使用增量SVM进行文本分类    张永;周振龙;侯莉莉;张世宏;

基于位置权重的文本分类    台德艺;谢飞;胡学钢;

基于模式聚合理论的文本特征降维方法及其在文本分类中的应用    李冠军;陈雪松;徐建锁;

基于朴素贝叶斯和支持向量机的短信智能分析系统设计    张兢;候旭东;吕和胜;

基于VSM的中文文本分类系统的设计与实现    张东礼,汪东升,郑纬民

基于支持向量机的Web文本分类方法    牛强;王志晓;陈岱;夏士雄;

面向支持向量机的降维方法比较分析    朱慕华;朱靖波;陈文亮;

一种基于支持向量机的多国语言文本分类平台    卢卫雄;

基于抽样的两阶段支持向量机训练算法    曹菲菲;朱慕华;朱靖波;

基于GA与SVM融合的网页分类算法    刘晓勇;

模糊聚类的最大树法在文本分类中的应用研究    杜长海;吉根林;

反馈方法在文本分类系统中的应用    庞剑锋;程学旗;

一种增量式支持向量机文本分类模型    栾江;唐常杰;黄晓冬;阴小雄;廖勇;

汉语文本按语体分类的研究    王慧玲;宋柔;戴伟长;

基于大规模真实文本的平衡语料分析与文本分类方法    陈克利;宗成庆;王霞;

内容为王    中国科学院计算技术研究所 王 斌

寻“宝”有术    清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江

内幕交易与市场操纵的行为动机与判别监管研究    课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院

计算机详解配伍与药效关系    李水根

非接触式人脸识别技术    清华大学 苏光大

我市九项目进入省“盘子”    YMG记者 李仁 通讯员 曲华明 孙运智

传承陆游风骨 推进国际交流    高利华

酷爱化学 孜孜以求    上海大学理学院教授、副院长 陆文聪

选择合适的数据挖掘算法    

蛋白质功能算出来    记者 耿挺

基于支持向量机的文本分类算法研究    秦玉平

用于文本分类的简明语义分析技术研究    李智星

面向分布式文本知识管理的中文分词与文本分类研究    李志国

文本挖掘预处理相关基础技术分析与应用研究    孙道军

基于CPFR的农产品采购模型研究    杜小芳

动态过程数据的多变量统计监控方法研究    刘育明

支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究    栾锋

市场条件下抽水蓄能电站效益综合评价及运营模式研究    孙薇

支持向量机的核方法及其模型选择    常群

锌钡白回转窑煅烧过程智能建模研究    朱燕飞

设计与实现基于支持向量机的水电故障分类器    姜仁辉

基于SVM的中文文本分类系统的建模与实现    马宏伟

基于Web的中文文本分类的研究与实现    邹丹

中文文本自动分类的研究与实现    都云琪

基于支持向量机的文本分类方法研究    李强

多类文本分类的支持向量机网络    孟祥国

中文文本分类方法研究    荣光

基于支持向量机的文本分类研究    王生新

基于内容的垃圾邮件过滤技术研究    杨丽华

短文本分类方法研究    常娟