首页 > 学术论文

基于用户行为分析的核能领域垂直检索系统研究

来源:论文学术网
时间:2024-08-18 12:23:19
热度:

基于用户行为分析的核能领域垂直检索系统研究【摘要】:中国核网具有资讯及时、信息全面的特点。如何从杂乱无章的庞大数据和强干扰的信息中搜索出有价值的核能信息,这对人类的智能信息处理能力

【摘要】:中国核网具有资讯及时、信息全面的特点。如何从杂乱无章的庞大数据和强干扰的信息中搜索出有价值的核能信息,这对人类的智能信息处理能力提出了挑战。由于网络资源的复杂性,通用搜索引擎已经不能满足用户信息检索的准确性需要。为了更及时、更精准地获取核能信息与核能数据,为中国核网高效及时提供精准的数据素材,保证这一核能领域门户网站的数据及时性、精确性、全面性。本文针对核能领域海量数据的高效获取、深度分类和信息检索开展研究。本文首先研究了针对核能领域专用数据的主题爬虫,实现了对核能主流数据的抓取、去噪。其次,基于支持向量机(Support Vector Machine)技术和IKAnalyzer分词技术对已爬取的海量数据按照中国核网的频道进行分类。最后,针对中国核网用户来源、搜索行为具有较为明显的聚类特性,对Lucene框架的检索排序算法进行改进,提出一种基于用户行为分析的检索排序算法,该算法很大程度上提高了搜索引擎的查询效率,为中国核网提供更有效、更精确的核能信息。相似度评分算法是全文信息检索的核心步骤,能够高效的对返回结果进行展示。本文对Lucene内部相似度评分算法进行研究之后,针对Lucene内部相似度排序算法仅考虑查询词出现频率而未考虑潜在用户心理这一问题,本文实现了面向核能领域的垂直检索系统,该系统基于改进的相似度评分算法,并且能够通过对用户最近一段时间内的检索与点击行为进行分析,获取一组用户偏好关键词,对查询词与偏好关键词进行组合评分。论文实验表明,该系统能够高效获取核能领域信息,并在保证正确率的情况下对信息进行分类,有效节约人力资源。通过对爬取的数据索引并验证其检索性能,可知改进相似度评分算法对检索时间延长30-40ms,却在在大众用户接受时间内,但该算法对搜索结果质量有一定提高。 【关键词】:用户行为分析 相似度评分算法 支持向量机 信息检索系统
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.3
【目录】:
  • 致谢7-8
  • 摘要8-9
  • ABSTRACT9-14
  • 第一章 绪论14-19
  • 1.1 研究背景14-15
  • 1.2 国内外研究现状15-17
  • 1.3 论文主要研究内容17-18
  • 1.4 本文组织结构18-19
  • 第二章 信息检索系统关键技术19-29
  • 2.1 信息检索系统概述19-24
  • 2.1.1 信息检索模型19-20
  • 2.1.2 倒排索引表20-22
  • 2.1.3 全文检索22-24
  • 2.2 网络爬虫技术24
  • 2.3 中文分词技术24-25
  • 2.4 文本相似度计算方法25-26
  • 2.5 系统流程26-27
  • 2.6 本章小结27-29
  • 第三章 面向中国核网的数据爬取和文本分类29-44
  • 3.1 核能领域数据获取与处理30-31
  • 3.1.1 数据获取30-31
  • 3.1.2 数据处理31
  • 3.2 支持向量机理论31-36
  • 3.2.1 文本分类32
  • 3.2.2 线性可分问题32-35
  • 3.2.3 线性不可分问题35-36
  • 3.2.4 核方法36
  • 3.3 基于支持向量机理论的文本分类系统实现36-43
  • 3.3.1 分类器训练37-42
  • 3.3.2 文本分类42-43
  • 3.4 本章小结43-44
  • 第四章 基于用户行为分析的垂直检索系统设计与实现44-55
  • 4.1 基于用户行为分析的相似度评分算法45-48
  • 4.1.1 用户行为定义45-46
  • 4.1.2 用户行为分析46-48
  • 4.1.3 相似度评分算法48
  • 4.2 垂直检索系统设计与实现48-51
  • 4.3 系统运行结果与分析51-54
  • 4.3.1 实验结果51-52
  • 4.3.2 排序效果测试52-53
  • 4.3.3 搜索速度比较53-54
  • 4.4 本章小结54-55
  • 第五章 总结与展望55-57
  • 5.1 论文工作总结55-56
  • 5.2 未来工作展望56-57
  • 参考文献57-60
  • 攻读硕士学位期间的学术活动及成果情况60-61


您可以在本站搜索以下学术论文文献来了解更多相关内容

用户行为分析系统在宽带网络中的应用    马维亮;

基于用户行为的3G业务分析与探讨    乔志伟;

基于用户行为分析的广告欺诈点击检测    龚尚福;姜晓旭;

基于云计算的移动互联网大数据用户行为分析引擎设计    陶彩霞;谢晓军;陈康;郭利荣;刘春;

社会网络服务及其用户行为分析    毛承洁;张龙;庞川;陈洁敏;

基于CDMA2000 1x EVDO网络的用户行为分析模型设计    雒江涛;胡燕清;徐孝娜;周进艳;

有线电视用户行为分析实践    许春玲;范志刚;郑小盈;李明齐;

一种移动互联网用户行为分析系统的顶层设计    李朝阳;谢传中;

大数据时代的信息用户行为分析    刘英梅;

宽带上网用户行为分析    陆群峰;

移动互联网用户行为分析系统技术架构浅析    赵勇;

基于云计算的可重构移动互联网用户行为分析系统的设计    冯铭;王保进;蔡建宇;

网络搜索引擎用户行为分析和研究    岑荣伟;刘奕群;张敏;茹立云;马少平;

转变运维模式,迎接移动互联网新挑战    赵艳梅;朱晓燕;

用户行为分析在网络信息检索中的应用概述    刘奕群;张敏;马少平;

基于位置轨迹加权网络图的用户行为分析识别算法    毛翔博;齐观德;李石坚;潘纲;

基于用户行为分析的移动终端偏好模型研究    尔古打机;苏小龙;朱征;

IP网络用户行为分析方法的探讨    谭景华杨国良

建设用户行为分析智慧模型    本报记者 逄丹

重庆电信建成宽带用户行为分析系统    李中朝通讯员 黄伟

新媒体系统中用户行为分析与系统设计    王琪

移动用户网络行为分析与预测方法研究    罗海艳

网络用户行为分析的若干问题研究    刘鹏

基于流量监测的网络用户行为分析    延皓

根据多维特征的网络用户分类研究    窦伊男

基于用户行为分析的搜索引擎评价研究    岑荣伟

基于Web日志的用户行为分析系统的研究与实现    江惠彬

基于用户行为分析的冰箱设计研究    李亚飞

基于网络用户行为分析的用户推荐反馈系统的设计    石钊

基于移动校园应用的用户行为分析及性能改进    李婷蔚

基于Hadoop的用户行为分析系统的设计与实现    王颖颖

聚类算法及其在校园网用户行为分析中的应用    马仕玉

基于用户行为分析的核能领域垂直检索系统研究    徐娟

基于兴趣分类的用户行为分析系统的研究与设计    周岳

移动互联网的用户行为分析系统的设计与实现    郑桂凤

基于移动社会网络的用户行为分析    魏彦鹏