客户知识管理中的文本挖掘方法与技术研究

[复制链接]
查看: 126|回复: 0

2万

主题

3万

帖子

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
72280
发表于 2024-2-27 19:29:04 | 显示全部楼层 |阅读模式
目:


雅宝题库答案
****此区域为收费内容****    需支付 1 知识币后可查看,1币=0.01元查看答案


雅宝题库解析:
客户关系管理的重点是客户知识的管理,客户关注的产品特征,对产品的观点与看法、改进建议等都为企业提供重要的决策依据。只有真正理解了用户的偏好、需求、意见才能更好进行客户关系管理。在当今的网络社会中,Internet 已逐步演化成为一个重要的交流的渠道,随着 Web2.0 的迅速发展,互联网人人参与精神的逐步深入,开放的互联网更是为大家表达自己的意见提供了广阔的天地,这种知识以大量的网页、博客、帖子、随笔、评论等等形式散布于各种电子商务网站、博客站点、论坛和微博之中。这些知识的发现与获取对于企业的品牌建立,客户获取和保持,产品研发,质量保证有着重要的意义。 本文从客户知识管理与中文文本挖掘及相关的研究内容出发,以中文文本挖掘在客户知识管理中的应用为主线,旨在提出一套理论与实际相结合的、将中文自然语言处理和文本挖掘技术应用于挖掘互联网中所蕴藏的客户知识的方法构架。本文研究了高精度、高召回率的中文分词算法,中文评论中的产品特征提取方法并分析产品特征集与客户满意度之间的关系,以及对互联网的中文文本数据流聚类以发现客户关注热点的方法等。具体来说,论文的研究工作和创新点主要体现在以下几个方面: 1.提出了基于贝叶斯网络结构的 N元语法中文分词模型。中文分词是中文自动化处理的基础,是中文文本的自动检索、过滤、分类及摘要,自动校对,机器翻译,语音识别等领域应用的基础。本文从二元语法出发,使用贝叶斯网络结构来描述中文分词模型,使用字齐 Viterbi 算法在分词网络中寻找最优解,在充分对比和分析了各种平滑算法之后,选择最优的数据平滑算法,同时在贝叶斯分词网络中一并解决了交叉、组合歧义消解,中文人名和中文译名的识别等题目。封闭测试的精度、召回率分别为 99.68%、99.7%,开放精度、召回率为98.64%、98.74%,分词速度约为 74.8 千字/秒。通过对比分析证明了该方法的优越性。 2.提出了基于评论挖掘的客户知识发现框架。电子商务在中国的飞速发展,使得从用户评论中发现客户知识成为可能。本文从电子商务网站用户评论的特点出发,提出了分析用户评论中包含的客户知识的框架:以互联网上大量存在的评论信息等非结构化信息为研究对象,依托中文分词算法进行句子级别的分析,使用频繁关联项发现算法,从电子商务网站的产品用户评论中提取产品的特征,将产品关键特征归并成产品特征主题,采用多分类有序 logistic 回归方法量化分析了用户满意度和产品特征主题之间的关系。以平板电视和手机的数据为例,分析用户最关注的特征,和最影响用户满意度的特征,发现这两种特征并不等同;定量分析在不同满意度水平下,各特征主题对评分的贡献程度, 以及用户满意度在不同等级时的关键影响特征。数据实验表明了方法的有效性。  3.提出了文本数据流投影聚类算法,并将之应用于客户知识热点发现。每天互联网上生成海量的页面,这些页面的文本向量天然就是高维、稀疏、流式的,传统的聚类算法面对这些特性时,往往无能为力,本文扩展了 Squeezer 聚类算法,引入投影聚类算法思想,重新定义了类的质心、半径,引入判别距离的概念,消解文本向量的高维、稀疏、多主题题目。同时将算法推导至数据流环境,提出了数据流环境下的聚类簇结构;通过开始时间窗数据预处理提高了聚类的精度;通过对数据流类的概要信息的提取,实现了在数据流环境下高效的聚类;通过对全部向量空间的维度投影,减少计算复杂度,也为数据流聚类结果加上可理解的语义标签。文章将这种算法应用于网页文本的聚类,提出了应用文本流投影聚类从网页流中提取客户知识热点的方法。





上一篇:某公司开发物料管理系统设计与实现
下一篇:真实涡轮叶片高温复合疲劳试验研究
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图