Web数据挖掘
名称 编辑本段
Web数据挖掘
Web数据挖掘的概念编辑本段
Web数据挖掘 (Web Data Mining),是数据挖掘技术在Web环境下的应用,是从大量的Web文档集合和在站点内进行浏览的相关数据中发现潜在的、有用的模式或信息。它是一项综合技术,涉及到Internet技术、人工智能、计算机语言学、信息学、统计学等多个领域。对应于不同的Web数据,Web挖掘也分成三类:Web内容挖掘、Web结构挖掘和Web使用模式挖掘。
Web使用模式挖掘(Web Usage Mining)是对用户访问Web时在服务器方留下的访问记录进行挖掘,它通过挖掘Web日志文件及客户交易数据来发现有意义的用户访问模式和相关的潜在用户群。其主要特点是对用户信息数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。
尽管Web挖掘的形式和研究方向层出不穷,但随着电子商务的兴起和迅猛发展,Web挖掘的一个重要应用方向将是电子商务系统。电子商务是数据挖掘技术最恰当的应用领域,因为电子商务可以很容易满足数据挖掘所必需的因素:丰富的数据源、自动收集的可靠数据,并且可将挖掘的结果转化成商业行为,商业投资可以及时评价。其中与电子商务关系最为密切的是Web使用模式挖掘。
电子商务中Web挖掘的数据源 编辑本段
在Web上可以用来作为数据挖掘分析的数据量比较大,而且类型众多,总结起来有以下几种类型的数据可用于Web数据挖掘技术产生各种知识模式。
1.服务器数据
客户访问站点时会在Web服务器上留下相应的日志数据,这些日志数据通常以文本文件的形式存储在服务器上。一般包括sever logs、error logs、cookie logs等。
2.查询数据
它是电子商务站点在服务器上产生的一种典型数据。例如,对于在线客户也许会搜索一些产品或某些广告信息,这些查询信息就通过cookie或是登记信息连接到服务器的访问日志上。
3.在线市场数据
这类数据主要是传统关系数据库里存储的有关电子商务站点信息、用户购买信息、商品信息等数据。
4.Web页面
主要是指HTLM和XML页面的内容,包括本文、图片、语音、图像等。
5.Web页面超级链接关系
主要是指页面之间存在的超级链接关系,这也是一种重要的资源。
6.客户登记信息
客户登记信息是指客户通过Web页输入的、要提交给服务器的相关用户信息,这些信息通常是关于用户的人口特征。在Web的数据挖掘中,客户登记信息需要和访问日志集成,
以提高数据挖掘的准确度,使之能更进一步的了解客户。
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
如果您认为本词条还有待完善,请 编辑
上一篇 Session、Cookie 下一篇 媒体组合