三是信息推送服务。信息推送服务是基于报送技术发展而出现的一种新型服务,是传统定题服务在网络环境下的一种再现,它包括由智能软件完成的全自动化的信息报送服务,以及借助于电子邮箱、并依赖于人工参与的信息推送服务两大类。一般先由用户向系统输入自己的信息需求,包括用户的个人档案信息、用户感兴趣的信息主题等,然后由系统或人工在网上进行针对性的搜索,最后定期将有关信息报送至用户主机上。这里突出的是信息的主动服务,即改“人找信息”为“信息找人”,通过邮件、“频道”报送、预留网页、寻呼机等多种途径送信息到人。另外还包括用户网上图书预约、预约查询、用户信息检索、全文传递等业务。
2.如何开展个性化信息服务。个性化信息服务是一种服务理念和原则,是图书馆在推崇“个性化信息服务”时,从前期的资源采访到后期的资源整合都应全程贯彻的服务理念。图书馆实现个性化信息服务主要从以下几个方面开展:
(1)用户个『生化需求分析。个性化信息服务是针对用户的个性化需求提供的服务,图书馆必须事先了解和分析用户的需求。根据图书馆发展计划,对用户的抽样问卷调查、电话采访、专家咨询等人工调查结果,也可以利用数据挖掘、联机分析处理等先进的信息技术对图书馆Web日志进行分析处理,获取用户的浏览模式和需求信息;然后将这些用户信息进行综合分析、归并,从而获取多粒度的用户个性化信息需求信息,为图书馆进行多粒度个性化信息服务提供依据。
(2)用户的资源需求的采访。影响图书馆资源采访决策的因素很多,如资金、用户需求、专业分布、当前热点、重点学科建设等,其中用户需求又是资源采访决策所需考虑的重中之重。要综合考虑以上众多因素,可以结合用户群和用户需求来定性、定量地考虑采访资金的分配和资源的分配。
(3)参考咨询工作的开展。从参考咨询的角度可以将图书馆用户的需求大致分为书目检索型、数据检索型、比较研究型、决策研究型等。图书馆参考咨询工作的内容和质量对个性化信息服务工作有着很大的影响。由于每个用户的需求各不相同,参考咨询馆员不可能满足所有人的个性化需求,工作的重心肯定有所倾斜。
(4)网络服务的形成。网络服务在现代化图书馆中最能体现用户的个性化信息服务。由于海量信息的出现和用户个性化需求的突出,利用先进的人工智能、信息整合技术和检索技术从图书馆数字化资源的整合、网页设计、功能设计等可以提供针对具体个人的某些个性化需求的信息服务。具体体现于:
一是数字资源的布局。数字资源的整体布局既要满足细粒度用户群的个性化需求,也要考虑到拥有众多用户群的个性化需求,即要遵循多“层次”个性化信息服务的原则。”层次”度用户群是一个动态的概念,不同时间周期可以产生不同的信息寻求群体;为此,数字资源的布局要具周期性、时效性、专指性。
二是数字化服务功能。针对单个用户的个性化服务通过人工智能等信息技术,可以为用户定制当日公告、个人热点链接、参考书架、书目数据库、电子期刊、最新的期刊目次与国际上有关本学科、本课题研究前沿和进展情况等。网上书籍目标(bookmark)服务系统,可以实现用户随意访问和管理自己的网上书籍目标系统,并随时共享他人的优秀网上书籍目标,而无需受操作系统、浏览器、甚至终端的限制,采用聚类的方法、根据匹配度来为用户提供个性化服务。
3.“同类型”用户群的个性化服务。相邻学科的用户往往有类似的信息需求,如重点学科信息资源、专题信息,或某一时间段内一群用户有类似的信息需求,如考研信息等。不同用户群的个性化信息服务,将会涉及信息资源的重组。由于重组后的资源来自不同的数据库,具有较强的专业性,因而它具有较广的知识面。
(1)实现资源重组首先要进行信息发现。帮助用户从大量的信息集合中找到与给定查询请求相关的相当数目的信息子集。这需要通过开发有效的信息发现工具来实现,同时要求图书馆员不仅能够帮助用户选择信息、评价信息,并与信息网络取得联系,还应具备较强的知识分类和知识组织技能。真正实现个性化服务,还必须建立统一的数据格式标准,对无序的、交叉的数字资源进行重组,把相同学科或专业,来自不同的数据集成商的数据重新组成一个新的数据库或镜像数据库,提供统一的用户界面,根据用户的需求提供相应的资源,生成用户自己的数字图书馆。
(2)吸引用户,挖掘用户潜在的信息需求。个性化信息服务的提出,最大限度地增加用户对图书馆信息资源的利用,并通过用户的反馈信息,加强图书馆的自我校验和完善,从而优化服务,提高信息服务的附加值。
(3)为用户提供多层次、多元化的个性化信息服务。图书馆的个性化信息服务并不能针对所有用户的每一个需求提供相应的服务,而应在了解分析用户的个性化信息需求的基础上,进行信息服务。图书馆进行个性化信息服务是一种服务理念、一种服务策略;是为图书馆的采访决策、数字资源建设与功能设计、参考咨询服务、图书馆布局等提供一个理论依据;避免因为考虑针对所有用户的每一个性需求提供相应的服务因素,而产生无序的结果。最终目标是为广大用户提供多层次、多元化、个性化信息服务。
(三)用户评估界面
1.对数据挖掘发现的模式进行解释和评价,过滤出有用的知识。
2.利用可视化技术将有意义的模式以图形或逻辑可视化的形式表示,转化为用户可理解的语言。一个成功的数据挖掘的应用应能将原始数据转换为更简洁、更易理解、可明确定义关系的形式。
3.利用统计方法对模式进行评价。解决发现的结果与以前知识的潜在冲突,利用统计方法对模式进行评价,决定是否需要返回数据挖掘模块,重复以前的操作,以得到最优、最适合的模式。
4.在预测未来中进行决策制定。数据挖掘抽取的信息经过事后处理可用于解释当前或历史现象,预测未来可能发生的情况,使决策者参照从过去发生的事实中抽取的信息进行决策制定。
二、用户研究的方式和方法
数字图书馆的用户研究,大致包括用户信息收集、用户信息分析、开发相应技术、提供特定服务几个环节。各个环节都以高新技术为支撑,大量使用计算机处理技术、人工智能、专家系统等来完成工作。
(一)用户信息收集
用户信息收集是用户研究中最基础、同时也是最重要的环节。现在数字图书馆收集用户信息的最常用方法是通过用户注册来收集,用户在注册时,提交自己的姓名、年龄、学历、职业、工作单位等信息。数字图书馆根据这些信息,建立用户数据库。数字图书馆还可以通过用户行为日志来收集用户信息。数字图书馆跟踪用户在本馆查询信息的全过程,以此了解用户的阅读兴趣和所需信息的内容,掌握用户信息利用的一些规律,然后将这些信息追加到个人信息库中。同时,数字图书馆还要注意收集用户反馈信息,专门设计一些表单将用户的意见、建议等信息及时统计上来。现在的一些数字图书馆收集用户信息时设计的注册信息表单过于简单,内容与一般网站几乎雷同,难以判断更深层次的用户信息。应对此加以改进,使注册信息能够体出用户信息需求的特点。同时要增强注册表单的交互,通过数字图书馆与用户之间的相互交流,把双方所需信息的特征都充分表现出来,帮助图书馆收集到更为完整、准确的用户个人信息。
(二)用户信息分析
对收集来的用户信息必须进行及时、充分、细致分析,才能得出规律性的认识。由于数字图书馆用户数众多,类型各异,对用户进行分析的工作量非常巨大,要充分利用人工智能、专家系统等应用技术,将工作做深、做细。
(三)加强服务技术的开发,提高服务水平
用户信息的收集、分析以及信息提供,都要依靠一定的技术来支持。这些技术包括两类:一是用户信息的收集和分析技术;二是用户信息服务技术。目前的趋势是把这两种技术结合在一起来开发,提出个性化服务技术、交互式网上咨询服务技术以及基于推送技术的最新报道服务等。但这些方式还只是刚刚起步,效果如何,还有待于实践的进一步检验,要不断开发新技术,不断提供新服务,使图书馆提供的信息能更好地满足不同用户的需要。
三、用户行为分析及信息挖掘模型的设计
由Intemet的开放性所决定,电子商务网站会得到大量原始数据,其中包括重要的信息——客户(用户)行为信息(CustomerBehaviour Information)。通过在Web上应用各种信息分析技术,企业可以根据这些信息分析和预测客户行为,做到针对不同顾客提供个性化服务,改善网站结构,提高Web站点的效率。同时,利用有效的顾客信息还可以大大降低企业的运营成本。在当前的信息分析技术中,数据挖掘技术是最具有应用前景的一种技术。
(一)数据挖掘
数据挖掘是指按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。
1.数据挖掘又是一种决策支持过程。它主要基于人工智能机器学习、统计学等技术,高度自动化地分析企业原有数据,做出归纳性推理,从中挖掘出潜在的模式,预测顾客的行为,帮助企业决策者调整市场策略,减少风险,做出正确决策。
2.从功能上划分,数据挖掘的分析方法主要可分为关联分析、序列模式分析、分类分析和聚类分析等。在一个实际的数据挖掘系统中经常是综合地利用这些方法。
(二)数据挖掘技术在分析用户行为中的应用
1.数据挖掘技术可以科学地把握消费者的消费行为和消费心理。网络环境和网络营销不但带来了商业流通领域和商业运行模式的革命性变化,而且还影响了买方市场下消费者购买行为的变化,消费者直接参与生产和商业流通循环,消费者的选择范围比以前更大,消费行为更加趋向理性化和主动化。在电子商务中,消费者无论是从心理上还是行为上,都发生了巨大的变化。对一个开展电子商务的企业来说,如何把握消费者的消费行为和消费心理,直接关系到企业网上经营的成功与否,这对企业分析消费数据提出了新的要求。作为一种新的商业信息处理技术,数据挖掘技术的主要特点正是对商业数据库和服务器日志中的大量数据进行抽取、转换、分析和模型化处理,从中提取辅助商业决策的关键性数据。因此,数据挖掘技术在对客户行为的分析和研究上,具有广泛的应用前景。
2.使用数据挖掘技术可以确定用户的浏览模式。通过使用数据挖掘技术对商务数据进行分析,可以得到以下信息:
(1)电子销售商可以获知访问者的个人爱好,更加充分地了解顾客的需要,可以发现顾客的购买模式和访问者的浏览模式,决定网站上访问者到购买者的转化率,还可以决定顾客的“回头率”,根据顾客的资料分析潜在的目标市场。
(2)企业也可以了解顾客的价值,通过区分高价值顾客和一般顾客,对各类顾客采取相应的营销策略;利用数据库的资料,计算顾客生命周期的价值,及发现什么样的顾客群在网站上购买什么商品。再次,根据顾客的历史资料不仅可以预测需求趋势,还可以评估需求倾向的改变,为顾客提供更好的服务。另外,企业通过理解访问者的动态行为来优化电子商务网站的经营模式。
3.数据挖掘技术可以确定特定消费群体或个体的消费需求。对涉及消费者消费行为的大量信息进行收集、加工和处理,企业就可以确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,其作用主要体现在以下几个方面:
(1)对于日志及顾客资料数据库等的分析结果有助于企业确定顾客消费的生命周期,针对不同的产品制定相应的营销策略。
(2)对那些要通过WWW发送广告的企业,分析用户访问模式有助于有针对性地在某些用户经常访问的地方插播广告条。这样,根据这些信息,网站的建设者就可以针对特定的顾客群提供个性化广告服务,这种广告要比泛泛的、随意的广告有价值得多。
(3)在强大的数据挖掘技术与全面的顾客资料数据库的基础上,企业可以根据各个细分市场,甚至是每一个顾客的独特需求来为他们设计“量身定造”的产品。高度细分化、定制化的产品有利于提高顾客满意度,巩固与他们的长久关系,最终达到留住顾客的目的。
(4)优化Web站点。网站的设计者可以不再完全依靠专家的定性指导来设计网站,而是根据访问者的信息来修改和设计网站。根据分析结果可以找出如何优化一个网站组织结构的策略,还可以确定预传哪些页面到客户端,从而提高网站的效率。
(5)针对顾客设计个性化网站。利用数据挖掘工具,电子商务网站可以做到以顾客需求为导向,达到“一对一”行销的目的。在这个阶段,网站已改变原有的千篇一律的信息传递方式,强调信息爪性化,亦即顾客所得到的信息将是网站针对其个人喜好、需求与特点的设定所给予的,也就是符合顾客的个人信息需求。如顾客可以到一些新闻网站上去订阅他喜欢看的信息类别,如政治新闻或科技新闻,当使用者下次再拜访此网站时,网站就会智能地只显示出该顾客所喜欢观看的信息。
(三)用户行为分析的工具设计和实现
1.客户行为分析的综合分析工具。它包括:数据来源,系统框图;主要功能模块包括:数据预处理模块、数据挖掘模块、用户评估界面和方法驱动模块。
(1)数据来源分析。在对电子商务网站进行数据挖掘时,所需要的数据主要来自于三个方面:Web服务器中的日志文件,Web服务器中的其它信息,以及客户的背景信息。