(3)齐夫定律(Chive’s Law)。齐夫定律是在不同学者的互补基础上形成的。齐夫定律研究了符荷信息的基本单元,词汇的选择、使用及出现的频次对信息的影响,从数学的统计角度研究了信息的分布问题,是对自然语言的语言词汇进行统计后得到的规律。在齐夫定律发表以后,美国学者朱斯又针对齐夫定律存在的“纯粹经验”的问题,提出了双参数等级分布定律。数学家曼德尔布罗进一步运用信息论原理和概率论方法,研究了词频分布,用三参数修正了齐夫定律,即:将词视为有一定顺序的字母序列,把语言和利用模拟或数学公式表达形式的编码加以比较;将句子看成是用词表示的编了码的序列;将文章视为是由句子的增减过程而形成的句子系列。齐夫定律研究的对象是英语的语言词汇得出的结论,适合于拉丁语系。20世纪80年代中期以来,,我国学者进行了卓有成效的研究,提出齐夫定律完全符合汉语语言词汇的分布。
(4)洛特卡定律(The IJaw 0f Rotkar)。美国统计学家洛特卡经过大量的统计和研究,1926年在美国著名的学术期刊《华盛顿科学院学报》上发表了名为“科学生产率的频率分布”的论文,揭示了对发表论文、著作的统计去探明科技工作者的生产能力及对科技进步和社会发展所做的贡献。到1949年,这一研究随着信息技术的发展引起了学术界的关注和重视,并且被誉为“洛特卡定律”。
(5)普赖斯定律(The Law of Pulaise)。在洛特卡定律的启示下,普赖斯研究某一特定领域中,全部论文的半数是由该领域中全部作者的平方根的那些人撰写的,那些人撰写的人无疑是该学科领域的核心和高产作者;进而提出了核心生产者分布的“平方根定律”。
(6)在洛特卡定律和普赖斯定律的基础上,还有一些学者提出过描述文献信息生产者分布规律的研究成果。所有这些成果的共同特点是:其一,这些成果所揭示的信息学规律,都揭示了少数信息生产者生产了大量的信息、体现了知识生产的规律和特点,充分显示了马太效应的作用效果。其二,这些成果所揭示的信息学规律,都是用数学方程式表示的,这既是对研究对象的量化过程,也显示了在研究信息资源及分布中的数字化特征和表述方式。
(二)信息资源组织的理论研究
在信息被视为与物资、能源、资本、劳动力等同的基本经济资源的同时,包涵着信息资源的开发利用、获取和信息资源的积累、效应的信息资源管理(IRM—Information Resource Management)研究引起世界各国政府和学者的普遍关注和高度重视,已经成为国内外的研究热点。
1.信息资源的开发利用研究。对于信息资源的开发利用研究,已经形成了系统性的理论研究框架,国内外学者已经达成共识,将信息资源的开发利用研究区分为广义与狭义理论界定。
(1)广义信息资源的开发包括:信息本体开发,信息技术开发,信息系统建设,信息设备的制造和信息机构的建立,信息规则设定,信息环境维护,信息人员的培养等方面。
(2)信息本体开发:是一种狭义的信息资源的开发理论,它仅仅指信息本体开发,这种理论在应用领域具有一定的对应性,因而被普遍应用。主要包括:信息生产,信息表示、搜集、整理、组织、存储、检索、重组、转化、传播、评价、应用、分解信息资源的开发利用研究中,与应用领域的甄别是,众多学者从逻辑审视的角度出发,认为广义的信息资源的开发利用包括了狭义的信息资源的开发利用的概念和相关内容及定义。
2.信息资源的获取研究。信息资源的获取或者是信息采集,已经成为实现信息管理的首要环节,由于信息种类繁多、分布广泛、结构复杂,而且呈“爆炸式”的增长特征,在给信息资源的开发和利用带来极大困难的同时,也为信息资源的获取研究带来了挑战。尽管目前对于信息资源的获取研究尚未形成统一的、同一的、规范的理论模式和方法,但是已经取得的成果的理论共同性在于:
(1)对于信息资源获取概念的理论界定的一致性。信息资源的获取是根据用户的特定需求或信息管理工作者规划的需要,利用科学的方法和技术搜集、检索、整理、分离获取特定的信息资源的过程。
(2)信息资源获取的研究范围和对象、’目标的确定性。信息的分布和传播研究,学习资源的评价体系和选择研究,信息获取遵循的原则、方法、途径研究等。
3.信息资源的积累、效应研究。信息资源的积累、效应研究已经取得的成果表明,所有的理论都是建立在自然科学与社会科学、应用科学与理论科学、应用技术与实验创新的交融、交叉与融合中。研究主要集中在:
(1)关于信息的测度研究。信息的测度是研究信息资源的积累、效应实绩的一种量化的评估体系和标准,是从量的关系上来精确地刻画信息。国际上对于信息的程度和分析研究方法主要的有申农的信息测度,基于信息服务的信息测度。
一是申农的信息测度。信息论的缔造者申农在《通信的数学理论》中,从信息量的直观定义、自信息、信息熵、互信息的研究出发,导出了信息量度公式,为信息论乃至信息科学的创立和发展奠定了坚实的理论基础。他的信息测度方法是在引进概率理论和数理理论的基础知识中,创造性地将信息测度与对信息的不确定的消除联系起来,提出的可能性测度(Probability)、不确定性测度(Uncertainty)测度,或熵(Entropy)的测度,将人类对于信息的认识和测度理论推向了新的高度,是信息的测度理论起到了质的飞跃。
二是语义信息测度。在申农的信息测度的理论启迪下,对于信息测度的研究出现了新的热潮。1953年,希勒尔(Y.Bar Hillel)和卡尔纳普(Rudolf Camap)提出了处理信息的意义的信息测度方法,他们的信息测度公式与申农的信息测度熵的测度公式很相似,其发展和理论突破在于以内容测度取代了申农的理论的不确定性因素,更加接近语义信息的本质。
三是基于信息服务的信息测度。美国学者萨克利夫(TagueSutcliffe J)在1995年出版的《可测度的信息:信息服务透视》①从信息服务环境中用户与信息记录的交互作用的角度提出了信息测度方法,强调信息记录对信息用户的效用,是一种对应于用户的信息需求或兴趣的信息记录的信息度顺序的测度方法。萨克利夫的信息测度方法是通过对信息度的测度与比较,将信息度的信息记录从用户对信息的需求或兴趣相关的信息记录集合中甄别出来,谋求解决用户与信息记录、交互作用过程中信息量的测度问题。最终目的是提高信息服务的质量和效果。
(2)关于信息化水平的测度研究。对于信息化水平的测度,主要有马克鲁普测算法、斯托尔尼测算法、波拉特测算法,我国学者提出的综合力度测算法。
一是马克鲁普测算法。美国著名经济学家F.马克鲁普(FrilzMarchlup)在采用“综合法”对美国的知识产业的统计资料进行研究和测算中,提出的对信息化水平的测算理论。其理论具有实证性和极大的实践意义。在马克鲁普测算法的理论指导下,许多学者在对信息经济、信息产业、信息资源的进一步深入研究中,提出了有价值、有影响的信息测算法。如:斯托尔尼测算法,日本学者小松峙清介的信息化指数法。
二是信息化指数法。在西方关于信息化水平的测度研究的推动下,日本学者小松峙清介在研究社会信息设施装备水平和信息能力反映社会信息化水平和程度中,提出了信息化指数法。
①Tague-Sutcliffe J:《Measuring information:an information seHices perspective》,San Diego:Academic Press,Inc,1995.信息化指数法确定了一套科学的指标。
信息化指数法得到世界许多学者和信息实用结构机构的认可和使用,原因是:设立的参数集中、明晰,指标统计、索取容易方便;变量参数较少,计算比较简单,极高的可操作性和对比性;在基年确定后,可以在辑取完整、连续的时间序列数据后,对社会信息化的发展程度和进度做出趋势性的预测和判断。
三是波拉特测算法。马克·波拉特(Mark Paulate)以马克鲁普测算法为基础,吸收丹尼尔·贝尔(Daniel Bell)的“后工业社会化”的思想,将信息化指数的范围扩展到全社会的信息活动,把第一、第二、第三产业中的信息与信息活动分离出来构成独立的信息领域,进一步对美国的信息经济、信息产业采用最终需求法、增殖法和投入产出法进行了定量测算。波拉特的工作为定量研究信息及相关活动提供了一整套可操作的方法,引起了人们的普遍关注和重视,世界各国学者都相继利用波拉特测算法的方法和指标体系对各自国家和地区的信息和系活动进行测算。
(三)信息资源管理的理论研究
信息资源管理(Information Resource Management,IRM)已经发展为一门独特的研究领域,经过世界范围众多学者的努力使这一领域已经有了明确的研究对象、目标、任务和内容。虽然研究的切入点不同,表述方法各异,但是共同点在于:都是研究信息的管理者或使用者为了达到预期和确定的目标,运用现代化的信息处理和管理手段去研究信息资源在经济生活和其他活动中的利用规律,并且依据这些规律对信息资源进行组织、传输、规划、协调和控制的科学活动。从总体看,对于信息资源管理的研究主要集中在两个领域:信息资源的管理研究,以及信息资源保障机制研究。