作者h指数与作者被引次数间关系的实证研究

时间:2024-12-27 00:40:26 来源:作文网 作者:管理员

[摘 要] 为了理解在不同学科中作者的h指数与被引次数的关系的变化情况,对图书情报、数学、材料科学、基础医学、金融、心理学以及政治学领域的作者的h指数与被引次 ☺数之间的关系进行了分析,两者之间幂律关系中所存在的差异应当与学科的发展阶段、理论性或者是应用性的倾向有关,另外作者的h指数与被引次数的最大值之间的正相关性与学科的学术规模也有关联。

[关键词] h指数;被引次数;幂律;不同学科

Abstract: In order to understand the variation of the relationship between author’s H index and citation counts in different disciplines, the relationship between the author’s H index and citation counts in library information, mathematics, material science, basic medicine, finance, psychology, politics and other disciplines was analyzed, the diversity existed in their Power Law relationship should be related to the development stage of the discipline, its theoretical or applicable tendency. In addition, the positive correlation between the author's H index and the maximum number of citation counts was also linked to the academic scale.

Keywords:H index;citation count;power law;different disciplines

1 引言

学术论文是科学研究成果的重要表现形式,在对作者学术影响力的评价方面一直为科学界,尤其是科技管理界所关注,例如科技人员的学术成就和对学科的贡献可以采用传统的发表文献的数量、文献的被引次数等指标¿,以及建立相应的评价体系来进行衡量。

2 数据的获取与拟合

2.1 数据来源

本文首先选取了图书情报学作为研究对象,在CNKI数据库中所分类的研究方向为“图书情报与数字图书馆”中,统计了截止到目前发表文献量以及被引次数较多的前50位学者(按发表文献量排序),并在CNKI的引文数据库中得到这些作者的h指数,进一步建立作者的h指数与作者的总被引次数的关系图如图1所示,其中给出了两者的拟合关系,并给出了相应拟合关系的判定系数,其中横轴为作者的被引总次数,纵轴为该作者的h指数。对于其他学科例如自然科学类、工程技术类以及人文社科中的其他学科的情况,采取了相同的处理方法。

2.2 数据处理

笔者在统计的过程中,注意到高被引次数的论文中有作者重名的情况,由此可能会导致统计结果的不确切,为了减少数据不准确所引起的偏差,在生成散点图以及趋势图时,作者重名情况未包含在内。

2.3 数据拟合

用相同的方法研究人文社科领域,是为了进一步分析了人文社科中除图书情报学领域之外的其他分支学科,从而进一步验证上述的幂函数关系,分别选取了金融学、心理学以及政治学这三个学科作为代表来进行考察。金融和心理学两个学科的发展较为迅速,发文量和引文量都达到较高水平,作为应用性较强的人文社会学科,其h指数和作者被引之间也能够呈现出一定的相关性。其中金融学中y=0.246x0.599(R2=0.833),心理学y=0.443x0.532(R2=0.814)。

选取政治学的原因是注意到该领域的学科边界相对比较明确,从而作为一个特殊对象进行考察,事实上,与边界相对模糊的学科相比,这种学科界限的明确性也使得该领域以及与该领域相关的论文绝对数量以及论文的总被引用次数都会相对有所下降,因而在统计结果中,由于学科自身的发展状况等因素,有可能暂时无法明确体现作者h指数与作者的总被引次数之间的一般性规律,实际结果表明,h指数与总被引次数表现为弱的幂函数相关性,其中判定系数仅为0.567,结果如图2所示。

所以,这是否能够说明,考虑到学科的不同发展阶段以及学科边界等因素,作者的h指数与作者的总被引次数之间的关系不仅仅表现为已有研究中所得到的幂函数关系,甚至能够反过来利用两者之间的关系来对学科的性质及发展状况进行表征。

3 结果分析与讨论

3.1 作者的h指数与总被引次数之间的拟合关系的确有学科影响因素

3.1.1 拟合系数a与b对学科因素的敏感程度不相一致。数据拟合结果表明,在作者的h指数与作者的总被引次数c之间能够呈现出一定的幂律关系,并且幂指数b大于0小于1,这表明论文总被引次数C的增量对于h指数的增长具有效应递减的规律,但是针对不同的学科又会表现出一定的差异性。能够注意到大部分学科幂指数b在0.5左右,而系数a存在较大的差异性,因此,我们初步估计对于不同的学科,作者的h指数与作者的论文总被引次数之间的这种幂律关系应当能够反映不同学科的属性,假定用A表示学科因子,那么应当有h=acb=a(A)cb,其中a是A的函数,这样从直观上,不同学科的h指数与总被引次数的关系不能直接进行比较,或者需要对两者之间的关系进行学科归一化处理之后才能进行比较,相关的研究包括,尝试创建期刊h指数的归一化换算公式,试图将不同领域的期刊的h指数进行归一运算,以实现不同学科间h指数的比较[8]。

3.1.3 拟合系数a与学科的理论或是应用性的侧重程度有关。需要注意,作者的h指数与总被引次数之间的关系应当还与学科的理论或者是应用的倾向程度有关。或者说,在假定两者之间服从幂函数关系的基础上,则至少应当有A=A(t),其中t表示学科侧重理论性或是应用性的程度,从而t不同,反映为系数a也会有所差异,从直观上可以有这样的原因,例如论文的理论或应用的性质也会从时间上对h指数的增长速率有所影响ข,比如一般理论性质的文章可能会具有较长时间的引用期,文献的衰老速度较慢,而通常的工程技术类论文则偏重于实验技术与方法的创新,从而往往被引用的是该领域中前沿的技术知识,文献的老化速率则相对较快,而这些会直接影响到文献被引次数在文献中的分布以及随时间的变化关系,由此学科的理论或应用的倾向会对幂函数的系数,也即拟合函数的系数等产生影响,或者说作者的h指数与其总被引次数的关系能够对学科的理论或者是应用性倾向给予一定的反映。

3.2 作者h指数与作者被引次数的最值关系的学科影响

3.2.1 学科变量的选取。h指数与被引次数的关系随学科的不同会有所变化,还可以借助中间变量(相对于上述对两变量的直接拟合)来进行考察学科影响因素,例如研究人员的数量,该数值能够在一定程度上反映相应学科的学术规模以及活跃程度,在此基础上,分别考察在不同学科中的h指数与研究人数的关系,以及被引次数与研究人数的关系。由此,笔者整理了上述不同学科的作者h指数的最大值、作者被引总次数的最大值,以及各个学科的博导▼人数,用该人数大致反映该学科的研究人员的数量,并以研究人数作为横轴,h指数与被引次数的最大值作为纵轴,给出两者随不同学科的变化情况如图3所示,其中由于作者被引总次数最大值与h指数的最大值相比往往不在同一数量级上,所以采取将前者除以100以便进行比较,而且除以常数也不会改变被引次数与研究人数的关系,以及与h指数的比较。另外,在图3-1中,学科从左至右依次为政治学、图书情报学、心理学、材料科学、金融学、基础医学以及数学。

3.2.2 两变量的最大值随学科变化的趋势不相一致

由以上分析可知,h指数与论文总被引次数之间在不同的学科中大都存在着形如h=acb的关系,其中0 a与b不大于1说明了✿作者总被引次数c对于作者h指数增长的影响会逐渐减小。在不同的学科中,h指数与作者总被引次数之间的幂函数相关性会存在一定的差异,表现为拟合系数的差异,特别是a值的不同,这应当与学科的发展阶段、理论及应用的倾向有关。

另外,作为对h指数与被引次数关系的补充,对h指数与被引次数的最大值随不同学科的变化情况也进行了考察,其中变化趋势的不一致能够体现学科因素的影响,与学术规模偏低的学科相比,在规模偏高的学科中,h指数与被引次数的最大值可能会具有更强的正相关性。


热门排行: 教你如何写建议书