-
文献引文分析利器
HistCite
详细使用教程
p>
一款非常强大的引文分析工具,可以快速绘制出某个研
究领域的发展
脉络,快速锁定某个研究方向的重要文献和学
术大牛,还可以找到某些具有开创性成果的
无指定关键词的
论文!如果你选修过中国科学技术大学罗昭锋老师的《文献
管理与信息分析》
,那么你一定不会对
HistCi
te
感到陌生,
这是一款非常强大的引文分析工具,可以快速
绘制出某个研
究领域的发展脉络,快速锁定某个研究方向的重要文献和学
术大牛,还可以找到某些具有开创性成果的无指定关键词的
论文。
如果说一次引用表示给你的文章投一票,那么并不是所有票
都有效,只有相同领域文章的引用才能真正体现你在这个领
域中的实力。所以在
Web of Science
(以下简称
WOS
< br>)
上按照被引次数倒序排列,越靠前不一定就越重要。还有一
种情况,你发明了某种材料,但是后来名字变了,之后的文
章使用的关键词都是新名
字,别人搜新名字的关键词是搜不
到你的开创性文章的,但是很显然你的文章是非常重要
的。
通过
HistCite
可以直观的看出这个研究领域的论文全部引
用了你的文章,可以体现你
的文章的重要性。
好了,
下面开始使
用这个工具。
首先要了解一点,
HistCite
这
款软件是
Thomson Reuters
(汤森路透)公司开发的,和
WOS
是一家公司,所以
HistCite
只支持
WOS
数据库,
对于
Scopus
等数据库则无能为力,
不过
Github
上面有人
写了一个可以将
Scopus
导入
Histcite
进行分析的脚本
—
—
Scopus2Histcite
,有兴趣的同学可以去试试
看。
2016
年
10
< br>月,汤森路透知识产权与科技业务被
Clarivate
Analytics
(科睿唯安)公司收购了,从此
WOS
也是归该
公司所有,因此导出
的数据纯文本也发生了些许变化,从而
不能直接导入
HistCite
进行分析。
不过别
担心,
HistCite Pro
完全兼容新的文件格式!
打开
WOS
,
注意数据库要选择核心合集
(
Core
Collection
)
!
例如简单检索一下石墨烯在锂离子电池负极中的应用:
检索结果不是太多,可以全部导出,如果文献太多的话,可
以先按照被
引频次降序排列,
只导出前
2000
篇
就差不多了。
下面开始导出文献信息,点击页面上的【保存至
Endnote
Online
】
p>
按钮右边的下拉按钮,
选择
【保存为其他文
件格式】
。
在弹出的菜单中,记录数
填写
1
到
500
,因为每次最多只能
导出
500
篇文
献,所以上面的
2819
篇文献需要分成
6
次导
出,后面导出的时候依次填写
501
到
1000
、
< br>1001
到
1500
等等。
p>
。
。记录内容选择【全记录与引用的参考文献】
,文件
格式选择【纯文本】
,然后点击发送即可得到导出的
txt
文
件,类似可以导出其他
5
个。注意:含
500
个记录的
txt
文
档一般是
3M
左右,如果你的只有几百
K
,请仔细按照上面
这张图进行导出!
!
!
下面使用
HistCite
来分析这
6
个
txt
格式的引文数据文件。
由于
HistCite
多年不更新,现在存在各种
Bug<
/p>
,比如直接
打开
HistCite
,
一加载文件就报错:
No such file or directory
。
对于这种情况,你可以选择在
C
盘根目录下新建
fakepath
文件夹,然后将全部的
txt
文档复制到里面,再打开
HistCite
来进行加载,但是仍然会遇到下面
Format
Unknown
的问题。
尝试第二种方法。选中所有的
txt
文件,然后拖到
HistCite
的图标上,放开鼠标,果然自动打开了软件。
但是,
事情好像并没有那么简单,
又出现了一个报错:
Format
Unknown
。
最后,在罗老师的指引下,我将每个
txt
文件的第一行中的
Science
改成了
Knowledge
。
然后再将
txt
文件拖放到
HistCite
图标上面打开,终于成
功加载了!
<
/p>
可以看到
2819
篇文献信息全部加载进
来了。
在受到这么多折磨之后,
我用
Python
开发了一个方便使用
的
脚步,于是一个以
HistCite
源程序为核心的精简易用免
安装版本问世了,就叫
HistCite Pro
吧。
由于
HistCite
源程序只支持
Windows
系统,
所以
Pro
版
本也只能在
Windows
下使用!你只需要下载
HistCite Pro
的压缩包(下载链接见文末)并解压(建议解压到
C
盘或
者
D
盘的根目录下,
保证路径中不含中
文)
,
就可以直接用,
不需要安装,同
时去掉了很多没用的文件,大大缩小了软件
体积。
对于从
WOS
上导出的
txt
数据文件,
不用做任何修改,
只要把全部的
< br>txt
放到
TXT
文件夹里面,然后双击
即可一键完成加载,非常方便。
好了
,
数据加载完毕,
下面开始分析数据吧,
点击
Tools
菜
单下的
Graph Maker
。
在弹出的页面上点击
Make
Graph
即可得到一张引文关系
图,包含了最有价值的前<
/p>
30
篇文章的完整引文关系。
这张图看起
来不是很清楚,在左边的
Size
选项中选择
< br>
Full
模式,重新绘制一张高清图,然后右击图片
“另存为”一张图
片即可。图上有
30
个圆圈,每个圆圈表示一篇文献,中间
< br>的数字是这篇文献在数据库中的序号。圆圈越大,表示被引
用次数越多。不同圆圈
之间有箭头相连,箭头表示文献之间
的引用关系。
多数情况下,
你会看到最上面有一个圆圈较大,
并有很多箭头指向这篇文章。
那么这篇文章很可能就是这个
领域的开山之作。
通过我绘制出的这张关系图,
我们发现标号为
29<
/p>
、
49
、
56<
/p>
、
60
的四个大圆圈非常显眼,
可见这四篇文献的被引次数都是
非常高的,我们对全部文献进行按照
p>
LCS
排序,发现前四
位刚好就是这
4
篇文献。