Currently set to Index
Currently set to Follow

谷歌学术(Google Scholar)在科研中的正确用法

在研究生中,流传着一个撰写英文论文的科研五步曲:1步,用谷歌学术(Google Scholar)找文献;第2步,用Cite It for Me(或EndNote)编制参考文献;第3步,用DeepL(或有道)翻译器;第4步,用Grammarly查语法;第5步,用Quillbot查重。还有研究报道,某校竟然有80%的研究生使用谷歌学术查找文献,而只有10%的研究生使用文献数据库检索资料。人们不禁会问:谷歌学术与文献数据库究竟有什么区别?什么时候应该使用谷歌学术?

虽然谷歌(www.google.com)和谷歌学术(scholar.google.com)的网页目前在中国大陆经常会遇到访问困难的障碍,但是很多国内的科研人员和学生仍然非常怀念这两个功能强大的搜索工具,因为很多人基本是依靠着“中文搜百度,外文搜谷歌”的习惯长大的。谷歌是目前全球最大的搜索引擎。谷歌公司自1998年创立以来,在信息技术方面不断创新,其中谷歌学术(Google Scholar,简称GS)于2004年发布,用户能够免费使用。它基于庞大的互联网网页信息,检索汇集全球各种语言的学术资源,以简约的条目排列,显示标题、作者、刊名、年代、文献来源的机构网址、摘要、被引用次数、版本数量等内容,包括论文、专业书籍、预印本、摘要、技术报告等学术文献。谷歌学术抓取的学术资源主要来自学术性商业数据库、学术出版社、大学、科研机构、政府、预印本数据库、开放的机构知识库等网络学术资源。

谷歌学术与谷歌在搜索时的区别是前者能够根据谷歌学术制订的收录标准自动剔除非学术内容,而后者则包括大量非学术内容。而且,谷歌学术与众多学术文献出版商合作,加入了很多普通搜索引擎(例如谷歌)无法搜索到的加密内容,并要求合作者至少免费提供文献的摘要。

目前从中国大陆能够访问谷歌学术的网站包括http://scholar.scqylaw.com在内的一批镜像网站(https://www.zhihu.com/question/27568949)。检索时如果不使用双引号将多个词或字括起来,谷歌学术则将词之间的关系视为“或”,将检出大量结果。如果使用双引号,则视为严格不可拆分的词间顺序关系,检出的结果会较少。检索结果包括文献的标题、作者、被引用次数、相关文章、版本数量、下载地址,能够按照年份或是否综述型文章进行细分,能够按照日期或相关度排序,还能够选择是否包括发明专利。如果按照作者姓名检索,谷歌学术会先列出该作者撰写的作品,然后列出提到该作者名字的他人作品。

免费和全面是谷歌学术的两个最大优点。任何人无需订购文献数据库,即可免费在互联网上使用谷歌学术,无须注册、登录之类的烦琐手续。如果需要快速汇集自己、某个作者或某个领域的全部作品(包括论文、专著、发明专利)并查阅被引用次数,使用谷歌学术是最为方便的。虽然并不能保证绝对的完整,但是相比于使用多个文献数据库逐个检索再汇总的做法,谷歌学术还是非常值得一试的首选方法。

权威性筛选困难和检出文献过多是谷歌学术的两个最大缺点。对于某个科研方向,人们在很多时候并不需要检索出浩如烟海的文献,而是希望用最少的时间获得最权威的少量精品。诸如Web of Science(含SCI数据库)的文献数据库能够依靠严格的收录标准或专家审核选择收录论著,并且能够根据很多细化检索标准进一步筛选检出的文献,而谷歌学术则无法做到这两点。谷歌学术检索出的文献是良莠并存的,甚至包括未经同行评议的文献。虽然谷歌学术能够按照某种基于被引用次数、期刊档次、作者知名度等因素制订的排序标准或学术价值对检索出的文献进行排序,但是这种排序标准是不公开透明的,其排序的准确性和公正性也是令人质疑的。一般来讲,谷歌学术在文献的查全率、查准率、漏检率、误检率、新颖率、标引深度上也均不如文献数据库。

由于一个人的论著数量通常比较有限,使用谷歌学术完整检索某个作者的作品是最为有效的。相反,由于一个学科领域的论著数量通常非常多,使用具有不同收录质量档次的文献数据库检索作品是最为有效的,这样能够最快和最方便地找到权威精品。因此,谷歌学术与文献数据库是互相补充的关系。

我国在图书馆学领域针对谷歌学术开展过一些研究,包括谷歌学术与文献数据库在学术搜索性能测评方面的对比、谷歌学术对图书馆的冲击、谷歌学术指标与影响因子的对比等。比较重要的论文有以下4篇,值得深入学习:

  • 董文鸳,我国谷歌学术搜索研究综述,新世纪图书馆,2011年,第9期;
  • 张宇娥,刘静,李世兰,Google scholar对文摘数据库的冲击,四川图书馆学报,2011年第3期,总第181期;
  • 许广奎,涂志芳,两类学术评价指标比较研究——以影响因子和谷歌学术指标期刊评价为观察视角,图书情报工作,2017年2月,第61卷,第3期;
  • 郭海鸥,谷歌学术计量指数分析及其应用,河南教育学院学报(自然科学版),2017 年12 月,第26卷,第4期。

谷歌学术指标(Google Scholar Metrics)是谷歌从2012年推出的一项功能,根据期刊的引用情况计算排名,引入h指数、h核心和h中位数这三项计量指标,每年发布一次,公布英、中、葡、德、西、法、日、荷、意等9种语言的期刊的h指数前100位的排名情况。因此,很多期刊以能够位列h5指数或h5中位数排名的前100名为荣。所谓的h5指数是指某期刊在过去5年内发表的论文中,至少有h5篇论文每篇引用不少于h5次。例如排名最高的《Nature》期刊,在2011年至2015年的h5指数是379,表示该刊共有379篇论文的引用次数不少于379次。所谓的h5中位数是进入h5指数的所有论文的引用中位数。例如《Nature》的h5中位数是560次,表示在进入统计的这379篇论文中,论文引用次数的中位数是560次。

综上所述,无论从收录排序标准还是从期刊评价指标上,谷歌学术与文献数据库代表了两大类颇为不同的检索方法,科研人员应当了解它们之间的异同点和优缺点,做到按需妥善使用。

Researchers Poll

大学在研究和学术写作中应该采取什么立场?