基于Web的化学化工数据事实型数据库评析
〔摘要〕该文介绍了化学化工等相关学科领域内常用的四个经典而重要的网络数据事实型数据库:Web of Science的化学子库、SciFinder、Reaxys、SpringerMaterials。分别对它们进行了数据来源、历史发展、收录范围等方面的简要介绍,并结合相同的检索实例:有机物蒽和无机物硫酸,使用了化合物分子式检索、化学结构检索等具有化学特点的检索方式,比较和分析了这4个数据库在检索途径以及所提供实验数据事实的数量、质量、种类等方面的共性和各自特点,并对该类型数据库的发展趋势作出归纳和预测。指出研究者应根据实际的实验需求,选取适宜的1个或多个数据库进行实验数据的查检和选用。
〔关键词〕化学化工;基于网络;数据事实型数据库;结构检索
〔中图分类号〕G254〔文献标识码〕A〔文章编号〕1008-0821(2014)06-0099-08
在化学化工相关学科的研究工作中,几乎每一个研究环节都与各种数据事实的检索密不可分。许多来自化合物及化学反应的各种宏观和微观数据,例如反应物的各种物理化学性质、化学反应的热力学和动力学数据,决定了必需的反应条件;新的产物生成,则需要进行各种检测,查找各种特征谱图与之对应,帮助确定特征元素和基团等等,小到反应试剂的购买,大到实验室安全,无不是随时需借助各种化学参考工具来支持实验的方方面面。从某种程度上来说,化学相关领域研究中,数据事实的查检决定了实验的成败。
在网络技术飞速发展的今天,化学化工类的数据事实型数据库正以其内容丰富、存储量大、检索方便、链接快捷等特点广泛使用于高校的化学化工类专业和科研机构中。本文将重点比较化学化工数据事实检索中Web of Science、SciFinder、Reaxys和SpringerMaterials 4个常用网络型数据库。
1各数据事实型数据库的基本介绍
1.1Web of Science
Web of Knowledge是美国Thomson Reuters公司开发的信息检索平台,Web of Science是该平台上的核心数据库,它是世界上有影响的多学科的学术文献文摘索引数据库,包含7个子库,其中有2个是化学数据库:Current Chemical Reactions和Index Chemicus,不但能提供文献信息,还能够为研究者们提供有机化学领域的数据事实。Current Chemical Reactions收录了1985年以来来自世界上化学领域的核心期刊和发明专利中新的一步或多步化学反应100多万种,提供翔实的反应综述,报导详尽的反应细节和条件;Index Chemicus则收录1993年以来世界上有影响专业期刊报导的新颖有机化合物,详细描述化合物的化学结构和相关性质,包括制备方法、生物活性、药理学研究等,数量超过260万[1]。
1.2SciFinder
SciFinder是美国化学文摘社的主要产品CA(Chemical Abstract)的网络版数据库,它不仅包括来自众多化学化工领域的文献信息,更重要的是它将来自化学化工文献中的各种物质和反应信息抽取出来,为研究者提供了大量的相关信息,成为化学化工领域权威的数据事实数据库。Scifinder中包含有6个数据库,其中2个是文摘数据库,4个是物质、反应等数据事实型数据库。数据事实型数据库中CAS REGISTRY是有关化学物质注册的数据库,是世界上最大最全的化学物质数据库,到2011年5月,已有超过6 000万个有机和无机化学物质、6 200万个生物序列登记注册[2]。该数据库除了提供化学物质登记号之外,还提供物质的系统命名、商品名、俗名、分子式、结构式、环数据,以及各种实验性质和计算性质、光谱信息。研究者还可以通过该数据库,定位到物质的商品信息和管制信息。
Reaxys数据库是荷兰的Elsevier公司在2009年推出的集检索和合成路线设计等功能于一身非常重要的化学化工领域的数据事实数据库。它是MDL Crossfire数据库的升级版本,不但将原有基于软件下载安装使用的客户端版本升级为直接基于浏览器的网络版本,而且在原有的两个主要数据库——Beilstein和Gmelin的基础上,增加了专利化学数据库。
Beilstein是世界知名的有机化学数据事实数据库,收录数据最早可追溯至1771年。其数据包含化合物相关的物理、化学等方面的性质;包含化学反应相关的各种数据;包含详细的药理学、环境病毒学、生态学等信息资源。Gmelin是世界知名的无机化学和金属有机化学数据事实数据库,其时间跨度从1772年至今;包含化合物详细的理化性质,以及地质学、矿物学、冶金学、材料学等方面的信息资源。新整合进来的专利化学数据库,收录了世界知识产权组织、欧洲专利局、美国专利局等专利信息。整个Reaxys的数据来源于精选的有机、无机以及金属有机领域的化学重点期刊、化学专利出版物,收录了2 800多万个化学反应和1 800多万个化合物,以及400多万条来源文献记录[3]。从该数据库中,既可以得到物质的熔点、沸点、临界参数、饱和蒸汽压、折射率、热容、摩尔蒸发焓等宏观数据,还可以得到分子偶极矩、电离能、键参数(键角、键长、键能)等微观数据。
1.4SpringerMaterials
SpringerMaterials是德国著名的科技出版社Springer公司推出的物理、化学、材料等科学与工程领域有关物质数值数据库。它是以经典的、具有Landolt-Bornstein丛书为基础,汇总了科学、工程所有领域最经典的物质数据。包括物理学、物理化学、地球物理学、天文学、材料技术与工程、生物物理学等,内容涉及相关科学与技术的数值数据和函数关系、常用单位以及基本常数等。Landolt-Bornstein丛书由德国施普林格出版社(Springer-Verlag) 于1883年开始出版。经过120年的发展,目前,LB已出版300多卷,成为一套以基础科学为主,系列出版的大型数值与事实型工具书,全世界千余名知名专家和学者常年为这套工具书提供系统而全面的原始研究资料。LB手册由传统的纸版发展为在线的电子图书,在2009年转变为基于网络的SpringerMaterials数据库。该数据库包含91 000份在线文档,其中包括165 000种物质及材料系统,以及3 000种属性,其数据来源于精选的400余部大型参考工具书中的100万篇文献[4]。主要数据涵盖了粒子、核子和原子,分子和自由基,电子结构与传输、磁学、半导性、超导性、结晶学、热力学、多相系统、先进材料、先进技术,天体物理学和地球物理学等方面。
2各数据事实型数据库的检索实例
笔者分别以有机物蒽和无机物硫酸来作为实例,在这4个数据库中检索和比较这两种物质的相关性质。
2.1Web of Science中的化学子库
2.1.1实例之一:蒽
Web of Knowledge检索平台针对中国用户,有非常友好的简体中文检索界面,但检索词和检索结果,仍用英文显示。进入Web of Knowledge检索平台,选择Web of Science数据库上的化学结构检索途径。在绘图框内绘制具有3个苯环的稠环芳烃化合物蒽的结构,并在“化合物数据”的条件中限定蒽作为反应产物出现,要求进行精确匹配检索。
得到38条检索结果。这些结果中,蒽出现在中间产物和最后产物的情况,均有出现;作为惟一产物和混合产物的结果也均有出现。笔者选择蒽作为最终产物、惟一产物的一种结果(见图1),看到反应的信息和条件以列表的形式显示,包括反应式、反应的催化剂和溶剂,反应时间和产率。
2.1.2实例之二:硫酸
因为硫酸是无机物,所以检索式一般采用分子式或化学物质名称的方式较为方便,而该检索平台上支持分子式和化学物质名称的检索方式,检索途径选择普通的主题检索。试用分子式检索,发现结果数量巨大,有15 000多条记录,因此修改检索式为“H2SO4 SAME PROPERTIES”,结果仍然有2 300多条。目前的检索界面无法进一步限制和缩小当前的检索结果。这其中,尽管H2SO4和PROPERTIES同时在题名或关键词中出现,但绝大多数是报道硫酸作为一种溶剂或反应物出现在化学反应中,真正报道H2SO4性质的文献,需要大量阅读检索结果中文献的摘要,再通过查找原文才能看到具体数值。这点证实了Web of Science中的化学子库只是收录有机化学领域的物质和反应,所以有关无机物的性质,没有特别收录,只是作为文献内容出现。所以在查检无机物的相关反应和性质时,Web of Science中的化学子库不是研究者应该考虑的数据库。
2.2SciFinder
2.2.1实例之一:蒽
SciFinder的访问入口:https:∥scifinder.cas.org,与其它几个数据库不同的是,每次使用SciFinder时都需要用注册过的个人账号进行登录,高校和研究机构通常是购买一定数量的并发用户数量,在限定的并发用户数量之内才能进行使用。Scifinder有3种检索途径:文献检索(Explore References)、物质检索(Explore Substances)以及反应检索(Explore Reactions)。其中物质检索的途径下,有5种入口供选择:化学结构(Chemical Structure)、马库西结构(Markush)、分子式(Molecular Formula)、物质识别符(Substance Identifier(s),例如化学物质名称、化学物质登记号等),此外该平台新增加了性质(Property)入口。笔者选择其中的化学结构入口,在绘图框中画出蒽的结构图,要求系统进行精确匹配检索。
检索结果以表格的形式显示。系统检索出932种物质结构中都含有蒽的结构,从结果中选择化学物质登记号为120-12-7的蒽。从页面中可以看到有关蒽的细节信息,以及有关它的化学反应、商品信息、管制信息的链接等。
点击进入到蒽的详细信息界面(见图2),看到蒽的化学物质登记号、分子式、结构式、各种化学名称,有来自图书、会议录、学位论文、期刊、专利、报告以及预印本的3万多篇文献提供了蒽的各种信息。
对报道该化合物的文献,数据库按研究内容、是否专利文献、是否含非取代衍生物等等信息,进行聚类分析;另外数据库显示了该化合物的各种计算性质,以及通过实验实际测得的各种性质,包括物理、化学、结构、光谱等。以蒽的光谱性质为例,可以看到它的C13核磁共振谱、H的核磁共振谱、电子能谱、发光光谱、红外吸收光谱、紫外/可见吸收光谱、质谱等等。其中有些简单谱图已经直接收录进数据库中,有些复杂谱图还需要根据原文的来源信息去查看原文。1111图2SciFinder上查检到蒽的部分数据事实1111
在该物质的商品信息界面,还可以看到蒽的149个商品信息,包括了供应商信息、订购号、试剂规格等等。
2.2.2实例之二:硫酸
同样通过Scifinder平台上的物质检索途径。无机物通常使用分子式或者化学名称检索更为方便。使用H2SO4进行检索分子式检索,得到20个检索结果。这些结果中,有些是同素异形体,有些是同位素,有些是异构体,所以尽管分子式相同,却检索出了20种不同物质。
可以选择化学性质(Chemical Structure)等条件作为二次检索的限制条件对结果进行分析或者精炼,从而得到目标物质。结果显示Scifinder收录了16万多篇文献研究硫酸的各种性质。
在以表格形式列出的众多性质中,较为简单的数据,如密度、摩尔体积、沸点、熔点等等,都以数值的形式直接给出,而较为复杂的性质或需要辅以图形说明的数据事实,如生物活性、微观的键长键角等,则给出了原文的来源信息,研究人员还需要进一步查找原文。
2.3Reaxys
2.3.1实例之一:蒽
Reaxys的访问入口:https:∥www.reaxys.com。相比之前客户端版本的MDL Crossfire来说,Reaxys的检索界面显得简单明了、直观易用。Reaxys也有3种检索途径:化学反应(Reactions)、物质和性质(Substances and Properties)、文献信息(Literature)。选择物质和性质的入口,在绘图框内绘制结构图。对于较难绘图的无机物和复杂的有机金属而言,Reaxys数据库还特别提供给研究者从化合物名称生成结构(Generate structure from name)的功能来查看复杂结构,并可进一步利用该结构来进行反应设计。
期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。
【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
投稿辅导服务咨询与期刊合作加盟
陆老师联系QQ: 913775405(普刊)
蒋老师联系QQ: 867306987(核心)
刘老师联系QQ: 271374912(核心)
联系电话:18015016272
17327192284
投稿辅导投稿邮箱:zgqkk365@126.com
期刊推荐
- 《课程教育研究》 旬刊 国家级
- 《网络空间安全》(信息安全与技术)月刊 国
- 《价值工程》旬刊 国家级 科技统计源期刊
- 《高教论坛》 月刊 省级
- 《法制与社会》旬刊 省级
- 《中国教育学刊》月刊 14版北大核心
- 《语文建设》 旬刊 14版北大核心
- 《中国绿色画报》 月刊 国家级
- 《社科纵横》季刊 社科类优秀期刊
- 《求索》月刊 14版北大核心期刊
- 《财会月刊》旬刊 14版北大核心
- 《艺术品鉴》 月刊 省级
- 《中华建设》月刊 国家级 建设类优秀期刊
- 《教学与管理》旬刊 北大核心
- 《当代经济》 旬刊 省级
- 《新课程研究》旬刊 省级 教育类优秀学术期
- 《文教资料》 旬刊 省级
- 《学术界》 月刊 双核心
- 《吉林教育》旬刊 省级 教育类学术期刊
- 《中国农业资源与区划》 月刊 14版北大核心
- 《继续教育研究》月刊 北大核心期刊
- 《财经界(学术版)》半月刊 国家级
- 《电影评介》半月刊 14版北大核心
- 《公路交通科技》 月刊 北大核心
- 《新闻传播》月刊 省级 新闻类优秀期刊