网站首页 > 论文格式> 文章内容

科研论文公开数据集不完整 研究人员呼吁采用标准格式

※发布时间:2016-1-3 22:44:36   ※发布作者:A   ※出自何处: 

  内容摘要:中国社会科学报综合外媒报道一项新研究显示,许多科研论文附带的公开数据集不完整,不利于再现性研究(reproducibility study)和后续研究的开展。近日,在线学术期刊《公共科学图书馆·生物学》(PLOS Biology)刊登了国立大学生物研究学院4位研究人员合著的论文《生态学与进化研究领域的公开数据存档:状况如何?研究人员从生态学与进化研究领域设置了严格的公开数据存档政策的7家顶尖期刊中,抽取了2012—2013年被收录于知名数字资源库“树妖”(Dryad)的100篇论文,并从两方面分析了这些论文的公开数据集质量,一是数据是否完全公开、符合期刊的公开数据存档政策。

  中国社会科学报综合外媒报道一项新研究显示,许多科研论文附带的公开数据集不完整,不利于再现性研究(reproducibility study)和后续研究的开展。

  近日,在线学术期刊《公共科学图书馆·生物学》(PLOS Biology)刊登了国立大学生物研究学院4位研究人员合著的论文《生态学与进化研究领域的公开数据存档:状况如何?》(Public Data Archiving in Ecology and Evolution: How Well Are We Doing?)。该文提出,在包括生态学与进化研究在内的许多科研领域里,公开数据存档政策即学术期刊要求作者将论文所用的数据上传到公共数据库中,现在正成为一种规范,其价值在于使再现性研究和数据再利用成为可能,共享数据还可以加速科学发现并节约重复收集数据带来的经济成本。然而,论文作者提交的这些数据集有时也存在不完整、不可用的情况。

  研究人员从生态学与进化研究领域设置了严格的公开数据存档政策的7家顶尖期刊中,抽取了2012—2013年被收录于知名数字资源库“树妖”(Dryad)的100篇论文,并从两方面分析了这些论文的公开数据集质量,一是数据是否完全公开、符合期刊的公开数据存档政策,即“完整性”(completeness);二是数据是否便于第三方访问和使用,即“再利用性”(reusability)。分析结果显示,56%数据集不完整,原因是数据丢失或元数据不充分;64%数据集的储存方式部分阻碍或彻底阻碍了数据再利用,原因是缺少主要的元数据,数据以加工过的形式而非原始形式存储,或使用了不适当的文件格式。

  国立大学生物研究学院博士生多米尼克·罗什(Dominique Roche)说,“对于大多数科研人员来说,公开数据存档及科学是新事物,许多科学家缺乏这方面的训练。生物学家经常与大体量且复杂的数据集打交道,这些数据的重要性可能不亚于论文本身,但需要凭借良好的组织技能对其进行处理和展示后才能为他人所用。所幸的是,此次研究发现的很多问题能够以较快速、简便的方决。”研究人员,论文作者应向期刊提交基础但完整的数据描述符(data descriptor),采用标准的文件格式,将数据集存储在稳定、可搜索的在线数据库中,而不是作为论文附录等。

  (王悠然/编译)

推荐:

关键词:论文格式