通过GBIF.org发布数据的快速指南

了解通过GBIF网络发布数据集的工具、流程和最佳实践

data publishing hero image

GBIF.org支持使用广泛接受的生物多样性数据标准发布四类数据集

目前,GBIF网络只发布直接出自各组织的数据集。 希望发布相关数据集的个人应通过其附属组织 (见下文“请求认可“) 运作或考虑向越来越多的期刊之一提交数据论文

公民科学家可以通过参与世界上越来越多的项目间接地贡献发生记录,这些项目通过GBIF网络发布其数据集。

确保机构协议

一旦您决定通过GBIF网络共享数据,您应提醒管理员您代表您的机构发布数据的计划。 共享开放数据可以提高机构的知名度和影响力,在学术出版物和标本借贷等传统方法的基础上,揭示新的合作机会,并通过使用基于DOI的引用,直接链接到研究用途 (示例) 。

请求认可

要成为数据发布者,您的组织必须向GBIF社区请求认可。 一旦您审阅了数据发布者协议并原则上同意共享数据,我们鼓励您尽快为您的组织请求认可,以避免数据发布的延误。

选择发布工具和合作伙伴

现在与GBIF共享的大部分数据都存在GBIF IPT: 集成发布工具包的几十个装置中的一个上,并且越来越多地存储在最初由澳大利亚生物地图集开发的生物地图集平台的国家装置上。

还存在其他替代整理,包括那些为了在特定数据发布机构内部和外部数据托管的整理。 高技能的发布者也可以使用API以编程方式注册数据集(联系GBIF帮助台了解更多细节)。

我们还维护一个工具其他文档的知识库。

准备数据以供发布

选择使用达尔文核心档案(参见数据标准) 共享数据的数据持有者可使用为发生数据集清单抽样事件数据集创建的电子表格模板来熟悉其格式.

数据持有者可选择其托管数据的安排。 有些人选择托管和维护I综合出版工具包I(IPT,由GBIF秘书处开发的免费开源软件工具)的实例。 然而,存在其他替代方案,包括通过秘书处维护的国家和专题节点基于云的区域服务 提供的托管IPT服务。

使用更新后的GBIF数据验证器,您可以在发布之前检查数据集,并获得关于改进和清理数据集的具体建议。 该报告会有助于,例如,标出重复的记录、不完整的字段和已识别的格式不一致之处。

您还可以准备数据集以符合GBIF的数据质量要求

选择一种知识共享许可协议

根据一项GBIF理事会2014年的决定,数据发布者必须为任何发生数据集指定三种知识共享许可协议中的一种:

  • CC0,适用于不受任何限制而可供任何用途的数据
  • CC BY,适用于在适当注明出处的情况下可用于任何用途的数据
  • CC BY-NC,适用于在适当注明出处的情况下可用于任何非商业用途的数据



请注意,CC-BY-NC许可对数据的可重复使用性具有显著影响。 GBIF鼓励数据发布者尽可能选择最开放的选项。

发布数据集

如果您使用的是IPT,只需点击按钮将您的数据集“注册”到GBIF。 发布后,您可以查看您的数据集 (示例)、使用者下载活动 (示例) 和可追踪的文献引用 (示例) 的一些快速指标。

发布开放获取的生物多样性数据的激励措施

GBIF使命的一个重要部分是促进一种文化,使人们认识到发布开放获取的生物多样性数据对他们自己和更广泛的社会都有好处。

  • 通过GBIF和类似的信息基础设施,使您的数据可被发现和获取,您将为全球关于生物多样性的知识做出贡献,从而为促进生物多样性的保护和可持续利用的解决方案做出贡献。
  • 数据发布使世界各地的数据集得以整合,为数据所有者和研究人员提供了合作的新机会
  • 通过良好的元数据创作使发布机构具有可见性,发布数据可以使个人和机构在创建和管理生物多样性数据方面的工作得到适当的认可。 如果您撰写了一篇经同行评议的数据论文,这种认可则可以得到进一步的发展,使生物多样性数据集的发布得到学术上的认可。
  • 藏品管理员可以追踪数字化数据的使用和引用,这些数据由他们的机构发布,并通过GBIF和类似基础设施获取。
  • 一些资助机构现在要求接受公共资金的研究人员在项目结束时使数据可免费获取