)1月15日,中国科学院在北京正式对外发布了A类战略性先导科技专项“地球大数据科学工程”2018年度成果地球大数据共享服务平台,向全球公开了平台的两大核心系统数据共享服务系统和CASEarth“数据银行”(Databank)系统,以及一个区域系统数字丝路地球大数据系统。
中科院副院长张亚平表示,科学数据的积累、开放、共享,慢慢的变成了世界科技发展的重要资源和推动力,中科院作为国家战略科技力量,格外的重视科学数据共享在科研和信息化建设中的创新与应用。中科院设立“地球大数据科学工程”先导专项,将力求突破超大规模跨学科、跨领域、分布式资源技术瓶颈问题,建立科学数据共享及其机制体制建设与实施的新模式,只要有终端和互联网,任何人在任何地点都能够轻松的享受到地球大数据提供的多样化便捷服务。
张亚平说,此次发布的三项成果是地球大数据专项数据共享工作迈出的第一步,也是坚实的一步。未来地球大数据共享服务平台全面建成后,将有力地推动中科院乃至国家层面地球大数据实现从被动共享到主动共享的转变,从项目资源驱动到平台与服务驱动的转变。
地球大数据共享服务平台是集成多领域海量数据,服务数据驱动的科学发现与决策支持的科学平台。该平台以共享方式为全球用户更好的提供系统、多元、动态、连续并具有全球唯一标识的规范化的地球大数据,通过建立数据、计算与服务为一体的数据共享系统,推动形成地球科学数据共享新模式。
目前,平台共享数据总量约5PB,其中对地观测数据1.8PB,生物生态数据2.6PB,大气海洋数据0.4PB,基础地理数据及地面观测数据0.2PB;地层学与古生物数据库49万条数据记录、中国生物物种名录360万条、微生物资源数据库42万条、组学数据目前在线亿条。截至记者发稿日,用户能在线%的数据,随着硬件条件逐渐完备,平台数据将陆续上线PB的数据量进行更新。
专项负责人、中科院院士郭华东指出,科学数据开放共享意义重大,地球大数据专项通过集成中科院资源环境生物生态等领域基础数据和科研成果,构建基于地球大数据的信息共享平台,将为驱动原创性科学发现和促进国家经济社会持续健康发展提供技术支撑和决策依据。
数据共享服务系统是地球大数据专项数据资源发布及共享服务的门户窗口,可提供项目分类、关键词检索、标签云过滤、数据关联推荐等多种数据发现模式,同时提供在线下载、应用程序编程接口访问等多种数据获取模式,支持可定制的多格式数据在线查看、预览和查询,并能够应对各种个性化需求,进行统计、收藏、推荐、下载和评价服务。
CASEarth Databank系统提供长时序的多源对地观测数据即得即用产品集,包括1986年中国遥感卫星地面站建设以来20万景、共计240万个产品的长时序陆地卫星数据产品等。该系统自主研发了高效的对地观测数据引擎,面向一般用户、行业用户和科学家用户,提供不一样的层次的数据分析与信息挖掘服务。中科院空天信息研究院研究员何国金透露,未来用户还可以上载多源数据,完成特定的专题信息挖掘、知识发现和融合决策。
数字丝路地球大数据系统包括了“一带一路”区域资源、环境、气候、灾害、遗产等专题数据集94套、自主知识产权数据产品57类,共享数据超过120万亿字节。目前已具备千万亿字节级的软硬件环境,在国际上率先研发了通用大数据平台下地球大数据提取、转换与加载工具集,实现了6大类数据的检索、共享、产品可视化展现,并通过中、英、法等多语言版本在国际相关单位实施共享。
据了解,中科院“地球大数据科学工程”先导专项于2018年1月1日启动实施,执行期5年,由中科院空天信息研究院牵头,致力于构建包含资源、环境、生物、生态等多个领域的大数据与云服务共享平台,最终目标是建成国际地球大数据科学中心。