中国工程科技数据和知识技术研究中心

2012年,中国工程院启动建设“中国工程科技知识中心(CKCEST)”项目(http://www.ckcest.cn/),该项目是我国工程科技领域重要的大数据项目。旨在打通和汇聚各类工程科技数据资源,通过技术分析处理形成知识库,并开发各种应用提供知识服务,推动国家工程科技战略思想库的建设,服务于国家的战略决策。

从数据到知识、再从知识到决策是实现大数据支撑下知识服务的主要途径。从数据的性质看,建设知识中心所需的知识是高度结构化的,而分散在各工程科技领域的数据资源绝大部分属于非结构化数据。如何将无序繁杂的文本、图像、视频等原始的非结构化数据加工转化为有序、可用、标准的结构化知识是知识中心建设的核心问题。这个问题的解决,需要数据汇聚、知识加工、数据可视化等诸多关键技术的支撑。

为了进一步支撑中国工程科技知识中心的关键技术研发,全面提升项目在人工智能和大数据时代的技术竞争力,浙江大学与中国工程院于2014年3月签订协议,合作共建“中国工程科技数据和知识技术研究中心”。

研究中心将在工程科技数据和知识的互通、集成、生成、传播和应用的关键共性技术和标准体系方面进行研发,形成自主知识产权的核心技术体系,建设以数据和知识为主的核心技术研发平台,成为我国数据和知识技术可持续发展的研发、成果转化和人才培养基地。

2014年3月,浙江大学获批建立 “中国工程科技数据和知识技术研究中心”签字仪式

 

2015年4月,浙江大学团队提出了KS-Studio(Knowledge Service-Studio)技术框架,旨在实现从非结构化数据中析取知识。

KS-Studio技术框架

KS-Studio作为一种知识计算引擎,是将非结构化数据转换为结构化知识及提供创新服务的一系列API和工具的集合。KS-Studio涵盖了从大数据到知识全过程中的核心功能,它包括实体检测、实体链接、属性填充、事件抽取、图像识别和文本描述生成以及跨媒体分析等技术内容。

KS-Studio在对人类社会常识性实体的内涵和外延分析理解基础上,构建知识图谱,从而具备知识深度计算能力,以提供知识创新服务。

知识计算引擎KS-Studio目前已经对外发布,详情请访问:http://ksstudio.org/