关于我们



研究组概况


中国科学院文献情报中心科技文献语义挖掘研究组, 成立于2017年。先后承接了中国科学院文献情报能力建设专项《基于科技文献知识的人工智能(AI)引擎建设》、国家科技图书文献中心(NSTL)《下一代开放知识服务平台总体设计及关键技术研发专项--基于深度学习的科技论文语步标注技术工具研发》、中国科学院文献情报中心《科技文献丰富语义检索应用示范》等多项深度学习相关项目。 科技文献资源中蕴含着丰富的知识内容,如定义、概念,研究背景、研究问题、研究基础、研究思路、论文中应用到的理论工具和方法、论文所进行的科学试验、得到的实验结果、形成的研究结论等。对科技文献中的知识进行揭示是数字图书馆研究和建设人员的一项重要任务。



研究主题




科研动态


2020年12月4日: 科技文献知识AI引擎发布。



科研团队


课题负责人


张智雄

深度学习技术方法、语义标注、信息抽取、网络科技信息监测、预印本学术交流。

中国科学院文献情报中心副主任,研究馆员(二级),博士,博士生导师。"中科院特聘硏究员计划”入选者,“中国科学院朱李月华优秀教师奖”获得者。中国科学技术情报学会知识组织专业委员会副主任,中国图书馆学会数字图书馆研究与建设专业委员副主任,《Data Intelligence》(DI)期刊共同主编、《数据分析与知识发现》期刊副主编、《Journal of Data and Information Science》(JDIS)、《数字图书馆论坛》、《智库理论与实践》、《情报工程》期刊编委。出版专著一部,发表研究论文一百五十余篇,译著三部。主持和参加国家、省部级项目四十余项。主持和作为核心成员参的国家级重要课题有“预印本学术交流的理论和实践研究”(国家社科基金项目,19BTQ006)、“基于语言网络的文本主题中心度计算方法研究”(国家自然科学基金,批准号为61075047)、“科技知识组织体系共享服务平台建设”(“十二五”国家科技支撑计划重点项目课题,编号:2011BAH10B03)、 “从数字信息资源中实现知识抽取的理论和方法研究”(国家社科基金,05BTQ006)、“数字资源长期保存技术的研究与实践”(国家社科基金,09FTQ005)项目、“基于海量信息分析的科技评价方法、技术研究与应用”(“十一五”国家科技支撑计划重点项目课题,2006BAH03B05)、“网络信息资源保存的理论与方法研究”(国家社科基金,06BTQ025)、“网络科技信息中爆发主题的监测与分析方法研究”(国家社科基金,09BTQ035)等。

团队成员


于改红(馆员)

研究型论文的功能性语篇元素自动标注,科技信息监测


张敏(馆员)

智能语义索引构建,主题标引,科技信息监测


刘熠(博士后)

科技文献智能问答、自动综述、文本聚类


刘欢(博士)

科技文献预训练语言模型、科技文献知识引擎构建


丁良萍(博士)

科技论文关键词抽取、命名实体识别


李婕(博士)

期刊审稿人推荐、科技文献语料构建、文本聚类


赵旸(博士)

自动分类、概念定义句识别、 基金语步识别、客户端开发


李雪思(博士)

科技文献概念定义句识别、事件抽取


王宇飞(博士)

文本标签自动生成、关键词排序


张梦婷

科技文本标题生成


林歆

科技文献引用句识别



发表论文


1. Zhang Zhixiong, Liu Huan, Ding Liangping, Pengmin Wu, Gaihong Yu. Moves Recognition in Abstract of Research Paper Based on Deep Learning[C]. 2019 ACM/IEEE Joint Conference on Digital Libraries. 2019.06

2. 丁良萍, 张智雄, 刘欢.影响支持向量机模型语步自动识别效果的因素研究[J].数据分析与知识发现.2019.12

3. Gaihong Yu, Zhixiong Zhang , Huan Liu , Liangping Ding. Masked Sentence Model based on BERT for Move Recognition in Medical Scientific Abstracts[J]. Jornal of Data and Information Science (JDIS). 2019.12

4. 马娜, 张智雄, 于改红. 科技论文引用对象研究综述[J]. 图书情报工作.2019.12

5. 张智雄, 刘欢, 丁良萍, 吴朋民, 于改红.不同深度学习模型的科技论文摘要语步识别效果对比研究[J].数据分析与知识发现.2020.01

6. Liangping Ding, Zhixiong Zhang, Huan Liu,Jie Li,Gaihong Yu.  Automatic Keyphrase Extraction from Scientific Chinese Medical Abstracts Based on Character-Level Sequence Labeling[C]. 2020 EEKE Workshop of ACM/IEEE Joint Conference on Digital Libraries. 2020.08

7. 赵旸, 张智雄, 刘欢, 丁良萍. 基于BERT模型的中文医学文献分类研究[J].数据分析与知识发现.2020.09

8. 张智雄, 刘欢, 于改红. 构建基于科技文献知识的人工智能引擎[J].农业图书情报学报.2021.01

9. 刘欢, 张智雄, 王宇飞. BERT模型的主要优化改进方法研究综述[J].数据分析与知识发现.2021.01

10. Liangping Ding, Zhixiong Zhang, Huan Liu, Yang Zhao. Design and Implementation of Keyphrase Extraction Engine for Chinese Scientific Literature[C].2021 EEKE Workshop of ACM/IEEE Joint Conference on Digital Libraries.2021.09

11. Liangping Ding, Zhixiong Zhang, Yang Zhao. Bert-Based Chinese Medical Keyphrase Extraction Model Enhanced with External Features[C].The 23rd International Conference on Asia-Pacific Digital Libraries.2021.09

12. 丁良萍, 张智雄, 刘欢. 利用本体范畴体系实现物理学文献中的领域命名实体识别[C]. 2021中国情报学会年会&全国情报学博士生学术论坛(三等奖). 2021.09

13. 李雪思, 张智雄, 刘欢. 一种基于序列标注的概念短语抽取方法[C]. 2021中国情报学会年会&全国情报学博士生学术论坛(二等奖). 2021.09

14. 赵旸, 张智雄, 刘欢. 基于层次分类法的中文医学文献分类研究[J]. 图书馆学研究. 2021.09

15. 张智雄, 赵旸, 刘欢. 构建面向实际应用的科技文献自动分类引擎[J]. 中国图书馆学报.(已录用)

16. 赵旸, 张智雄, 刘欢, 李婕. 基金项目摘要的语步识别系统设计与实现[J]. 情报理论与实践. 2021-04-07

17. 丁良萍, 张智雄, 张敏, 刘欢. 一个语义检索系统用户交互界面的设计与实现[C]. 2021全国图书馆学博士生论坛. 2021.11



软件著作权


课题已申请相关软件著作权5项。包括:

Responsive image