Welcome to Data Intelligence!
关于举办第二届“数据智能与知识服务”研讨会的通知 May 11, 2021  |  views: 633

关于举办第二届“数据智能与知识服务”研讨会的通知

        在数据智能时代,一方面数据量不断增长,愈加呈现出高维度、高阶态和异构性的特点,另一方面,知识构建、机器学习、人工智能等技术在飞速进步。如何对海量数据进行分析、处理、挖掘和表示,获取有揭示性和可操作性的信息,从而为人们在基于数据制定决策或执行任务时提供有效的知识服务,成为全社会共同关注的热点,并因此催生和孵化了一系列基于大数据和知识服务的多领域智能平台和知识服务。为促进学术和技术交流,展示这一领域的前沿发展态势,以具体场景为例解读跨领域知识服务平台构建的理论基础与建设实践,中国科学院文献情报中心主办第二届“数据智能与知识服务”研讨会。

       本次研讨会将邀请国内外从事相关研究的知名学者、具有前瞻洞见的业界领袖和精通实战的技术大咖,交流“数据智能和知识服务”的前沿与“知识服务智能化平台建设”的构建,欢迎从事相关研究和实践工作的人员踊跃报名。

 

一、组织机构
主办:中国科学院文献情报中心

承办: 东南大学计算机科学与工程学院

           Data Intelligence(DI)编辑部

 

二、会议内容

专题1 数据智能与知识服务前沿进展

报告专家:Jim Hendler
报告题目(暂定):数据智能前沿及智慧医疗(RPI与IBM创新实践)
专家简介:Jim Hendler,语义网之父,美国伦斯勒理工学院(RPI)大学计算机系教授。DataIntelligence(《数据智能》)共同主编。曾任美国白宫互联网Web政策顾问,美国政府数据网站data.gov首席顾问,纽约州开放数据顾问,美国国土安全部技术委员会委员,**部高等项目研究署(DARPA)信息系统办公室首席科学家,DAPPA DAML 项目负责人。他是美国人工智能协会(AAAI)、英国计算机协会(BCS)、电子电气工程师协会(IEEE)、美国计算机协会(ACM)、美国科学促进会(AAAS)、美国国家公共行政学院的院士。人工智能领域经典学术期刊IEEE Intelligent Systems前主编。2001年,他与Tim Berners-Lee和 Ora Lassila 发表The SemanticWeb(《语义网》)经典奠基论文,标志着这个研究领域的形成。除此之外,他在认知科学、智能规划、数据科学、Web 科学等都有杰出的贡献和深远的影响。

 

报告专家:Pascal Hitzler
报告题目对知识图谱和本体的深度演绎推理
报告摘要:符号知识表示和推理与深度学习是人工智能研究的两种基本方法,具有互补能力。前者过程透明,能有效利用数据,但它对噪声敏感,不能应用于数据模糊的非符号领域。后者可以从示例中学习复杂任务,对噪声具有鲁棒性,但是过程是个黑箱,需要大量(不一定容易获取)数据,学习速度较慢,容易遇到对抗性实例。由此可见,任何一种范式都只擅长于某些类型的问题。为了开发更强大的人工智能系统,人们正在寻找结合人工神经网络和符号推理的集成神经-符号系统。在这种情况下,一个基本的开放问题是如何通过可训练的人工神经网络在知识库上执行基于逻辑的演绎推理。在第二届“数据智能与知识服务”研讨会上,Pascal Hitzler教授将介绍并讨论这一主题的最新进展。
专家简介: Pascal Hitzler,美国堪萨斯州立大学计算机科学系人工智能和数据科学中心(CAIDS)主任、教授,Lloyd T. Smith创新工程主席,人工智能和语义网领域顶级国际期刊Semantic WebJournal的创始人兼主编。2019年7月,他被授予NCR杰出教授、Brage Golding杰出研究教授称号,同时他也是美国莱特州立大学计算机科学与工程系数据科学主席。Pascal是数据语(DaSe)实验室主任。Pascal在语义网、人工智能、神经符号集成、知识表示和推理、机器学习、指称语义和集论拓扑等领域发表了400多篇论文并被广泛引用。是IOS出版社出版的《语义网研究》系列图书的主编。他是W3C推荐标准OWL 2 Primer作者之一,是《语义Web技术基础》图书作者,该书被美国图书馆协会推荐为计算机科学与信息科学的七本最佳学术图书之一。Pascal是多个国际期刊编委,在众多顶级国际会议中担任重要职务。

 

报告专家:丁颖
报告题目:知识图谱及其超越
报告摘要:知识图谱正在成为人工智能的最重要的驱动力。像人的头脑一样,知识图谱是机器的头脑,它把分散的数据连接起来,进行理解推断,更重要的是,从这些不同来源的海量数据中获得知识,提炼观点。Gartner公司预计从现在到2022年知识图谱应用和图谱挖掘将以每年100%的速度增长,将来的数据科学必将能计算更复杂的关系,也将更加适应实际需求。为了增强人工智能算法黑箱的透明化,可解释的人工智能模型将是透明决策必不可少基础。知识图谱将在揭示隐含的关联关系,解释结果复杂原因方面起到关键的作用。本报告将讨论构建和挖掘知识图谱,以及知识图谱在药物发现、医疗影像诊断,新冠肺炎疫情防治等方面的应用。
专家简介:丁颖博士是美国德克萨斯大学奥斯汀分校信息学院教授。在这之前,她是美国印第安纳大学信息、计算与工程学院教授,担任数据科学研究生项目主任。她领导团队建立并发展了印第安纳大学的数据科学研究生项目。她同时也是奥地利Innsburck大学计算机科学系高级研究员、荷兰阿姆斯特丹自由大学的高级研究员。她主持或共同主持过美国国立卫生院(NIH),美国自然科学基金会(NSF),以及欧盟资助项目多项,先后在著名学术期刊和各类学术会议上发表论文240余篇,并担任200多个国际会议的程序委员会委员。她是Morgan & Claypool出版社出版的Semantic Web Synthesis 系列图书的共同编辑,是MIT出版社出版的国际期刊 Data Intelligence的共同主编, 并担任信息科学和语义网领域多个顶级期刊的编委会成员。她是 Data2Discovery company 的共同创始人,致力于数据科学领域的前沿技术在药物研发和健康医疗方面的应用。她的研究方向包括数据驱动的科学学,人工智能在健康医疗的应用,语义网,知识图谱,数据科学,学术交流以及网络技术应用。

 

报告专家:张智雄
报告题目:科技文献知识人工智能引擎(SciAIEngine)的研发和应用
专家简介:张智雄,中国科学院文献情报中心副主任,研究馆员,博士生导师,Data Intelligence(《数据智能》)共同主编。研究领域为信息监测、语义标注、数字图书馆、长期保存等。主要学术任职有中国科学技术情报学会信息技术专业委员会主任、全国图书馆标准化技术委员会(SAC/TC389)副主任委员、国际图书馆联合会科学和技术图书馆委员会常务委员等。是《数据分析与知识发现》、《农业图书情报学报》期刊等副主编。发表论文150余篇。主持国家、省部级项目40余项。目前在主持多项基于深度学习的语义标注项目课题,致力于为人工智能领域提供科技文献预训练基础语言模型和基于科技文献知识内容的AI引擎,推动文献情报领域能够在人工智能时代有所作为。

 

报告专家:漆桂林
报告题目:多模态知识图谱构建技术和应用

报告摘要:知识图谱是实现认知智能的关键因素,为推理提供有效支撑。最近,越来越多的研究者开始关注如何融合视觉数据、文本数据和结构化数据来构建知识图谱,从而得到多模态知识图谱。本讲座首先介绍多模态知识图谱的历史和背景。其次,介绍多模态知识图谱构建的相关技术。最后,介绍多模态知识图谱的应用。
专家简介:漆桂林,东南大学教授、博士生导师,东南大学认知智能研究所所长,获得江苏省六大人才高峰计划资助。担任中国中文信息学会语言与知识计算专业委员会副主任、中国科学技术情报学会知识组织专业委员会副主任,是著名国际期刊Journalof Web Semantics的副主编和Semantic Web Journal 的编委。Data Intelligence《数据智能》共同主编。研究兴趣是人工智能,知识表示和推理,语义网。编写专著1部,发表高水平学术论文150余篇。主持和参与科技部重点研发项目、国家863、自然科学基金重点、自然科学基金面上等10余项国家级知识图谱相关项目以及华为、百度等企业知识图谱相关项目。是国际语义Web 会议 2011 年海报和演示分会联合主席和国际知识工程和知识管理2014年海报和演示分会联合主席,并且是国际联合语义技术会 议 JIST2015 程序委员会主席。

 

报告专家:Bing Liu (刘兵)

报告题目:模型部署后的持续和交互式学习

专家简介:Bing Liu(刘兵),美国伊利诺伊大学芝加哥分校(UIC)杰出教授,北京大学讲席教授。爱丁堡大学博士,ACM、AAAI和IEEE会士。他的研究兴趣包括终身学习、情感分析、数据挖掘、机器学习和自然语言处理。刘兵教授在顶级会议和期刊发表了大量论文。其中2篇论文获得了KDD 10年Test-of-Time奖和1篇论文获得WSDM 10 年Test-of-Time奖。他也是4本书的作者,其中2本关于情感分析,1本关于终身学习,1本关于数据挖掘。刘兵教授的工作被媒体广泛报道,包括纽约时报的首页文章。他是2018 ACM SIGKDD创新奖的获得者,是2013-2017年ACM SIGKDD的主席。刘兵教授也曾是很多顶级数据挖掘会议的程序主席,包括KDD、ICDM、CIKM、WSDM、SDM和PAKDD。他同时也是顶级期刊的副主编,包括TKDE、TWEB、 DMKD和TKDD。他还是很多自然语言处理、人工智能、网络和数据挖掘会议的领域主席或者高级程序委员会成员。

 

报告专家:Heng Ji

报告题目:信息诊室

报告摘要:可能大家跟我的感受一样,已经过去的2020年是非常糟糕的一年,这一年我们失去了亲人朋友,这一年我们悲痛欲绝,这一年我们忧心忡忡。近年来,一些别有用心的人利用自然语言处理和计算机视觉的生成式神经网络模型制造了大量虚假信息。这些人工智能模型生成的消息看起来很像是真的,人们很容易上当受骗。因此,开发具有鲁棒性的验证技术识别机器生成的虚假信息迫在眉睫。当前虚假信息的识别方法主要包括基于文本的方法,利用词汇特征并嵌入语义关系分辨真伪。但是编造虚假信息的人只是会操纵(包括误用,夸大,或伪造)真实信息的一小部分内容,即知识元素(包括实体,关系和事件)。而且,最近新闻里的一些论断,我们还没有证据能判断这些论断的真假,评价这些实时产生的论断的真实性,则更多要看这些论断和其他多模态数据集的信息是否一致。本次报告中,我将汇报我在信息抽取方面的研究,我们的研究方向是评价新闻真假,并且致力于改变全世界的新闻消费状况。我们的方法把传统的事件抽取方法扩展到未来事件预测的方法,利用多媒体多语言的信息作为基础来分析全世界的新闻报道,辨别细粒度的伪造信息,修正错误信息,把信息按照重要性排序后用于总结分析。我将展示一个新的“信息诊室”模型,该模型充分利用业界最先进的多媒体联合知识抽取技术来分析细粒度的事件、实体和关系元素,同时分析是否这些抽取到的知识元素和其他多模态数据集和背景知识是一致的。我们提出了一个新颖的概率图神经网络模型来融合来自评价指标的输出数据,从而识别虚假信息,同时该模型将使得研究结果可解释。要完成基于知识元素层次的虚假信息识别的任务,我们面临的主要挑战是缺少训练数据。因此,我们又提出了一个新的图-文本生成方法,我们操作知识元素自动生成噪声训练数据。实验结果表明我们的方法识别精确率达到92%-95%,比当前最先进的方法的精确率高16.8%。

专家简介:Heng Ji(季姮)是美国伊利诺伊大学香槟分校计算机科学系教授,电气与计算机工程系岗位教师,是亚马逊学者。她于清华大学获得计算语言学学士学位和硕士学位,于美国纽约大学获得计算机科学硕士学位和博士学位。她的研究兴趣包括自然语言处理,特别是多媒体、多语言信息抽取,知识图谱数据,以及知识驱动的信息生成。她当选为“青年科学家”,是2016年和2017年世界经济论坛的全球未来理事会成员。她2013年入选国际人工智能领域著名期刊IEEEIntelligent Systems发布的“人工智能10大新星”名单,2009年获得美国自然科学基金早期职业生涯奖,2009年和2014年获得谷歌研究资助奖,2012年和2014年IBM杰出学者奖,2014-2018年获得博士研究奖,2019年获得腾讯AI Lab犀牛鸟资助学者奖,2020年ACL最佳演示论文奖。她是许多国际会议的程序委员会共同主席,包括自然语言处理顶会NAACL-HLT2018。她当选为国际计算语言学学会北美分会秘书(2020-2021)。

 

报告专家:陆伟
报告题目:智能内容审核研究
专家简介陆伟,博士,珞珈特聘教授,博士生导师,现任武汉大学信息管理学院院长,信息检索与知识挖掘研究所所长,先后赴英国、丹麦、荷兰和美国访学或博士后研究。发表论文百余篇,其中SSCI/SCI/EI论文50余篇,主持和参与编写著作多部。曾主持国家社科基金重大项目、国家重点研发计划课题、国家社科(自科)基金等各类纵横向项目40余项。主持和参与国家标准2项,申请发明专利和软件著作权10余项,研发问答机器人、学术信息智能处理平台、文本格式化 理解系统等,成果为华为、阿里、腾讯、泰康、国家网安中心、中国科技信息研究所等数十家科研院所和企事业单位提供了支撑。目前主要研究兴趣为信息检索与可视化、知识图谱与大数据智能、AI人机协同等。

 

报告专家:陈为

报告题目:大规模图数据的可视化与可视分析关键技术与系统研发
专家简介:陈为,浙江大学教授,博导,计算机学院副院长,CAD&CG国家重点实验室副主任。国家特聘专家。中国计算机学会CAD&CG专委会秘书长。曾主持国家自然科学基金重点、优青等项目10余项。出版著作5部,担任5个国际SCI期刊编委和主编、多个国际顶尖学术会议主席。

 

报告专家:黎铭

报告题目:软件缺陷学习
专家简介:黎铭,南京大学教授,博士生导师,人工智能学院副院长。国家优秀青年基金获得者、教育部新世纪人才。主要从事软件挖掘、机器学习方面的研究工作。在《IEEE Trans KDE》等国内外重要学术刊物和IJCAI、ICML 等重要国际会议发表论文三十余篇,被国际同行他引三千余次。曾作为主要成员获国家自然科学二等奖、教育部自然科学一等奖等。应邀担任《Frontiersof Computer Science》Associate Editor、《自动化学报》编委、国际软件挖掘系列研讨会SoftwareMining、PAKDD首届博士研讨会DSDM'11主席、国际会议IJCAI、IEEE ICDM的领域主席、AAAI的资深程序委员以及KDD、NIPS等多种一流国际会议程序委员;现任中国人工智能学会青年工委副主任、机器学习专委会常务委员,中国计算机学会人工智能与模式识别专委会委员、教育部高校计算机类专业教指委人工智能专家委秘书长等。

 

报告专家:陈华钧
报告题目:OpenKG区块链:构建可信开放的联邦知识图谱平台
专家简介:陈华钧,浙江大学计算机科学与技术学院教授,博导,阿里巴巴-浙江大学前沿技术联合研究中心主任,浙江省大数据智能计算重点实验室副主任,OpenKG主要发起人。主要研究方向为知识图谱、本体和语义网,信息抽取,自然语言处理及其在生物医药、电子商务和智慧城市等的应用。在WWW / ISWC, IJCAI/AAAI/KR, ACL/EMNLP/NAACL,VLDB/ICDE, IEEE Magazine onComputational Intelligence, IEEE Intelligent System, IEEE TKDE, Briefings in Bioinforamtics, AI in Medicine等国际顶级会议或期刊上发表多篇论文。作为负责人主持2项国家自然科学基金重点类项目,以及国家重点研发计划课题、国家重大科技专项项目及企业合作项目等二十余项。曾获国际语义网会议ISWC2006最佳论文奖(第一作者)、教育部技术发明一等奖、国家科技进步二等奖、中国中文信息学会钱伟长科技奖一等奖、阿里巴巴优秀学术合作奖、中国工信传媒出版集团优秀出版物一等奖等奖励。

 

报告专家:鲍捷
报告题目:从语义网到价值网络——Web 3.0到底是什么?
专家简介:鲍捷,博士,文因互联CEO,创始人。爱荷华州立大学(Iowa State University)博士,伦斯勒理工学院(RPI)博士后,麻省理工学院(MIT)分布式信息组(DIG)访问研究员。曾任三星美国研发中心研究员,曾任 W3C OWL(Web本体语言)工作组成员,参与撰写了OWL2 知识图谱语言国际标准。现任W3C(万维网联盟)顾问委员会委员、中国中文信息学会语言与知识计算专业委员会委员、金融知识图谱工作组主席、中文开放知识图谱联盟(OpenKG)发起人之一、中国计算机学会会刊编委,DataIntelligence (《数据智能》)编委。

 

专题2:数据智能与知识图谱

报告专家:王昊奋
专家题目:多策略与多模态知识问答
专家简介:王昊奋,同济大学百人计划,特聘研究员。长期在一线人工智能公司担任CTO之职,拥有前沿科技视野及丰富的研发管理经验,荣获上海徐汇区学科带头人人才计划。全球最大的中文开放知识图谱联盟OpenKG发起人之一。负责参与多项省部级AI相关项目,发表90余篇AI领域高水平论文,被引用次数达到2000余次,H-index达到21。构建了全球首个可交互养成的虚拟偶像—“琥珀·虚颜”;所构建的智能客服机器人已累计服务用户超过10亿人次。目前,担任中国计算机学会术语工委副主任;中国中文信息学会语言与知识计算专委会副秘书长、上海交通大学AI校友会秘书长等社会职位。

 

报告专家:Francesco Osborne
报告题目:面向开放科学自动生成的知识图谱研究
报告摘要:过去几年,传统闭合式科学正在向全方位开放科学范式转型,这极大增加了在线机构库里科技文章的可发现性。人工智能领域的研究人员抓住了开放科学带来的机会,他们提出了科学知识抽取、表示和分析的新的模型和方法。他们雄心勃勃的目标是改变存储和管理科技成果的方法,从目前的基于文献的方式转型到基于知识图谱的机器可自动处理的方式。这需要我们对科技文献进行结构化处理,增加元数据描述信息,使得科技文献之间可互联,这样的方法将能够支持新一代人工智能系统对知识进行推理,辅助科学家开展科研工作。在这样的范式下,机器将可以推荐相关文献,自动提出新的假设并开展大型实验。机器辅助的科研过程将会更加有效,科研成果可被访问,可升级,从而应对大数据对科研领域带来的新的挑战。
专家简介:Francesco Osborne 是英国开放大学知识媒体学院的研究员,Data Intelligence编委。他领导的团队从事学术知识挖掘研究(SKM,http://skm.kmi.open.ac.uk),与国际著名出版集团合作(包括SpringerNature,Elsevier等)研究开发了用于科技文献分析的人工智能系统。他于意大利都灵大学获得计算机科学硕士学位和博士学位。他的研究领域包括人工智能、信息抽取、知识图谱、科学学、语义网和研究分析方法。Francesco Osborne发表了80多篇论文,是国际万维网大会(The WebConf 2021)科技知识研讨会主席,是语义网领域顶级期刊The Semantic Web Journal 和 QuantitativeScience Studies 的客座主编,是W3C知识图谱构建社区组成员。他开发的有代表性的开放科学资源包括:1)计算机本体(http://cso.kmi.open.ac.uk),是目前为止计算机科学领域的最大的词表,该工作刊发于Data Intelligence,具体研究内容请参考:The Computer Science Ontology: A ComprehensiveAutomatically-Generated Taxonomy of Research Areas。2) AI知识图谱(http://w3id.org/aikg),该知识库描述从论文中抽取的85万种方法,任务,材料,评价指标;3) Academia/IndustryDynAmicsKnowledge Graph,该知识库将3000万出版物和专利文献映射到对应的研究主题和所属行业。

 

报告专家:赵一铮
报告题目:大规模本体上的知识推理
报告摘要:在人工智能众多的子领域中,知识表示与推理有着非常重要的地位:它是人工智能学科的起源领域之一,是机器通往智能的基础,同时也是人类高阶智慧在机器上的集中体现。知识表示与推理的目标是让机器拥有人类的经验和知识,并且能够按照某种规则推理演绎得到新的知识,最终运用这些知识来辅助机器进行计算和决策。而作为支撑知识表示与处理的重要数据模型之一,本体是对真实世界某些特定领域中的概念、个体以及它们之间的相互关系的形式化表示,对大规模数据及数据实体之间的关系具有很强的表达和管理能力,目前广泛应用在能源、法律、生物、医疗等领域。该报告主要介绍如何利用本体数据结构化的特点,结合逻辑推理技术和算法在生物医疗领域的一些直接和间接应用,包括基于本体中已有信息进行推理、挖掘隐含知识、语义差异计算、数据质量把控、辅助诊疗等。
专家简介:赵一铮,博士、南京大学人工智能学院副教授、徐新人工智能发展基金特聘教授。他于2017年12月在英国曼彻斯特大学获得计算机科学博士学位,并先后在曼彻斯特大学和牛津大学开展博士后研究工作,研究方向为:知识表示与推理、本体论、知识图谱、数理逻辑。他在CCFA/B类等国际会议发表学术论文20余篇,目前担任AAAI、IJCAI、ECAI等国际会议程序委员会委员以及AI Journal等期刊审稿人。他以项目PI身份主持一项国家自然科学基金和四项江苏省科研基金。他以项目骨干身份参与一项科技部科技创新2030—“新一代人工智能”重大项目、两项英国工程与自然科学理事会(EPSRC)面上项目。他与Google DeepMind智能医疗机构Babylon Health合作完成的智能医疗系统为超过6000万注册者提供先进的智能医疗服务。他于2019年入选江苏省“六大人才高峰”计划,2020年入选江苏省“双创博士”计划。

 

报告专家:张华平

报告题目:面向小样本的领域知识图谱构建与应用
报告摘要:特定专业的领域知识图谱构建挑战巨大,主要面临可用语料少、领域专家稀缺以及样本标注困难等冷启动问题。本文介绍了我们团队在小样本数据集情况下构建领域知识图谱的两种解决方案:KGB知识图谱引擎采用人机结合的策略,综合专家知识、机器学习与深度学习方法实现跨领域的知识图谱构建,实体抽取实验取得了准确率98.5%,召回率90.5%;基于动态原型神经网络的小样本知识抽取方法尝试了融合了自注意力机制的原型神经网络,还提出了一个查询-注意力机制,以更准确地选择原型点。在FewRel数据集上的实验结果表明,该模型在小样本关系分类有了显著的提高。并在情报分析、文档核查、合同校对等相关的应用探索。
专家简介:张华平,北京理工大学副教授,博士,研究生导师,知名汉语分词系统ICTCLAS创始人,大数据搜索与挖掘实验室主任,中国人工智能学会多语种智能信息处理专业委员会秘书长,担任新疆大学兼职教授、西南政法大学兼职导师、辽宁师范大学客座教授,首都师范大学兼职教授;中国计算机学会青年科技论坛YOCSEF委员。研究方向为:大数据搜索与挖掘、自然语言处理、信息检索与信息安全。作为课题组长主持开发了国家自然科学基金、**创新特区课题、863、973、242等科研课题十余项,曾先后获得2016年度新疆自治区科技进步奖二等奖,2010年度钱伟长中文信息处理科学技术奖一等奖。发表《大数据智能分析》等专著5部,SCI等论文几十余篇。

 

报告专家:陈玉博
报告题目:复杂场景下的事件图谱构建
报告摘要:知识图谱是下一代人工智能的基础设施,是实现可解释人工智能的重要手段。然而,现有知识图谱大都以实体为核心,缺乏事件知识。事件是认知的基本单元,是行业智能应用的基础。随着深度学习的发展,基于深度神经网络的事件抽取方法取得了长足进步,但是将其应用到金融、通信、医疗等复杂场景时,遇到了新的挑战。该报告首先介绍事件图谱构建过程中的基本概念,然后介绍事件知识抽取的最新工作进展,最后介绍实践过程中的经验和体会。
专家简介:陈玉博,博士,中科院自动化所模式识别国家重点实验室副研究员,研究方向为信息抽取、知识图谱和自然语言处理。在ACL、EMNLP、COLING、AAAI、IJCAII等国际重要会议和期刊发表学术论文40余篇,参与出版《知识图谱》专著一本,多次获得最佳论文奖(NLP-NABD2016、CCKS2017、CCL2020、CCKS2020),GoogleScholar引用量1900余次。主持国家自然科学基金青年基金项目,参与国家自然科学基金重点项目、973计划子课题、重点研发计划子课题以及多项企业合作科研项目的研发,同时也开发了事件抽取、关系抽取、实体识别等多项工具和软件。目前为中国中文信息学会青年工作委员会执行委员、中国中文信息学会语言与知识计算专委会委员。获2018年中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖(个人排名第四)、2019年北京市科学技术进步奖一等奖(个人排名第五),入选第五届中国科协青年人才托举工程。

 

专题3:数据智能在图情领域的应用

报告专家:魏瑞斌
报告题目:学者研究方法图谱的构建及应用
专家简介:魏瑞斌,男,博士,教授,硕士生导师,安徽财经大学学术带头人,安徽财经大学龙湖学者;中国科学技术信息研究所博士后,美国印第安纳大学访问学者;现为安徽财经大学管理科学与工程学院副院长;《科技情报研究》、《农业图书情报学报》编委。主要研究方向为信息组织与检索、科学计量学、知识图谱。主持国家社会科学基金、教育部人文社会科学研究项目和中国博士后基金等项目;出版专著 3部;在《情报学报》等学术期刊上公开发表论文70余篇。

 

报告专家:何琳
报告题目:古文本智能处理:现状与趋势
专家简介:何琳,南京农业大学信息管理学院副院长,教授、博士研究生导师。主要从事信息组织与信息检索领域的教学科研工作,承担多项国家及省部级科研项目,在各级各类期刊累计发表学术论文60余篇,出版专著2部,获江苏省哲学社会科学优秀成果奖。担任中国农学会图书情报分会副秘书长、中国社会科学情报学会、江苏省情报学会及江苏省农史学会理事,《图书情报工作》《中国农史》等期刊编委。入选中宣部宣传思想文化青年英才、江苏省“333高层次人才培养工程” 、江苏省“青蓝工程”优秀青年骨干教师。

 

报告专家:章成志
报告题目:基于学术文献全文内容的算法实体评估研究
专家简介章成志,南京理工大学教授、博士生导师,研究领域主要包括信息组织、信息检索、文本挖掘及自然语言处理,现为中国中文信息学会社会媒体处理专委会常委、中国系统工程学会数据科学与知识系统工程专委会常委、中国科学技术情报学会知识组织专委会委员、中国中文信息学会信息检索专委会委员、中国索引学会理事,担任Patterns、OIR、TEL等十余种国际期刊的编委或客座编辑、四种中文期刊编委、出版专著6部,发表学术论文180余篇,主持省部级以上科研项目十余项,曾获Emerald出版集团高度赞扬论文奖、江苏社科英才、中国科学技术情报学会“青年情报科学家奖”等称号或奖励,指导多名学生的毕业论文曾被评为江苏省优秀本科毕业论文、江苏省优秀硕士学位论文及江苏省优秀博士学位论文。

 

报告专家:陈云伟
报告题目:基于SPO的前沿技术发现方法研究与实践
报告摘要:前沿技术是指高技术领域中具有前瞻性、先导性和探索性的重大技术,是未来高技术更新换代和新兴产业发展的重要基础,是国家高技术创新能力的综合体现。为了更好地开展前沿技术的遴选、识别和预测研究,本研究首先介绍了前沿技术以及与之紧密相关的颠覆性技术、新兴技术、热点技术的概念,比较这些相近概念的区别和联系,并凝练前沿技术的基本共性特征;然后构建了基于SPO的前沿技术发现的基本方法和模型;最后在基因编辑技术领域开展实证研究,研究结果表明本研究方法在挖掘前沿技术方面具有较好的效果。
专家简介:陈云伟,博士,研究员,博士生导师,美国印第安纳大学访问学者,中国科学院成都文献情报中心科技处处长,科学计量与科技评价研究中心(SERC)执行主任,学术会议“科学计量与科技评价天府论坛”始创人之一。第十届中国图书馆学会理事,第七届全国科学计量与信息计量学专业委员会委员,四川省图书馆学会第九届常务理事,副秘书长。独立出版专著2部,发表论文100余篇。承担国家重点研发计划、国家社科基金、四川省科技计划项目等项目10余项,累计经费500余万元。作为负责人或主研人员,完成省部级科技领域规划文本起草及评估报告多份。主要研究领域:科技政策与科技战略、科学计量与科技评价、科学学大数据分析等。

 

报告专家:杜建
报告题目:可计算的医学知识:建模与应用
专家简介:杜建,情报学博士,北京大学助理教授、博士生导师。从事信息计量学与医学信息学的交叉研究,主要研究兴趣包括:健康医疗科研大数据分析、医学知识计算与知识图谱研究。主持国家自然科学基金面上项目、青年项目、国家部委机构委托项目等多项课题,至今在数据分析与情报科学领域Journal of InformetricsJournal of theAssociation for Information Science and TechnologyScientometricsJournalof Data and Information Science以及《情报学报》《科学学研究》等核心期刊上发表论文70余篇。完成基于“数据-证据-宏观环境”综合分析的健康科技战略咨询与政策研究报告多项。2017年入选中国科协青年人才托举工程。

 

专题4:数据智能与知识平台建设

报告专家:胡凝

报告题目:区块链和数字身份支持知识协作

专家简介:Ontology CTO,主要从事本体的研发工作,是高性能、公共区块链研究专家。他有近20年的软件开发经验,擅长语义网、大数据和人工智能技术开发。作为国内最早的语义网专家以及资深的IT系统架构专家,胡凝拥有ERP、电子政务、游戏平台、流媒体等不同系统的经验。2008年,他加入了微软联合创始人Paul Allen发起的Halo项目,负责大数据、人工智能、语义网方面的工作。2013年开始参与美国绿点公司中国分部建立,有银行金融及预付卡业务行业经验。

 

报告专家:钱力
报告题目:数据智能在智慧知识服务生态建设的应用实践
专家简介:钱力,博士,研究馆员,硕士生导师,现为中国科学院文献情报中心信息系统部主任兼知识服务平台建设协调组组长,国家科技图书文献中心(NSTL)数据研究管理中心副主任,中国科学院青年创新促进会会员,2019年度青年情报科学家,是中国科学院大学图书情报与档案管理系岗位教师,授课《科技情报数据分析技术》。从事科技大数据知识计算与智能情报知识服务方法研究,主要研究领域为科技大数据、知识计算、研究设计指纹识别、文本语义挖掘等方面,正承担科技部、JW科技委、中国科学院的多个重大项目研究工作,公开发表学术论文50多篇,专著1部,专利5项。带领团队构建的“慧科研”(https://scholarin.cn/)智能知识服务平台,打造成了集“知识获取、人才发现、技术识别、成果转化、产业咨询、决策支持”为一体的下一代开放科技知识服务新生态。

 

报告专家:胡伟

报告题目:基于表示学习的知识图谱融合技术

专家简介:胡伟,南京大学计算机科学与技术系副教授、博士生导师。主要研究方向为知识图谱、数据集成、智能软件。曾先后于荷兰阿姆斯特丹自由大学、美国斯坦福大学、加拿大多伦多大学访学。主持多项国家自然科学基金项目,在高水平会议和期刊上(例如ICML、AAAI、IJCAI、VLDB、ICDE、WWW、SIGIR、ACL、EMNLP、ISWC)发表50余篇论文,Google Scholar引用两千余次,还获得过JIST最佳论文奖、CCKS英文最佳论文奖、ISWC最佳论文提名等。担任中文信息学会语言与知识计算专委会委员、计算机学会数据库专委会委员、万维网联盟W3C南京大学学术代表等。

 

报告专家:肖国辉
报告题目:虚拟知识图谱的工业应用
专家简介:意大利Free University of Bozen-Bolzano(博尔扎诺自由大学)计算机科学系助理教授。他分别于2007年和2010年在北京大学获得学士和硕士学位,并于2014年在奥地利维也纳工业大学获得计算机科学博士学位。主要研究兴趣包括知识表示、语义网、数据库理论和虚拟知识图谱。在这些领域,他撰写了100多篇论文。据Google Scholar统计,引用次数超过2300次,h指数为24。他是Ontop虚拟知识图谱平台的负责人,并因Ontop的工作获得了Semantic Web Journal 2016 杰出论文奖和第16届国际语义网会议(ISWC 2017)最佳论文奖。他是Ontopic初创公司的联合创始人和首席科学家,公司致力于将虚拟知识图谱技术推向工业界。

 

专题5:数据智能青年学者论坛

报告专家陈矫彦
报告题目:知识驱动的零样本学习

报告摘要机器学习,尤其是深度学习,通常依赖于大规模的训练数据以获得良好的性能。 有监督机器学习分类使用标记好的样本训练模型,并预测那些在训练阶段已经遇到过的类别。 然而,在大多数现实世界的应用中,上下文都在不断发展变化,我们经常需要处理那些在训练过程中从未出现过的新的类别。 近年来,零样本学习(Zero-shot Learning) 引起了广泛关注。这类技术旨在使用外部知识(也称为辅助信息)对此类新的,未在训练过程中出现过的类别进行预测。在这次报告中,我将从外部知识的角度对零样本学习进行文献介绍。这些外部知识从简单到复杂,依次包括文本,属性,知识图谱,和逻辑表达。同时,我将介绍我们最近研发的零样本学习方法OntoZSL。该方法利用OWL 本体(也可以理解为知识图谱的本体模式),着重解决图像分类和知识图谱链接预测中的零样本问题。
专家简介:陈矫彦,博士,牛津大学计算机系高级研究员,在 Ian Horrocks院士所领导的数据和知识小组工作。陈博士从事知识图谱、语义网、知识驱动的零样本和迁移学习、神经符号人工智能等领域的研究,在AAAI、IJCAI、WWW、ISWC、KR、InformationSystems,Journalof Web Semantics,MachineLearning等相关会议和期刊上发表论文40余篇,也是 英国EPSRC 项目“ConCur: Knowledge Graph Construction and Curation”( >100 万英镑)的联合 PI。陈博士同时也积极为学术界服务,担任Journalof Web Semantics编委、IJCAI高级PC、ISWC’21 Challenge Track联合主席等职务。陈矫彦于 2016年获得浙江大学计算机科学与技术博士学位,由吴朝晖教授和陈华钧教授共同指导。他也是苏黎世大学访问博士生,由胡大宁教授指导。陈矫彦于2011年获得浙江大学计算机科学与技术学士学位。

 

报告专家:黄立富
报告题查询和抽取:将事件抽取精炼为面向类型的二进制解码
报告摘要:事件抽取通常被建模为多分类问题,其中事件类型和参与者角色都被视为原子符号,因此这些方法通常仅限于一组预定义的类型。我们提出了一个新的事件抽取框架,它将事件类型和参与者角色作为自然语言查询语句,从输入文本中抽取候选事件触发词和参与者。凭借查询语句中的丰富语义,我们的框架受益于注意力机制,可以更好地捕获事件类型或参与者角色与输入文本之间的语义相关性。这种新的查询和抽取范式还允许我们的方法利用来自各种本体的所有可用事件标注作为统一模型。在ACE 和 ERE 两个公共基准上的实验表明,我们的方法不仅在每个数据集上获得了最优的性能,而且在零样本事件抽取和跨本体迁移方面也显著优于现有方法。
专家简介:黄立富,博士,弗吉尼亚理工大学计算机科学系助理教授。他于2020年获得伊利诺伊大学厄巴纳-香槟分校计算机科学博士学位,在自然语言处理方面有着广泛的研究兴趣,包括在有限监督下提取架构化知识,自然语言理解以及利用外部知识和常识进行推理,自然语言生成,跨语言和垮域迁移的表示学习,以及多模态学习和知识抽取。他是2019年AI2 Fellowship和2021年AmazonResearch Award获得者。

 

报告专家:祁磊
报告题目面向监控视频大数据的行人图像检索技术
报告摘要随着社会安防意识的增强和科学技术的进步,城市中安装部署的监控摄像头越来越多,包括在写字楼、校园、商场、大大小小的街道和社区等各种各样的公共场所,因而每天都会产生大量的监控图像视频数据。计算机视觉技术能够帮助我们有效地利用产生的大规模图像或视频数据,并进行分析和理解。对于监控视频数据而言,行人是其主要的目标对象之一。行人重识别技术(即行人图像检索技术)已经在学术界和工业界受到了广泛的关注,其旨在将不同摄像头下的行人图像进行关联匹配。本报告将介绍我们在全监督、半监督以及无监督场景下的行人重识别技术,并对该领域的发展进行讨论与展望。
专家简介:祁磊,东南大学计算机科学与工程学院助理研究员(至善博士后),2020年博士毕业于南京大学计算机科学与技术系,2018年8月至2019年8月在澳大利亚伍伦贡大学进行学术交流访问,并在2020年获江苏省人工智能学会优秀博士论文奖。主要研究兴趣包括行人重识别、图像分割等计算机视觉任务和无/半监督学习、领域泛化及自适应等机器学习方法。目前在IEEE/ACM Transactions期刊及CCF-A类会议等国际主流期刊和会议上发表论文10余篇。担任多个国际会议和期刊(包括ICCV,CVPR,IJCV等)审稿人,并担任IJCAI‘21的高级程序委员会委员(SPC)。

 

报告专家:周陆
报告题目:关于复杂本体对齐的研究
报告摘要:本体可以提供一个词汇表来描述一个或多个领域中的许多概念,并且通常可以服务于知识图谱的框架建设。不同的知识图谱通常会采用不同的本体来表达其对应的主题和概念。但是,每一个本体可能会采用不同的词汇表,建模的理念,或者表达知识的语言,从而加大了基于本体的数据融合的难度。本体对齐被公认为解决这一难题的关键。对于本体对齐的研究已经有十多年的历史了,研究人员已经提出了很多方法,并开发了系统来自动化检测两个本体之间一对一的匹配关系。但是,在面对现实数据中复杂结构的情况时,一对一的匹配关系已经不能够完全满足应用中的要求或者持续提升性能了。在这次研讨会上,周陆博士将会介绍并讨论这一主题的最新进展。 
专家简介:周陆,美国堪萨斯州立大学计算机科学系数据语义实验室博士后。他的研究兴趣包括知识图谱,本体匹配和对齐,实体链接,公指消解,自然语言处理,和机器学习。他是语义网领域国际著名期刊Semantic Web journal的编辑助理,是多个国际期刊和顶级会议的委员会成员和审稿人。他创建的多个复杂本体对齐和公指消解的基准数据集被广泛运用在本体对齐竞赛中(OntologyAlignment Evaluation Initiative, OAEI),并且帮助研究者们测试自动对齐的系统和算法和提供了未来研究工作的路线图。

 

快闪报告

报告专家:侯丽
报告题目:数据驱动的医药卫生知识服务创新实践
报告摘要:面临着大数据时代的健康革命,临床数据、医药研发数据、医疗费用数据、病人行为与情绪数据以及环境数据等构成的海量数据如何处理、利用与服务对信息服务机构构成新的挑战。近年来,医药卫生知识服务系统以用户和数据为基础开展了大量知识服务的创新研究与实践工作。系统紧密围绕医药卫生事业发展和用户个性化需求,整合文献、专利、科学数据等13类领域特色数据资源,并借助人工智能、数据挖掘、大数据等技术开发了知识图谱、自动报告生成系统、营养健康、新冠肺炎专题、环境健康等一系列知识应用,进而面向院士、工程科技人员等提供丰富的信息资源服务、深层次的知识服务和多元化的智能分析服务。
专家简介:侯丽,女,博士,研究员,毕业于中国科学院文献情报中心,现任中国医学科学院医学信息研究所,医学信息标准研究室主任,中华医学会医学信息学分会青年委员,中国中文信息学会 医疗健康与生物信息处理专业委员会委员。研究方向为医学知识表示、医学知识图谱、医学信息标准、语义出版、健康知识组织、医学信息学等。主持国家社科基金项目、互联网医疗重点实验室项目、中国医学科学院创新工程项目等省部级以上科研课题10余项,其研究成果发表在国内外医学信息学领域权威期刊及会议上(JMIR、BMC,MedInfo,Biocuration),已发表论文60余篇。

 

报告专家:逄金辉
报告题目:基于图数据库的党史知识图谱智能搜索
专家简介:逄金辉,博士,计算机学院副教授,研究方向人工智能算法、博弈论、知识图谱技术。承担科技创新2030-“新一代人工智能”重大项目“非完全信息条件下的博弈决策”的大规模动态对抗学习与层级动态多智能体半马尔科夫博弈研究任务和科技创新2030-“新一代人工智能”重大项目“拟人化人机交互服务关键技术与系统”的场景知识图谱自动构建研究任务,国家自然基金面上项目“模糊限制合作对策的刻画及其解结构特性研究”项目、装发项目、北京市科技计划项目、北京市社科基金等30余项。开展知识图谱和人工智能科学前沿主题讲座40余场,达到5万人次参与。北京运筹学会副秘书长、Data Intelligence(《数据智能》)编委、CCF会员、人工智能学会会员、中国运筹学会会员、中国运筹学会博弈论分会常务理事、中国科技新闻学会数据新闻专委会委员、人工智能学会机器博弈专委会委员、中国电力企业联合会知识管理标准化技术委员会委员。

 

报告专家:化柏林
报告题目论文创新点的抽取
专家简介:化柏林,男,博士,北京大学信息管理系研究员,硕士生导师。主要从事知识抽取与大数据情报分析研究。主持国家自然科学基金青年项目、国家社会科学基金面上项目、中国博士后科学基金特别资助、国家社科基金重大项目子课题等课题14项。出版著作2部,参编教材5本,发表论文60余篇,主讲“文本挖掘技术”、“大数据应用案例分析”等课程。兼任中国索引学会理事、《科技情报研究》编委、《中国图书馆学报》《情报理论与实践》等期刊审稿专家,国家自然科学基金委评审专家。

 

报告专家:白如江
报告题目基于知识基因的智慧文献服务系统研究
专家简介:白如江,山东理工大学信息管理研究院教授,情报学博士,硕士研究生导师,国家图书馆博士后。研究方向为文本挖掘与智能情报分析,博士后研究课题:基于知识基因的智慧文献服务系统研究。美国路易斯安那州立大学访问学者。山东省高等学校青创人才引育计划“科技大数据研究创新团队”负责人,山东理工大学高层次人才“双百工程”第三层次。先后主持国家社科基金、中国博士后科学基金特别资助、中国博士后科学基金一等资助、教育部哲学社会科学研究重大课题攻关项目子课题、教育部人文社会科学青年基金和山东省自然科学基金等多项国家级、省部级项目。曾获国家级教学成果二等奖,山东省社会科学优秀成果奖三等奖,山东省科技情报工作先进个人,山东省优秀硕士论文指导教师,山东理工大学科研工作先进个人等多项教学、科研奖励。发表SCI、EI、CSSCI检索期刊论文70余篇,出版专著2部。《图书情报工作》、《信息资源管理学报》、《数字图书馆论坛》等期刊的审稿专家。

 

Editors Meet Authors

报告专家:刘凤红
报告题目:Data Intelligence, Beyond a Journal
专家简介:刘凤红,中国科学院文献情报中心副研究员,硕士生导师,Data Intelligence编辑部主任。中国科学院植物研究所植物生态学博士,南京大学信息管理学院情报学博士后,美国印第安纳大学访问学者。主要研究方向集中在数据出版、FAIR原则在开放科学数据管理中的应用等方向。

 

三、时间和会议形式

会议时间:2021年7月9-12日

会议形式:线上+线下

会议链接、会议密码通过报名登记邮箱发送

 

线下会议地点:东南大学榴园宾馆

(地址:江苏省南京市玄武区进香河路38号)

7月9日           报到

7月10-11日     会议

7月12日          疏散

 

四、会议注册与住宿

线上参会

2021年6月20日前注册:1500元 学生1200元

2021年6月20日后注册:2000元 学生1800元

 

线下参会

2021年6月20日前注册:2000元 学生1600元

2021年6月20日后注册:2500元 学生2000元

 

 

户名:  中国科学院文献情报中心

账号:  0200004509088129221

开户行:中国工商银行海淀西区支行

 

提示:开具发票内容为会议费,由中国科学院文献情报中心开具增值税普通发票(电子发票),通过报名邮箱发送给参会者,请注意查收邮件。个人汇款可开具单位抬头发票,但汇款前请和您单位财务确认单位可报销。

请扫描以下二维码报名                      

会议住宿:

参会代表住宿自理。

会议推荐东南大学榴园宾馆(江苏省南京市玄武区进香河路38号),位于东南大学四牌楼校区,地理位置方便。

 

五、联系人 

彭老师

电话:010-62537554

邮箱:data@mail.las.ac.cn