bootstrap式知识三元组抽取 开放式实体关系抽取 依靠依存分析确定可能的实体和关系
项目简介:
输入和输出:
输入:某个知识领域的一部分关键概念或实体;经过分词、词性标注和依存句法分析的、属于该知识领域的语料库
输出:该知识领域的重要的知识三元组以及实体关系
关键需求的实现:
1.根据给定的关键概念确定实体关系和实体: 寻找与代表关键概念的名词构成主谓(SVB)或动宾(VOB)关系的动词,抽取以该动词为
中心的动词短语作为实体关系;再以该动词为已知信息寻找与其构成主谓或动宾关系的名
词作为该关系中的另一个实体。
此外,还抽取了与关键概念相邻的名词作为与关键概念构成修饰限定关系的实体。
2. bootstrap式知识三元组抽取:从以抽取的知识三元组中确定新的关键概念,根据这些新的关键概念重复之前寻找实体关系和实体的程
序,以获得新的知识三元组
适用语料库:中文、复句少的语料库。