GithubHelp home page GithubHelp logo

-'s Introduction

#一.数据集处理 ##数据集大小:4047篇民事卷宗 标签类别:继承纠纷、租赁合同纠纷、劳动合同纠纷、侵权责任纠纷、借款合同纠纷 ##如何获取标签? 每个卷宗开头都带有一段Summary,其中第一句就会对卷宗类别进行说明,例如: “原被告系继承纠纷关系。”(卷宗1)、“原被告系租赁合同关系。”(卷宗23)、“原被告系劳动合同纠纷”(卷宗1043)。 通过读取卷宗Summary首句,进行简单的切割处理之后(一般为“系”之后,“关系”、“纠纷”等之前),便能得到该卷宗对应的标签类别。 ##选择多少种标签? 为了确保聚类的结果准确性,只考虑前三种标签的卷宗:继承纠纷、租赁合同纠纷、劳动合同纠纷 ##卷宗的处理:实体识别→实体关系识别→建立知识图谱 ###处理的对象? 卷宗除去第一句标签以外的Summary部分。 #二.知识图谱的建立 每篇卷宗建立一个知识图谱,知识图谱中以实体为Node,实体之间的关系为Edge。 ##实体分类: 实体类别编号 实体类型 大类别 0 案件 卷宗 1 自然人主体 主体 2 法人主体 主体 3 动产 财产 4 不动产 财产 5 人身损伤 损失 6 物破坏 损失 7 权益侵犯 损失 8 财务损失 损失 9 财务赔偿 赔偿 10 物赔偿 赔偿 11 归还产权 赔偿 12 合同 合同 13 法律文件 法律

##实体关系分类: 关系类别编号 关系类型 起点 终点 1 原告 卷宗 主体 2 被告 卷宗 主体 3 亲属 主体(长辈) 主体(晚辈) 4 夫妻 主体 主体 5 所有 主体 财产 6 侵占 主体 财产 7 签署 主体 合同 8 违反 合同 主体 9 涉及 合同 财产 10 造成 主体 损失 11 承受 损失 主体 12 承担 主体 赔偿 13 适用 卷宗 法律 14 雇佣 雇佣方主体 被雇佣方主体 15 解雇 雇佣方主体 被雇佣方主体

#知识图谱的存储: 对于每个卷宗: ##1. csv格式: 第一行为Entity标题,后面每一行按照(实体编号,实体类别编号,具体内容)的格式存储实体。 在Entity存储完毕后,新的一行以Relation为标题,后面每一行按照(边起点,边终点,关系类别编号)存储实体关系。 ##2. json格式: 实体构成一个实体库,将格式为(实体编号,实体类别编号,具体内容)的向量用名为entity的List存储。 实体嵌入完成之后,根据分类好的实体关系,按(边起点,边终点,关系类别编号)三元组保存一个名为relation的List。 ##3. 适用于Graph2Vec的格式: “edges”:[起点,终点]的List “features”:”序号”:”编号”的Doc 其中编号为实体类别编号。 因为Graph2Vec无法处理关系,将关系转换为关系实体,接续在实体之后存储,例如: (实体A,实体B,关系C),改变为(实体A,关系实体C),(关系实体C,实体B)

-'s People

Contributors

einzig-x avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.