根据文本规则,对《临川四梦》进行实体抽取。实体包含”词牌名“和“出数”,关系为“出现次数”,构建知识图谱a,挖掘曲牌的分布规律和探寻昆曲曲牌的客观特征。
对《临川四梦》每一出的末尾古诗,进行实体抽取。实体包含”作者“和“古诗”,关系为“出现的出处位置”,构建知识图谱b,探寻每一出的情感规律。
分词得到:词牌名;得到csv文件(包含2个实体和关系)
切割得到作者、古诗;
建立知识图谱
切割得到词牌名
切割得到词牌和句式关系 cutTxt:切割文本; 由epub生成txt,图片标记P js1:切割文本
颜色