Simple Attention for Learning to Rank based on Lawformer

基于Lawformer的简易Attention排序学习。

环境配置

Python==3.8.13

GPU: RTX3090*1

具体请参考requirments.txt

概述

目的：在显卡资源有限的情况下尽可能的发挥Lawformer模型的效果

分析：在Lawformer发布的论文中提到，对于类案检索长文本数据，query长度限制为509，candidates长度限制为3072，则模型的输入总长度为3584。在本方法中限制模型的输入总长度为1533（实际上还未达到显存的极限），query长度为509，candidates长度为1020（是论文中的1/3）。

方法：

数据预处理：既然限制了candidates的长度为1020，那么就得筛选最相关的部分作为模型的输入。本方法仅考虑ajjbqk字段内容，前五句必选，后面的内容利用BM25进行筛选，筛选出的内容长度≤700，最后加起来总长度不定。具体代码请参考data_preprocessing.py
Lawformer-Finetune：预处理后的数据即可用于微调Lawformer，训练时将crime+query作为查询案例的输入，将ajName+candidate作为候选案例的输入，最后将查询案例+候选案例输入模型中进行交互，采用MSE-Loss以Pointwise方式进行排序学习，评估时采用NDCG@30。具体代码请参考train.py
提取交互向量：Lawformer训练完毕后，将其作为编码器，①取出crime与ajName的交互向量；②取出query与candidate的交互向量；③取出query与candidate交互后除cls和sep之外所有token_embeddings的平均向量。具体代码请参考interact_extract.py
训练RankAttention：将上述提取的三种交互向量按查询分组，每组中的查询案例对应100个候选案例，则每组得到3x100个交互向量，搭建一个用于排序的简易Attention模型，将3种交互向量输出为1个logit，每组100个logits以Pairwise方式进行排序学习，损失函数采用CoSENT。具体代码请参考rank_attention.py

预测

直接运行run.sh，其中data_path需改成封测阶段数据的路径。

#!/bin/bash

data_path=cail2022_类案检索_封测阶段/

python predict.py \
    --input $data_path \
    --output ./ \
    --encoder_path saved/bsz1_lr1e-05/Lawformer.pt \
    --rank_model_path saved/bsz1_lr1e-04/RankAttention.pt \
    --model_path thunlp/Lawformer \
    --tokenizer_path hfl/chinese-roberta-wwm-ext \
    --extract_batch_size 10 \
    --max_length 1533

训练

直接运行train.sh，其中train_data_path需改成第二阶段训练集的路径，dev_data_path需改成第一阶段训练集的路径。

#!/bin/bash

train_data_path=cail2022_类案检索_第二阶段/train/
dev_data_path=cail2022_类案检索_第一阶段/train/label_top30_dict.json

python train.py \
    --input $train_data_path \
    --dev_id_file $dev_data_path \
    --output_path ./saved \
    --model_path thunlp/Lawformer \
    --tokenizer_path hfl/chinese-roberta-wwm-ext \
    --max_length 1533

结果

以下为第二阶段测试结果，评测指标为NDCG@30

模型	Dev	Test
Lawformer-Finetune	0.9386
Lawformer-RankMLP	0.9491	0.9355
Lawformer-RankAttention	0.9542

参考

Lawformer：https://github.com/thunlp/LegalPLMs
CoSENT：https://spaces.ac.cn/archives/9341

模型下载

百度网盘链接：https://pan.baidu.com/s/1eusFOqh2KiG3KEo4HQqhgw

提取码：loxr

chigee54 / lajs Goto Github PK

lajs's Introduction

Simple Attention for Learning to Rank based on Lawformer

环境配置

概述

预测

训练

结果

参考

模型下载

lajs's People

Contributors

Stargazers

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent

Jobs