jd-aig / nlp_baai Goto Github PK

View Code? Open in Web Editor NEW

252.0 252.0 62.0 1.38 MB

NLP models and codes for BAAI-JD joint project.

Python 99.23% Shell 0.77%

nlp_baai's People

Contributors

Stargazers

Watchers

nlp_baai's Issues

请问是否有pytorch的版本，我在执行转换脚本的时候会报错

数据集在哪里下载

你好，看到你们介绍有提供数据集，但是2020年的数据集在哪里下载哈？可以提供下下载链接吗

请问比赛模型文件如何上传呢？

比赛模型文件过大，几个G的大小。使用贵比赛提供的“提交评审”页面中“上传文件”按钮，选择了模型文件并上传后，无回复反应。请问该如何处理呢？

transformer加载预训练模型出现Segmentation fault (core dumped)错误。

model = model_class.from_pretrained(args.model_name_or_path, from_tf=bool('.ckpt' in args.model_name_or_path), config=config)，在进行检索baseline model调试过程中出现预训练模型加载时出现Segmentation fault (core dumped)。
transformer version：2.9.1， 2.11.0 都会出现这样的错误
pytorch version: 1.3.1

raw_data_preprocess.py报错

File "raw_data_preprocess.py", line 279, in <module>
    train_items, dev_items = do_preprocess(args.directory, args.sess_turns)
File "raw_data_preprocess.py", line 81, in do_preprocess
    waiter = word[4]

难道我们用的不是同一个训练文件吗？我用的是data_train.txt，这个文件里面商品编号这一列有部分是空的

JD-BERT for Tensorflow can't donwload?

为什么baseline模型训练过程中，需要预测每一次的utterance?而不仅仅预测客服的回答

你好！感谢提供baseline model
官网中对于问题的描述是这样的
输入（上下文信息，用户问题）：此轮对话用户提出的问题Qn，其中Qn可能为纯文本、纯图片的问题或图文相结合的问题；此轮对话前n-1轮的对话历史信息，C={Q0, A0, Q1, A1, …, Qn-1, An-1}，历史对话信息也可能为多模态形式。输出（文本预测答案）：根据输入信息，输出满足第n轮用户问题Qn所期望的答案，该答案应该是通顺、逻辑一致且含有丰富知识的文本回答。
我在阅读代码时发现
input_conversations = [conv[:-1] for conv in conversations] target_conversations = [conv[1:] for conv in conversations]
即，baseline model在train、evaluate以及test过程中，不仅需要根据{Q0, A0, Q1, A1, …, Qn-1, An-1,Qn}预测An,
还需要分别根据{Q0}预测A0，根据{Q0，A0}预测Q1，根据{Q0,A0,Q1}预测A1,...,根据{Q0,A0,...,Qn-1,An-1}预测Qn？

这与paper中的描述似乎不太一样？并且模型在训练过程中还需要预测客户问题，不太清楚这是否合理

模型和词向量下载链接失效

点击链接，提示访问权限被限制，不知道是否还开放下载权限？

jd-aig / nlp_baai Goto Github PK

nlp_baai's People

Contributors

Stargazers

Watchers

Forkers

nlp_baai's Issues

请问是否有pytorch的版本，我在执行转换脚本的时候会报错

数据集在哪里下载

请问比赛模型文件如何上传呢？

transformer加载预训练模型出现Segmentation fault (core dumped)错误。

raw_data_preprocess.py报错

JD-BERT for Tensorflow can't donwload?

为什么baseline模型训练过程中，需要预测每一次的utterance?而不仅仅预测客服的回答

模型和词向量下载链接失效

mddr使用的词向量是腾讯的吗

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent

Jobs