Comments (12)
你好,建议增加 --bits 4
参数进行量化
from deepke.
你好,建议增加
--bits 4
参数进行量化
在哪个文件更改啊,我现在没有进行微调,只是用这个模型去进行提取,就报了这个错误,谢谢!
from deepke.
你已经进行了4bits量化,建议减小输入长度 max_length=1024, max_new_tokens=512
from deepke.
你已经进行了4bits量化,建议减小输入长度 max_length=1024, max_new_tokens=512
已经启动起来了,感谢!
怎么抽也只能抽取到第一条,是我问的方式不对吗?
from deepke.
我们训练集中文本长度偏短,因此建议实际使用中不要使用过长的文本进行抽取。
from deepke.
我们训练集中文本长度偏短,因此建议实际使用中不要使用过长的文本进行抽取。
没办法啊,都是一篇一篇文档过来。我是做了下测试。后面如果真的需要用,那可能真的需要学习了。
from deepke.
您可以暂时对文档进行划窗口来进行抽取,跑多次抽取模型
from deepke.
您可以暂时对文档进行划窗口来进行抽取,跑多次抽取模型
那上下文变化,准确度应该会下降。然后能不能直接读pdf之类,我现在是通过程序读取的pdf,转为了string
from deepke.
当前阶段的模型可能还无法很好的处理文档级的抽取,我们将在下一个版本的模型中加强这方面的能力。
from deepke.
当前阶段的模型可能还无法很好的处理文档级的抽取,我们将在下一个版本的模型中加强这方面的能力。
期待中
from deepke.
@whwususu 请问你是怎么解决的?我也是报这个错,减小了输入输出长度也还是报错。
from deepke.
请问一下,你知道怎么使用vscode调试这个代码吗
from deepke.
Related Issues (20)
- max_source_length, max_target_length, cutoff_len含义 HOT 4
- wget 120.27.214.45/Data/triple/PRGC/data.tar.gz下载数据的时候 404 not Found HOT 4
- lora微调llm是报错 HOT 2
- 继续lora微调时报错KeyError: 'response' HOT 4
- 中文实体抽取模型选择 HOT 2
- 使用vscode对多模态命名体进行调试问题 HOT 16
- NER json格式不支持 HOT 31
- 关于大模型生成的知识图谱准确性的判断 HOT 2
- 模型选择 HOT 3
- 超参数设置问题 HOT 6
- 大模型支持千问2.0或者llama3.0么 HOT 2
- 不同任务类型选择的schema数量 HOT 3
- Schema疑惑 HOT 3
- InstructIE schema困惑 HOT 3
- knowlm-13b-ie模型直接推理遇到bug,楼主昨天的fix_tokenizer还存在bug HOT 20
- linux 安裝 conda环境报错Please use pip<24.1 if you need to use this version. INFO: HOT 1
- Linux 运行re run.py huggingface_hu 问题 HOT 3
- 推理代码bug反馈 HOT 9
- 模型评估 HOT 7
- 请问可以多卡推理吗,单卡显存有限 HOT 11
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from deepke.