clue-ai / promptclue Goto Github PK
View Code? Open in Web Editor NEWPromptCLUE, 全中文任务支持零样本学习模型
Home Page: https://www.clueai.cn
License: Other
PromptCLUE, 全中文任务支持零样本学习模型
Home Page: https://www.clueai.cn
License: Other
base模型微调之后是否可商用
请问large模型要怎么下载呢?
你好,请问下预训练代码有计划开源吗?
大神们好。我看该项目说是“在t5-large版基础上,使用数百G中文语料,训练了100万步,累积训练了1.5万亿个中文字词级别token
”
我想问下,这里是采用t5-large
模型作为预训练模型,在中文数据上进行微调训练的嘛?
有和现有的开源模型对比,或者在榜单上的效果对比吗?这样读者能有一个直观的性能比较
请问调用本地ClueAI/PromptCLUE-base-v1-5进行分类任务,如何实现clueai API进行分类的输出效果呢?(给出prediction、每个label的Confidence)
使用pCLUE-main项目里的数据训练后, 加载模型 , 同样的代码 , 使用本地训练的和示例代码出来的结果完全不同 , 请问需要怎么改进
示例代码
tokenizer = T5Tokenizer.from_pretrained("ClueAI/PromptCLUE")
model = T5ForConditionalGeneration.from_pretrained("ClueAI/PromptCLUE")
print(answer('''信息抽取:
今天我向大家介绍一下一个人。他是张丰毅1956年9月1日出生于河南省南阳市唐河县,1982年毕业于北京电影学院,是**电影协会理事。1993年,与其他演员主演电影《霸王别姬》
问题:主角,嘉宾,演员,改编自,面积,出生地,学校,成员,出生时间
答案:''',sample=False))
输出结果:
地址:河南省南阳市唐河县
组织:北京电影学院,**电影协会
名字:张丰毅
职位:理事
本地模型
tokenizer = T5Tokenizer.from_pretrained("ClueAI/PromptCLUE")
model = T5ForConditionalGeneration.from_pretrained("outputs/model_files/")
#或者以下方式引用
tokenizer = AutoTokenizer.from_pretrained("ClueAI/PromptCLUE")
model = AutoModelForSeq2SeqLM.from_pretrained("outputs/model_files/")
print(answer('''信息抽取:
今天我向大家介绍一下一个人。他是张丰毅1956年9月1日出生于河南省南阳市唐河县,1982年毕业于北京电影学院,是**电影协会理事。1993年,与其他演员主演电影《霸王别姬》
问题:主角,嘉宾,演员,改编自,面积,出生地,学校,成员,出生时间
答案:''',sample=False))
输出结果:
演员:张丰毅1956年9月1日出生于河南省南阳市唐河县
目前的模型在用于分类时,偶尔会输出多个类别标签,怎么能控制模型只输出一个最有可能的类别标签呢
如题,感谢你们发布了这个模型。
后续能发布一个small类型的模型吗?
下游在处理自定义简单单任务的时候未必需要base拿给层级的,这样对于小资源调试和推理都是有好处的。
有没有相关的参考文献或者开源代码可以借鉴一下怎么训练的
不知道官方是否有基于LLM+NLP任务prompt数据的模型计划~~~
因为现在的模型效果确实不太好
感谢能开源如此好用的模型,
直接索要数据这肯定是不可能的,但能否放出相应的数据格式提供用户拿自己数据进行FineTune参考?
比如v1.5新增的改写、纠错任务,thx
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.