vietnamaihub / vietnamese_llms Goto Github PK

Dự án bao gồm: 1. Xây dựng bộ dữ Instructions Vietnamese (chất lượng, nhiều, và đa dạng). 2.LLM Training, Finetuning, Evaluating & Testing trên Open-source mô hình ngôn ngữ: Bloomz,T5, UL2, LLaMA (1&2), OpenLLaMA, GPT-J pythia etc. 3. Ứng dụng và Giao diện Người dùng (UI)

License: Apache License 2.0

Python 100.00%

vietnamese_llms's People

Contributors

Stargazers

Watchers

vietnamese_llms's Issues

Vietnamese 52K Alpaca

@TranNhiem

Hi anh, ở mục Vietnamese Alpaca 52k (Translated using GPT-3.5) em check thấy chỉ có file alpaca_translate_GPT_35_10_20k.json --> hình như chỉ mới translation được 20k data, chưa hoàn thành translation 52k bằng GPT-3.5 đúng không ạ ?

Translate dataset

Hi team.
Trong quá trình tìm hiểu, mình có tìm được repo này
Mình nghĩ nó giúp ích cho việc chuyển đổi dataset các thứ tiếng sang ngôn ngữ cần.

https://github.com/artitw/text2text

Hi vọng có ích cho team và cộng đồng.

Longtext32k - Aplaca

Cảm ơn bạn đã đóng góp và triển khai cho cộng đồng!
Hiện tại longtext đã ra đời, do hiện tại mình bị giới hạn về phần cứng, rất vui nếu bạn có thể mở rộng thêm các bộ dataset32k cho tiếng việt để cộng đồng cùng nghiên cứu.

Cảm ơn bạn rất nhiều.!

Translate medical data

Hi team,
Mình có tìm thấy 1 open source có generate bộ data về medical, team có thể xem qua và dịch nó ra tiếng Việt,
Mình xin phép gửi link đính kèm: https://github.com/CogStack/opengpt

vietnamaihub / vietnamese_llms Goto Github PK

vietnamese_llms's People

Contributors

Stargazers

Watchers

Forkers

vietnamese_llms's Issues

Vietnamese 52K Alpaca

Translate dataset

Longtext32k - Aplaca

Translate medical data

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent

Jobs