GithubHelp home page GithubHelp logo

turkcekonusmatanimlama's Introduction

TurkceKonusmaTanimlama

Kullanılan Modeller

Facebook XLS-R
DeepSpeech

Kullanılan Paragraf

Yalnızlık Psikolojisi - Dr. Recai Yahyaoğlu kitabından ilk paragraf

Her şey bir ihtiyaçtan doğar. Yapılan her iş, iyi yada kötü bir anlam taşır ve her anlam hayata bakışımızı etkiler. İnsanlar bu farklı bakış açılarına göre kısmen yalnızdırlar. Çünkü etraflarında onlar gibi olaylara aynı şekilde bakan ve algılayan kimse yoktur. Bu yüzden iyi yada kötü anlamlar çağrıştıran, doğru ya da yanlış değerlendirilebilen ve kimi zaman ihtiyaç haline gelen yalnızlık duygusunun tanınması gerekir.

Paragraf ses dosyası: paragraf.mp3

Facebook XLS-R

Wav2vec2-large-xlsr-532 modeli 53 dil için 16 kHz ses dosyaları ile eğitilmiş bir modeldir. Bu modeli Mozilla tarafından oluşturulan Common Voice3 adlı, 96 dilde 15.234 saati doğrulanmış olmak üzere toplam 20.817 saat veri içeren dataset ile xlsr-large-53 modeli üzerinde ince ayar yaparak kullanmayı denedim. İnternette Common Voice 6.1-2020-12-11 dataseti ile hazırlanmış bir model bulunmaktadır4. Bu modeli oluşturan not defterini kullanarak datasetin en son sürümü olan 10.0-2022-07-04 versiyonunu kullanarak yeni bir model eğittim5. Bu üç modeli (common voice 6.1 ile ince ayar yapılmış xlsr-large-53 ozcangundes6 ve patrickvonplaten/wav2vec2-large-xlsr-turkish-demo modelleri , common voice 10.0 ile ince ayar yapılmış) kıyaslayıp paragraf için çıktılarını kıyasladım. Bu çıktılarda kelime hata oranlarını gösterdim. Model not defteri modelinin adıdır. model_original patrickvonplaten/wav2vec2-large-xlsr-turkish-demo modeli olan temel aldığım not defterindeki modeldir. model_base ise huggingface sayfasındaki ozcangundes modelidir. Amacım base modeli ile facebook modelini almaktı fakat dile özgü modeller için processor sunulmamaktaymış.

Sonuçlar

Tahmin edilen metinler

Paragraf:
her şey bir ihtiyaçtan doğar. yapılan her iş, iyi yada kötü bir anlam taşır ve her anlam hayata bakışımızı etkiler. i̇nsanlar bu farklı bakış açılarına göre kısmen yalnızdırlar. çünkü etraflarında onlar gibi olaylara aynı şekilde bakan ve algılayan kimse yoktur. bu yüzden iyi yada kötü anlamlar çağrıştıran, doğru ya da yanlış değerlendirilebilen ve kimi zaman ihtiyaç haline gelen yalnızlık duygusunun tanınması gerekir.

Not defteri modeli tahmin:
1

Orijinal not defteri modeli tahmin:
her şey bir ihtiyaştanduvar yapılan her viş iyi yada kötü bir anlam taşır ve her andan hayatapa kşimise etkiler i̇nsanlar bu farklı bakış açılarını göre kısınan yalnızdırlar çüngi yetraflamdaonlar gibi olaylara aynı şekilde bakan ve algalarenkimse yoktur bu yüzden iyii yada kötü anlamlar çağrıştıran doğru ya da yallışleğerlemdiilebilen vekim zaman ihtiye çarını gelenhannızlık duygu sunu tanınması gerekir

Wav2Vec2 Türkçe modeli tahmin:
her şeyi bir ihti yaştanbuar yapılan her içş iyi yılda kötü bir anlam taşır ve her andan hayatı bak şimise etkiler i̇nsanlar bu farklı bakışaçılarını görü kısına yalnızdırlar çüng etraflad unlar gibi olayları aynı şekilde bakan ve algalayan kimse yokturbu yüzden iyi yada kötü anlımlar çağrıştıran doğruyada yanlış değerlendirlebilen ve kimi zaman ihtiye çarını gelenyannızlık duygusunu tanınması gerekir

Kelime hata oranları (ne kadar az o kadar iyi)

Not defteri modeli hata oranı:
1.0

Orijinal not defteri modeli hata oranı:
0.5254237288135594

Wav2Vec2 Türkçe modeli hata oranı:
0.5932203389830508

Autocorrect sonrası çıktılar Konuşma tanımlama modellerinden daha iyi sonuç elde etmek için autocorrect ile birlikte kullanıldığını öğrendim.

Not defteri modeli tahmin:
1

Orijinal not defteri modeli tahmin:
her şey bir ihtiyaştanduvar yapılan her iviş iyi yada kötü bir anlam taşır ve her andan hayatapa kşimise etkiler i̇nsanlar bu farklı bakış açılarını göre kısınan yalnızdırlar çengi yetraflamdaonlar gibi olaylara aynı şekilde bakan ve algalarenkimse yoktur bu yüzden iyimi yada kötü anlamlar çağrıştıran doğru ya da yallışleğerlemdiilebilen velim zaman itiye çarını gelenhannızlık duygu sunu tanınması gerekir

Wav2Vec2 Türkçe modeli modeli tahmin:
her şeyi bir hiti yaştanbuar yapılan her iç iyi yılda kötü bir anlam taşır ve her andan hayatı bak şiimse etkiler i̇nsanlar bu farklı bakışasılarını görü kısına yalnızdırlar çünkü etraflan unlar gibi olayları aynı şekilde bakan ve alalayan kimse yokturbu yüzden iyi yada kötü anlımlar çağrıştıran doğrucada yanlış değerlendirtebilen ve kimi zaman intiye çarını gelenyannızlık duygusunu tanınması gerekir

Kelime hata oranları

Not defteri modeli hata oranı:
1.0

Orijinal not defteri modeli hata oranı:
0.5254237288135594

Wav2Vec2 Türkçe modeli hata oranı:
0.5932203389830508

Eksikler

  • Kendi geliştirdiğim modelde öğrenme gerçekleşmiyor. colabda ses dosyalarının çoğunluğunu göremiyor/okuyamıyor. Çok düşük batch boyutu ile eğitim tamamladığım zamanda bile anlamsız sonuç döndü

DeepSpeech

Türkçe için bu eğitimi yapan tek bir çalışma bulabildim. RashadGarayev tarafından geliştirilmiş model github reposunu buldum ve o aşamaları takip ettim. Fakat bir sonuç üretemedi. Felemenkçe için yapılan bir not defteri buldum. Bu aşamaları türkçe dataseti için uyarladım. Not defterindeki training kısmını çalıştırınca bu modül bulunmamaktadır hatası verdi. Mozillanın hazırlandığı dökümantasyondaki eğitim kısmı eksik/problemli. Paket uyumsuzluğu ve bulunamayan python scriptleri var.

Kaynakça
Wav2vec2-large-xlsr-53
Common voice
Fine-Tune XLSR-Wav2Vec2 on Turkish ASR with 🤗 Transformers (Model geliştirmek için kullanılan not defteri)
Tüm çalışmaları gösteren not defteri
ozcangundes modeli
Türkçe Deepspeech
Felemenkçe Not defteri
Eğitim Dökümantasyonu
AutoCorrect modülü virtualenv colab

turkcekonusmatanimlama's People

Contributors

theieyrre avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.