GithubHelp home page GithubHelp logo

nagyvikt / ocrsze Goto Github PK

View Code? Open in Web Editor NEW
1.0 1.0 0.0 856.84 MB

Útjelző táblák olvasása és értelmezése Trensflow model segítségével. A modell jelenleg 65 útjelző táblát képes 90%-os pontosság felett felismerni.

ocrsze's Introduction

Projekt README: Útjelző Táblák Felismerése OCR és TensorFlow Technológiával

Projekt Leírás

Ez a projekt egy innovatív trensflow modell betanítására irányul amely képes az útjelző táblák felismerésére és a rajtuk szereplő szöveges információk digitalizálására. A modern képfeldolgozási technikákat és gépi tanulási modelleket, mint például a TensorFlow-t alkalmazva elemzi a közlekedési jelzéseket, azonosítja a szimbólumokat és a szöveges utasításokat, támogatva ezzel a vezetők tájékozódását és döntéshozatalát. A projekt célja egy olyan GUI (grafikus felhasználói interfész) megalkotása, amely képes felismerni és azonosítani a beadott útjelző táblákat a feldolgozott 100 különböző típus közül.

Főbb Jellemzők

  • Képfeldolgozás és gépi tanulás alapú szövegfelismerés
  • TensorFlow segítségével tréningelt modell alkalmazása
  • Interaktív GUI-n keresztüli tábla felismerés
  • Támogatás többféle útjelző tábla azonosítására
  • Pontos és megbízható szöveges és vizuális kimenet generálása

Előfeltételek

A projekt futtatásához szükséged lesz a következőkre:

  • Python 3.6 vagy újabb
  • TensorFlow 2.x
  • OpenCV
  • PIL (Pillow)
  • NumPy
  • Pandas
  • Matplotlib (opcionális grafikonokhoz)

Telepítés

  1. Klónozd a projekt GitHub repóját a helyi gépedre:
    git clone https://github.com/NagyVikt/UtjelzoTablaFelismeroTFModell.git
  2. Lépj be a projekt könyvtárba:
    cd ocr-traffic-sign-recognition
  3. Hozz létre egy virtuális környezetet:
    python -m venv venv
  4. Aktiváld a virtuális környezetet:
    • Windows:
      .\venv\Scripts\activate
    • macOS és Linux:
      source venv/bin/activate
  5. Telepítsd a függőségeket:
    pip install -r requirements.txt

Használat

A GUI indításához futtasd a fő Python szkriptet a projekt gyökérkönyvtárában:

python main.py

A GUI-n keresztül töltheted fel az útjelző táblák képeit, amelyeket a rendszer elemz, és azonnali visszajelzést ad a felismerés eredményéről.

Fejlesztés

  • A képek előfeldolgozása: Ez magában foglalja a méretezést, szürkeárnyalatos konverziót, és zajszűrést.
  • Modell tréningelése és finomhangolása: Használj több különböző adathalmazt a modell robustusságának növelésére.
  • GUI fejlesztése: Implementálj további funkciókat a felhasználói élmény javítása érdekében.

A modell betanítása során mért idő

A modell felépítése az adott képek számától függően körülbelül 15 percet vesz igénybe.

A modell betanítása során mért metrikákák jelentése

  1. accuracy (Pontosság) Jelentés: Az accuracy vagy pontosság azt mutatja meg, hogy a modell mennyire képes helyesen osztályozni az adatokat. %-os pontossággal képes helyesen azonosítani a tanító adatkészletben szereplő címkéket. Ha ez pl.0,43 az azt jelenti, hogy körülbelül 100 kérdésből átlagosan 43-at helyesen tud beazonosítani.
  2. loss (Veszteség) Jelentés: A loss vagy veszteség az a szám, ami azt mutatja, mennyire távol vannak a modell által előrejelzett értékek a valós címkéktől. A veszteség alacsonyabb értéke azt jelzi, hogy a modell jobban illeszkedik az adatokhoz.
  3. val_accuracy (Validációs Pontosság) Jelentés: A val_accuracy hasonló a fent említett accuracy-hoz, de ez a validációs adatkészletre vonatkozik. Ha ez magasabb, mint a tanító adatkészleten mért pontosság, az azt sugallja, hogy a modell jól teljesít az új, eddig nem látott adatokon. Ebben az esetben ez azt mutatja, hogy a modell általánosítási képessége jó.
  4. val_loss (Validációs Veszteség) Jelentés: A val_loss az a veszteség, amit a modell a validációs adatkészleten produkál. Ha ez az érték jelentősen alacsonyabb, mint a tanítási veszteség, az jó jel, mivel azt mutatja, hogy a modell hatékonyan képes generalizálni az új adatokra.

Közreműködés

Minden közreműködést szívesen fogadunk! Nyiss egy issue-t a javaslatoddal vagy hibajelentéssel, vagy küldj be egy pull requestet a változtatásokkal.

Szerző

  • Projekt készítője: Nagy Viktor

Referenciák

A részletes projekt leírás a Dokumentacio.md fájlban található.

ocrsze's People

Contributors

nagyvikt avatar

Stargazers

 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.