GithubHelp home page GithubHelp logo

lethnis / torch-image-classification Goto Github PK

View Code? Open in Web Editor NEW
0.0 2.0 0.0 7.47 MB

Пример классификации изображений с моделями с нуля на PyTorch

License: MIT License

Python 100.00%

torch-image-classification's Introduction

Классификация изображений с нуля на PyTorch

Пример классификации изображений с моделями с нуля на PyTorch. Датасет Animals-10 взят с сайта Kaggle.
Дообучение готовых моделей здесь.

Использование

Обучение

  1. Подготовить виртуальную среду. Использовался python 3.11.8
  2. Установить зависимости. pip install -r requirements.txt
  3. В терминале запустить main.py Пример: python main.py path/to/dataset densenet Если написать python main.py без аргументов, то выведется подробная инструкция по использованию.
  4. Информация об обучении сохраняется в папку runs.
Подробнее об аргументах
  • Обязательные аргументы:
    • путь до данных - данные могут быть в формате папок train, val, test, или сразу папки с классами. В этом случае для val будет отобрано 10% датасета.
    • модель или путь до модели - есть подготовленные модели mobilenetv1 и densenet. Можно так же указать путь до готовой модели в формате .pt или .pth.
  • Необязательные аргументы:
    • alpha - множитель для модели mobilenetv1.
    • reps - список повторений слоёв для densenet.
    • bottleneck - для densenet использовать или нет стиль bottleneck
    • batch - размер батча
    • epochs - количество эпох
    • img_size - размер изображений
    • augs - какие аугментации применять к изображениям
    • name - имя проекта, под которым будет сохраняться информация об обучении
Примеры: python main.py path/to/dataset mobilenetv1 alpha=0.5 batch=32 epochs=100 img_size=224 name=experiment1 python main.py path/to/dataset/ densenet reps=[2,4,8] bottleneck=True augs='soft'

Предсказание

Выполнить python predict.py path/to/best.pt path/to/images

Результаты обучения

Результаты обучения сохраняются в папку runs/project_name со следующей информацией:

Графики обучения:

Достигнута точность ~80%: Как можно её улучшить:

  • экспериментировать с аугментацией
  • экспериментировать с гиперпараметрами(количество эпох, размер батчей, размер изображений и т.д.)
  • собрать больше данных
  • Использовать другие архитектуры (например, ViT, ResNet, EfficientNet)
  • использовать fine-tuning и feature extraction предобученных моделей

Примеры предсказания модели

TODO

  • save best model
  • add tensorboard support
  • add args.yaml file to store all parameters
  • add resume training from saved model

torch-image-classification's People

Contributors

lethnis avatar

Watchers

Kostas Georgiou avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.