GithubHelp home page GithubHelp logo

cs2225.ch2001013's Introduction

CS2225.CH2001013

**BÁO CÁO ĐỒ ÁN CUỐI KỲ MÔN: NHẬN DIỆN THÔNG TIN THỊ GIÁC *Tên đồ án: Nhận diện đối tượng qua hình ảnh hoặc video clip

Sau buổi hướng dẫn ngày 13/9/2020, Nhóm tự tạo các Github cá nhân, trong đó nhóm Trưởng tạo Github nhóm với địa chỉ:

MÔ TẢ ĐỒ ÁN CUỐI KỲ: Ngày 27/9/2020, nhóm nộp mô tả đồ án cuối kỳ lần đầu với nội dung:

  • Đề tài: Nhận dạng phương tiện giao thông
  • đầu vào là ảnh hoặc video giao thông
  • đầu ra: đếm số xe có trong ảnh, clip

**Sau quá trình nghiên cứu, thảo luận Nhóm quyết định chọn tên Đề tài cuối kỳ:

  • Nhận diện đối tượng qua hình ảnh hoặc video clip
  • Loại bài toán: Object Detection

**QÚA TRÌNH THỰC HIỆN:

Nhận diện đối tượng qua Clip:

  1. Tải ảnh lên : from google.colab import files uploaded = files.upload()

  2. Khởi chạy Yolo 3 để phân tích: !./darknet detector demo cfg/coco.data cfg/yolov3.cfg yolov3.weights -dont_show test.mp4 -i 0 -out_filename output.avi -thresh 0.7

  3. Hiển thị kết quả: #THÊM TRÌNH HỖ TRỢ HIỂN THỊ VIDEO QUA HTML: from IPython.display import HTML from base64 import b64encode mp4 = open('output.mp4','rb').read() data_url = "data:video/mp4;base64," + b64encode(mp4).decode()

#HIỂN THỊ VIDEO: HTML(""" """ % data_url)

Nhận diện đối tượng qua ảnh

  1. Đưa ảnh cần Test vào thư mục data trên Darnet,

run darknet detection

#di chuyển tới thư mục data, tải lên các ảnh để dự đoán

  1. Chạy Yolo 3 để phân tích ảnh:

    !./darknet detect cfg/yolov3.cfg yolov3.weights data/person1.jpg

  2. Hiển thị ảnh kết quả sau khi phan tích:

# show image using our helper function

    imShow('predictions.jpg')

**ĐÁNH GIÁ:

  • Với bộ dữ liệu train khá lớn của Darknet (hơn 20.000 ảnh), 80 class, các đối tượng được nhận diện với độ chính xác lên đến 95 - 100%

**NHỮNG VẤN ĐỀ NHÓM ĐÃ LÀM ĐƯỢC:

  • Có thể sử dụng tốt Google Colab, Github và lập trình Python, Yolo trong việc nhận diện đối tượng
  • Nhận diện được đối tượng qua ảnh, video clip

*NHỮNG VẤN ĐỀ CHƯA LÀM ĐƯỢC:

  • TÙY BIẾN CODE YOLO 3 ĐỂ NHẬN DIỆN MỘT SỐ ĐÓI TƯỢNG CỤ THỂ. Đây cũng là hướng để nhóm nghiên cứu, phát triển thêm.

cs2225.ch2001013's People

Contributors

cs2225ch2001013 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.