物体検出を行い検出結果をPascal VOC形式で保存するスクリプト
- xmltodict 0.12.0 or later
使用方法は以下です。
python main.py
- --device
カメラデバイス番号の指定
デフォルト:0 - --movie
動画ファイルの指定 ※指定時はカメラデバイスより優先
デフォルト:指定なし - --image_dir
画像ファイル格納ディレクトリの指定 ※指定時はカメラデバイスや動画より優先
デフォルト:指定なし - --output_dir
推論結果の保存先
デフォルト:Result - --detector
Object Detectionのモデル選択
デフォルト:yolox - --class_txt
物体検出時のラベル名のテキストを格納したパス
デフォルト:Detector/yolox/coco_classes.txt - --target_id
対象のクラスIDを指定
複数指定する場合はカンマ区切りで指定 ※Noneの場合は全てを対象とする
例:--target_id=1
例:--target_id=1,3
デフォルト:None - --use_gpu
GPU推論するか否か
デフォルト:指定なし - --set_name
xmlファイル一覧テキストを出力名
デフォルト:train - --bbox_offset
Pascal VOC形式のバウンディングボックスへ変換する際のオフセット
デフォルト:1 - --folder
<folder>タグに書き込む内容
デフォルト:VOCCOCO - --path
<path>タグに書き込む内容
デフォルト:指定なし - --owner
<owner>タグに書き込む内容
デフォルト:Unknown - --source_database
<database>タグに書き込む内容
デフォルト:Unknown - --source_annotation
<annotation>タグに書き込む内容
デフォルト:Unknown - --source_image
<image>タグに書き込む内容
デフォルト:Unknown - --segmented
<segmented>タグに書き込む内容
デフォルト:0
モデル名 | 取得元リポジトリ | ライセンス | 備考 |
---|---|---|---|
YOLOX | Megvii-BaseDetection/YOLOX | Apache-2.0 | YOLOX-ONNX-TFLite-Sampleにて ONNX化したモデルを使用 |
高橋かずひと(https://twitter.com/KzhtTkhs)
ObjectDetection2VOC is under MIT License.