xrli-u / musc Goto Github PK

This is an official PyTorch implementation for "MuSc : Zero-Shot Industrial Anomaly Classification and Segmentation with Mutual Scoring of the Unlabeled Images" (MuSc ICLR2024).

License: MIT License

Python 94.21% Shell 5.79%

musc's People

Contributors

Stargazers

Watchers

Forkers

cv-seg hsuchialun balancedzhi zhouyu-hust henghengxiong clovermini emilia-re next0001

musc's Issues

how to use dino or dinov2？

FileNotFoundError: [Errno 2]No such file or directory: '/home/robot/.cache/torch/hub/facebookresearch dinov2 main/hubconf.py'

musc模型进一步细节

利用用未标记测试图像，提出了一种基于未标记图像相互评分进行分类与分割，这确实是一种新机制。

我想请问：这是属于：无监督及自监督的思路吧？（通常是利用：正常合格的产品，即正样本去训练。）

从论文中，我的感悟，你这个思路，好像是类似：基于合成的模型？提取VIT特征，然后分区域打上标签？然后把合成前后的图像，互相打分？

请问：引用Dino V2作为骨干，是否效果最优呢？

另外：你论文中提到的RsCIN 有3个局限性：

1：对其骨干网中不包含图像级特征的一些单类方法，需要另一个骨干网来提取图像级特征。

2：对于分类结果非常高的方法，RsCIN 对图像级特征表示的改进(潜力空间)有限？

3:你们发现，你们的方法和 WinCLIP 都受到方向或比例不一致的影响。原因是使用固定的预训练视觉Transformer 作为特征提取器，在预训练过程中，Transformer 只对方向和比例进行了轻微的数据增强。因此，我们都不能有效地解决方向或比例不一致的问题。APRIL-GAN 的 AC 分数也有所下降，但 AS 分数有所提高。猜测原因是 APRIL-GAN 使用额外的训练集来优化 AS。

我很有兴趣你们团队是如何持续改进，解决以上问题的。当然，这样就离实际工业化落地更进一步了。

btad和mvtec_anomaly_detection无法可视化

visa可以直接可视化结果。可是剩余的两个数据集在结果文件夹只空的文件夹。请问是参数设置出现什么问题了吗？以下是我的参数设置。
parser = argparse.ArgumentParser(description='MuSc') parser.add_argument('--config', type=str, default='./configs/musc.yaml', help='config file path') parser.add_argument('--data_path', type=str, default="./data/mvtec_anomaly_detection/", help='dataset path') parser.add_argument('--dataset_name', type=str, default="mvtec_ad", help='dataset name') parser.add_argument('--class_name', type=str, default="ALL", help='category') parser.add_argument('--device', type=int, default=0, help='gpu id') parser.add_argument('--output_dir', type=str, default="./output/", help='save results path') parser.add_argument('--vis', type=str, default="true", help='visualization') parser.add_argument('--vis_type', type=str, default="single_norm", help='normalization type in visualization') parser.add_argument('--save_excel', type=str, default=None, help='save excel') parser.add_argument('--r_list', type=int, nargs="+", default=None, help='aggregation degrees of LNAMD') parser.add_argument('--feature_layers', type=int, nargs="+", default=None, help='feature layers') parser.add_argument('--backbone_name', type=str, default=None, help='backbone') parser.add_argument('--pretrained', type=str, default=None, help='pretrained datasets') parser.add_argument('--img_resize', type=int, default=224, help='image size') parser.add_argument('--batch_size', type=int, default=32, help='batch size') parser.add_argument('--divide_num', type=int, default=None, help='the number of divided subsets')

xrli-u / musc Goto Github PK

musc's People

Contributors

Stargazers

Watchers

Forkers

musc's Issues

Recommend Projects

Recommend Topics

Recommend Org

Jobs