GithubHelp home page GithubHelp logo

Comments (9)

pawopawo avatar pawopawo commented on July 29, 2024

resnet-50 中的bottleneck 里的 3个 conv 都换成ghost module吗

from efficient-ai-backbones.

iamhankai avatar iamhankai commented on July 29, 2024

是的,除了第一个conv,其他所有conv都换。

from efficient-ai-backbones.

huangpan2507 avatar huangpan2507 commented on July 29, 2024

是的,除了第一个conv,其他所有conv都换。

You mean, use Ghost_module instead of all the conv in the bottleneck ,include conv in downsample and except the first conv in Resnet? So I replace all of the conv except the first conv in Resnet, but The GPU cost increasely almost 10897M( My decive: 1 piece 1080ti GPU, before modify, GPU cost is 7645M ,batchsize= 8 * 4 ),it remind me that GPU is run out of memory, until I modify the batchsize = 1*4, the program can run!

from efficient-ai-backbones.

xyl-507 avatar xyl-507 commented on July 29, 2024

是的,除了第一个conv,其他所有conv都换。

@iamhankai @huangpan2507
您好,请问一下。对于后面两层layer3、4的conv2中有padding=2,dilation=2的情况,需要把padding=2,dilation=2传入到GhostModule中吗?如果是的话,GhostModule中primary_conv和cheap_operation都要接收这两个参数吗?
谢谢!

from efficient-ai-backbones.

iamhankai avatar iamhankai commented on July 29, 2024

是的,除了第一个conv,其他所有conv都换。

@iamhankai @huangpan2507
您好,请问一下。对于后面两层layer3、4的conv2中有padding=2,dilation=2的情况,需要把padding=2,dilation=2传入到GhostModule中吗?如果是的话,GhostModule中primary_conv和cheap_operation都要接收这两个参数吗?
谢谢!

您好,要传进去的。primary_conv接收这2个参数,cheap_operation不接收。

from efficient-ai-backbones.

xyl-507 avatar xyl-507 commented on July 29, 2024

是的,除了第一个conv,其他所有conv都换。

@iamhankai @huangpan2507
您好,请问一下。对于后面两层layer3、4的conv2中有padding=2,dilation=2的情况,需要把padding=2,dilation=2传入到GhostModule中吗?如果是的话,GhostModule中primary_conv和cheap_operation都要接收这两个参数吗?
谢谢!

您好,要传进去的。primary_conv接收这2个参数,cheap_operation不接收。

不好意思,我按照您的意思进行更改。发现GhostModule应用在stride=2的conv上会出现,和原始conv得到的特征图维度不一致的情况。如:输入6336的特征图,stride=2的conv得到3131的输出特征图,而ghostmodule得到的是32*32输出特征图。这样会影响网络的输出与训练标签不一致,请问一下,您们是怎么解决的啊?谢谢

from efficient-ai-backbones.

iamhankai avatar iamhankai commented on July 29, 2024

是的,除了第一个conv,其他所有conv都换。

@iamhankai @huangpan2507
您好,请问一下。对于后面两层layer3、4的conv2中有padding=2,dilation=2的情况,需要把padding=2,dilation=2传入到GhostModule中吗?如果是的话,GhostModule中primary_conv和cheap_operation都要接收这两个参数吗?
谢谢!

您好,要传进去的。primary_conv接收这2个参数,cheap_operation不接收。

不好意思,我按照您的意思进行更改。发现GhostModule应用在stride=2的conv上会出现,和原始conv得到的特征图维度不一致的情况。如:输入63_36的特征图,stride=2的conv得到31_31的输出特征图,而ghostmodule得到的是32*32输出特征图。这样会影响网络的输出与训练标签不一致,请问一下,您们是怎么解决的啊?谢谢

你需要改变conv或cheap_op的padding值,以让他们的输出尺寸能匹配上。

from efficient-ai-backbones.

xyl-507 avatar xyl-507 commented on July 29, 2024

是的,除了第一个conv,其他所有conv都换。

@iamhankai @huangpan2507
您好,请问一下。对于后面两层layer3、4的conv2中有padding=2,dilation=2的情况,需要把padding=2,dilation=2传入到GhostModule中吗?如果是的话,GhostModule中primary_conv和cheap_operation都要接收这两个参数吗?
谢谢!

您好,要传进去的。primary_conv接收这2个参数,cheap_operation不接收。

不好意思,我按照您的意思进行更改。发现GhostModule应用在stride=2的conv上会出现,和原始conv得到的特征图维度不一致的情况。如:输入63_36的特征图,stride=2的conv得到31_31的输出特征图,而ghostmodule得到的是32*32输出特征图。这样会影响网络的输出与训练标签不一致,请问一下,您们是怎么解决的啊?谢谢

你需要改变conv或cheap_op的padding值,以让他们的输出尺寸能匹配上。

感谢作者的耐心回复!在您的指点下,成功替换了resnet50中的conv(除了第一个conv和一个stride=2的conv)。但当我将替换后的backobone进行训练时,会报错:
CUDA is run out of memory (使用的是两块12GB 2080Ti的卡)
请问一下,按理来说替换后的网络参数量更少了,怎么会内存不够呢?
麻烦作者了,谢谢!

from efficient-ai-backbones.

iamhankai avatar iamhankai commented on July 29, 2024

是的,除了第一个conv,其他所有conv都换。

@iamhankai @huangpan2507
您好,请问一下。对于后面两层layer3、4的conv2中有padding=2,dilation=2的情况,需要把padding=2,dilation=2传入到GhostModule中吗?如果是的话,GhostModule中primary_conv和cheap_operation都要接收这两个参数吗?
谢谢!

您好,要传进去的。primary_conv接收这2个参数,cheap_operation不接收。

不好意思,我按照您的意思进行更改。发现GhostModule应用在stride=2的conv上会出现,和原始conv得到的特征图维度不一致的情况。如:输入63_36的特征图,stride=2的conv得到31_31的输出特征图,而ghostmodule得到的是32*32输出特征图。这样会影响网络的输出与训练标签不一致,请问一下,您们是怎么解决的啊?谢谢

你需要改变conv或cheap_op的padding值,以让他们的输出尺寸能匹配上。

感谢作者的耐心回复!在您的指点下,成功替换了resnet50中的conv(除了第一个conv和一个stride=2的conv)。但当我将替换后的backobone进行训练时,会报错:
CUDA is run out of memory (使用的是两块12GB 2080Ti的卡)
请问一下,按理来说替换后的网络参数量更少了,怎么会内存不够呢?
麻烦作者了,谢谢!

推测是因为中间过程的feature maps更多了。减小batch size吧。

from efficient-ai-backbones.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.