求助！将examples/pruner/oneshot/oneshot_prune.py里的模型替换为自己的模型时报错，代码如下： <a href="ht

目前已经支持了，详细情况参考 <a class="issue-link js-issue-link" data-error-text="Failed to load tit

目前已经支持了，详细情况参考 <a class="issue-link js-issue-link" data-error-text="Faile

OneShot Pruning Tensor Size Mismatch Error about tinyneuralnetwork HOT 4 CLOSED

zeo233 commented on August 27, 2024

OneShot Pruning Tensor Size Mismatch Error

from tinyneuralnetwork.

Comments (4)

zk1998 commented on August 27, 2024

目前已经支持了，详细情况参考 #326 ，此外还有个问题需要注意一下：

transformer类的模型，例如你这边使用的Whisper，模型定义大部分是通过config在init时就固定了，剪枝后模型的部分维度发生变化，你需要手动改一下这部分维度的定义。例如在你提供的WhisperAttention中进行剪枝，需要减少num_heads和embed_dim，剪枝后需要手动进行修改。

pruner = OneShotChannelPruner(model, torch.ones(1, 80, 3000), args.config)

# (Optional) A new config file with layer-level sparsity will be generated inplace
# If you want to customize those generated content, you may do that before calling `.prune`
pruner.generate_config(args.config)

# Get the pruned untrained model
pruner.prune()

# Manually modify related predefined dimension variables
for idx_l, layer in enumerate(model.audio_encoder.model.layers):
    layer.self_attn.num_heads = layer.self_attn.q_proj.out_features // layer.self_attn.head_dim
    layer.self_attn.embed_dim = layer.self_attn.num_heads * layer.self_attn.head_dim

model(torch.ones(1, 80, 3000))
exit()

from tinyneuralnetwork.

zeo233 commented on August 27, 2024

目前已经支持了，详细情况参考 #326 ，此外还有个问题需要注意一下：

transformer类的模型，例如你这边使用的Whisper，模型定义大部分是通过config在init时就固定了，剪枝后模型的部分维度发生变化，你需要手动改一下这部分维度的定义。例如在你提供的WhisperAttention中进行剪枝，需要减少num_heads和embed_dim，剪枝后需要手动进行修改。
pruner = OneShotChannelPruner(model, torch.ones(1, 80, 3000), args.config)

# (Optional) A new config file with layer-level sparsity will be generated inplace
# If you want to customize those generated content, you may do that before calling `.prune`
pruner.generate_config(args.config)

# Get the pruned untrained model
pruner.prune()

# Manually modify related predefined dimension variables
for idx_l, layer in enumerate(model.audio_encoder.model.layers):
    layer.self_attn.num_heads = layer.self_attn.q_proj.out_features // layer.self_attn.head_dim
    layer.self_attn.embed_dim = layer.self_attn.num_heads * layer.self_attn.head_dim

model(torch.ones(1, 80, 3000))
exit()

确实能跑通了，谢谢！请问transformer剪枝的时候剪掉的是注意力头吗

from tinyneuralnetwork.

zk1998 commented on August 27, 2024

一般三个维度剪，Attention_head，MLP_intermediate_size，hidden_size。目前是屏蔽了hidden_size维度，剪前两者。你可以把模型print看一下对应维度的减少。

from tinyneuralnetwork.

zeo233 commented on August 27, 2024

一般三个维度剪，Attention_head，MLP_intermediate_size，hidden_size。目前是屏蔽了hidden_size维度，剪前两者。你可以把模型print看一下对应维度的减少。

明白了，多谢多谢

from tinyneuralnetwork.

OneShot Pruning Tensor Size Mismatch Error about tinyneuralnetwork HOT 4 CLOSED

Comments (4)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent

Jobs