skyworkaigc / skypaint-ai-diffusion Goto Github PK

基于Stable Diffusion优化的AI绘画模型。支持输入中英文文本，可生成多种现代艺术风格的高质量图像。| An optimized text-to-image model based on Stable Diffusion. Both Chinese and English text inputs are available to generate images. The model can generate high-quality images in several modern art styles.

Home Page: https://sky-paint.singularity-ai.com/index.html#/

License: MIT License

dreambooth machine-learning text-to-image bert clip cv latent-diffusion openai pytorch ai-painting

skypaint-ai-diffusion's People

Contributors

Stargazers

Watchers

skypaint-ai-diffusion's Issues

微信群满了，怎么加入

[使用skyclip 计算image-text similarity的代码跑不通]

from PIL import Image
import requests
import clip
import torch
from transformers import BertTokenizer
from transformers import CLIPProcessor, CLIPModel, CLIPTextModel
import numpy as np

query_texts = ['一个人', '一辆汽车', '两个男人', '两个女人']  # 这里是输入提示词，可以随意替换。
# 加载SkyCLIP 中英文双语 text_encoder
text_tokenizer = BertTokenizer.from_pretrained("./tokenizer")
text_encoder = CLIPTextModel.from_pretrained("./text_encoder").eval()
text = text_tokenizer(query_texts, return_tensors='pt', padding=True)['input_ids']

url = "http://images.cocodataset.org/val2017/000000040083.jpg"  #这里可以换成任意图片的url
# 加载CLIP的image encoder
clip_model = CLIPModel.from_pretrained("openai/clip-vit-large-patch14")
clip_text_proj = clip_model.text_projection
processor = CLIPProcessor.from_pretrained("openai/clip-vit-large-patch14")
image = processor(images=Image.open(requests.get(url, stream=True).raw), return_tensors="pt")

with torch.no_grad():
   image_features = clip_model.get_image_features(**image)
   text_features = text_encoder(text)[0]
   # sep_token对应于openai-clip的eot_token
   sep_index = torch.nonzero(text == student_tokenizer.sep_token_id)
   text_features = text_features[torch.arange(text.shape[0]), sep_index[:, 1]]
   # 乘text投影矩阵
   text_features = clip_text_proj(text_features)
   image_features = image_features / image_features.norm(dim=1, keepdim=True)
   text_features = text_features / text_features.norm(dim=1, keepdim=True)
   # 计算余弦相似度 logit_scale是尺度系数
   logit_scale = clip_model.logit_scale.exp()
   logits_per_image = logit_scale * image_features @ text_features.t()
   logits_per_text = logits_per_image.t()
   probs = logits_per_image.softmax(dim=-1).cpu().numpy()
   print(np.around(probs, 3))

请问一下代码里 tokenizer 和 text_encoder分别是啥？

执行 pipe = StableDiffusionPipeline.from_pretrained("./SkyPaint").to(device) 出现如下错误

ValueError: The component <class 'transformers.models.clip.image_processing_clip.CLIPImageProcessor'> of <class 'diffusers.pipelines.stable_diffusion.pipeline_stable_diffusion.StableDiffusionPipeline'> cannot be loaded as it does not seem to have any of the loading methods defined in {'ModelMixin': ['save_pretrained', 'from_pretrained'], 'SchedulerMixin': ['save_config', 'from_config'], 'DiffusionPipeline': ['save_pretrained', 'from_pretrained'], 'OnnxRuntimeModel': ['save_pretrained', 'from_pretrained'], 'PreTrainedTokenizer': ['save_pretrained', 'from_pretrained'], 'PreTrainedTokenizerFast': ['save_pretrained', 'from_pretrained'], 'PreTrainedModel': ['save_pretrained', 'from_pretrained'], 'FeatureExtractionMixin': ['save_pretrained', 'from_pretrained']}.

能否解答一下，非常感谢

结束了都结束了，**人别用这些了。

《生成式人工智能服务管理办法（征求意见稿）》:http://www.cac.gov.cn/2023-04/11/c_1682854275475410.htm

skyworkaigc / skypaint-ai-diffusion Goto Github PK

skypaint-ai-diffusion's People

Contributors

Stargazers

Watchers

Forkers

skypaint-ai-diffusion's Issues

微信群满了，怎么加入

[使用skyclip 计算image-text similarity的代码跑不通]

执行 pipe = StableDiffusionPipeline.from_pretrained("./SkyPaint").to(device) 出现如下错误

结束了都结束了，**人别用这些了。

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent

Jobs