researchmm Goto Github PK

repos: 31.0 gists: 0.0

Name: Multimedia Research

Type: Organization

Bio: Multimedia Research at Microsoft Research Asia

Multimedia Research's Projects

2d-tan

AAAI2020 - Learning 2D Temporal Localization Networks for Moment Localization with Natural Language

2d-tan-microsoft

[AAAI‘20] - Learning 2D Temporal Localization Networks for Moment Localization with Natural Language

aast-pytorch

[MM'20] Aesthetic-Aware Image Style Transfer

ai_illustrator

[MM'22 Oral] AI Illustrator: Translating Raw Descriptions into Images by Prompt-based Cross-Modal Generation

aot-gan-for-inpainting

[TVCG'2023] AOT-GAN for High-Resolution Image Inpainting (codebase for image inpainting)

automl

AutoFormer, Cream

ckdn

[ICCV'21] CKDN: Learning Conditional Knowledge Distillation for Degraded-Reference Image Quality Assessment

cydas

Cyclic Differentiable Architecture Search

davinci-videofactory

dbtnet

Code for our NeurIPS'19 paper "Learning Deep Bilinear Transformation for Fine-grained Image Representation"

ftvsr

[ECCV'22] FTVSR: Learning Spatiotemporal Frequency-Transformer for Compressed Video Super-Resolution

generate-it

A collection of models for image<->text generation in ACM MM 2021.

img2poem

[MM'18] Beyond Narrative Description: Generating Poetry from Images by Multi-Adversarial Training

language-guided-animation

[TMM 2023] Language-Guided Face Animation by Recurrent StyleGAN-based Generator

lighttrack

[CVPR21] LightTrack: Finding Lightweight Neural Network for Object Tracking via One-Shot Architecture Search

mm-diffusion

[CVPR'23] MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation

neas

pen-net-for-inpainting

[CVPR'2019] PEN-Net: Learning Pyramid-Context Encoder Network for High-Quality Image Inpainting

sarigan

[NeurIPS'20] Learning Semantic-aware Normalization for Generative Adversarial Networks

siamdw

[CVPR'19 Oral] Deeper and Wider Siamese Networks for Real-Time Visual Tracking

soho

[CVPR'21 Oral] Seeing Out of tHe bOx: End-to-End Pre-training for Vision-Language Representation Learning

stark

[ICCV'21] Learning Spatio-Temporal Transformer for Visual Tracking

sttn

[ECCV'2020] STTN: Learning Joint Spatial-Temporal Transformations for Video Inpainting

sttr

[ACCV'22] Fine-Grained Image Style Transfer with Visual Transformers

tasn

Trilinear Attention Sampling Network for Fine-grained Image Recognition

trackit

[ECCV'20] Ocean: Object-aware Anchor-Free Tracking

ttsr

[CVPR'20] TTSR: Learning Texture Transformer Network for Image Super-Resolution

ttvsr

[CVPR'22 Oral] TTVSR: Learning Trajectory-Aware Transformer for Video Super-Resolution

vot2019

The Winner and Runner-up Trackers for VOT-2019 Challenges

vqd-sr

[ICCV'23] VQD-SR: Learning Data-Driven Vector-Quantized Degradation Model for Animation Video Super-Resolution

researchmm Goto Github PK

Multimedia Research's Projects

Recommend Projects

Recommend Topics

Recommend Org

Jobs