multimodal

Here are 220 public repositories matching this topic...

jina-ai / jina

🔮 Build cross-modal and multimodal applications on the cloud · Neural Search · Creative AI · Cloud Native · MLOps

kubernetes workflow machine-learning airflow microservices framework deep-learning pipeline grpc cloud-native semantic-search creative-ai aiops multimodal mlops fastapi neural-search vector-search-engine crossmodal

Updated Oct 3, 2022
Python

facebookresearch / mmf

Star

A modular framework for vision & language multimodal research from Facebook AI Research (FAIR)

deep-learning dialog pytorch vqa pretrained-models captioning multimodal multi-tasking textvqa hateful-memes

Updated Aug 11, 2022
Python

jina-ai / discoart

Star

🪩 Create Disco Diffusion artworks in one line

generative-art cross-modal diffusion prompts creative-ai creative-art multimodal clip-guided-diffusion dalle disco-diffusion midjourney imgen discodiffusion latent-diffusion stable-diffusion

Updated Oct 1, 2022
Python

OFA-Sys / OFA

Star

Official repository of OFA (ICML 2022). Paper: OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework

prompt chinese image-captioning pretrained-models visual-question-answering multimodal text-to-image-synthesis vision-language pretraining referring-expression-comprehension prompt-tuning

Updated Sep 30, 2022
Python

jina-ai / docarray

Star

🧬 The data structure for unstructured multimodal data · Neural Search · Vector Search · Document Store

graphql elasticsearch deep-learning protobuf sqlite data-structures nearest-neighbor-search cross-modal multi-modal semantic-search unstructured-data multimodal nested-data weaviate dataclass vector-search neural-search qdrant docarray

Updated Oct 3, 2022
Python

rom1504 / img2dataset

Star

Easily turn large sets of image urls to an image dataset. Can download, resize and package 100M urls in 20h on one machine.

image big-data deep-learning dataset image-dataset download-images multimodal

Updated Sep 28, 2022
Python

Eurus-Holmes / Awesome-Multimodal-Research

Star

A curated list of Multimodal Related Research.

awesome multimodal-learning multimodal multimodal-research

Updated Sep 15, 2022
Python

Stability-AI / stability-sdk

Star

SDK for interacting with stability.ai APIs (e.g. stable diffusion inference)

generative-art multimodal ai-art latent-diffusion stable-diffusion

Updated Oct 3, 2022
Jupyter Notebook

google-research-datasets / wit

Star

WIT (Wikipedia-based Image Text) Dataset is a large multimodal multilingual dataset comprising 37M+ image-text sets with 11M+ unique images across 100+ languages.

multilingual nlp machine-learning wikipedia multimodal cc-by-sa-3

Updated Sep 30, 2022

rom1504 / clip-retrieval

Star

Easily compute clip embeddings and build a clip retrieval system with them

ai deep-learning clip knn semantic-search multimodal

Updated Oct 2, 2022
Jupyter Notebook

lyndonzheng / Pluralistic-Inpainting

Star

CVPR 2019: "Pluralistic Image Completion"

generative-adversarial-networks inpainting image-completion multimodal

Updated Jul 29, 2022
Python

njustkmg / PaddleMM

Star

Multi-Modal learning toolkit based on PaddlePaddle and PyTorch, supporting multiple applications such as multi-modal classification, cross-modal retrieval and image caption.

python pytorch classification paddlepaddle imagecaptioning multimodal-learning multimodal crossmodal-retrieval