#

audio-generation

Here are 38 public repositories matching this topic...

archinetai / audio-ai-timeline

A timeline of the latest AI models for audio generation, starting in 2023!

machine-learning artificial-intelligence audio-generation

Updated Aug 25, 2023

archinetai / audio-diffusion-pytorch

Audio generation using diffusion models, in PyTorch.

deep-learning artificial-intelligence denoising-diffusion audio-generation

Updated Jun 12, 2023
Python

lucidrains / soundstorm-pytorch

Implementation of SoundStorm, Efficient Parallel Audio Generation from Google Deepmind, in Pytorch

deep-learning transformers artificial-intelligence attention-mechanism non-autoregressive audio-generation

Updated Aug 27, 2023
Python

tango

declare-lab / tango

Codes and Model of the paper "Text-to-Audio Generation using Instruction Tuned LLM and Latent Diffusion Model"

language-models diffusion diffusion-models text-to-audio audio-generation large-language-models

Updated Jul 26, 2023
Python

NVIDIA / BigVGAN

Official PyTorch implementation of BigVGAN (ICLR 2023)

speech-synthesis audio-synthesis music-synthesis neural-vocoder singing-voice-synthesis audio-generation

Updated Feb 23, 2023
Python

tts-generation-webui

rsxdalv / tts-generation-webui

TTS Generation Web UI (Bark, MusicGen + AudioGen, Tortoise, RVC, Vocos, Demucs)

Updated Aug 31, 2023
Python

v-iashin / SpecVQGAN

Source code for "Taming Visually Guided Sound Generation" (Oral at the BMVC 2021)

audio video pytorch transformer gan multi-modal evaluation-metrics video-understanding vas video-features vqvae bmvc melgan audio-generation vggsound

Updated Jun 6, 2023
Jupyter Notebook

researchmm / MM-Diffusion

[CVPR'23] MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation

video-generation multi-modality diffusion-models content-creation audio-generation

Updated May 10, 2023
Python

galgreshler / Catch-A-Waveform

Official pytorch implementation of the paper: "Catch-A-Waveform: Learning to Generate Audio from a Single Short Example" (NeurIPS 2021)

speech-synthesis gan music-generation raw-waveforms audio-inpainting audio-denoising audio-generation single-example bandwidth-extension audio-super-resolution

Updated Jan 30, 2023
Python

cabralpinto / modular-diffusion

Python library for designing and training your own Diffusion Models with PyTorch.

python machine-learning deep-learning text-generation pytorch transformer image-generation modular-design u-net diffusion-models audio-generation

Updated Sep 4, 2023
Python

archinetai / audio-diffusion-pytorch-trainer

Trainer for audio-diffusion-pytorch

deep-learning artificial-intelligence denoising-diffusion audio-generation

Updated Jan 13, 2023
Python

Yuan-ManX / ai-audio-datasets-list

This is a list of datasets consisting of speech, music, and sound effects, which can provide training data for Generative AI, AIGC, AI model training, intelligent audio tool development, and audio applications. It is mainly used for speech recognition, speech synthesis, singing voice synthesis, music information retrieval, music generation, etc.

audio machine-learning deep-learning audio-effect artificial-intelligence dataset audio-applications speech-recognition datasets music-generation audio-programming ai-data music-ai audio-generation aigc

Updated Aug 31, 2023

ilaria-manco / word2wave

Word2Wave: a framework for generating short audio samples from a text prompt using WaveGAN and COALA.

music-generation ai-music text-to-audio audio-generation

Updated Dec 13, 2021
Python

soham97 / awesome-sound_event_detection

Reading list for research topics in Sound AI

representation-learning audio-processing zero-shot-learning icassp sound-event-detection interspeech acoustic-scene-classification audio-captioning audio-generation audio-retrieval

Updated Jun 16, 2023

Yuan-ManX / audio-development-tools

This is a list of sound, audio and music development tools which contains machine learning, audio generation, audio signal processing, sound synthesis, spatial audio, music information retrieval, music generation, speech recognition, speech synthesis, singing voice synthesis and more.

audio music machine-learning deep-learning signal-processing dsp speech artificial-intelligence speech-synthesis music-generation speech-processing audio-processing audio-generation

Updated Sep 2, 2023

archinetai / audio-data-pytorch

A collection of useful audio datasets and transforms for PyTorch.

deep-learning pytorch datasets artifical-intelligense audio-generation

Updated Feb 11, 2023
Python

RoySheffer / im2wav

Official implementation of the pipeline presented in I hear your true colors: Image Guided Audio Generation

audio machine-learning pytorch video-to-audio image-to-audio audio-generation

Updated Jan 18, 2023
Python

olaviinha / NeuralTextToAudio

Text prompt steered synthetic audio generators

audio colab audio-synthesis music-generation audio-processing voice-synthesis text2music colab-notebook voice-cloning audio-generation audioldm text2audio mubert mubertai

Updated Aug 28, 2023
Jupyter Notebook

bark-speaker-directory

rsxdalv / bark-speaker-directory

Site for sharing Bark voices

machine-learning text-to-speech web ai deep-learning tts bark audio-generation

Updated Aug 2, 2023
TypeScript

soham97 / sound_ai_progress

Tracking states of the arts and recent results (bibliography) on sound tasks.

audio-processing sound-event-detection music-classification acoustic-scene-classification audio-captioning audio-generation audio-retrieval

Updated Jan 10, 2023

Improve this page

Add a description, image, and links to the audio-generation topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the audio-generation topic, visit your repo's landing page and select "manage topics."