WaveNet vocoder

A Pytorch implementation of the WaveNet vocoder, which can generate raw speech samples conditioned on mel spectrograms. This task refers to a speech synthesis problem, when we need to reconstruct an audio signal from a mel spectrogram.

Usage

You can download my pretrained model or train your own. Settings for calculating mel spectrograms can be found here:

from config import MelSpectrogramConfig
from src.preprocessing import MelSpectrogram

featurizer = MelSpectrogram(MelSpectrogramConfig()).to(device)
mel_spectrogram = featurizer(audio_wav)

Then, prediction:

predicted_audio = model.inference(mel_spectrogram)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

WaveNet vocoder

Usage

Files

README.md

Latest commit

History

README.md

File metadata and controls

WaveNet vocoder

Usage