MusicGen jest modelem SI generującym muzykę z wprowadzonego tekstu, używanym przez bibliotekę Audiocraft udostępnioną publicznie przez meta/facebook. Istnieje wiele interfejsów webowych do obsługi tego modelu, w tym przykładzie użyjemy najprostszego, który bazuje na bibliotece Gradio.

Do generowania muzyki użyto największego modelu MusicGen large, który zajmuje 6 GB przestrzeni na dysku. Podczas przetwarzania zużywane jest 11 GB pamięci VRAM karty graficznej. Wygenerowano 30 sekundowe próbki muzyczne na podstawie następujących promptów:
funky soul
ghetto house
hip hop beat detroit style
minimal techno
polish disco polo
reggae
Dodaj komentarz