facebook
/

musicgen-stereo-medium

Inference Endpoints

Model card Files Files and versions Community

reach-vb HF staff commited on Nov 8, 2023

Commit

bf047d5

•

1 Parent(s): 4a6083c

Update README.md (#4)

- Update README.md (ae923b050f2e9372f51478d622f9ccf9157659eb)

Files changed (1) hide show

README.md +7 -6

README.md CHANGED Viewed

@@ -63,22 +63,23 @@ Try out MusicGen yourself!
 ## 🤗 Transformers Usage
-You can run MusicGen locally with the 🤗 Transformers library from version 4.31.0 onwards.
 1. First install the 🤗 [Transformers library](https://github.com/huggingface/transformers) and scipy:
 ```
 pip install --upgrade pip
-pip install --upgrade transformers scipy
 ```
 2. Run inference via the `Text-to-Audio` (TTA) pipeline. You can infer the MusicGen model via the TTA pipeline in just a few lines of code!
 ```python
-from transformers import pipeline
 import scipy
-synthesiser = pipeline("text-to-audio", "facebook/musicgen-stereo-medium")
 music = synthesiser("lo-fi music with a soothing melody", forward_params={"do_sample": True})
@@ -91,13 +92,13 @@ scipy.io.wavfile.write("musicgen_out.wav", rate=music["sampling_rate"], music=au
 from transformers import AutoProcessor, MusicgenForConditionalGeneration
 processor = AutoProcessor.from_pretrained("facebook/musicgen-stereo-medium")
-model = MusicgenForConditionalGeneration.from_pretrained("facebook/musicgen-stereo-medium")
 inputs = processor(
     text=["80s pop track with bassy drums and synth", "90s rock song with loud guitars and heavy drums"],
     padding=True,
     return_tensors="pt",
-)
 audio_values = model.generate(**inputs, max_new_tokens=256)
 ```

 ## 🤗 Transformers Usage
+You can run MusicGen Stereo models locally with the 🤗 Transformers library from `main` onward.
 1. First install the 🤗 [Transformers library](https://github.com/huggingface/transformers) and scipy:
 ```
 pip install --upgrade pip
+pip install --upgrade git+https://github.com/huggingface/transformers.git scipy
 ```
 2. Run inference via the `Text-to-Audio` (TTA) pipeline. You can infer the MusicGen model via the TTA pipeline in just a few lines of code!
 ```python
 import scipy
+import torch
+from transformers import pipeline
+synthesiser = pipeline("text-to-audio", "facebook/musicgen-stereo-medium", torch_dtype=torch.float16, device="cuda")
 music = synthesiser("lo-fi music with a soothing melody", forward_params={"do_sample": True})
 from transformers import AutoProcessor, MusicgenForConditionalGeneration
 processor = AutoProcessor.from_pretrained("facebook/musicgen-stereo-medium")
+model = MusicgenForConditionalGeneration.from_pretrained("facebook/musicgen-stereo-medium").to("cuda")
 inputs = processor(
     text=["80s pop track with bassy drums and synth", "90s rock song with loud guitars and heavy drums"],
     padding=True,
     return_tensors="pt",
+).to("cuda")
 audio_values = model.generate(**inputs, max_new_tokens=256)
 ```