- 100% staðbundin framkvæmd MusicGen: friðhelgi, stjórn og hraði.
- Umhverfi undirbúið með Python, PyTorch, FFmpeg og Audiocraft.
- Hámarkaðu afköst með því að velja rétta stærð líkansins og GPU.
- Ljúktu skapandi vinnuflæði án þess að reiða sig á skýgeymslu.

¿Hvernig á að nota MusicGen frá Meta staðbundið? Að búa til tónlist með gervigreind án þess að reiða sig á utanaðkomandi þjónustu er fullkomlega mögulegt í dag. MusicGen frá Meta getur keyrt eingöngu á tölvunni þinni.Forðastu að hlaða sýnum eða niðurstöðum upp í skýið og hafðu stjórn á gögnunum þínum allan tímann. Þessi handbók leiðir þig í gegnum ferlið skref fyrir skref, með hagnýtum ráðleggingum, afköstasjónarmiðum og ábendingum sem skipta öllu máli.
Einn af kostunum við að vinna staðbundið er frelsið til að gera tilraunir án kvótatakmarkana, án þess að bíða eftir ofhlaðnum netþjónum og með meiri friðhelgi. Ólíkt skýjalausnum eins og geymslu- og auðkenningar-SDK-um sem eru hannaðar fyrir farsímaforritHér þarftu ekki að fela hljóðið þitt þriðja aðila: líkönin, leiðbeiningarnar og mynduðu lögin eru áfram hjá þér.
Hvað er MusicGen og hvers vegna er það keyrt staðbundið?
MusicGen er tónlistarframleiðslulíkan þróað af Meta sem getur búið til verk úr textalýsingum og, í sumum afbrigðum, skilyrt niðurstöðuna með tilvísunarlaglínu. Tillaga þeirra sameinar auðvelda notkun og óvæntan tónlistargæðibjóða upp á mismunandi stærðir líkana til að vega og meta gæði og nýtingu kerfisauðlinda.
Að keyra tölvuna staðbundið hefur nokkrar lykiláhrif. Í fyrsta lagi, PersónuverndRödd þín, sýnishorn þín og tónsmíðar þurfa ekki að fara úr tækinu þínu. Í öðru lagi, endurtekningarhraðinnÞú ert ekki háður bandvídd til að hlaða upp skrám eða fjarstýrðum bakenda. Og að lokum, tæknilegt eftirlitÞú getur lagað útgáfur bókasafna, fryst þyngdir og unnið án nettengingar án þess að koma upp óvæntar uppákomur vegna breytinga á API.
Það er mikilvægt að skilja andstæðuna við skýgeymslulausnir. Til dæmis, í farsímavistkerfinu, Firebase auðveldar iOS og öðrum forriturum að vista hljóð, myndir og myndbönd. með öflugum SDK-kerfum, innbyggðri auðkenningu og náttúrulegri pörun við rauntímagagnagrunn fyrir textagögn. Þessi aðferð er tilvalin þegar þú þarft samstillingu, samvinnu eða hraða útgáfu. En ef forgangsverkefni þitt er ekki að hlaða neinu upp á utanaðkomandi netþjónaAð keyra MusicGen á eigin tölvu forðast þetta skref alveg.
Samfélagið vinnur líka þér í hag. Á opnum og óopinberum vettvangi eins og r/StableDiffusion er deilt og rætt um nýjustu tækni í skapandi verkfærum sem byggja á kynslóðarlíkönum. Þetta er staður til að birta greinar, svara spurningum, hefja umræður, leggja sitt af mörkum við tækni og kanna. Allt sem er að gerast í tónlistarsenunni. Þessi opna, könnunarkennda menning passar fullkomlega við notkun MusicGen á staðnum: þú prófar, endurtekur, skráir og hjálpar öðrum sem koma á eftir þér. Þú ákveður hraðann og nálgunina.
Ef þú rekst á tæknileg brot sem tengjast ekki flæði tónlistarinnar við rannsóknir þínar — til dæmis umfangsmiklar CSS stílblokkir eða framhliðarsniðmát— Hafðu í huga að þetta skiptir ekki máli fyrir hljóðframleiðslu, en það birtist stundum á síðum með gagnasöfnum. Það er gagnlegt að einbeita sér að raunverulegum hljóðtengdum kerfum og þeim tvíundarskrám sem þú þarft í raun á kerfinu þínu.
Athyglisvert er að sumir listar yfir heimildir innihalda tilvísanir í fræðilegt efni eða verkefnatillögur á PDF-sniði sem eru vistaðar á vefsíðum háskóla. Þótt þær geti verið áhugaverðar til innblástursTil að keyra MusicGen staðbundið eru nauðsynlegustu atriðin Python umhverfið þitt, hljóðbókasöfnin og líkanþyngdirnar.

Kröfur og undirbúningur umhverfisins
Áður en þú býrð til fyrstu athugasemdina skaltu staðfesta að tölvan þín uppfylli lágmarkskröfur. Það er mögulegt með örgjörva, en upplifunin er mun betri með skjákorti. Skjákort með CUDA eða Metal stuðningi og að minnsta kosti 6-8 GB af VRAM Það gerir kleift að nota stærri líkön og áreiðanlegan ályktunartíma.
Samhæf stýrikerfi: Windows 10/11, macOS (Apple Silicon er æskilegt vegna góðrar afköstar) og algengar Linux dreifingar. Þú þarft Python 3.9–3.11Þú þarft umhverfisstjóra (Conda eða venv) og FFmpeg til að umrita/afkóða hljóð. Á NVIDIA skjákortum skaltu setja upp PyTorch með viðeigandi CUDA; á macOS með Apple Silicon, MPS útgáfuna; á Linux, þá sem samsvarar reklunum þínum.
Þyngdir MusicGen líkansins eru sóttar þegar þú kallar þær fyrst úr samsvarandi bókasöfnum (eins og Audiocraft frá Meta). Ef þú vilt starfa án nettengingarHlaðið þeim niður fyrirfram og stillið staðbundnar slóðir þannig að forritið reyni ekki að komast á internetið. Þetta er mikilvægt þegar unnið er í lokuðu umhverfi.
Varðandi geymslu: þó að verkfæri eins og Firebase Storage séu hönnuð til að geyma og sækja skrár í skýinu með öflugri auðkenningu og SDK-um, Markmið okkar hér er að vera ekki háð þessum þjónustumVistaðu WAV/MP3 skrárnar þínar í staðbundnum möppum og notaðu Git LFS útgáfustýringu ef þú þarft að fylgjast með breytingum á tvíundarskrám.
Að lokum, undirbúið hljóðinntakið/úttakið. FFmpeg er nauðsynlegt Til að breyta í stöðluð snið og til að hreinsa eða snyrta viðmiðunarsýni. Gakktu úr skugga um að ffmpeg sé í PATH skránni þinni og að þú getir kallað hana fram úr stjórnborðinu.
Skref-fyrir-skref uppsetning í einangruðu umhverfi
Ég legg til vinnuflæði sem er samhæft við Windows, macOS og Linux með því að nota Conda. Ef þú kýst venv, aðlagaðu skipanirnar. samkvæmt umhverfisstjóra þínum.
# 1) Crear y activar entorno
conda create -n musicgen python=3.10 -y
conda activate musicgen
# 2) Instalar PyTorch (elige tu variante)
# NVIDIA CUDA 12.x
pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# CPU puro (si no tienes GPU)
# pip install torch torchvision torchaudio
# Apple Silicon (MPS)
# pip install torch torchvision torchaudio
# 3) FFmpeg
# Windows (choco) -> choco install ffmpeg
# macOS (brew) -> brew install ffmpeg
# Linux (apt) -> sudo apt-get install -y ffmpeg
# 4) Audiocraft (incluye MusicGen)
pip install git+https://github.com/facebookresearch/audiocraft
# 5) Opcional: manejo de audio y utilidades extra
pip install soundfile librosa numpy scipy
Ef umhverfi þitt leyfir ekki uppsetningu úr Git geturðu klónað geymsluna og búið til breytanlega uppsetningu. Þessi aðferð auðveldar að setja upp ákveðnar skuldbindingar fyrir endurtekningarhæfni.
git clone https://github.com/facebookresearch/audiocraft.git
cd audiocraft
pip install -e .
Prófa að allt virki í CLI
Fljótleg leið til að staðfesta uppsetninguna er að ræsa skipanalínukynninguna sem fylgir Audiocraft. Þetta staðfestir að vigtin séu sótt og að ályktunarferlið sé að hefjast. rétt í örgjörvanum/skjákortinu þínu.
python -m audiocraft.demo.cli --help
# Generar 10 segundos de música con un prompt simple
python -m audiocraft.demo.cli \
--text 'guitarra acústica relajada con ritmo suave' \
--duration 10 \
--model musicgen-small \
--output ./salidas/clip_relajado.wav
Fyrsta keyrslan gæti tekið lengri tíma þar sem hún mun hlaða niður líkaninu. Ef þú vilt ekki sendar tengingarFyrst skaltu sækja eftirlitspunktana og setja þá í skyndiminni möppuna sem umhverfið þitt notar (til dæmis í ~/.cache/torch eða þá sem Audiocraft gefur til kynna) og gera netið óvirkt.
Notkun Python: Fínstilling

Fyrir flóknari verkflæði, kallaðu á MusicGen úr Python. Þetta gerir þér kleift að stilla fræin, fjölda frambjóðenda og hitastig. og vinna með lög sem eru skilyrt af tilvísunarlaglínum.
from audiocraft.models import MusicGen
from audiocraft.data.audio import audio_write
import torch
# Elige el tamaño: 'small', 'medium', 'large' o 'melody'
model = MusicGen.get_pretrained('facebook/musicgen-small')
model.set_generation_params(duration=12, top_k=250, top_p=0.98, temperature=1.0)
prompts = [
'sintetizadores cálidos, tempo medio, ambiente cinematográfico',
'batería electrónica con bajo contundente, estilo synthwave'
]
with torch.no_grad():
wav = model.generate(prompts) # [batch, channels, samples]
for i, audio in enumerate(wav):
audio_write(f'./salidas/track_{i}', audio.cpu(), model.sample_rate, format='wav')
Ef þú vilt skilyrðingu með laglínu, notaðu laglínugerðalíkanið og sendu tilvísunarklippuna þína. Þessi stilling virðir laglínur og endurtúlkar stílinn samkvæmt fyrirmælum.
from audiocraft.models import MusicGen
from audiocraft.data.audio import load_audio, audio_write
model = MusicGen.get_pretrained('facebook/musicgen-melody')
model.set_generation_params(duration=8)
melody, sr = load_audio('./refs/melodia.wav', sr=model.sample_rate)
prompts = ['árpegios brillantes con pads espaciales']
wav = model.generate_with_chroma(prompts, melody[None, ...])
audio_write('./salidas/con_melodia', wav[0].cpu(), model.sample_rate, format='wav')
Vinna án nettengingar og stjórna líkönum
Til að fá 100% staðbundið vinnuflæði skaltu hlaða niður eftirlitspunktunum og stilla umhverfisbreytur eða leiðir fyrir Audiocraft til að finna þá. Haltu skrá yfir útgáfur og þyngdir til að endurtaka upplýsingar og koma í veg fyrir óvart niðurhal ef þú gerir netið óvirkt.
- Veldu stærð líkansins eftir VRAM-inu þínu: lítill eyðir minna og bregst hraðar við.
- Vistaðu afrit af vigtunum á staðbundnum eða ytri diski.
- Skráðu hvaða Audiocraft commit og hvaða PyTorch build þú notar.
Ef þú notar margar vélar geturðu búið til innri spegil með bókasöfnum þínum og þyngdum. alltaf á staðarneti og án þess að afhjúpa neitt á internetinuÞetta er hagnýtt fyrir framleiðsluteymi með strangar reglur.
Bestu starfsvenjur fyrir fyrirmæli og breytur
Gæði raddbeitingarinnar hafa mikil áhrif. Hún lýsir hljóðfærum, tempói, andrúmslofti og stílfræðilegum tilvísunum. Forðastu mótsagnakenndar beiðnir og halda orðasamböndum hnitmiðuðum en ríkum af tónlistarlegu innihaldi.
- Hljóðfæraleikur: kassagítar, náið píanó, mjúkir strengir, lo-fi trommur.
- Taktur og tempó: 90 BPM, hálfleikur, merkt grúv.
- Andrúmsloft: kvikmyndalegt, náið, dökkt, umhverfislegt, glaðlegt.
- Framleiðsla: fínleg endurómur, miðlungs þjöppun, hliðræn mettun.
Varðandi breytur: top_k og top_p stjórna fjölbreytileika; hitastig aðlagar sköpunargáfu. Byrjaðu með miðlungsgildum og hreyfðu þig smám saman þar til þú finnur rétta staðinn fyrir þinn stíl.
Afköst, seinkun og gæði

Með örgjörva getur ályktun verið hæg, sérstaklega á stærri gerðum og með lengri gildistíma. Á nútíma GPU-tækjum styttist tíminn verulega.Íhugaðu þessar leiðbeiningar:
- Byrjið með 8–12 sekúndna myndskeiðum til að ítreka hugmyndir.
- Búðu til nokkrar stuttar afbrigði og settu saman þær bestu.
- Gerðu uppsampling eða eftirvinnslu í DAW-inu þínu til að fága útkomuna.
Í macOS með Apple Silicon býður MPS upp á milliveg á milli sérstaks örgjörva og skjákorts. Uppfærsla í nýlegri útgáfur af PyTorch til að kreista út úrbætur á afköstum og minni.
Eftirvinnsla og vinnuflæði með DAW-inu þínu
Þegar þú hefur búið til WAV skrárnar þínar skaltu flytja þær inn í uppáhalds DAW-ið þitt. Jöfnun, þjöppun, endurómur og klipping Þau gera þér kleift að umbreyta efnilegum bútum í heila hluti. Ef þú þarft aðskilnað á stilkum eða tækjum skaltu treysta á verkfæri til aðskilnaðar uppruna til að sameina og blanda saman.
Að vinna 100% staðbundið kemur ekki í veg fyrir samvinnu: deildu einfaldlega lokaskránum í gegnum þínar uppáhalds einkarásir. Það er engin þörf á að birta eða samstilla við skýjaþjónustur ef persónuverndarstefna þín mælir gegn því.
Algeng vandamál og hvernig á að leysa þau
Uppsetningarvillur: ósamhæfar útgáfur af PyTorch eða CUDA eru venjulega orsökin. Staðfestu að uppbygging brennarans passi við drifbúnaðinn þinn og kerfi. Ef þú notar Apple Silicon skaltu ganga úr skugga um að þú setjir ekki upp hjól eingöngu fyrir x86.
Niðurhal læst: Ef þú vilt ekki að tækið þitt tengist internetinu, Settu þyngdirnar í skyndiminnið eins og Audiocraft bjóst við og slökkva á öllum utanaðkomandi símtölum. Athugaðu lesheimildir möppanna.
Skemmt eða hljóðlaust hljóð: athugaðu sýnatökutíðni og snið. Breyttu leturgerðunum þínum með ffmpeg og viðhalda sameiginlegri tíðni (t.d. 32 eða 44.1 kHz) til að forðast truflanir.
Léleg frammistaða: minnkar stærð líkansins eða lengd klippunnar, Loka ferlum sem nota VRAM og auka smám saman flækjustigið þegar þú sérð lausa framlegð.
Leyfisveitingar og ábyrga notkun
Skoðið MusicGen leyfið og öll gagnasöfn sem þið notið til viðmiðunar. Að framleiða efni á staðnum undanskilur þig ekki undan því að fara að höfundarréttarlögum.Forðastu fyrirmæli sem herma beint eftir vernduðum verkum eða listamönnum og veldu almenna stíl og tegundir.
Hugmyndaleg samanburður: ský vs. staðbundið
Fyrir teymi sem þróa forrit bjóða þjónustur eins og Firebase Storage upp á SDK með auðkenningu og stjórnun hljóð-, mynd- og myndskráa, sem og rauntíma gagnagrunn fyrir texta. Þetta vistkerfi er tilvalið þegar þú þarft að samstilla notendur og efni.Aftur á móti, fyrir einkarekið skapandi vinnuflæði með MusicGen, forðast staðbundinn háttur töf, kvóta og gagnavernd.
Hugsaðu um þetta sem tvær aðskildar brautir. Ef þú vilt birta, deila eða samþætta niðurstöður í snjalltækjaforrit, þá er skýjabundið bakendi gagnlegt. Ef markmið þitt er að búa til frumgerð og búa til án þess að hlaða neinu uppEinbeittu þér að umhverfi þínu, þyngd þinni og staðbundnum diski.
Hvernig á að nota MusicGen frá Meta á staðnum: Úrræði og samfélag
Spjallborð og undirsíður sem eru tileinkuð verkfærum fyrir skapandi verkefni eru góð vísbending um nýjar framfarir og tækni. Einkum eru til óopinber samfélög sem tileinka sér verkefni með opnum hugbúnaði. þar sem þú getur birt list, spurt spurninga, hafið umræður, lagt fram tækni eða einfaldlega skoðaðSamfélagið opnar dyr sem formleg skjöl ná ekki alltaf yfir.
Þú finnur einnig tillögur og tæknileg skjöl í fræðilegum gagnasöfnum og á vefsíðum háskóla, stundum sem niðurhalanleg PDF skjöl. Notið þau sem aðferðafræðilega innblásturEn einbeittu þér að raunverulegum hljóðtengdum þáttum og flæði til að MusicGen virki vel á tölvunni þinni.
Með öllu þessu hefur þú nú skýra mynd af því hvernig á að setja upp umhverfið, búa til fyrstu verkin þín og bæta árangur án þess að afhjúpa efnið þitt fyrir þriðja aðila. Samsetning góðrar staðbundinnar uppsetningar, vandlegra fyrirmæla og skammts af eftirvinnslu Þetta mun veita þér öflugt sköpunarflæði, algjörlega undir þinni stjórn. Nú veistu það. Hvernig á að nota MusicGen frá Meta staðbundið.
Hefur brennandi áhuga á tækni frá því hann var lítill. Ég elska að vera uppfærður í geiranum og umfram allt að miðla honum. Þess vegna hef ég lagt mig fram við samskipti á tækni- og tölvuleikjavefsíðum í mörg ár. Þú getur fundið mig að skrifa um Android, Windows, MacOS, iOS, Nintendo eða annað tengt efni sem mér dettur í hug.