您的当前位置:首页 > 娱乐 > 一个开源库搞定种种文本到音频天生,Meta宣告AudioCraft 正文
时间:2025-03-15 08:40:03 来源:网络整理 编辑:娱乐
最近,Meta 宣告并开源了多个 AI 模子,好比 Llama 系列模子、分割所有的 SAM 模子。这些模子增长了开源社区的钻研妨碍。如今,Meta 又开源了一个可能天生种种音频的 PyTorch 库
最近 ,个开搞定告Meta 宣告并开源了多个 AI 模子,源库好比 Llama 系列模子 、种种分割所有的文本 SAM 模子。这些模子增长了开源社区的到音钻研妨碍 。如今 ,频天Meta 又开源了一个可能天生种种音频的个开搞定告 PyTorch 库 ——AudioCraft,并果真了其技术细节。源库
代码地址 :https://github.com/facebookresearch/audiocraft
名目主页:https://audiocraft.metademolab.com/?种种utm_source=twitter&utm_medium=organic_social&utm_campaign=audiocraft&utm_content=card
AudioCraft 可能基于用户输入的文本天生高品质、高保真的文本音频。咱们先来听一下天生下场 。到音
AudioCraft 可能天生一些事实场景中的频天声音 ,好比输入文本 prompt:「Whistling with wind blowing(风咆哮而过)」
还能天生有旋律的个开搞定告音乐 ,好比输入文本 prompt:「Pop dance track with catchy melodies,源库 tropical percussions, and upbeat rhythms, perfect for the beach(盛行舞曲,具备朗朗上口的种种旋律 、热带侵略乐以及欢喜的节奏,颇为适宜海滩)」
致使还可能抉择详细的乐器,天生特定的音乐,好比输入文本输入文本 prompt :「Earthy tones, environmentally conscious, ukulele-infused, harmonic, breezy, easygoing, organic instrumentation, gentle grooves(简朴的曲调,环保理念 ,尤克里里 ,以及声,轻松 ,随以及,有机乐器 ,暖以及的节奏)」
AudioCraft 简介
比照于文本、图像,音频天生是更具挑战性的 ,由于天生高保真音频需要对于重大的信号以及方式妨碍建模。
为了高品质地天生种种音频,AudioCraft 搜罗三个模子:MusicGen、AudioGen 以及 EnCodec。其中,MusicGen 运用 Meta 具备版权的音乐数据妨碍磨炼,基于用户输入的文本天生音乐;AudioGen 运用公共音效数据妨碍磨炼,基于用户输入的文本天生音频;EnCodec 用于缩短音频并以高保真度重修原始信号。解码器可能保障天生的音乐是高品质的。
从原始音频信号天生音频需要对于极长的序列妨碍建模。好比 ,以 44.1 kHz 采样的多少分钟音乐曲目由数百万个光阴步(timestep)组成。比照之下,Llama 以及 Llama 2 等基于文本的天生模子是将文本处置成子词 ,每一个样本仅需要多少千个光阴步。
MusicGen 是特意为音乐天生量身定制的音频天生模子 。音乐曲目比情景声音更重大,在建树新的音乐作品时,在长程(long-term)妄想入地生毗邻的样本颇为紧张 。MusicGen 在约莫 400000 个录音以及文本形貌以及元数据上妨碍磨炼,合计 20000 小时的音乐。
AudioGen 模子可能天生情景声音及声效 ,好比狗啼声、汽车喇叭声或者脚步声 。
EnCodec 神经音频编解码器从原始信号中学习离散音频 token,这至关于给音乐样本提供了新的牢靠「辞汇」;而后钻研团队又在这些离散的音频 token 上磨炼自回归语言模子 ,以在运用 EnCodec 的解码器将 token 转换回音频空间时天生新的 token、声音以及音乐 。
总的来说 ,AudioCraft 简化了音频天生模子的部份妄想 。MusicGen 以及 AudioGen 均由单个自回归语言模子组成 ,并在缩短的离散音乐表征流(即 token)上运行 。AudioCraft让用户可能运用差距规范的条件模子来操作天生,好比运用预磨炼的文本编码器实现文本到音频天生。
参考链接:https://ai.meta.com/blog/audiocraft-musicgen-audiogen-encodec-generative-ai-audio/
12/12NBA赛事风向(公牛vs雄鹿)(爵士vs雷霆)2025-03-15 07:52
一眼锁定!夷易近警下班途中抓获一位在押职员2025-03-15 07:50
我国千兆宽带用户突破1.5亿,占比逾越23%2025-03-15 07:33
中国女足12025-03-15 07:30
原创 再见,曼联乱了,9000万核心走人,拉爵士下通牒,利物浦幕后赢家2025-03-15 07:22
“除了非我自己离队,否则球队不会生意我”,盘货NBA现役8位非卖品2025-03-15 07:08
克莱:我颇为喜爱波杰姆斯基 他是咱们在选秀大会上捡的漏2025-03-15 06:57
同盟第1!同盟第1!NBA时期变了,这便是快船湖人怯夫败落的原因2025-03-15 06:44
凯尔特人深陷失利阴影,管理层密谋大动作,季后赛之路何去何从?2025-03-15 06:31
爆冷12连败!漂亮的13连败!手握大把好牌打稀烂,还不如及早开幕2025-03-15 06:10
原创 湖人夺冠!他们1胜48败!又一中国人要进NBA?2025-03-15 08:34
[瞎话板]字母哥不断2场65%命中率拿到30分10助,近50个赛季第四人2025-03-15 08:26
原创 上海双雄依然是中超球员第一选择 不仅拿钱多 而且还可以捧杯2025-03-15 08:16
发射乐成!2025-03-15 07:52
战德国妖星降世!细数尤文图斯队内俊杰,将靠青年军,挑战国米世界首富心塞:51岁女友紧贴47岁小李子,再有钱也输给了“球草”2025-03-15 07:52
1:1战平浦项铁人,武汉三镇告别亚冠赛场长江日报2023-12-06 22:48长江日报2023-12-06 22:482025-03-15 07:36
刘德华父亲去世,刘德华:在怙恃眼前永世只是艰深人2025-03-15 07:20
蓝色紧身牛仔裤+骑士靴真气质!有层次又有氛围,保暖洋气又撩人被“杭州街拍”惊艳到!满大街都是“塑身衣+宽腿裤”,显瘦时髦2025-03-15 06:38
威海481家企业加速向海“掘金”9岁女孩放学路上失踪,10年后在邻居家发现,父母哭到崩溃2025-03-15 06:27
中国驻英使馆回应英官员行动:英国负有排放温室气体历史责任2025-03-15 06:14