索尼人工智能语音 索尼音乐人工智能
近年来,许多工程师开发了基于人工智能(AI)的工具,以支持创作专业人员的工作,并通过创建音乐和促进音乐创作的计算模型来加快或改进各种内容的制作
sonyn csl的研究人员提供了人工智能解决方案,可帮助音乐家、音乐制作者和其他音乐制作人员在最近发布的arXiv的一个预打印服务器上完成他们的工作,该服务器提供了一个有希望的Diff-A-Riff计算模型
Sony CSL巴黎音乐团队告诉techxplore:我们最新的研究是基于我们对低音乐器的研究& RDO & LDO现状,尽管我们过去专注于补充现有乐曲,但Diff-A-Riff扩展了这一概念,并创建了一个单一的乐器组,即me
&ld现状这个发展激发了音乐制作人和艺术家的灵感,他们经常寻找工具,通过添加其它播放器来改进现有的工作,并希望能够灵活地选择播放器的类型和声音
索尼csl(Sony csl)巴黎音乐团队的主要目标是创建一个功能全面的AI系统,该系统能够创建与特定音乐背景无缝集成的高质量播放器,并且只专注于一个播放器,他们开发了基于两种独特和高效的深度学习的工具
他们解释道:& ldquoo diff-a-riff使用可能的扩散模型和统一自动压缩程序的效率来创建与特定音乐环境的风格和可调节性匹配的播放器
&ld现状系统使用经过预先训练的统一自动编码解码器(内部开发的解码器)压缩输入声音,通过创建编码来确保高质量的编码,然后将压缩后的演示文稿导入到我们的潜在传播模型中,从而在可能的输入模式下创建新的声音
与其它播放器控件相比,Diff-A-Riff具有许多优势,首先它具有丰富的控件来调整音频和文本提示,此外,它还通过调整控件来提高灵活性,从而提供48kHz的高品质输出
与& LDO相比,Diff的-A-Riff也大大减少了系统的时间和内存使用,因为我们使用64倍的压缩;RDO组解释道,我们发现它可以在任何音乐背景下创建一个配置器
此外,LDO还提供了其它控制功能,如播放器条目和文本提示之间的内插、立体声宽度设置以及创建无缝循环的能力
SonyCSL的音乐团队认为他们的发现是非常有希望的,因为这个模型为各种各样的音乐制作了高质量的播放器,人们无法区分人们的音乐
他们说,“声音是以三秒钟的速度发出的”。这是前所未有的。这是一个高压缩比的自动压缩器,在现实世界中,diff的-A-Riff可以用于音乐、创作协作和音频设计
SonyCSL开发的音乐工具即将在世界各地推出,因此他们可以创建与现有作品相匹配的音乐,并且艺术家可以使用diff-A-Riff软件轻松探索新的音乐创意
该小组补充道:& ldquoo未来的研究计划包括通过改进控制机制和探索将模型集成到音乐制作过程的各个阶段的新方法来增强Diff-A-Riff的功能
我们的目标是提供更直观的输入,帮助艺术家(包括业内爱好者和专业人士)使用模型,并与音乐家和作曲家合作,以改进和加强我们的模型并确保他们与您的音乐理论相匹配