2021年10月22-24日,由中央音乐学院(CCoM)与中国人工智能学会(CAAI)联合主办的世界音乐人工智能大会(SOMI: Summit on Music Intelligence)将在京举办。大会汇聚全球音乐人工智能顶尖专家、学者、相关领域具有影响力的领军人物以及音乐产业相关企业代表等,集思广益,精骛八极,共同探究未来音乐世界,推动音乐人工智能“产、学、研、用”的发展,服务北京、服务国家战略,与世界携手未来。
本次大会系列活动包括开幕式暨交响音乐会、世界音乐人工智能交流峰会1+N论坛、全球音乐科技提案比赛。与会人员来自清华大学、北京大学、复旦大学、斯坦福大学、卡内基梅隆大学、麦吉尔大学、伦敦玛丽女王大学、佐治亚理工大学、华为、腾讯、微软等国内外知名院校和音乐科技相关企业。
22日 19:00 开幕式暨交响音乐会
中央音乐学院歌剧音乐厅
23日 8:40-17:00 世界音乐人工智能峰会1+N论坛
24日 8:40-17:00 论坛、全球音乐科技提案比赛、圆桌讨论
民族文化宫
会议时间:2021年10月22-24日
会议地点:中央音乐学院/民族文化宫
主办单位:中央音乐学院、中国人工智能学会
承办单位:中国人工智能学会艺术与人工智能专委会、中央音乐学院音乐人工智能与音乐信息科技系
大会联系方式:
邮箱:SOMI@ccom.edu.cn
电话:010-6641 5568
提示:本次大会论坛与提案赛举办地址变更为民族文化宫,请合理安排出行
世界音乐人工智能峰会1+N论坛
第一场
时间:2021年10月23日 上午 8:40-10:10
论坛主席
孙茂松
清华大学计算机科学与技术系教授,清华大学人工智能研究院常务副院长,清华大学计算机学位评定分委员会主席,欧洲科学院外籍院士。
2007-2018年任清华大学计算机科学与技术系系主任、党委书记。国家重点基础研究发展计划(973计划)项目首席科学家。在自然语言处理和人工智能领域发表了一系列论文,谷歌学术引用逾2万次。带领清华团队研发了世界上第一个大规模中文慕课开放平台“学堂在线”(https://www.xuetangx.com/),目前全球注册用户已超过7千万人。领衔研制了“九歌”人工智能中国古典诗歌写作系统(http://jiuge.thunlp.org/),并在GitHub上开源(https://github.com/THUNLP-AIPoet),产生了较好的学术和社会影响。
报告一:可控音乐生成
Controllable Music Generation
Alexander Lerch
美国佐治亚理工学院音乐技术中心研究生院主任/ISMIR大会主席
Lerch 教授计算机聆听和理解音乐。他的研究将他定位于信号处理、机器学习和音乐的交叉点,并为音乐生成、制作和消费创建人工智能软件。Lerch 是教科书“音频内容分析简介”(IEEE/Wiley 2012)的作者。在加入佐治亚理工学院之前,Lerch 是其公司 zplane.development 的联合创始人兼研究主管,该公司是音乐技术许可的行业领导者。他在 zplane 研究的技术包括时间拉伸和自动关键检测等算法。zplane 技术如今已被全球数百万音乐家和制作人使用。
摘要:
自动音乐生成或音乐元创作是音乐人工智能的核心领域之一。虽然生成的音乐的质量不断提高,但在创建具有人类引导的生成过程的交互式可控系统方面取得的进展较少。监督解纠缠学习方法提供了一种方法,可以强制神经网络的潜在表示具有可解释的意义,并能够控制正则化的音乐属性。本文将介绍一种正则化变分自动编码器潜在空间的方法,并讨论该方法的优点和潜在挑战。
报告二:
可控音乐生成重复结构对AI音乐生成的重要性
The Importance of Repetition Structure for AI Music Generation
Roger B. Dannenberg
卡内基梅隆大学计算机科学学院荣誉教授、计算机音乐中心主任
Roger B. Dannenberg 1982 年获得卡内基梅隆大学计算机科学博士学位。他在计算机音乐领域的研究享誉国际。他目前的工作包括与人工计算机音乐家的现场音乐表演、交互式媒体、用于声音合成的高级语言以及课程设计的计算机支持。Dannenberg 教授也是一位小号手和作曲家。他曾在哈莱姆历史悠久的阿波罗剧院到巴黎 IRCAM 的现代 Espace de Projection 音乐厅演出。除了为音乐家和互动电子产品创作的众多作品外,丹嫩伯格还与豪尔赫·萨斯特 (Jorge Sastre) 共同创作了歌剧 La Mare dels Peixos。
摘要:
音乐被定义为“有组织的声音”。传统音乐是高度组织化的,由多个层次组成。在自然语言中,标记(词)指的是外部概念,例如“声音”这个词意味着这个句子之外的东西。但是在音乐中,我们一般没有“词”和外部参考之类的东西。因此,在音乐中,组织主要是通过重复来实现的。当被识别时,音乐重复作为一种内在参考,因此重复本身就是结构的基础。反过来,结构在听众的期望和惊喜中扮演着重要的角色。
如果结构和重复在音乐中很重要,那么任何成功的 AI 音乐生成系统都应该能够创建音乐重复并可能学习分层音乐结构。深度学习的一个巨大希望,甚至是声称,这种抽象表示可以直接从数据中学习。在实践中,我们几乎没有证据表明最先进的序列学习器可以形成音乐结构模型或生成令人信服的音乐重复结构。本次演讲将解释这种困难的一些来源。
我们需要更多地了解音乐的本质,包括结构的作用。最近的工作研究了重复结构与节奏、音高与和声的统计分布之间的关系。例如,众所周知,乐句通常以更长的音符或主音和弦结尾。然而,人们必须问,乐句是由这些特征定义的,还是乐句产生了这些特征?我将描述如何纯粹基于重复而不考虑任何其他乐句边界指标来分割乐句。事实上,这些乐句确实对节奏、音高与和声产生了重大影响。此外,多层次的结构对较低层次的音乐特征产生不同的影响,这证明复杂的层次结构对于音乐创作是必不可少的。
我将描述一些当前在音乐生成和音乐模仿中使用这些结构思维的工作。在与人类听众的评估中,我们发现,就平均的表现而言,成功的流行歌曲比计算机生成的模仿作品要好,但在随机配对中,这听众对所提供的这两种歌曲都不熟悉,机器生成的歌曲通常可以收到与人类创作歌曲同样好甚至优于人类创作歌曲的评价。我们还发现结构在感知歌曲质量中起着重要作用。
报告三:
从工程哲学看音乐人工智能创作过程
On the Creative Process of AI Music from the Perspective of Engineering Philosophy
潘宇
中央音乐学院音乐人工智能与音乐信息科技系高级工程师
摘要:
工程哲学的研究对象是工程活动和工程知识。工程活动的基本单位是项目,做好一个项目,需要有技术手段和管理手段的支撑。基础科学、技术科学、工程技术构成了技术手段的工程知识体系。项目管理科学是管理手段的工程知识体系中的重要一环。音乐创作可以看成以音乐美学追求为目标的工程,根据音乐创作的具体项目,每个项目都有项目的目标、项目活动,同样也需要项目的技术手段和管理手段的支撑。艺术家如何有效的运用合理的方法完成创作?工程师需要掌握什么样的技术,才能有效的为音乐创作提供创作工具?创作过程如何定义并有效的管理?这些问题都是音乐创作工程哲学的主要问题。本报告聚焦此三类问题,总结、归纳、对比分析软件工程和音乐创作工程的发展历程,提出一种现代音乐创作工程的知识体系,在此基础上提出音乐创作工程领域的理论创新方向。
报告四:
音乐人工智能与大规模钢琴数据集GiantMIDI-Piano的收集与分析
When AI meets Music: Piano Transcription and GiantMIDI-Piano dataset
孔秋强
字节跳动 音乐人工智能研究科学家
摘要:
音乐人工智能是近年来一个新兴的学科。音乐人工智能是一门结合音乐学、计算机科学等多种学科的交叉学科。本汇报将介绍音乐人工智能在音乐创作、音乐传播、音乐推荐中的应用。本汇报将介绍:1)自动钢琴转谱系统;2)使用转谱系统转录的大规模钢琴数据集GiantMIDI-Piano。自动钢琴转谱系统采用人工智能算法,将音频波形转谱为MIDI文件。转谱的音符信息包括音高、时长、力度、延音踏板信息。制作大规模GiantMIDI-Piano数据集的目的是,将历史上的钢琴独奏作品以MIDI数字格式归档。GiantMIDI-Piano数据集元信息来源于国际音乐数字图书馆IMSLP,音频数据下载于YouTube网站。本工作开发了钢琴独奏检测系统和自动钢琴转谱系统,转谱了来自2786位作曲家的10854部钢琴独奏作品,合计3450万个音符。GiantMIDI-Piano数据已开放下载。基于GiantMIDI-Piano数据集,我们分析了不同时期、不同作曲家们的音高分布、音名分布、音程分布、和声分布,并分析了六位来自不同时期作曲家们的音符使用统计值。以此实验证实、并展望使用计算机方法进行音乐学研究的可行性。