近年來發展的神經語言模型 (neural language model) 像是 GPT (Generative Pre-trained Transformer) 已被廣泛用來輔助各種多媒體內容的生成和理解等任務。然而,這些模型在處理音樂資料的限制和挑戰值得注意。在這個演講中,我們討論一個有趣的音樂理解問題:如何讓神經網路模型解析並呈現音樂的結構?我們將在計算音樂學 (computational musicology) 的視角下定義這個問題,討論它所衍生的一些任務,包括音樂訊號中的邊界偵測 (boundary detection)、片段標註 (segment labeling) 和動機探索 (motif discovery) 等等。瞭解到音樂資料的特殊性,我們將說明一般的神經語言模型在這些任務上可及與不可及之處,特別是指出音樂的階層結構之理解,本質上並無法化簡為閉集分類 (closed set classification) 問題,而需被描述成一種依賴前後文資訊的聚類 (context-dependent clustering) 機制,在實作面上需要同時搭配監督式 (supervised) 與自監督式 (self-supervised) 的模型訓練策略。由這些研究結果啟發,我們最後將討論音樂結構的尋找機制在音樂資訊檢索、音樂生成等應用情境下的重要性。
推薦活動
以人工智慧技術尋找音樂的結構
| 活動訊息 | |
|---|---|
| 活動時間:10/19 10:10 -10/19 10:40 | 活動地點:資訊科學研究所 |
| 主講人:蘇黎 副研究員 | 位置:資訊科學研究所新館106會議室 |
| 主辦單位 | |
| 資訊科學研究所 | |
| 活動分類 | |
| 活動類型:演講座談 | 活動組別:數理科學 |
| 其他資訊 | |
| 適合對象: | 聯絡人:陳冠文。27883799分機2203 |
| 活動人數限制:None | |
| 備註:None | |
推薦活動
| 活動時間 | 活動地點 | 活動類型 | 活動名稱 | 主辦單位 | 適合對象 |
|---|---|---|---|---|---|
| 10/19 09:00-10/19 15:00 | 人文社會科學館 | 互動體驗 | 時空魔法桌 | 天文及天文物理研究所 | |
| 10/19 09:00-10/19 16:00 | 跨領域科技研究大樓 | 成果展示 | 晶片上的細胞培養 | 應用科學研究中心 | |
| 10/19 09:00-10/19 16:00 | 跨領域科技研究大樓 | 參觀導覽 | 阿凱師的奇幻光影世界 | 應用科學研究中心 | |
| 10/19 10:00-10/19 11:40 | 環境變遷研究大樓 | 互動體驗 | 熱出新世界:對抗熱浪的超級任務 | 環境變遷研究中心 | |
| 10/19 10:00-10/19 16:00 | 資訊科技創新研究中心 | 互動體驗 | 意念啟程-腦控取物車 | 資訊科技創新研究中心 | |
| 11/08 10:00-11/08 14:30 | 南部院區 | 成果展示 | 天文所「天聞季報」展示及發送 | 天文及天文物理研究所 | |
| 10/19 10:00-10/19 11:00 | 地球科學研究所 | 演講座談 | 隕石與我 | 地球科學研究所 | |
| 10/19 11:00-10/19 12:00 | 地球科學研究所 | 成果展示 | 海洋的化學時光機 | 地球科學研究所 |