近年來發展的神經語言模型 (neural language model) 像是 GPT (Generative Pre-trained Transformer) 已被廣泛用來輔助各種多媒體內容的生成和理解等任務。然而,這些模型在處理音樂資料的限制和挑戰值得注意。在這個演講中,我們討論一個有趣的音樂理解問題:如何讓神經網路模型解析並呈現音樂的結構?我們將在計算音樂學 (computational musicology) 的視角下定義這個問題,討論它所衍生的一些任務,包括音樂訊號中的邊界偵測 (boundary detection)、片段標註 (segment labeling) 和動機探索 (motif discovery) 等等。瞭解到音樂資料的特殊性,我們將說明一般的神經語言模型在這些任務上可及與不可及之處,特別是指出音樂的階層結構之理解,本質上並無法化簡為閉集分類 (closed set classification) 問題,而需被描述成一種依賴前後文資訊的聚類 (context-dependent clustering) 機制,在實作面上需要同時搭配監督式 (supervised) 與自監督式 (self-supervised) 的模型訓練策略。由這些研究結果啟發,我們最後將討論音樂結構的尋找機制在音樂資訊檢索、音樂生成等應用情境下的重要性。
推薦活動
以人工智慧技術尋找音樂的結構
| 活動訊息 | |
|---|---|
| 活動時間:10/19 10:10 -10/19 10:40 | 活動地點:資訊科學研究所 |
| 主講人:蘇黎 副研究員 | 位置:資訊科學研究所新館106會議室 |
| 主辦單位 | |
| 資訊科學研究所 | |
| 活動分類 | |
| 活動類型:演講座談 | 活動組別:數理科學 |
| 其他資訊 | |
| 適合對象: | 聯絡人:陳冠文。27883799分機2203 |
| 活動人數限制:None | |
| 備註:None | |
推薦活動
| 活動時間 | 活動地點 | 活動類型 | 活動名稱 | 主辦單位 | 適合對象 |
|---|---|---|---|---|---|
| 10/19 09:00-10/19 16:00 | 跨領域科技研究大樓 | 互動體驗 | 晶片誕生之旅:無塵室穿梭與元件製程體驗 | 應用科學研究中心 | |
| 10/19 09:00-10/19 10:00 | 地球科學研究所 | 影片欣賞 | 地球所簡介影片欣賞 | 地球科學研究所 | |
| 10/19 09:00-10/19 16:00 | 化學研究所 | 參觀導覽 | 生活中的元素 | 化學研究所 | |
| 10/19 09:30-10/19 16:00 | 人文社會科學館 | 互動體驗 | 跳舞的離子 ─ 離子阱原理演示 | 原子與分子科學研究所 | |
| 10/19 11:30-10/19 12:30 | 物理研究所 | 演講座談 | 遇見量子熊: 量子大亂鬥 | 物理研究所 | |
| 10/19 13:00-10/19 15:00 | 人文社會科學館 | 演講座談 | 問A咖 | 天文及天文物理研究所 | |
| 11/08 14:00-11/08 15:00 | 南部院區 | 演講座談 | 從數據看世界: 生活中統計的應用與誤解 | 統計科學研究所 | |
| 10/19 14:30-10/19 15:00 | 人文社會科學館 | 演講座談 | ㄧ千億個太陽系 | 天文及天文物理研究所 |