山梨大学電子シラバス−授業データ

授業科目名

担当教員

音声・音響情報処理特論

小澤　賢司

時間割番号

単位数

コース

履修年次

期別

曜日

時限

PTW711

(未登録)

後期

火

［概要と目標］

音声・音響情報処理は，今日のユーザインタフェース構築に必須の技術である。本講義では，複数音源からの音が重畳した音を分離する技術を学ぶ。これは騒音環境下で音声認識精度を高めるために，特定ユーザの音声のみを抽出する前処理に利用される。さらに，複数の楽器音が混ざった音から，楽器ごとの音を抽出するといった高度な応用に繋がる。これを実現するために，数学的基礎からはじめ，人工知能技術までを修得する。

[到達目標]

・音声情報処理・アレイ信号処理に関する歴史や最先端技術の概要を説明できる．
・音声情報処理・アレイ信号処理に関する技術が世の中でどのように利用されているかを理解した上で，自身が解決すべき問題に適切に利用できる．

［必要知識・準備］

微分積分学，線形代数，確率統計など大学学部レベルの数学知識があることが望ましい．

［評価基準］

No	評価項目	割合	評価の観点
1	小テスト／レポート	100 %	レポートにより、総合的な理解の程度を測る。

［教科書］

戸上真人著, Pythonで学ぶ音源分離, インプレス, ISBN:9784295009849,
(2020年出版機械学習実践シリーズ)

［参考書］

［講義項目］

講義の実施形態については受講者と相談して決める。（対面授業／Zoomによるライブ型の授業／他の選択肢も可能である）

１．アレイ信号処理の基礎，音源分離の基本概念
２．音声データの取り扱い・可視化
３．スペクトル・スペクトログラムの描画
４．音源分離に関する数学的基礎
５．最適化の技法
６．シミュレータによる音の合成
７．古典的音源分離方法（その１）：遅延和アレイ，最小分散ビームフォーマ
８. 古典的音源分離方法（その２）：最大SNRビームフォーマ，ウィーナフィルタ
９. 音源方向推定に基づく音源分離
10. 統計モデルに基づく音源分離（その１）：独立成分分析
11. 統計モデルに基づく音源分離（その２）：独立ベクトル分析・独立低ランク分析
12．統計モデルに基づく音源分離（その３）：マルチチャネル時変ガウスモデル
13. 残響除去
14. 音源分離と残響除去の統合
15．総括