山梨大学電子シラバス>検索結果一覧>授業データ



授業科目名
担当教員
ディジタル音声処理特論
小澤 賢司
時間割番号
単位数
コース
履修年次
期別
曜日
時限
GTK510 2 (未登録) 1 後期 I
[概要と目標]
音声は人間同士のコミュ二ケーション、さらにはヒューマンマシンインタフェースにおいても重要な役割を果たしている。授業前半では音声認識を取り上げ、その基礎となる音声及び聴覚に関わる生理学的・心理学的性質についても学ぶ。授業後半では、主に音声合成に関するトピックを中心に、ディジタル信号処理を活用した音声情報処理や、最近の応用事例について学ぶ。
[到達目標]
1.音声生成系および聴覚系に関する生理学特性の基礎、音声知覚・聴覚の心理学的特性を理解する。
2.音声認識の他に知覚符号化など情報圧縮を取り上げ、音情報に関する信号処理の基礎を理解する。
3.音声合成に必要となるディジタル信号処理技術を理解する。
4.信号処理技術を活用した伝統的な音声分析・音声合成手法を理解する。
[必要知識・準備]
初等関数の微積分、確率統計、ディジタル信号処理の基礎
[評価基準]
No評価項目割合評価の観点
1小テスト/レポート 100  %小テストにより、毎回の講義内容について理解の程度を観る。レポートにより、総合的な理解の程度を観る。 
[教科書]
(未登録)
[参考書]
  1. 荒木雅弘, イラストで学ぶ音声認識, 講談社, ISBN:4-06-153824-1
  2. 森勢将雅, 音声分析合成, コロナ社, ISBN:4339011371
[講義項目]
第1回 音声・音響情報理工学分野の概観、(音の物理学)フーリエ変換とスペクトル
第2回 (音に関する生理学)聴覚末梢・中枢系の解剖学的・生理学的基礎、音声生成系の解剖学的・生理学的基礎、(音声情報処理1)音声の合成
第3回 (音声情報処理2) 音声の特徴表現、知覚符号化による高能率圧縮
第4回 (音声知覚)人間における音声の知覚、(音声情報処理3)計算機による音声認識(概観)、統計的パターン認識
第5回 (音声情報処理4)有限状態オートマトン、音声認識:基本的な音響モデル
第6回 (音声情報処理5)音声認識:高度な音響モデル、音声認識:言語モデル
第7回 (音声情報処理6)音声認識:言語モデル(つづき)、探索アルゴリズム
第8回 (聴覚の心理学)音の大きさ(ラウドネス)・高さ(ピッチ)
第9回 音声分析・合成手法の全体像の解説、(音声のモデル化)ボコーダ
第10回 (音声分析1)基本周波数推定
第11回 (音声分析2)スペクトル包絡推定
第12回 (音声分析3)非周期性指標推定
第13回 (音声加工)声質変換,音声のモーフィング
第14回 (音声合成1)テキスト音声合成
第15回 (音声合成2)最先端の音声合成技術、音声の高能率符号化