山梨大学電子シラバス>検索結果一覧>授業データ



授業科目名
担当教員
ディジタル音声処理特論
小澤 賢司/森勢 将雅
時間割番号
単位数
コース
履修年次
期別
曜日
時限
GTK510 2 (未登録) 1 後期 I
[概要と目標]
音声は人間同士のコミュ二ケーション、さらにはヒューマンマシンインタフェースにおいても重要な役割を果たしている。授業前半では音声認識を取り上げ、その基礎となる音声及び聴覚に関わる生理学的・心理学的性質についても学ぶ。授業後半では、主に音声合成に関するトピックを中心に、ディジタル信号処理を活用した音声情報処理や、最近の応用事例について学ぶ。
[到達目標]
1.音声生成系および聴覚系に関する生理学特性の基礎、音声知覚・聴覚の心理学的特性を理解する。<BR>2.音声認識の他に知覚符号化など情報圧縮を取り上げ、音情報に関する信号処理の基礎を理解する。<BR>3.音声合成に必要となるディジタル信号処理技術を理解する。<BR>4.信号処理技術を活用した伝統的な音声分析・音声合成手法を理解する。
[必要知識・準備]
初等関数の微積分、確率統計、ディジタル信号処理の基礎
[評価基準]
No評価項目割合評価の観点
1小テスト/レポート 100  %小テストにより、毎回の講義内容について理解の程度を観る。レポートにより、総合的な理解の程度を観る。 
[教科書]
(未登録)
[参考書]
  1. 荒木雅弘, イラストで学ぶ音声認識, 講談社, ISBN:4-06-153824-1
[講義項目]
(第1回〜第8回前半:担当 小澤賢司)<BR>第1回 音声・音響情報理工学分野の概観、(音の物理学)フーリエ変換とスペクトル<BR>第2回 (音に関する生理学)聴覚末梢・中枢系の解剖学的・生理学的基礎、音声生成系の解剖学的・生理学的基礎、(音声情報処理1)音声の合成、音声の高能率符号化<BR>第3回 (音声情報処理2) 音声の特徴表現、知覚符号化による高能率圧縮<BR>第4回 (音声知覚)人間における音声の知覚、(音声情報処理3)計算機による音声認識(概観)、統計的パターン認識<BR>第5回 (音声情報処理4)有限状態オートマトン、音声認識:基本的な音響モデル<BR>第6回 (音声情報処理5)音声認識:高度な音響モデル、音声認識:言語モデル<BR>第7回 (音声情報処理6)音声認識:言語モデル(つづき)、探索アルゴリズム<BR>第8回前半 (聴覚の心理学)音の大きさ(ラウドネス)・高さ(ピッチ)<BR>(第8回後半〜第15回:担当 森勢将雅)<BR>第8回後半 音声分析・合成手法の全体像の解説<BR>第9回 (音声のモデル化)ボコーダ<BR>第10回 (音声分析1)基本周波数推定<BR>第11回 (音声分析2)スペクトル包絡推定 <BR>第12回 (音声分析3)非周期性指標推定<BR>第13回 (音声加工)声質変換,音声のモーフィング<BR>第14回 (音声合成1)テキスト音声合成<BR>第15回 (音声合成2)最先端の音声合成技術