山梨大学電子シラバス

授業科目名

担当教員

ディジタル音声処理特論

小澤　賢司／森勢　将雅

時間割番号

単位数

コース

履修年次

期別

曜日

時限

GTK510

(未登録)

後期

月

［概要と目標］

音声は人間同士のコミュ二ケーション、さらにはヒューマンマシンインタフェースにおいても重要な役割を果たしている。授業前半では音声認識を取り上げ、その基礎となる音声及び聴覚に関わる生理学的・心理学的性質についても学ぶ。授業後半では、主に音声合成に関するトピックを中心に、ディジタル信号処理を活用した音声情報処理や、最近の応用事例について学ぶ。

[到達目標]

１．音声生成系および聴覚系に関する生理学特性の基礎、音声知覚・聴覚の心理学的特性を理解する。 ２．音声認識の他に知覚符号化など情報圧縮を取り上げ、音情報に関する信号処理の基礎を理解する。 ３．音声合成に必要となるディジタル信号処理技術を理解する。 ４．信号処理技術を活用した伝統的な音声分析・音声合成手法を理解する。

［必要知識・準備］

初等関数の微積分、確率統計、ディジタル信号処理の基礎

［評価基準］

No	評価項目	割合	評価の観点
1	小テスト／レポート	100 %	小テストにより、毎回の講義内容について理解の程度を観る。レポートにより、総合的な理解の程度を観る。

［教科書］

(未登録)

［参考書］

荒木雅弘, イラストで学ぶ音声認識, 講談社, ISBN:4-06-153824-1

［講義項目］

（第１回～第８回前半：担当小澤賢司） 第１回音声・音響情報理工学分野の概観、（音の物理学）フーリエ変換とスペクトル 第２回（音に関する生理学）聴覚末梢・中枢系の解剖学的・生理学的基礎、音声生成系の解剖学的・生理学的基礎、（音声情報処理１）音声の合成、音声の高能率符号化 第３回（音声情報処理２）音声の特徴表現、知覚符号化による高能率圧縮 第４回（音声知覚）人間における音声の知覚、（音声情報処理３）計算機による音声認識（概観）、統計的パターン認識 第５回（音声情報処理４）有限状態オートマトン、音声認識：基本的な音響モデル 第６回（音声情報処理５）音声認識：高度な音響モデル、音声認識：言語モデル 第７回（音声情報処理６）音声認識：言語モデル（つづき）、探索アルゴリズム 第８回前半（聴覚の心理学）音の大きさ（ラウドネス）・高さ（ピッチ） （第８回後半～第１５回：担当森勢将雅） 第８回後半音声分析・合成手法の全体像の解説 第９回（音声のモデル化）ボコーダ 第１０回（音声分析１）基本周波数推定 第１１回（音声分析２）スペクトル包絡推定 第１２回（音声分析３）非周期性指標推定 第１３回（音声加工）声質変換，音声のモーフィング 第１４回（音声合成１）テキスト音声合成 第１５回（音声合成２）最先端の音声合成技術