山梨大学電子シラバス>検索結果一覧>授業データ



授業科目名
担当教員
ディジタル音声処理特論
小澤 賢司
時間割番号
単位数
コース
履修年次
期別
曜日
時限
GTK510 2 (未登録) 1 後期 IV
[概要と目標]
音声は人間同士のコミュ二ケーション、さらにはヒューマンマシンインタフェースにおいても重要な役割を果たしている。授業前半では、音声処理の基礎となる音のディジタル信号処理の基本を取り上げる。授業後半では音声処理のうち特に認識に長い時間を割き、その基礎となる音声及び聴覚に関わる生理学的・心理学的性質についても学ぶ。
[到達目標]
1.音声認識・合成に必要となるディジタル信号処理技術を理解する。
2.音声生成系および聴覚系に関する生理学特性の基礎、音声知覚・聴覚の心理学的特性を理解する。
3.音声認識の他に知覚符号化など情報圧縮を取り上げ、音情報に関する信号処理の基礎を理解する。
[必要知識・準備]
初等関数の微積分、確率統計
[評価基準]
No評価項目割合評価の観点
1試験:中間期 40  %達成目標1に関する理解の程度を評価する。 
2小テスト/レポート 60  %小テストにより、毎回の講義内容について理解の程度を観る。レポートにより、授業後半に関する理解の程度を観る。 
[教科書]
(未登録)
[参考書]
  1. 岩田彰編著 ; 黒柳奨著, ディジタルシグナルプロセッシング, コロナ社, ISBN:9784339027136,
    (2008年出版 コンピュータサイエンス教科書シリーズ / 曽和将容, 岩田彰, 富田悦次編集委員, 13)

  2. 荒木雅弘著 ; 講談社サイエンティフィク編集, イラストで学ぶ音声認識, 講談社, ISBN:4061538241,
    (2015年出版)

  3. 森勢将雅著, 音声分析合成, コロナ社, ISBN:4339011371,
    (2018年出版 音響テクノロジーシリーズ / 日本音響学会編, 22)
[講義項目]
【Zoomによるライブ型の授業と,Moodleを用いた小テストなどインタラクティブな授業を組み合わせて行う。中間試験は対面で実施する。】
第1回 ガイダンス,音声・音響情報理工学分野の概観,A/D変換
第2回 フーリエ級数展開・スペクトル
第3回 複素フーリエ級数展開・複素スペクトル表現
第4回 離散フーリエ変換
第5回 インパルス応答と畳み込み・FIRフィルタ
第6回 z変換・IIRフィルタ
第7回 音声認識・合成の基礎
第8回 中間評価:まとめ
第9回 (音に関する生理学)聴覚末梢・中枢系の解剖学的・生理学的基礎、音声生成系の解剖学的・生理学的基礎、(音声情報処理1)音声の合成
第10回 (音声情報処理2) 音声の特徴表現、知覚符号化による高能率圧縮
第11回 (音声知覚)人間における音声の知覚、(音声情報処理3)計算機による音声認識(概観)、統計的パターン認識
第12回 (音声情報処理4)有限状態オートマトン、音声認識:基本的な音響モデル
第13回 (音声情報処理5)音声認識:高度な音響モデル、音声認識:言語モデル
第14回 (音声情報処理6)音声認識:言語モデル(つづき)、探索アルゴリズム
第15回 (音声情報処理7)音声分析・合成手法の全体像