つくってわかる Python音声処理プログラミング
■ つくってわかる Python音声処理プログラミング
青木 直史 著
B5判 336ページ
定価3,520円 (本体3,200円+税)
ISBN-10: 4065413931
ISBN-13: 978-4065413937
講談社サイエンティフィク
2025年11月21日第1刷発行
■ リンク
◆ 講談社サイエンティフィク
◆ Amazon
■ 目次
まえがき
第1講 周波数特性って、なんですか?
1.1 サイン波
1.2 フーリエ変換
1.3 逆フーリエ変換
1.4 重ね合わせの原理
1.5 スペクトログラム
第2講 画像から音って復元できるの?
2.1 スペクトログラムリーディング
2.2 母音を読み取る
2.3 破裂音を読み取る
2.4 摩擦音を読み取る
2.5 破擦音を読み取る
2.6 音の推理
2.7 グリフィン・リムのアルゴリズム
第3講 重ね合わせれば歌声だってつくれます
3.1 Speech to MIDI
3.2 MIDIによる音の表現
3.3 分析合成
3.4 加算合成で音をつくる
3.5 音声のロバスト性
第4講 音声って、一体どんな音?
4.1 ソースフィルタ理論
4.2 声帯音源
4.3 声道フィルタ
4.4 音声のスペクトログラム
4.5 減算合成で音をつくる
4.6 音声の自然性
第5講 つくればわかる日本語の音声の特徴
5.1 有声音と無声音
5.2 破裂音をつくる
5.3 摩擦音をつくる
5.4 破擦音をつくる
5.5 接近音をつくる
5.6 弾音をつくる
5.7 鼻音をつくる
5.8 Motion to Speech
第6講 音声認識がやっていること、ご存じですか?
6.1 ケプストラム
6.2 フィルタバンク
6.3 MFCC
6.4 セグメンテーション
6.5 DPマッチング
第7講 音声生成の物理とつながる美しい数学の世界
7.1 線形予測法
7.2 前向き線形予測
7.3 後向き線形予測
7.4 レビンソン・ダービンのアルゴリズム
7.5 分析フィルタと合成フィルタ
7.6 スペクトル包絡の推定
7.7 声道断面積関数
7.8 LPC係数とPARCOR係数
7.9 LPC係数とLSP係数
第8講 音響分析すれば見えてくる音声の特徴
8.1 パワー
8.2 ゼロ交差率
8.3 音声区間検出
8.4 自己相関関数
8.5 ピッチ抽出
8.6 フォルマント抽出
第9講 ボコーダを使えばロボットの声もつくれます
9.1 音声の符号化
9.2 分析フィルタと合成フィルタ
9.3 声帯音源の簡単化
9.4 ハイブリッド方式
9.5 LPC ボコーダ
9.6 ミュージシャンのボコーダ
第10講 ボイスチェンジャでカワイイ声をつくるには
10.1 声質の役割
10.2 早送り再生とスロー再生
10.3 スペクトログラムの拡大と縮小
10.4 ピッチとフォルマントのコントロール
10.5 ヘリウムボイス
第11講 その人の声質で音声合成してみます
11.1 コーパスベースの音声合成
11.2 音韻論と音声学
11.3 日本語音声の統計的性質
11.4 音素バランス文
11.5 アノテーション
11.6 音声素片の連結
11.7 AI技術による音声合成
第12講 ニューラルネットワークを使ってみよう
12.1 ディープラーニング
12.2 ニューラルネットワーク
12.3 データセットの作成
12.4 モデルの定義
12.5 学習
12.6 評価
12.7 音声分類の可能性
あとがき
■ プログラム
◆ 本書は、プログラミング言語としてPythonを利用しています。プログラムを実行する手順はつぎのとおりです。
(1) Anacondaのインストール
https://www.anaconda.com
からインストーラをダウンロードし、実行する。
(2) プログラムのダウンロード
http://floor13.sakura.ne.jp/book10/book10.html
から
program.zip
をダウンロードし、解凍してから、ユーザーディレクトリのなかにすべてを展開する。
(3) プログラムの実行
Jupyter Notebookを開く。
p1_1.ipynbを開き、実行する。
Last Modified: November 19 12:00 JST 2025 by Naofumi Aoki
http://floor13.sakura.ne.jp/