Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.

ソース・フィルタモデル

Другие языки:

ソース・フィルタモデル

Подписчиков: 0, рейтинг: 0

この記事のほとんどまたは全てが唯一の出典にのみ基づいています。他の出典の追加も行い、記事の正確性・中立性・信頼性の向上にご協力ください。
出典検索^?: "ソース・フィルタモデル" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL（2020年1月）

ソース・フィルタモデル

●ソース:　声門　　 (声帯)
●フィルタ: 声道　　 (鼻腔, 口腔)
　　　　　　放射特性 (唇)

[ソース]→[声道フィルタ]→[唇(放射)]→[出力]

ソース・フィルタモデル（英: Source-filter model）は人の声道で声が生成される過程を音源と線形フィルタで表現した数理モデルである。音源フィルタモデル、音源フィルタ理論（英: Source-filter theory）とも呼ばれる。

概要

人の声道で声が生成される過程ではまず声門などで原音がつくられる。この原音が声道や口唇における調音を受けて音色が付与され、最終的な声となる。

これを信号処理の観点からみると、声道とは独立した原音すなわちソース（音源）があり、これがフィルタによる周波数成分増減を受けているとモデル化できる。このソースとフィルタによる音声合成過程モデルがソース・フィルタモデルである。

ソース・フィルタモデルは音声合成や音声分析に使用される。このモデルは「ソースとフィルタの独立性」を仮定しており、この仮定を強調するならば「独立ソース・フィルタモデル」(independent source-filter model)と呼ぶべきである。

このモデルは比較的シンプルで応用例が多数ある。程度の差こそあれ、異なる音素はその音源とスペクトル形状の特性によって区別できる。発声された音 (例: 母音) は、(少なくとも) 一つの音源 —— (たいていは) 声門の周期的励起 —— を持ち、それは時間領域ではインパルス列、周波数領域ではハーモニクスとして近似でき、また舌の位置や唇の突き出し具合に依存したフィルタ (調音) を持つ。他方、摩擦音は (少なくとも) 一つの音源を持つ —— 口腔を狭める事 (constriction) で生成される乱流騒音 (例: 正書法 (orthographically) で"s"や"f"で表現される音) である。有声摩擦音 ("z"や"v") は二つの音源を持つ —— 一つは声門で、もう一つは声門上部のくびれである。

ソース・フィルタモデルは線形予測 (linear prediction) と関連している。モデルの開発は、その大部分が Gunnar Fant の初期の研究に拠っている —— もちろん他の人々、特に Ken Stevens も音声の音響分析や音声合成の基礎となるモデルに潜在的には寄与しているが。

ソース・フィルタモデルでは、音源または励起信号は、有声音については周期的インパルス列で、無声音についてはホワイトノイズで、しばしばモデル化される。声道フィルタは、最も単純な場合には全極フィルタ (all-pole filter) で近似され、その係数は再生される音声信号の平均二乗誤差を最小とする線形予測により得られる。励起信号をフィルタの伝達関数と畳み込む事で、合成音声が得られる。

参考文献

Chiba, Tsutomu; Kajiyama, Masato (1941). The vowel: Its nature and structure. Tokyo, Japan: Kaiseikan
- 千葉, 勉; 梶山, 正登 (2003). 母音 - その性質と構造 -. 杉藤　美代子, 本多　清志 (訳). 岩波書店. ISBN 9784000021074
Fant, Garnner (1960). Acoustic theory of speech production. The Hague, The Netherlands: Mouton

関連項目

音声合成

モデル / 手法

エンジン

商　用	AquesTalk AITalk ReadSpeaker FineSpeech RECAIUS RubyTalk VoiceOperator CereProc IVONA Microsoft text-to-speech voices PlainTalk Syllaflow Seiren Voice
フリー	eSpeak Gnuspeech Festival Speech Synthesis System Open JTalk
非OSS	MBROLA

システム / API

商　用	Microsoft Speech API Microsoft Speech Server Talk It!
フリー	FreeTTS

ハードウェア

歴史的	DECtalk Pattern playback The Voder Wolfgang von Kempelen's speaking machine
ＬＳＩ	GI SP0256 TI LPC Speech Chips
娯　楽	Currah Echo 2 Phasor Intellivoice Speak & Spell PC-6000シリーズ PC-6600シリーズ Yamaha CX5M

応用ソフトウェア

商　用	VOICEROID CeVIO Megpoid Talk A.I.VOICE ボイスソムリエ AOLbyPhone DialogOS Dr. Sbaitso Microsoft Agent Microsoft Narrator Voice font VOICEPEAK
フリー	棒読みちゃん SofTalk VOICEVOX
サイト	コエステーション / CoeAvatar CoeFont

アクセシビリティ

RIAS
Silent speech interface
Speech-generating device
Spoken Web
TuVox

スクリーン　
リーダー
(リスト)

商　用	JAWS PC Talker VoiceOver
フリー	BRLTTY Gnopernicus GR for UNIX NonVisual Desktop Access Orca Thunder
ハード	簡単ケータイらくらくホン

Self-voicing

商　用	WordQ+SpeakQ
フリー	Emacspeak

音声ブラウザ

商　用	aiBrowser ホームページリーダー Spoken Web

ブラウザ拡張

フリー	Fire Vox Text to Voice

サイト拡張

商　用	BrowseAloud Readspeaker

ボーカルシンセ

商　用	Cantor VOCALOID CeVIO Synthesizer V くまうた
フリー	AquesTone Flinger ディレイラマ Sinsy NEUTRINO
シェア	UTAU（重音テト）
非OSS	MBROLA
ハード	DECtalk PC-6000シリーズ PC-6600シリーズ Yamaha CX5-M
応　用	ぼかりす
サイト	コエラボ

サービス・サイト

Odiogo
Quack.com

プロトコル

開発者・研究者

Catherine Browman
Franklin Seaney Cooper
Gunnar Fant
Haskins Laboratories
ヴォルフガング・フォン・ケンペレン
Ignatius Mattingly
Philip Rubin
CereProc
IVONA
VoiceWeb
ヤマハ