Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
PSOLA
Подписчиков: 0, рейтинг: 0
PSOLA (Pitch Synchronous Overlap and Add; ピッチ同期重畳加算) は「ピッチに基づいた音声の分割・変換・再合成」をおこなう音声処理の枠組みである。ピッチ同期波形重畳法とも。
PSOLAを採用した音声処理ではスペクトル包絡/フォルマントを保ったまま音高や持続時間(テンポ)を変更できる。
PSOLAは次の3つの段階(分析・変換・再合成)からなる。
- 分析: 信号を短い区間の集合へ変換。区間長は可変、短時間でのピッチに同期(Pitch-Synchronous)
- 変換: 区間ごとあるいは区間単位で操作
- 再合成: 重畳加算(OverLap-Add)
分析では、対象の音声波形がもつ周期(ピッチ)と同期した分析窓を用い、互いにオーバーラップした短い断片/区間(基本周期の2倍程度)に分割する。
変換例として、信号のピッチを下げるには断片を互いに遠ざけ、ピッチを上げるには互いに近付けて断片を再配置する。断片を離す/重ねる結果として信号長/持続時間が変化するため、次の補正を行う。信号の持続時間を長くするには 引き続き同じ断片を複数回繰り返し、短くするには いずれかの断片を間引きする。
変換された断片は重畳加算法 (英語: overlap-add) で結合され信号が再合成される。
PSOLAを採用しかつ操作が時間領域でおこなわれるアルゴリズムはTD-PSOLAと総称され、また周波数領域でおこなわれるアルゴリズムはFD-PSOLAと総称される。
PSOLAは音声信号の韻律 (英語: prosody) の変更に使用できる。
関連項目
- タイムストレッチ/ピッチシフト
- 重畳加算法
- 波形接続型音声合成
- フェーズボコーダ(一定区間長/STFTで分析)
参考文献
- Eric Moulines; Francis Charpentier (December 1990), “Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones”, Speech Communication 9: 453–467, doi:10.1016/0167-6393(90)90021-Z
- Eric Moulines; Jean Laroche (February 1995), “Non-parametric techniques for pitch-scale and time-scale modification of speech”, Speech Communication 16 (2), doi:10.1016/0167-6393(94)00054-E
外部リンク
- Changing Pitch with PSOLA for Voice Conversion (英語)
- A thesis that discusses PSOLA with diagrams (PDF, 英語); 35ページ参照(PDF上の44ページ目)