Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
フェーズボコーダ
フェーズボコーダ(英語: Phase vocoder)は音声信号を周波数領域の振幅と位相でモデル化するボコーダである。
フェーズボコーダの心臓部は短時間フーリエ変換 (STFT)であり、次の段階を経る。
フェーズボコーダは周波数領域での変更処理により音声信号の時間伸縮とピッチ変換などを可能にする。また再合成前にSTFT分析フレームの時間的位置を変更すれば、再合成結果の時間発展を変更でき、たとえば音の時間スケール変更を実現できる。
位相コヒーレンス問題
位相コヒーレンス問題はSTFTによる時間-周波数表現 (STFT表現) の操作で必ず解決が必要な主要問題である。これは、時間軸方向にオーバーラップした分析窓(窓関数)を使用する事により、個々の信号成分 (正弦波、インパルス) が、複数のフレームやSTFT周波数ビン(bin)へ拡散しまう問題である(周波数については「スペクトル漏れ」にあたる。)。窓関数の時間的オーバーラップは、隣接するSTFT分析結果が互いに強い相関を持つという事実に基づいている (時刻 t の分析フレームに存在する正弦波成分は、後続フレームにも同様に存在し続ける可能性が高い)。
STFT表現上で行なう全ての変更は、隣接する 周波数ビン (垂直コヒーレンス) や 時間フレーム (水平コヒーレンス) との間で 「適切な相関関係」を維持する必要がある。これは、フェーズボコーダによる信号変形の問題に関連している。合成音が極めて単純な場合以外、この「適切な相関関係」を正確に維持ですることは困難である。フェーズボコーダの発明以来、研究は主にSTFT表現変更後に垂直/水平コヒーレンスを維持するアルゴリズムの発見のために行われてきた。なお、振幅コヒーレンスは、時間スケール操作に関してマイナーな問題に過ぎない。なぜなら、分析フレームの時間シフトは、振幅に小さな影響しか与えないからである。しかし位相コヒーレンスの問題は、適切な解決策が得られるまでかなり長い期間の検討を要した。
歴史
フェーズボコーダは Flanagan & Golden (1966) によって、正弦波成分を表す各ビンの位相間で水平コヒーレンスを維持するアルゴリズムとして導入された。このオリジナルのフェーズボコーダは、隣接する周波数ビン間の垂直コヒーレンスを考慮しなかったので、このシステムによるタイムストレッチ(時間伸縮)の音響信号は明瞭さが欠けていた。
振幅変更後のSTFT表現から音響信号を再構築する最適な方法は、Griffin & Lim (1984) により提案された。このアルゴリズムはコヒーレントSTFT生成の問題を考慮していないが、たとえ変更済みSTFTがコヒーレントでなくとも(いかなる信号も表現していなくとも)、それに可能な限り近いSTFTに相当する音響信号の発見を可能にする。
垂直コヒーレンスの問題は、タイム・スケーリング操作の品質に関する大きな問題として、Laroche & Dolson (1999) が周波数ビン間の位相的整合性を保つずっと簡単な方法を提案するまで、(問題が)残り続けた。LarocheとDolsonの提案は、フェーズボコーダの歴史的転換点と看做すべきだろう。垂直位相の整合性保証により、非常に高品質なタイムスケーリング変換が得られることが示されている。
Larocheが提案したアルゴリズムは、発声(あるいはノート発音)の瞬間の水平位相コヒーレンスの維持は不可能だった。この問題の解決策はRöbel (2003) が提案した 。ここで説明したRöbel提案までの音質改善策を施した、フェーズボコーダ・ベースの信号変換のソフトウェア実装例として、IRCAM SuperVPを挙げることができる 。
音楽での使用
イギリスの作曲家 トレヴァー・ウィシャートは、人間の声のフェーズボコーダ分析/変換に基づいて、“Vox V” (アルバム “Vox Cycle”) を制作した。アメリカの作曲家 ロジャー・レイノルズの作品 “Transfigured Wind” は、フェーズボコーダをフルート音のタイムストレッチに使用した。
商用音楽制作で広く活用されているプロプライエタリなピッチ修正ソフトウェア「Auto-Tune」も、フェーズボコーダの動作原理に基づいているとみなされている。
関連項目
注釈
参考文献
- Dudley, Homer (1939), “The vocoder”, Bell Labs Record 17: 122–126
外部リンク
- The Phase Vocoder: A Tutorial, http://www.panix.com/~jens/pvoc-dolson.par (英語) — フェーズボコーダに関するチュートリアル
- New Phase-Vocoder Techniques for Pitch-Shifting, Harmonizing and Other Exotic Effects, http://www.ee.columbia.edu/~dpwe/papers/LaroD99-pvoc.pdf (英語) — [ピッチシフト、ハーモナイジング、その他のエキゾティックなエフェクトのための新しいフェーズボコーダ・テクニック]
- “Phase Vocoder”, Guitar Pitch Shifter, http://www.guitarpitchshifter.com/algorithm.html#33 (英語) — フェーズボコーダの解説(図・式入り)
- ソフトウェア
- AwesomeBox, https://web.archive.org/web/20110709004823/http://decabear.com/awesomebox.html (英語) — オープンソースのピッチ修正ソフト