アップサンプリングに関連するアイデアを一緒に検証してくださる方を募集します。

サンプリング定理(Nyquist-Shannon sampling theorem)を数式で追える方や、A/D変換・D/A変換のプロセスに明るい方がいらっしゃいましたら、一緒に議論していただけないでしょうか。


取り組みたいアイデアの骨子は以下の通りです。

  • PCMによる録音・再生は、サンプリング定理を基盤にしている。
  • サンプリング定理の前提を満たすため、マイクで集音してA/D変換する過程でナイキスト周波数以上の成分はローパスフィルタでカットされる。
  • [推測] 音の立ち上がり部分はインパルスのようなものであり、周波数領域で見ると高周波が含まれている。例えば、440Hzの音叉を鳴らしたとき、音波が空間を伝搬してマイクに到着した直後の立ち上がり部分を周波数領域でみれば、440Hzの基音・倍音以外に、より高い周波数の成分が含まれている。A/D変換時にこれをカットすると、音の立ち上がりを再現することは不可能になってしまう。つまり、可聴帯域を超える周波数は不要という主張は誤りである。
  • [推測] 音の立ち上がりに含まれていたはずの高周波がカットされた状態のデジタルデータを、サンプリング定理に則ってD/A変換すると、プリリンギングが生じる。
  • プリリンギングの対策としてデジタルフィルタの工夫がなされているが、特性のトレードオフがあり万能なフィルタは無い。デジタルフィルタ毎の音の感じ方は個人差が大きい。
  • [推測] A/D変換の過程でカットされた高周波成分を補完してDACに渡すことができれば、音の立ち上がりを改善できるのではないか。例えば44.1KHzのPCM音源を96KHzにアップサンプリングするときに、音の立ち上がり部分を特定して、そのプリリンギングを消去するような成分を22.05KHz〜48KHzの周波数帯域を使って補完するようなアルゴリズムを検討したい。

数学/物理/工学に明るい方からご意見をいただけるとうれしいです。
早い段階で誤りや矛盾を指摘していただければ、このアイデアを深掘りして時間を無駄にすることを防げます。何卒よろしくおねがいいたします。