みっちのDSD(Direct Stream Digital)録音の原理を突き止めてみる、の巻。(笑) |






>要するにエンコードが簡単という事が製品のメリットになるという意味ですかね?
う〜ん、DSDの存在意義は、『PCM方式とは異なったアナログーデジタル変換の1方式を考案できた』という点に尽きるのではないでしょうか。
DSDがPCMに勝る(あるいは劣る)という、客観的な証拠はないように思います。
みっち的には、本文中に述べたように、サンプリング44.1kHz量子化16bitで十分ではないかと...(おい、おいー笑)
デジタルの基本特許は20世紀の初め、フランスでとられたと何かの記事で見ました。ずいぶん古いので驚いた記憶があります。(Wikiで調べてみましたがわかりません)
理論上の話で、実現化まで相当な年数を要したということですが、コンピューターの原理、0、1のビットに置き換える(サンプリング)という発想からおもうと、1ビット方式のほうが先のような気がします。マルチビット方式は後ででてきて、実現化はマルチビットのほうがしやすい、ということで先にPCM方式のデジタル録音が実用化された、のでは?。
1ビットを時間軸でサンプリングする考え方のほうが、発想しやすい?、これは、ぼくの妄想ですが...。
聴感上、みっちさんの意見の通りCDのスペックで十分かと思うのですが、あれこれ、理屈を並べられると、そこは人間の心理で、DSDのほうが音がいいような?、気がするのですが...。ま、SACDのほうが、音がいいと感じたことは無いですけどね。
CDと比較どころか、256のMP3やAACで聴き比べても。差はよくわからないのが、本音です。
いや、もう全くそのとおりで。(笑)
みっちもシャープの文献を読んで、ははぁ、こうやってエンコードするのか、というのは分かったのですが、その背後の物理的意味はまだ謎です。(笑)
ただ、シャープ文献の「図2ΔΣ変調動作説明図」をじっと睨んでいると、時間軸でダイナミックレンジを確保する、という意味がもや~っと、(あくまで、もや~っとです-笑)分かってきます。
あと、みっちの聴感能力では、ロッシーなAAC圧縮でも、256Kbpsと128Kbpsの違いを(やっと-笑)聴き分けられる程度です。(大笑)
DSDの原理はとても難しいです。私は回路設計が本職だったので、自分用のDACを作る時にかなり解析しました。
ややこしい原因は、大きな分類としてDSDはデルタシグマ方式の一つですが、一ビットという事でかなり特殊な場合です。4ビット位にして考えると、比較的分かり易いです。
細かい話はとてもできませんが、DSDのような1ビットのデータ列であっても、サンプリング周波数をかなり上げてやると、そのFFT解析の結果は、元の音声信号にとても近くなります。ですから、1ビットでも記録再生が可能なのです。
参考文献のシャープの資料の図5で、20kHzが-80dBぐらいですから、元の1kHzの0dBと較べると、とても低い歪になってます。
感覚的に理解するのではなくて、数字的な解析で理解するしかない方式だと思います。
自分用の覚書としてmixiの日記に書いたのがありますので、分かり易くはないですが参考までに。
http://mixi.jp/view_diary.pl?id=1907541972&owner_id=3963564
http://mixi.jp/view_diary.pl?id=1909820249&owner_id=3963564&org_id=1907541972
コメントありがとうございます。
そうですか、DSDについては、定性的な理解は難しそうですねぇ。(汗)
ご教示いただいたMixiの記事は拝見させていただきました。
正直、難しいです。(笑)
何にしても、暖かいアドバイスに感謝いたします。
4bitの数値にするのではなく、4つずつを平均したものでグラフ化してみるとどうでしょう?
つまり、 0 1 0 1 1 0 1 1 1 …の場合、(最初の3つはスキップして)0.5 0.75 0.5 0.75 0.75 0.75 … というデータとしてグラフ化。
カクカクしてますがかなり最初の波形に似たものになります。
さらに4つずつではなく、8つずつ、16個ずつ、にすると、どんどんカクカクが取れて、元の波形に近くなっていくのがわかると思います。
これは実はLPF(ローパスフィルター)に近いことを行っているからなんです。
LPFは実は「移動平均」です。上記でやっているのは移動しながらの平均なので移動平均に近いものです。平均することで細かいところは忘れる、つまりぎざぎざ(高周波)成分をなくしていくので、LPFになるんです。ただし、これだと平均するときにたとえば16個取った0と1の個数しか見ていません。並び方無視です。でも並び方にも本来は意味があったはずです。並び方を考慮する場合は荷重計算することが必要になります。たとえば16個取ったデータの内側のものを重要視するようなイメージです。詳しくは書きませんが、sinc関数で得られた曲線を使って加重平均を行うと綺麗にLPFになります。
優しいコメントありがとうございます。(嬉)
みっちの場合、専門外の話も自分に分かるところは分かるようになりたいなぁ、そのためには、分かりやすく説明しているサイトはないかなぁ、といった視点でいます。
このDSDについては、どうも素人向きに解説してくれているところがなかったんですよ。
それで自分に分かる範囲のことだけを、書き出してみたと。
>LPFは実は「移動平均」です...
おおっ、こういう指摘は新鮮です。なるほどねぇ。
この記事は3年前に書いたので、もう忘れかけているところもある(汗)ので、もう一度考えなしてみます。
いずれにせよ、丁寧な解説ありがとうございました。
とのことですが、DSD回路図を見ますと、Z^-1を経由することで、量子化器から出力された1の値は0に、0の値は1に変わっています。
このことから考えると、[1つ前のデータで量子化器が出した値が1であれば0に、その値が0であれば+1になります。]となるのではないでしょうか。
https://blog.goo.ne.jp/commux/e/e08c353a7d0d5be49a00c3c61e7b8372
http://audiokenkyu.sakura.ne.jp/wordpress/wp-content/uploads/2013/09/02cf504b996ef50262a85f1dfed67938.pdf
こんばんは、みっちの拙い過去記事にコメント頂き恐縮です。
>DSD回路図を見ますと、Z^-1を経由することで、量子化器から出力された1の値は0に、
>0の値は1に変わっています。
>このことから考えると、[1つ前のデータで量子化器が出した値が1であれば0に、
>その値が0であれば+1になります。]となるのではないでしょうか。
たしかに、回路図には0と1の2値であるかのように書かれていますね。
ここでシャープの元論文(本文記事中に参照している論文、また蘭さんがお示しのリンクも結局この同じ論文がベースですね)を読んでみると、こう書かれています。
『この 変調の動作を図2を用いて以下に説明する。なお,入力部からのアナログ信号成分は黒塗のベクトルで,負帰還される2値量は白抜きの単位ベクトルで表現している。
このブロックにおいて
・積分器の出力が『正』であれば,入力側に対し『正の単位ベクトル』を減算する。(図中,下向きの白抜ベクトルを加算する)
・積分器の出力が『負』であれば,入力側に『負の単位ベクトル』を減算する。(図中,上向きの白抜ベクトルを加算する)
という負帰還動作が行われる。』
図2は、元論文の「⊿Σ変調動作説明図」です。この図で負帰還は、白抜きの単位ベクトルです。そして、積分器の出力に応じて、「正の単位ベクトル」と「負の単位ベクトル」の2種となります。図2を見ますと、そのとおり正負の単位ベクトルは同じ長さで向きだけ逆になっています。よって、負帰還の値は+1と-1という具合に、みっちは読みました。そうでないと、同論文の『積分器の出力が増大した場合,すなわち入力信号の振幅が増大した場合,これを抑制する負帰還のかかることがこの図から読み取れる。』とならないように思います。
0を-1、1を1として、1ビットずつ積算していく方がよいのでは?(ビット数が100あるので100点のデータになり、かなりサインカーブに近いものになります)

