クロマ・サブサンプリングについて調べた

複数のpngを全部pdfに結合する処理を書いていて、その中でJPEG圧縮について興味が湧いた。JPEG圧縮全体はまだ全く理解出来てなかったけど、その工程の中のクロマ・サブサンプリングについて調べたのでメモしておく。間違ってる可能性も高いので、ツッコミあれば教えてください。

ChatGPTに聞いたら次の流れのようだ。逆順をたどれば復元できるが、量子化で捨てた分は戻らない。

これの2でクロマ・サブサンプリングをしている。

RGBからの可逆変換で、RGBと違い色の情報だけサンプリングしやすい。人間は輝度に対して色差の変化を感じにくいことを利用して情報を圧縮することができる。

雑に言うとYは輝度（グレースケール）、Cbは青っぽさ、Crは赤っぽさを表す数字になっていて、この3つを使うことで色を表現する。

YCbCrでCbCrだけをサンプリングする。imagemagickなどで -sampling-factor 4:2:0 と指定しているが、この情報はクロマ・サブサンプリングに使われている。

クロマ・サブサンプリング - Wikipediaの図がわかりやすい。4:2:0をJ:a:bと表した時

と表現される。それぞれのsampling-factorの変換のイメージはWikipediaの画像がわかりやすい。

データ構造的にサンプリングしただけでデータ量が減るんだっけ？と疑問に思ったが、これはYUVフォーマットという形式を調べるとデータ量が減ることがわかる。参考: YUVフォーマットの違いを世界一分かりやすく解説 #OpenCV - Qiita。

視覚的にはこの図を見るとわかりやすい。

$shibayu36->blog;