\r\n\r\n

ファイル圧縮の仕組みは?

ファイル圧縮の基本、非可逆圧縮と可逆圧縮の違いについて学ぶ......。

ファイル圧縮は、Webの仕組みの中心的な部分です。これにより、通常では帯域と時間がかかりすぎるファイルの転送が可能になりました。ZIPファイルにアクセスするときやJPEG画像を見るときは、いつでもファイル圧縮の恩恵を受けることができます。

そこで時々、「ファイル圧縮はどのように行われるのか? ここでは、圧縮の仕組みについて基本的な紹介をします。

圧縮とはどういう意味ですか?

ファイル圧縮(またはデータ圧縮)とは、簡単に言えば、元のデータを保持したままファイルサイズを小さくすることです。これにより、ストレージデバイス上のファイル容量を削減し、さらにインターネットなどでの転送も容易になります。

ここで重要なのは、圧縮は無限ではない、ということです。ZIPファイルとして圧縮すると、ファイルのサイズは小さくなりますが、さらにサイズを小さくするために圧縮を続けることはできません。

一般的に、ファイルの圧縮には大きく分けて「非可逆圧縮」と「可逆圧縮」の2種類がありますが、この2つの方式がどのような仕組みになっているのか、順番に見ていきましょう。

ファイル圧縮のしくみ:非可逆圧縮

非可逆圧縮は、不要な情報を削除することでファイルサイズを小さくします。ソースメディアを完全に表現する必要がない、画像、ビデオ、オーディオフォーマットで最も一般的です。この種のメディアの一般的なフォーマットの多くは非可逆圧縮を使用しており、MP3やJPEGはその代表的な例です。

MP3は、元の録音に含まれるすべての音声情報を含んでいるわけではなく、人間には聞こえない音も作っています。いずれにせよ、それらがないことには気づかないので、この情報を削除することは、基本的にデメリットのないファイルサイズの縮小につながります。

同様に、JPEGは画像の重要でない部分を削除します。例えば、青空を含む画像では、JPEG圧縮により、何十種類もの色合いを使用する代わりに、すべての空のピクセルを1つか2つの色合いに変更することができます。

ただし、圧縮するファイルが重くなればなるほど、画質の劣化は顕著になります。YouTubeにアップロードされたMP3ファイルで遭遇したことがあるかもしれません。例えば、この高音質な音楽トラックを比べてみてください。

同曲の高圧縮版。

ロッシー圧縮は、ファイルが目的に応じて必要以上の情報を含んでいる場合に適しています。例えば、巨大な元画像ファイルがあったとします。大きなバナーに印刷する場合、そのクオリティを維持したいかもしれませんが、元のファイルをFacebookにアップロードするのは意味がありません。

この写真には、SNSで見てもわからないほどのデータが含まれています。高画質なJPEGに圧縮すると、多少の情報は出てきますが、肉眼ではほとんど同じ画像に見えます。より詳細な情報は、一般的な画像フォーマットの比較をご覧ください。

一般的に使用されている非可逆圧縮

先に述べたように、非可逆圧縮はほとんどのメディアにとって素晴らしいものです。そのため、SpotifyやNetflixのように、常に大量の情報を転送している企業には欠かせない存在です。品質を保ちつつ、ファイルサイズをできるだけ小さくすることで、より効率的な運用が可能になります。YouTubeにアップされているすべての動画が、非圧縮のオリジナルフォーマットで保存・転送されているとしたら、想像できますか?

しかし、非可逆圧縮は、すべての情報が重要であるファイルにはうまく機能しない。例えば、テキストファイルやスプレッドシートに非可逆圧縮を使用すると、出力が乱雑になることがあります。最終製品に深刻なダメージを与えずに、何かを捨てることはできないのです。

ロッシーフォーマットで保存する場合、品質レベルを設定できることが多い。例えば、多くの画像編集ソフトには、JPEGの画質を0〜100の間で選択できるスライダーがあります。

90%や80%程度で保存すると、ファイルサイズはかなり小さくなりますが、見た目の差はあまりありません。しかし、低画質で保存したり、同じファイルを繰り返しロッシー形式で保存すると、パフォーマンスが低下します。

下記はその一例です(クリックすると大きな画像が表示されます)。左はPixabayからダウンロードしたJPEG形式の元画像です。真ん中の画像は、JPEGで50%の画質で保存した結果です。右端の画像は、10%の画質でJPEG保存した元画像です。

ぱっと見、真ん中の画像は悪くないと思うのですが。拡大すると、箱の縁の不完全な部分にしか気がつかない。もちろん、一番右の画像はすぐに悪く見えます。

アップロードのためにトリミングする前のファイルサイズは、それぞれ874KB、310KB、100KBでした。

ファイル圧縮のしくみ:可逆圧縮

可逆圧縮とは、元のファイルを完全に復元できるように、ファイルサイズを小さくする方法です。非可逆圧縮とは対照的に、情報を捨てないのが特徴です。その代わり、可逆圧縮は基本的に冗長性を排除することで機能します。

これが何を意味するのか、基本的な例を挙げて説明しましょう。ここに青2個、黄5個、赤3個の計10個のブロックが積まれています。この積み重ねは、これらのブロックを説明する簡単な方法ですが、もう一つの方法があります。

10個のブロックをすべて表示するのではなく、1色を除いてすべて削除すればよいのです。そして、各色のレンガの数を数字で表すと、まったく同じ情報を表すのに使うレンガの数が少なくなります。10個必要だったレンガが3個で済むようになりました。

これは可逆圧縮が可能であることを示す簡単な例です。冗長性を排除することで同じ情報をより効率的に保存することができます。実際に次のような文字列を含むファイルを考えてみましょう。

mmmmmuuuuuuuoooooooooooo

次のように「圧縮」して短くすることができる。

m5u7o12

これにより、同じデータを表現するのに24文字ではなく7文字で済むようになり、大幅なコストダウンが実現しました。

日常的に使われるロスレス圧縮

前述したように、可逆圧縮は元のファイルを一切削除できない状況において重要である。ZIPファイルの仕組みに興味があるなら、これが答えです。

Windowsで実行ファイルからZIPファイルを作成する場合、可逆圧縮を使用します。 ZIPファイル圧縮はプログラムをより効率的に格納する方法ですが、解凍すると元の情報がすべて表示されます。実行ファイルを非可逆圧縮で圧縮すると、解凍したファイルが破損して使用できなくなります。

一般的なロスレス形式には、画像のPNG形式、音声のFLAC形式、ZIP形式などがあります。動画のロスレス形式は、容量が大きくなるため希少です。

非可逆圧縮と可逆圧縮の使い分けについて

ここまで2種類のファイル圧縮について見てきましたが、どのような場合にどちらを使うべきか迷ってしまうかもしれません。結局のところ、「より良い」圧縮方法はありません。それはすべて、ファイルを使用する目的に依存します。

一般的に、ソースの完全なコピーが必要な場合はロスレス圧縮を、不完全なコピーで十分な場合はロッシー圧縮を使用する必要があります。別の例で、それらがどのように調和しているかを見てみましょう。

例えば、古いCDコレクションを掘り起こし、それをデジタル化して、すべての音楽をコンピューターに保存したいとします。CDをリッピングする際、FLACのようなロスレスフォーマットを使用することは理にかなっています。こうすることで、オリジナルのCDと同じ品質のマスターコピーをパソコンに保存することができます。

あとで、**や古いMP3プレーヤーに音楽を入れて、それを聴きながら移動できるようにするといいかもしれませんね。音楽の品質が完璧であれば、おそらくあなたは気にしないので、FLACファイルをMP3に変換することができます。これはまだ完璧に聞くが、あなたのモバイルデバイス上であまりにも多くのスペースを取ることはありませんオーディオファイルを与えるだろう。FLACから変換したMP3は、元のCDから作成した圧縮MP3と同等の品質となります。iPhoneで直接動画を圧縮することも可能です。

また、ファイル内のデータの種類によって、どのタイプの圧縮が最適かを判断することもできます。PNG画像は可逆圧縮を行うため、パソコンのスクリーンショットのような余白の多い画像でもファイルサイズを小さくすることができます。しかし、実際の写真で雑多な色を表現する場合、PNGの方がより多くのスペースを占めることに気づくでしょう。

ファイル圧縮処理における問題点

これまで見てきたように、ロスレス形式からロッシー形式への変換は問題ありませんし、あるロスレス形式から別のロスレス形式への変換も同様です。ただし、ロッシーフォーマットからロスレスフォーマットへの変換は行わず、あるロッシーフォーマットから別のロッシーフォーマットへの変換には注意が必要です。

ロッシーフォーマットからロスレスフォーマットへの変換は、単なるスペースの無駄遣いです。

例えば、3MBのMP3ファイルがあったとします。FLACに変換すると30MBのファイルができますが、その30MBの中にはもっと小さなMP3とまったく同じ音が入っています。ロスレスに戻すと、MP3圧縮で吐き出された情報が「復元」されるわけではありません。

最後に、前述したように、あるロッシーフォーマットから別のフォーマットに変換する(あるいは同じフォーマットで繰り返し保存する)と、さらに品質が低下します。非可逆圧縮を適用するたびに、より多くのディテールが失われます。これは、ファイルが完全に破壊されるまで、次第に明らかになる。

圧縮のしくみ - 今だからわかる

これまで、非可逆圧縮と可逆圧縮について、その仕組みを見てきました。オリジナルフォーマットよりも小さなサイズでファイルを保存する方法と、ニーズに合わせて最適な方法を選択することがお分かりいただけたと思います。

もちろん、非可逆圧縮方式でどのデータを捨てるか、可逆圧縮方式で冗長なデータをどのように保存するのが最適かを決めるアルゴリズムは、ここで説明したよりもはるかに複雑である。もし興味があれば、このテーマについてもっと多くの発見があるはずです。

ロスレス圧縮を試したが、友人に何かを送る必要がある?大容量ファイルのオンライン転送を素早く行う方法をご紹介します。大容量のオーディオファイルの圧縮にお困りの方に、簡単で効果的な方法をご紹介します。

  • 2021-03-20 02:33 に公開
  • 閲覧 ( 20 )
  • 分類:IT

あなたが興味を持っているかもしれない記事

匿名者
匿名者

0 件の投稿

作家リスト

  1. admin 0 投稿
  2. 匿名者 0 投稿

おすすめ