圧縮は、ウェブサイトのパフォーマンスを向上させるための重要な手段です。ドキュメントによっては、必要な帯域を最大 70% 削減するほどサイズが縮減します。長年かけてアルゴリズムはより効率的になり、またクライアントおよびサーバーが新たなアルゴリズムをサポートしました。
実際のところ、圧縮の仕組みはブラウザーやサーバーがすでに実装していますので、ウェブ開発者が実装する必要性はありません。しかし、サーバーが適切に設定されるように注意しなければなりません。圧縮は、3 種類の異なるレベルで実施します:
- 始めに、一部のファイル形式は、固有の最適化された方法で圧縮されます。
- そして、一般的な暗号化が HTTP レベルで行われれる場合があります (リソースはエンドツーエンドで圧縮されて転送されます)
- 最後に HTTP コネクションの 2 つのノード間で、コネクションレベルで圧縮が定義される場合があります。
ファイル形式の圧縮
それぞれのデータ形式には、無駄なスペース (wasted space) と呼ばれる冗長な領域が内部にあります。テキストが一般的に 60% もの冗長性を持つのであれば、この割合は音声や動画といった他のメディアよりはるかに高くなります。これらのメディア形式はテキストとは異なり、保存するために多くの領域を占めており、早期に無駄なスペースを取り戻すことが必要です。技術者は特定の用途向けに設計されたファイル形式で使用される、最適化された圧縮アルゴリズムを設計しました。メディアファイルで使用される圧縮アルゴリズムは、大きく 2 つのカテゴリーに分類できます:
- 可逆圧縮。圧縮・展開のサイクルで取り出したデータは変化しません。これは元のデータに (バイト単位で) 一致します。
画像ではgif
やpng
が可逆圧縮を使用しています。 - 非可逆圧縮。圧縮・展開のサイクルで、ユーザーが感知できない方法で元のデータを変更します。
ウェブ上の動画形式やjpeg
画像で使用されています。
webp
のように可逆圧縮と非可逆圧縮のいずれかを使用できる形式もありますが、通常は非可逆圧縮で高圧縮・低圧縮を設定でき、当然ながらそれは品質の高低に結びつきます。サイトのパフォーマンスを高めるには、満足できる品質レベルを維持しながら、できるだけ圧縮することが理想です。画像の場合は、ツールが生成する画像はウェブ向けに十分最適化されていない場合があります。要求する品質で可能な限り圧縮するツールを使用することをお勧めします。この用途に特化した 多くのツール があります。
非可逆圧縮アルゴリズムは一般的に、可逆圧縮より効率がよくなります。
特定の種類のファイルは圧縮が良好に機能しているため、通常は 2 度目の圧縮を行いません。実際のところ、大きなファイルの圧縮によって得られる追加の利益よりもオーバーヘッド (アルゴリズムは一般的に、初期のサイズに追加する辞書が必要です) のコストが上回る場合があります。圧縮済み形式のファイルで、以下の2つの技術は使用しないでください。
エンドツーエンドの圧縮
エンドツーエンドの圧縮は、ウェブサイトのパフォーマンスをもっとも向上させます。エンドツーエンドの圧縮は、サーバーによって行われるメッセージボディの圧縮を指しており、圧縮されたデータはクライアントに到達するまで変更されません。中間のノードはすべて、ボディ部分に手をつけないままにします。
現代のすべてのブラウザーやサーバーはこの圧縮をサポートしており、唯一取り決めることは、使用する圧縮アルゴリズムです。これらのアルゴリズムは、テキストに最適化されています。1990 年代に圧縮技術は速いペースで進歩して、いくつものアルゴリズムが、使用可能な選択肢に追加されました。現在妥当なアルゴリズムは、もっとも一般的な gzip
と新たな挑戦者である br
の 2 つだけです。
使用するアルゴリズムを選択するには、ブラウザーとサーバーで プロアクティブなコンテンツネゴシエーション を行います。ブラウザーは Accept-Encoding
ヘッダーで、サポートするアルゴリズムを優先度順に並べて送信します。サーバーはそのうちひとつを選択して、レスポンスのボディの圧縮に使用します。そして Content-Encoding
ヘッダーを使用して、選択したアルゴリズムをブラウザーに伝えます。エンコーディングに基づいて表現を選択するためにコンテンツネゴシエーションを使用したとき、少なくとも Content-Encoding
を含めた Vary
ヘッダーを、レスポンスとともに送信しなければなりません。この方法によって、リソースのさまざまな表現をキャッシュすることができます。
圧縮によってパフォーマンスが大きく向上しますので、画像・音声・動画といったすでに圧縮されているものを除くすべてのファイルで圧縮を有効化することを推奨します。
Apache は圧縮や mod_deflate をサポートします。nginx では ngx_http_gzip_module、IIS では <httpCompression>
要素があります。
ホップバイホップの圧縮
ホップバイホップの圧縮はエンドツーエンドの圧縮に似ています。しかし、サーバー内のリソースでは圧縮を行わずに特定の表現形式を生成して転送しますが、クライアントとサーバーの間のパス上にある任意の 2 つのノードの間でメッセージのボディが圧縮されるという根本的な違いがあります。連続した中間ノードの間のコネクションで、異なる圧縮が行われることがあります。
これを行うために、HTTP ではエンドツーエンドの圧縮のコンテンツネゴシエーションに似ている仕組みを使用します。リクエストを転送するノードは TE
ヘッダーを使用して圧縮アルゴリズムを伝えます。相手のノードは適切な方式を選択して圧縮を行い、Transfer-Encoding
ヘッダーを使用して、選択した方式を示します。
実際は、ホップバイホップの圧縮はサーバーやクライアントにとって透過的であり、あまり使用されません。TE
および Transfer-Encoding
は主にチャンク形式でレスポンスを送信するために使用され、長さがわからないリソースの転送を開始することができます。
ホップレベルで圧縮や Transfer-Encoding
を使用することは Apache、nginx、IIS などほとんどのサーバーでまれであり、簡単に設定する方法はありません。このような設定は、主にプロキシレベルで行います。