xzスゴイ。

画像を多用しているPDFでの圧縮率と実行時間を、gzip, bzip2, xzをそれぞれ-9オプションで比較してみました。結論、xzすごいね。テキストファイルなどでの実行結果と比べてみるとまたちゃうんでしょうね。

gzip 圧縮後のサイズ比92.5%

-rwxr-x--- 1 user user 12226478  222 13:38 hoge.pdf
## gzip compress ##

real    0m0.556s
user    0m0.548s
sys     0m0.004s
-rwxr-x--- 1 user user 11307285  222 13:38 hoge.pdf.gz

## gzip uncompress ##

real    0m0.114s
user    0m0.096s
sys     0m0.016s

bzip2 圧縮後のサイズ比35.5%

## bzip2 compress ##

real    0m6.313s
user    0m6.308s
sys     0m0.000s
-rwxr-x--- 1 user user 4344225  222 13:38 hoge.pdf.bz2
## bzip2 uncompress ##

real    0m0.646s
user    0m0.624s
sys     0m0.020s

xz 圧縮後のサイズ比19.0%

## xz compress##

real    0m2.355s
user    0m2.264s
sys     0m0.088s
-rwxr-x--- 1 user user 2319720  222 13:38 hoge.pdf.xz
## xz uncompress##

real    0m0.149s
user    0m0.112s
sys     0m0.036s

ところで圧縮率って?

圧縮率という場合、圧縮後のファイルサイズ÷元のファイルサイズ、なのか、圧縮によって縮小されたファイルサイズ÷元のファイルサイズ、なのか。「圧縮」を形容詞と捉えて、圧縮(された(後の))率と考えれば前者ですが、動詞と捉えて圧縮(する)率と考えれば後者ですね。圧縮率が高いという言い方をしたり聞いたりするから、やはり後者なんですかね。その方が直感的か。