想除掉pdf文件里的页脚,某个网站的域名,试了如下方法:
-
用
vim打开 pdf 文件,搜关键字,没搜到。strings再grep也没找到。hd再grep,没找到。pdf2ps再搜,还是没找到。后来知道, pdf 的内容几乎都是压缩了的。 -
解压
pdftk in.pdf output out.pdf uncompress -
再次搜
out.pdf就能搜到,但是 vim 里面直接修改再保存导致文件损坏。 -
找了个现成的脚本
-
重新再压缩
pdftk out.pdf output nowatermark.pdf compress -
pdf2ps再ps2pdf14使得 8.7 MB 的文件减少了 200 KB