如何从PDF文件中删除水印?
我以为这是个简单的工作,结果却反过来了。
水印在每一页上都是相同的(重叠的,但透明的)图像。我自己用PDFCreator 0.9.8创建了这个PDF文件(所以这里没有版权问题)。
我已经尝试过我朋友的Adobe Acrobat Pro,但它没有工作。它试图删除它,但它不能。我试过删除页眉/页脚等,但水印就是不消失。
如何才能去除水印?
我以为这是个简单的工作,结果却反过来了。
水印在每一页上都是相同的(重叠的,但透明的)图像。我自己用PDFCreator 0.9.8创建了这个PDF文件(所以这里没有版权问题)。
我已经尝试过我朋友的Adobe Acrobat Pro,但它没有工作。它试图删除它,但它不能。我试过删除页眉/页脚等,但水印就是不消失。
如何才能去除水印?
对于基于图像的水印,有几个工具承诺自动去除。例如:
所有这些都是免费试用的,但需要一个许可证来实际产生所需的输出。
然而,这个特定的PDF文件的水印(上级通过电子邮件发给我)并不是一个单一的图像,在所有页面上重复。事实证明,PDFCreator将其硬编码(几乎是一个像素一个像素)到每一个人的身上。这使得水印更难去除(并导致在一个相当臃肿的PDF文件)。
由于水印实际上是由许多微小的图像组成的,你可以用PDF编辑器(如Foxit Advanced PDF Editor)删除它们,只需选择它们并按删除即可。不幸的是,你必须对每一页都重复这样做。
一个比较省时的解决方案是以编程方式去除水印。我们需要
1.下载Pdftk并解压pdftk.exe和libiconv2.dll到%windir%System32, 路径中的一个目录或你选择的任何其他位置。
3.下载并安装Notepad++。PDF流通常使用 DEFLATE 算法进行压缩。这样可以节省空间,但会使PDF的源文件难以辨认。
4.打开未压缩的.pdf。用Notepad++打开未压缩的.pdf**,揭示水印的结构。
按Ctrl + H,设置如下。
现在水印已经被去除,但PDF文件有错误(流的长度不正确),而且它没有被压缩。
不再需要uncompressed.pdf。您可以删除它。
结果是同样的PDF文件,没有水印(大约一半大小)。
印章的特点是,你可以在Adobe Acrobat Pro中删除它,但它会在鼠标移动时重新生成,因为流对象使它保持持久性。
如果你试图编辑pdf源–这是非常棘手的,有可能文件会被损坏。
如果邮票是一个流,我们可以通过断开计算机与网络的连接来中断它,我就是这样做的。
然后用Adobe Acrobat Pro选中我的一个批注,右击得到弹出窗口,选择 “显示评论列表"。
从列表中选择那个恶毒的水印/印章,右键点击得到弹出窗口,选择 "删除"。对每一个出现贴图的页面都这样做。
用另一个名字保存文件。我的应用程序崩溃了,但在保存文件之前还没有崩溃!
打开新的且小得多的文件;注意,所有的水印/印章都是gonzo。
在我的例子中,我的3页文件的文件大小从300 kb缩减到令人印象深刻的60 kb。所有原始数据和注释都完好无损–没有水印。
~狩猎愉快:o)
找到了另一种方法。
1.使用pdf2htmlEX工具(或任何其他PDF到HTML转换器)将PDF转换为HTML文件。 2. 用文本编辑器编辑HTML,并删除水印。保存它。 3. 打印到HTML到一个新的PDF文档 4. 盈利
这是对@Dennis 2012年7月30日18:06的回答的补充。他肯定解决了较难的情况。
在最简单的情况下,水印是简单的、无装饰的文本,例如
Smedley For Commissioner
未压缩的 PDF 水印可以这样定义。
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
其中75.96
是水平偏移量,625
是这个特定水印实例的垂直偏移量。(是的,实数和整数都可以看到。)
类似下面的regexp将适用于所有此类水印,忽略其位置的任何变化。
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
要注意的是,各种修改PDF的运算符可能会对具有更复杂格式的水印产生作用。这样的花哨可以将读者期望(希望?)的一个连续的、容易搜索的字符串变成一团乱麻的字母汤。例如,
E1 = mc² by Smedley™
Might be the product of this:
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
……如果你的水印是颜色增强的,那就更糟糕了!
在注意到所有这些之后,我还会注意到PDFtk有一个GUI版本,据称可以处理水印,代价是4美元的许可费。一点都不贵
另一方面,我发现它的网站目前宣传完全支持O/S的通过Windows 8
和OS X 10.8 Mountain Lion
。这个年份已经超过4年了。PDFtk可能已经过时了吗?我怀疑不会,但我不知道。