2009-09-27 11:06:58 +0000 2009-09-27 11:06:58 +0000
40
40

无法从pdf文件中复制文本

我正在使用foxit PDF阅读器查看我的教科书。我想把PDF文件中的文字复制到word文档中,但它不让我这样做。我可以选择文本,但复制文本的选项是不可用的。我可以从其他文档中复制文本,但不能复制一些。有没有办法绕过windows中的这种保护?

答案 (10)

29
29
29
2009-09-27 11:22:46 +0000

该pdf文件可能已经被锁定,无法复制文本。以下是两种解锁的方法。

1.如果pdf文件没有被锁定不能打印,你可以把它打印到虚拟pdf打印机上,创建一个解锁的文件。请看这个。 “删除密码并解锁受保护的PDF文件 允许在不知道秘密的情况下打印” . 2. 如果打印功能已被锁定,请看这个: “移除限制和解密受密码保护的PDF文件与PDF解锁器”

25
25
25
2012-07-16 09:54:15 +0000
  1. 在Google Chrome浏览器中打开PDF文件(将PDF文件拖放到Chrome浏览器中)。
  2. 将特定页面打印为PDF或打开打印预览。
  3. 现在你可以从打印预览或输出PDF中复制文本。但我不认为你可以直接复制表格。
12
12
12
2012-07-15 23:33:28 +0000

我能够使用Ghostscript(可用于Windows)为您的PDF文件创建一个无DRM版本。

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

所生成的文件stripped.pdf可以加载到Adobe Reader中,Reader会很高兴地允许你复制你想要的任何部分。它还保留了表格的大部分格式化。

2
2
2
2012-07-15 21:19:08 +0000

我可以用Okular(Linux;KDE的一部分)成功地从你的PDF文件中复制表格。要做到这一点,我必须进入Okular的设置,取消勾选 “服从DRM限制"。

我知道这对你没什么帮助,因为你运行的是Windows,但如果你手头有一台Linux机器或者愿意安装它,这是一种可能性。

不幸的是,这是没有格式化的纯文本,但看起来重新创建表格应该不会太难。你可以看到我复制粘贴冒险的结果 这里

1
1
1
2012-07-27 07:58:44 +0000

你可以使用GT Text是一个程序,翻译图像(也是pdf快照=图像)到文本。你可以选择区域并将其复制到剪贴板它是免费的

官方主页是 http://gttext.googlecode.com

1
1
1
2019-04-15 08:05:52 +0000

如果复制是灰色的,因为它现在怀疑是为你,然后PDF是'锁定',它可以阅读,但确实阻止你从复制/粘贴任何东西。

这个网站将解锁一个PDF https://smallpdf.com/unlock-pdf

0
0
0
2012-09-13 14:24:39 +0000

另一种可能是 Evince 在Windows中,它似乎默认支持复制。

在Linux中,如果还没有的话,可以通过检查override_restrictions设置来启用复制,按照 这些指示 (dconf-editor/org/gnome/evinceoverride_restrictions)。

0
0
0
2015-09-09 19:49:19 +0000

这设法转换基本的文本。不过,它对表格很不满意。 http://www.onlineocr.net/documents

0
0
0
2012-07-15 21:07:35 +0000

endolith 的回答:

你的 PDF 受保护不被复制,但不受保护不被打印。

所以我把包含表6.15的一页打印到另一个不受保护的PDF中,选择并复制该表,然后把它粘贴到Word中。令我非常惊讶的是,粘贴的结果完全是垃圾。

我现在进一步查看了这个表格,发现了一个非常令人惊讶的结果。**

这实际上是一个蒙太奇的小块文字,在页面上的位置看起来像一个表格。但这不是一个真正的表格。

你能做的最好的办法就是把整个内容改写成表格,或者在你的作品中使用这个表格式的组合文本的截图。

这是我的表格截图,取自我的生成的单页pdf文档 :

0
0
0
2012-07-11 17:34:13 +0000

如果你只是想找一些简短的片段,你经常可以在google的引号里面输入几个字,然后找到已经以其他格式扫描的准确引文,或者是别人输入的。

另一个选择是Google Docs Android应用中的 “Document from Photo",它会把文字通过OCR处理。当然,这很容易出错。

我希望PDF锁定功能从来没有存在过 :(