备选方案1)
sudo apt-get install cups-pdf
然后导航到系统/>管理/>打印,并创建一个新的打印机,将其设置为PDF文件打印机,并命名为 “pdf"。
然后运行
oowriter -pt pdf your_word_file.doc
现在你会在~/PDF中找到你的.pdf文件。
备选方案2)
sudo apt-get install wv tetex-extra ghostscript
wvPDF test.doc test.pdf
如果你的发行版中没有texex-extra包,可以试试texlive-base加上texlive-latex-base。
sudo apt-get install wv texlive-base texlive-latex-base ghostscript
wvPDF test.doc test.pdf
你可以使用。
oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
如果你运行的是X,那么你可以通过Open Office来完成。既然你要反对手动操作,记得在Open Office中有一些很好的宏脚本,所以你可以自动化。你可以用AbiWord做类似的事情(AbiWord –to=pdf)。
如果你没有X,那么有antiword,但它只是提取文本–不做任何格式化或图形。还有 wvWare 我曾用它从doc文件中批量提取图片,但我从未尝试过用它将doc文件转换为pdf文件。
哦,还有.docx文件可能需要一些不同的东西,但是因为它们只是压缩的xml文件,所以对它们做一些有用的事情应该不会太难。对于批量提取图像,你只需解压并复制图像目录,但我从未需要在Linux中转换它们。
我会尝试在Linux下使用
$ /opt/openoffice.org3.1/program/python DocumentConverter.py test.odt test.pdf
对于Windows。
"C:\Program Files\OpenOffice.org 3.1\program\python" DocumentConverter.py test.odt test.pdf
PyODConverter需要OpenOffice.org作为服务运行,并在端口(默认)8100上监听;最简单的方法是通过命令行启动OpenOffice.org作为服务:
"C:\Program Files\OpenOffice.org 3.1\program\soffice" -accept="socket,port=8100;urp;"
```。
Open Office是一个很好的方法,但转换的保真度并不总是很好。
如果你追求的是100%的Linux解决方案,那么这是最好的方式。然而,如果你不介意一个单一的Windows Box,并从你的Linux系统中写一点代码与它接口,那么看看这篇文章。
我写了这篇文章,所以通常的免责声明适用。