在linux中如何方便地在文档格式之间转换

切换到Linux会导致文件兼容性问题。例如,LibreOffice中的文档与Word中的文档看起来不一样。这只是你需要潘多克的原因之一。...

切换到Linux时经常提到的一个问题是文件兼容性。你总是会给其他操作系统的用户发送文件,当他们在Word这样的应用程序中打开时,看起来就不一样了。虽然您可以安装字体或尝试vm或模拟器,以确保外观一致,但另一种方法是以纯文本格式完成工作,然后在完成后进行转换。

convert-document-formats-linux-featured

一个可以用来在格式之间转换的工具是pandoc,它是任何Linux用户工具箱中的一个基本工具。

基本pandoc安装和使用

在大多数Linux发行版上安装pandoc只需简单地访问存储库。在基于Ubuntu的系统上,以下命令将为您安装它:

sudo apt-get install pandoc

安装后,可以开始使用命令行程序转换文件。擅长处理Markdown和其他轻量级标记语言,如果您有一个.MD文件,可以使用以下命令将其转换为HTML:

pandoc -o myfile.html myfile.md

pandoc markdown source target

-o标志告诉您想要的输出文件的名称。在本例中,它还通过文件扩展名推断输出格式(HTML)。您可以使用-r(表示读取)和-w(表示写入)标志来告诉pandoc您想要的转换类型。假设您习惯于使用Markdown进行写作,但需要将内容发布到基于Mediawiki的页面:

pandoc -r markdown -w mediawiki -o markdown.wiki markdown.md

pandoc convert markdown source mediawiki

在早期版本中,pandoc专注于“升级”文件,从某种意义上说,它可以将更简单的格式(如Markdown)转换为更复杂的格式(如ODT或微软的DOCX)。但它现在也会读取这些更复杂的格式。这意味着,如果你习惯了文字处理器,但又被各种各样的理由所诱惑,想要使用更小、更可移植的纯文本格式,那就变得容易多了。

给定一个满是Word文件的目录,以下命令将每个文件转换为Markdown:

for file in *do pandoc -r docx -w markdown -o "$file".md "$file"done

pandoc convert batch result

请注意,这将给您留下名为文件名.docx.md,因此您需要运行一个快速重命名命令(或者最好将其作为shell脚本添加到上面)。

pandoc命令行选项

现在,您已经掌握了一些基本知识,我们将了解pandoc命令行选项中一些更高级的选项。

odt/docx参考文件

假设您已将所有旧的、庞大的字处理器文件转换为Markdown。当你陶醉于用纯文本创作的乐趣时,在某个时候你需要和别人分享这些。有人可能不像你那么开明。您只需反转读写标志即可将文件转换回Word格式:

pandoc -r markdown -w docx -o wordfile.docx wordfile.md

但是有些人喜欢他们的Word文件带有特定的字体、编号的标题等。Pandoc的DOCX后端支持模板文件,称为参考文件,用于这种场合。这些是ODT或DOCX文件,您已经设置了所有您需要的样式。如果您在命令行将引用文件传递给pandoc,则pandoc在转换时将应用这些样式:

pandoc -r markdown -w odt --reference-odt=/home/user/path/to/ref-file.odt -o lowriter.odt lowriter.md

pandoc odt reference style

请注意上面的参考文件中配置的字体(标题1为Arial Black等)如何显示在下面的转换文件中。您可以根据需要创建任意数量的这些引用文件(例如,每个客户机一个)。然后在编写时完全忽略格式,并在转换时一步应用样式。

pandoc odt reference output

pdf呈现后端

一旦安装了一些必要的软件包,创建PDF也是一个简单的练习。获得PDF编写功能的一种轻量级方法是安装wkhtmltopdf包,这是一种将HTML转换为PDF的命令行工具。pandoc本机支持这一点,因此如果您将write标志设置为HTML,而将输出文件设置为PDF,则它将解释为您打算单独使用wkhtmltopdf!

pandoc -r markdown -w html -o nicepub.pdf nicepub.md

或者,您可以使用TeTex排版系统来选择全功能选项。通过使用以下命令重新安装,可以利用这些软件包是pandoc软件包的建议安装:

sudo apt-get install --install-suggests pandoc

然后,在安装很多(真的,很多)包的时候坐下来。完成后,您可以通过将文件指定为写入标志将其直接转换为PDF:

pandoc -r markdown -w pdf -o nicepub-tetex.pdf nicepub.md

虽然wkhtmltopdf选项只需要安装一个包,但是使用TeTex可以获得一些更便于打印的结果。也就是说,默认情况下使用衬线字体,页面自动编号。

pandoc pdf tetex result

电子书生成器

最后,潘多克可以将你的文件转换成适合在**或电子阅读器上阅读的电子书。epub和epub3后端将为您提供格式正确的电子书:

pandoc -r markdown -w epub -o mybook.epub mybook.md

pandoc epub output

高级提示

潘多克的优势超越了它作为命令行工具的能力。。。例如,它包括对Markdown的改进版本的支持,并且可以很容易地与图形应用程序集成。

潘多克的降价风味

除了作为一个转换工具,pandoc还支持稍微增强的降价风格。通过使用pandoc而不是标准的markdown命令,您可以获得一些附加功能,包括以下功能:

  • 元数据——Pandoc的降价风格允许您在文档的标题中包含诸如作者、日期、电子邮件地址等信息。
  • 文本修饰——您可以通过pandoc应用标准标记中不支持的文本修饰,如删除线或超级/下标。
  • 桌子——与“香草”降价相比,单凭这一点,潘多克就值得了。使用管道字符来分隔表格单元格,可以创建一个从非常难看到人类可读的纯文本以及呈现格式的表格。
  • 花式列表—Pandoc允许您使用大纲样式级别设置列表的格式,例如“1.”、“A.”、“i.”等。您还可以指定列表的起始编号,其中以简单标记的列表从“1”开始
  • 代码语法高亮显示——通过告诉pandoc语言是什么,可以将高亮显示应用于代码块。

以上只是pandoc Markdown的精选功能。请访问上的手册页潘多克网站对于一个完整的额外列表,这种风格的降价提供。

与pandoc一起使用gui

虽然pandoc作为命令行工具很有效,但它确实包含很多选项。如果您是Linux新手,您可能更喜欢使用带有GUI界面的pandoc。虽然默认情况下它不包含图形界面,但您可以安装pandocelection,通过点击来转换文档。从应用程序的网站下载安装脚本,然后运行它来安装所有必要的软件包和程序本身。

pandoc convert pandocelectron install

安装后,pandoelectron目录中的npm start命令将启动应用程序。通过格式下拉列表和通过对话框选择输入文件的功能,这将帮助您习惯pandoc的“输入和输出”,就像它一样。

pandoc convert pandocelectron ui

如果您对pandoc的无数选项和标志感到满意,但只想找到一种简单的方法来调用它,那么您可以将它与GUI文本编辑器集成。例如,Atom编辑器包含许多程序包,这些程序包提供了使用pandoc(程序包pandoc convert)将当前文件保存为不同格式的功能:

pandoc convert atom commands

另一种选择是使用编辑器的内置函数(如build命令)运行pandoc命令。Atom的构建工具包使您能够指定自定义命令:

pandoc convert buildtools config

然后,您可以在与pandoc兼容的文件上调用build命令,就像在源代码上一样:

pandoc convert buildtools command

潘多克减轻了转换的压力

在你的工具箱中有了pandoc,你就可以放心了,因为你知道你总是可以用别人需要的格式把你的文档发给他们。同时,您可以利用Linux的一些优秀特性(考虑尝试使用基于终端的文本编辑器,比如vim)。

你经常发现自己在不同格式之间来回转换文件吗?如果您遇到了兼容性问题,请在评论中告诉我们,我们将看看是否可以使用pandoc来解决您的问题!

图片来源:尼拉特.pix通过Shutterstock.com网站

  • 发表于 2021-03-14 18:46
  • 阅读 ( 286 )
  • 分类:IT

你可能感兴趣的文章

如何从windows浏览linux分区(反之亦然)

... 幸运的是,有解决办法。这就是如何在双引导操作系统之间共享数据的方法。 ...

  • 发布于 2021-03-12 09:47
  • 阅读 ( 212 )

linux应该使用哪些文件格式?

... Microsoft Office文档无处不在。如果你的老师、老板或同事在网上给你发了一份文档,很有可能它会以DOCX(文字处理)、XLSX(电子表格)或PPTX(演示文稿)的形式出现。然而,尽管微软...

  • 发布于 2021-03-14 10:09
  • 阅读 ( 217 )

linux上转换音频和视频文件的5个最佳应用程序

...且希望每个操作系统之间保持一致性,那么这种方法非常方便。如果你有物理DVD,你想翻录到你的数字图书馆,手刹也可以帮助那里。 ...

  • 发布于 2021-03-18 05:25
  • 阅读 ( 497 )

winx视频转换器赠品:转换、压缩和编辑视频

... WinX中集成了基本的视频编辑工具,方便用户使用。您可以将长视频剪辑成多个剪辑,切掉不需要的部分,将视频裁剪到所需区域,将多个视频合并为一个,调整视频音量并添加外部字幕(.srt、.ssa、.ass)以...

  • 发布于 2021-03-27 06:55
  • 阅读 ( 210 )

将word文档保存为图像文件的5种方法

... 以下是如何将Word文档中的一个页面转换为带有屏幕截图的图像: ...

  • 发布于 2021-03-30 12:19
  • 阅读 ( 234 )

在任何地方编辑pdf文件的7个最佳工具

...然,现在每个浏览器都可以打开一个PDF文件,但是你知道如何编辑PDF文件吗? ...

  • 发布于 2021-03-30 14:07
  • 阅读 ( 302 )

如何在microsoft word中添加脚注和尾注并设置其格式

... 有关更多信息,请查看如何在Word中为学校论文创建带注释的书目。 ...

  • 发布于 2021-03-31 08:27
  • 阅读 ( 468 )

如何使用pandoc在linux命令行上转换文件

...下一节中介绍更多的例子。 相关报道:什么是降价?你如何使用它? 转换文件 文件转换非常简单。pandoc通常可以从文件名中找出您正在使用的文件格式。在这里,我们将从一个降价文件生成一个HTML文件。-o(output)选项告诉pan...

  • 发布于 2021-04-02 00:59
  • 阅读 ( 233 )

什么是azw文件(如何打开文件)?

...和更高版本的Kindle使用KFX格式。 相关:什么是MOBI文件(如何打开一个)? 我怎么打开一个? 因为AZW文件是为Kindle设计的,所以最简单的打开方式是在Kindle设备上,或者在Windows、Mac、iOS或Android上使用Kindle应用程序。 相关:使...

  • 发布于 2021-04-04 08:07
  • 阅读 ( 193 )

如果没有photoshop,如何打开(或转换)photoshop文件

...图像文件以供共享。 我们要看看三种可能的解决方案,如何在没有Photoshop的情况下使用PSD文件,所有这些都是免费的。然而,如果你经常得到PSD文件来处理,或者如果你有一堆需要处理很短时间的文件,你可能会考虑短期订阅Ph...

  • 发布于 2021-04-05 01:50
  • 阅读 ( 183 )
msxodni
msxodni

0 篇文章

相关推荐