\r\n\r\n

linuxで簡単に文書形式を変換する方法

linuxに切り替えると、ファイルの互換性に問題が生じることがあります。例えば、libreofficeで作成した文書とwordで作成した文書では見た目が異なります。これは、Pandocを必要とする理由の一つです...

Linuxへの乗り換えでよく問題になるのが、ファイルの互換性です。他のOSのユーザーには、Wordなどのアプリケーションで開いたときに見た目が異なるファイルを送ることが常にあります。フォントをインストールしたり、VMやエミュレーターを試したりして見た目を統一することもできますが、プレーンテキスト形式で作業を行い、終了後に変換するという方法もあります。

フォーマット間の変換に使えるツールは、Linuxユーザーのツールボックスにある基本的なツールであるpandocです。

pandocの基本的なインストールと使用方法

ほとんどのLinuxディストリビューションでのpandocのインストールは、リポジトリにアクセスするだけの簡単な作業です。Ubuntuベースのシステムでは、以下のコマンドでインストールされます。

sudo apt-get install pandoc

インストールが完了したら、コマンドライン・プログラムを使ってファイルの変換を開始することができます。Markdownなどの軽量マークアップ言語に特化し、.MDファイルをお持ちの場合は、以下のコマンドでHTMLに変換できます。

pandoc -o myfile.html myfile.md

oフラグは、必要な出力ファイルの名前を指定します。この場合、ファイルの拡張子から出力形式(HTML)も推測される。r (読み込み) と -w (書き込み) フラグを使って、pandoc にどのような変換が必要かを指示することができます。あなたがMarkdownで書くことに慣れていて、Mediawikiベースのページにコンテンツを公開する必要があるとします。

pandoc -r markdown -w mediawiki -o markdown.wiki markdown.md

以前のバージョンでは、pandocは、より単純なフォーマット(Markdownなど)をより複雑なフォーマット(ODTやMicrosoft DOCXなど)に変換できるという意味で、ファイルを「アップグレード」することに重点を置いていました。しかし、これからはもっと複雑なフォーマットも読み取れるようになる。つまり、ワープロに慣れていても、さまざまな理由から、より小さく、より携帯性の高いテキストのみのフォーマットを使いたくなった場合、それが非常に容易になるのです。

Wordファイルでいっぱいのディレクトリがある場合、次のコマンドで各ファイルをMarkdownに変換します。

for file in *do pandoc -r docx -w markdown -o "$file".md "$file"done

この場合、.docx.mdというファイル名が残るので、素早くリネームコマンドを実行する必要があることに注意してください(あるいは、上記のシェルスクリプトとして追加するのもよいでしょう)。

pandoc コマンドラインオプション

さて、基本的な知識を得たところで、pandocのコマンドラインオプションの中から、より高度なオプションについて見ていきましょう。

odt/docx リファレンスドキュメント

あなたが古い、かさばるワードプロセッサのファイルをすべてMarkdownに変換したと仮定すると、ある時点で、あなたはプレーンテキストで作成の喜びに浸るように、他の人とこれを共有する必要があります。あなたほど悟りを開いていない人もいるかもしれません。に読み取り/書き込みフラグを逆にするだけで、ファイルをWord形式に戻すことができます。

pandoc -r markdown -w docx -o wordfile.docx wordfile.md

PandocのDOCXバックエンドは、そのような場合のために、参照ファイルと呼ばれるテンプレートファイルをサポートしています。これらは、あなたが必要なすべてのスタイルを設定したODTまたはDOCXファイルです。コマンドラインで参照ファイルをpandocに渡すと、pandocは変換時にこれらのスタイルを適用する。

pandoc -r markdown -w odt --reference-odt=/home/user/path/to/ref-file.odt -o lowriter.odt lowriter.md

上記の参考ファイルで設定されたフォント(見出し1はArial Blackなど)が、以下の変換ファイルにどのように表示されるかに注目してください。このリファレンスファイルは、必要な数だけ作成できます(たとえば、顧客ごとに1つ)。そして、執筆時には書式を完全に無視し、変換時に一度にスタイルを適用します。

pdfレンダリングバックエンド

PDFの作成も、必要なパッケージをいくつかインストールすれば、簡単にできるようになります。PDFオーサリング機能を得るための軽量な方法は、HTMLをPDFに変換するコマンドラインツールであるwkhtmltopdfパッケージをインストールすることです。pandocはこれをネイティブにサポートしているので、書き込みフラグをHTMLに、出力ファイルをPDFに設定すれば、あたかもwkhtmltopdfだけを使うつもりであると解釈されます!

pandoc -r markdown -w html -o nicepub.pdf nicepub.md

また、TeTex組版システムを使って、フル機能のオプションを選択することも可能です。これらのパッケージは、以下のコマンドで再インストールすることで、pandocパッケージの推奨インストールであることを利用することが可能です。

sudo apt-get install --install-suggests pandoc

そして、たくさんの(本当にたくさんの)パッケージをインストールする間、くつろいでいてください。一旦、このようにすると、で書き込みフラグとして指定することで、直接PDFに変換することができます。

pandoc -r markdown -w pdf -o nicepub-tetex.pdf nicepub.md

wkhtmltopdfオプションは1つのパッケージしかインストールする必要がありませんが、TeTexを使用すると、より印刷に適した結果が得られます。つまり、デフォルトでセリフフォントが使用され、ページには自動的に番号が振られるのです。

電子書籍ジェネレーター

最後に、Pandocはあなたのファイルを**や電子書籍リーダーで読むのに適した電子書籍に変換することができます。epubとepub3バックエンドは正しいフォーマットで電子書籍を提供します:。

pandoc -r markdown -w epub -o mybook.epub mybook.md

上級者向けヒント

Pandocの強みは、コマンドラインツールとしての機能だけではありません。例えば、改良版のMarkdownをサポートし、グラフィカルなアプリケーションと簡単に統合することができます。

パンドラの値下げフレーバー

pandocは変換ツールであるだけでなく、少し強化されたマークダウン・スタイルもサポートしています。標準のmarkdownコマンドの代わりにpandocを使うことで、以下のような追加機能を得ることができます。

  • メタデータ - Pandocの低価格スタイルでは、文書のタイトルに著者、日付、電子メールアドレスなどの情報を含めることができます。
  • テキスト修飾子 - 標準のマークアップではサポートされていない、取り消し線、上付き/下付きといったテキスト修飾子を、pandocを介して適用することができます。
  • テーブル-「バニラ」の値下げと比較すると、パンドックだけでも価値があります。表のセルを区切るためにパイプ文字を使用すると、レンダリングと同様に非常に見にくい人間が読めるプレーンテキストから整形された表が作成されます。
  • ファンシーリスト - Pandoc では、"1.", "A.", "i." などのアウトラインスタイルのレベルを使用してリストをフォーマットすることができます。その他リストの開始番号を指定することも可能で、単純なマーカーであれば "1 "から開始されます
  • コード構文のハイライト - pandoc言語に伝えることで、コードのブロックにハイライトを適用することができます。

これらは、pandoc Markdownで利用可能な機能のほんの一部です。このスタイルのマークダウンが提供するエクストラの完全なリストについては、マニュアルページのpandocウェブサイトをご覧ください。

pandocでguiを使う

pandocはコマンドラインツールとしてうまく機能しますが、多くのオプションが含まれています。Linuxを初めて使う人は、GUIインターフェースでpandocを使うことを好むかもしれません。デフォルトではGUIは含まれていませんが、pandocelectionをインストールすれば、ワンクリックでドキュメントを変換することができます。アプリケーションのウェブサイトからインストールスクリプトをダウンロードし、それを実行すると、必要なすべてのパッケージとプログラム本体がインストールされます。

インストール後、pandoelectronディレクトリでnpm startコマンドを実行すると、アプリケーションが起動します。これにより、フォーマットのドロップダウンリストとダイアログボックスによる入力ファイルの選択機能を通じて、いわばpandocの「入力と出力」に慣れることができます。

pandocで利用できる無数のオプションとフラグに満足しているが、それを簡単に呼び出す方法を見つけたいだけなら、GUIテキストエディターと統合することができます。例えば、Atomエディタには、pandocを使用して現在のファイルを別のフォーマットに保存する機能を提供するパッケージが多数含まれています(パッケージ pandoc convert)。

また、buildコマンドのようなエディタの組み込み機能を使ってpandocコマンドを実行する方法もあります。atomのbuild toolkitでは、カスタムコマンドを指定することも可能です。

そして、pandoc互換のファイルに対して、ソースコードと同じようにビルドコマンドを呼び出すことができます:.

Pandocが変換のプレッシャーを軽減

pandocをツールボックスに入れれば、いつでも必要なフォーマットで相手に文書を送ることができ、安心です。その間、Linuxの素晴らしい機能のいくつかを利用することができます(vimなどのターミナルベースのテキストエディタを試してみることを検討してみてください)。

ファイルをフォーマット間で相互に変換することはよくあることです。もし、互換性の問題が発生した場合は、コメントでお知らせください。pandocを使って問題を解決できるかどうか、確認させていただきます

画像引用元:nirat.pix via Shutterstock.com ウェブサイト

  • 2021-03-14 18:46 に公開
  • 閲覧 ( 37 )
  • 分類:IT

あなたが興味を持っているかもしれない記事

匿名者
匿名者

0 件の投稿

作家リスト

  1. admin 0 投稿
  2. 匿名者 0 投稿

おすすめ