火曜日, 3月 30, 2021

PDFをオンラインでHTMLに変換

PDFデータをHTMLにした方が素早く確認できるメリットがありますね。そこで、作成したPDFをHTMLに自動変換してくれるサイトのうち2つのサイトを比較してみました。

使用したPDFは私が実際に授業で使っている75ページの私製マニュアルです。

1つ目はsoda PDF online。手順に従ってファイルを指定して変換を待ってダウンロードするだけです。無料で処理できます。スピードも速いです。

次はconvertio。ここも手順に従ってファイルを指定して変換を待ってダウンロードするだけです。無料で処理できます。ただし、スピードもメチャクチャ遅いです。

ダウンロードしたデータを比較してみました。上の3つのリストがそれです。元のデータは8.9MB。sodapdfはhtmlファイル1つと関連データのフォルダーで合計62.4MB。最後にconvertioはhtmlのファイルが1つだけでした。ファイルサイズは37.1MB。

実際に比較してみると、sodapdfはフォントが正しく反映されていません。

convertioはざっと見た範囲ではほとんど完璧な変換となっていました。驚きです。

sodapdfは、やはりフォント処理が苦手のようです。それ以外は問題ありません。

convertioは合格です。

これでhtmlファイルが分割されていればベストですが、贅沢なわがままは言えませんね。

convertioは合格です。

生成された直後は1ファイルのconvertioに違和感を感じましたが、結果としてデータの合計値はconvertioの方が小さく、またコンバート結果も正確であったので、これは使えそうです。他にもいくつかためしてみましたがレイアウトが崩れてしまったりして使い物になりませんでした。単純な文字データだけのpdfではない場合は今回紹介した2つのサイトは要チェックですね。