SJISからUTF8に変換

概要

  • 青空文庫のテキストファイル、HTMLファイルの文字コードをSJISからUTF8に変換します。
  • SJISにないため記号や画像として埋め込まれている漢字で文字として取り込めるものは取り込みます。

前準備

  • Windowsパソコンにrubyをインストール
  • 下のバッチファイルとaozora.csvを同じフォルダに準備

使い方

  • 変換したい青空文庫のテキストファイル、HTMLファイルをバッチファイルのあるフォルダ以下に準備しておく
  • バッチファイルをダブルクリックして実行すると変換が実行されます
  • 頭に「~」がついたファイルが元のファイルのバックアップとして作成されます

分かっている不具合

  • HTMLファイルで目次が崩れる(「div class=”jisage_5″」をなんとかしなくてはいけないような気がする)

コメント

タイトルとURLをコピーしました