Word書類(.doc形式)をWebページ(.html形式)に変換する

doc2html_01.png

Webページの素材としてワード形式のデータをいただきました。オーサリング手順をメモっておきます。

私の制作環境

  • Mac OS10.4
  • Microsoft Word 2004
  • Macromedia Studio 8 (Dreamweaver 8 と Fireworks 8)

1. (レイアウト確認用として)PDFに変換

doc2html_02.png

直接PDFを使う訳ではないですが、レイアウトの確認用にPDF版を用意しておきます。Wordを開くのに結構時間がかかるのと、書類自体重い場合が多いので、その辺のストレス対策になります。いちからデザインを構築する場合でも、発注者の意思を理解する上でサクサクと見えるようにしておくと良いです。プリントアウトしても良いのですが、大量に原稿がある場合はこちらの方が経済的です。

2. Web ページとして保存

doc2html_04.png

目印として、ファイル名の頭に「word_」や「w_」をつけておきます。

Sdoc2html_05.png

「保存」を押すと、htmlと画像ファイルが生成されます。

doc2html_06.png

画像ファイルはオリジナルのサイズで一つのフォルダにまとめられるので、これだけでもうれしいです。画像は別途作業として、Fireworksで適当なサイズにリサイズしましょう。

doc2html_08.png

3. Dreamweaverで余分なタグをお掃除

Wordが生成したHTMLは無駄に長い・重いので、Dreamweaverの便利な機能を使ってお掃除をしてやります。

doc2html_09.png

現在、1,059行あります。

メニューの「コマンド」から「Word HTMLのクリーンアップ」(クリーンナップじゃないのね)を選びます。

doc2html_10.png

全部チェックいれておけば、とりあえずOKです。

doc2html_11.png

OKを押すと…、

doc2html_12.png

色々、削除してくれました。

さ、ソースを見てみましょう。

doc2html_13.png

1,059行あったソースが、396行に! ほんと無駄に長いんですよね、Word生成のHTMLって…。

更に「HTMLのクリーンアップ」でspan要素を削除すると…、

doc2html_14.png

doc2html_15.png

299個のspan要素が消えました。HTMLは257行まで短くなりました。イェイ! 容量は68KBあったのが16KBにまで軽くなりました。

doc2html_16.png

4. HTMLを見て、そのまま編集するもよし、ブラウザで表示させてテキスト素材とするもよし

変換されたソースをざぁーと見てみます。

「こりゃイチから組んだ方が早そうだな」という場合は、HTMLをブラウザで表示し、テキスト素材として利用します。

そのまま編集していけそうなら、さらにDreamWeaverの便利な機能を使って完成形まで持っていきます。レガシーな要素、属性を、今どき風に置換しましょう。

「検索/置換」の機能を使って、b要素をstrong要素に置換したり、img要素にとりあえずのalt属性を追加していきます。(やり方は省略) ここまできたら、「変換」機能でXHTML1.0 tranditionalあたりにサクっと変換します。あとはいつものとおりのコーディングで、調整をしてください。

* * *

ということで、変換よろしく!>右

trackback

trackback URI: http://www.mathatelle.com/mt/mt-tb.cgi/657

post comment

about

mathatelle
図書館の本の質感が好きです。時間の経過による黄ばみや不特定多数の人たちが触ることによる破れ・汚れ・シミなど…。

» profile

» twitter

feed

  • Mathatelle.comのFeed
  • Add to livedoor
  • Add to google

analysis

あわせて読みたいブログパーツ

Apple iPod nano 8GB シルバー MA980J/A