blog/content/post/2006-10-30-00000353.md

46 lines
1.5 KiB
Markdown
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: 業務連絡
author: kazu634
date: 2006-10-30
url: /2006/10/30/_382/
wordtwit_post_info:
- 'O:8:"stdClass":13:{s:6:"manual";b:0;s:11:"tweet_times";i:1;s:5:"delay";i:0;s:7:"enabled";i:1;s:10:"separation";s:2:"60";s:7:"version";s:3:"3.7";s:14:"tweet_template";b:0;s:6:"status";i:2;s:6:"result";a:0:{}s:13:"tweet_counter";i:2;s:13:"tweet_log_ids";a:1:{i:0;i:2619;}s:9:"hash_tags";a:0:{}s:8:"accounts";a:1:{i:0;s:7:"kazu634";}}'
categories:
- つれづれ
---
<div class="section">
<p>
 おそらくここをチェックしているであろう後輩のWくんへ。まだ未確認ながら、Dickens事典のバイトを楽にできる方法がありそうな模様です。
</p>
<p>
 どういうことかというと、
</p>
<ol>
<li>
PDFをページごとに分割できるソフトがあるので、それをつかってページごとにファイルを分割する
</li>
<li>
ページごとに分割したPDFをテクストに変換できるソフトがあるので、それを利用してテクストに変換
</li>
<li>
エディター付属のGREPなどを活用する
</li>
</ol>
<p>
おそらくこのようにすれば、格段に速く仕事がこなせそうです。別解としては、(1)がおわった段階でGoogle Desktop検索を使うというのもありかと思いますです。
</p>
<p>
 とりあえず検証作業中なので、しばらくお待ちください。
</p>
<hr />
<p>
追記:どうやらWくんの方法の方が効率がいいみたいだ…
</p>
</div>