http://sasapanda.com/toshi/archives/200405/07_0255-764.php
Orbium -そらのたま-:移転しています。
コピー不可や印刷不可のファイルでなければツールバーにある、テキスト選択ツールを選択してから文章をドラッグすればできると思うのですが・・・
もしもコピー不可や印刷不可でしたらこちらに記載されています。著作権に注意しつつご利用ください。
http://www.sourcenext.com/products/pdf_todata/?i=top
ソースネクスト・ドットコム/文書作成ソフト/いきなりPDF to Data
こういったソフトを使用してテキストにするしかないのではないでしょうか?
御回答ありがとうございます。残念ながらPDFウインドウの左下に鍵のマーク(暗号化制限)がございますので、使用できないようです。
http://www.keiyu.com/doc/pdftxt.htm
PDFのテキスト抽出とHTML変換(KeiYu HelpLab)
Acrobat ReaderとAcrobatの(テキスト選択ツール)、(範囲選択ツール)で、PDF文書中のテキストを選択できます。
PDF文書の指定範囲をドラッグして反転し、[編集]→[コピー]でコピーした後、テキストエディタなどを起動して[編集]→[貼り付け]などで貼り付けると、テキストのみが貼り付けられます。
御回答ありがとうございます。残念ながらPDFウインドウの左下に鍵のマーク(暗号化制限)が表示されています。本来なら制限されたPDFは、頑張って勉強して自力で読まなければならないのですが、私の英語力では、かなりの年数が必要のようです。(T_T)
御回答ありがとうございます。こちらのソフトもお教えいただいて挑戦した見たのですが、残念ながらPDFウインドウの左下に鍵のマーク(暗号化制限)がございますので、こちらのソフトも使用できないようです。
http://pac.mediadrive.jp/pocr/
MediaDrive:やさしくPDF OCR v.2.0
要は、PDFを「画像」としてOCRに読み込み、テキスト化します。
画像の読み込みとしてPDFに対応しているOCRソフトならリンクのもの以外でも出来るはずです。
ただし、元のPDFの解像度が低いと誤字が増える可能性が高いです。
御回答ありがとうございます。
読んでココ見ないな物でしょうか?以前使用した事があったのですが、tiptop様が仰られているように誤字が多かった気が致しました。
翻訳したいPDFもA4版数十枚にびっしりと英文が記載されています。誤字のチェックも不可能に近そうです。(T_T)
URL はダミーです。
スクリーンショットなどでイメージを作ってからOCRにかけるか、面倒ならプリントアウトをスキャナーにかけてOCR->翻訳ソフトという流れではいかがでしょうか。
御回答ありがとうございます。
読んでココ見たいな物ですよね?以前使用した事があったのですが、誤字が多かった気が致しました。最近のソフトはだいぶ改善したのでしょうか?
翻訳したいPDFもA4版数十枚にびっしりと英文が記載されています。誤字のチェックだけでも相当な時間がかかりそうです。(T_T)
http://blog.sf-dream.com/archives/2005/04/pdf_2.html
セキュリティのかかったPDFファイルからテキストを抽出する方法 : (Dreamのお好み情報箱)
こんにちは.
このサイトに書いてある情報が使えるかもしれません.
それで駄目なら,最悪,Acrobat Readerを最大化して目的のPDFを表示
→スクリーンキャプチャを取り画像に保存
→OCRソフトで読み取る,となると思います.
画像取り出し禁止のPDFからこの方法(最後のOCRは除く)で
画像を取り出したことはあります.
御回答ありがとうございます。xdoc2txt 1.16 の使い方なのですが、どうしてもデスクトップ上のショートカットアイコンのリンク先に-f -nを追加して適用ボタンを押すと、「パス名が無効です。確認してください」とのエラーが出ます。もしお判りになられれば、このソフトの正しい使用方法を分かりやすくお教え戴けないでしょうか?因みにDドライブにProgram Filesを作製してそこで使用しています。よろしくお願い致します。
御回答ありがとうございます。こちらの方法も、私には内容が難しく理解する事ができませんでした。もしよろしければ、分かりやすく御解説いただけにでしょうか?よろしくお願いいたします。
http://www.bravaviewer.jp/reader.htm
Brava! Reader - �����Ŏg����PDF�ATIFF�ACSF�r���[��
このビューアを使えば、編集不可のpdfから、テキストをコピーすることができます。pdfを表示した後、「編集」→「選択」の後、矩形領域を選び、CTRL-Cまたは「編集」→「コピー」により、テキストをコピーします。
私もkazz7さんと同じような目的でいろいろ試したことがあります。
xdoc2txtはdos窓のコマンドラインでないと動かないと思います。それに、少なくとも日本語のpdfでは、空白やタブが無視され、ベタのテキストになってしまいます。
pdf表示→画面コピーは解像度が低く、これまで試した限りでは、ocrでは満足する結果が出ていません。拡大表示すればよいのですが、手間がかかり過ぎて...
s34itl様 御回答ありがとうございます。何度かDLに失敗してしまいまして、時間が懸かってしまいました(^^ゞ
早速試して見ました。完璧です。本当にありがとうございました。この質問に御回答くださいました他の方々にもこの場をお借りしてお礼申し上げます。
xdoc2txtの使い方ですが、
コンソールアプリなので
pdfと同じディレクトリにバッチファイル
を置いて実行すれば簡単です
(コマンドプロンプトを立ち上げてもいいけど)
市販のソフトになるのですが,Acrobat Readerの強化ソフトとして動作し
表示されているPDFを翻訳して表示する翻訳ソフトが
あるようです.
編集不可能のPDFに対応しているかどうかメールなどでメーカーに確かめ,
対応しているようであれば購入を検討してみてはいかがでしょうか.
p.s. xdoc2txtは,
-f -n ”%1”
と加えると良いみたいです.
暗号化されたPDFは抽出できません.
お返事遅れました。LSRさんにお教え頂いたプログラムを試して見たのですが、こちらのソフトがPDFのセキュリティ(暗号化)に対応していないのか、私の力量の未熟によって使用する事ができませんでした。理解できるようもう少し頑張って見ます。ありがとうございました。