10/29/2011

某スキャンサービスとの騒動記(その3)

次に漫画のチェックを行った。おおむね良さそうだと思ったが、

  • 赤や緑、水色などの縦線が入ったページが散見された。
  • レシートの影になって空白部分が生じているページがあった。(これは送りだす時に余計な紙を排除できなかったこちらのミスでもある。)
などの不備があった。この縦線というのは図1のような筋である。極端な話、読むのに支障はない。しかし、奇数ページのみ連続して同じ位置に入っていたりしたので明らかにスキャナーの手入れ不足が原因だろう。もしスキャンに問題がないか確認していれば容易に気がつくレベルのミスである。静岡県浜松市の業者は確実にチェックをしていない事がわかる。しかし、再スキャンの要請に応じてくれたのでよしとする事にした。最悪自分で全部チェックすればいいとその時は思ったのだ。しかし、安心感を求める人には全くお勧めできない業者であると言わざるを得ないだろう。

(続く)

図1 スキャナーの不備による赤い線

10/21/2011

某スキャンサービスとの騒動記(その2)

PDFが納品されてきて最初にした事はOCRの出来具合の確認である。もし綺麗であればBookScanから乗り換える事ができるなどと甘い考えを持っていたのだ。それは無残に打ち砕かれた。

静岡県浜松市の業者から納品された物の例を出そう。図1はOCRのチェック用に依頼した計算論の本の一部である。正直かなり汚い仕上がりである。Acrobatで何も考えずにOCRの処理をするとこのようになる。図2はクレームをつけて再処理して貰ったものである。このクオリティなら問題はないだろう。参考までに図3、4に英語の物を示す。やはり最初に納品された物は読みづらい仕上がりになっている。

しかし本当の問題はそこではない。クレームをつけて返ってきたメールの内容に愕然とした。
度々すみません。
確認いたしました。かなりひどい状態でした。
OCR設定を変更したのが、原因でした。只今、再度OCRしております。今度は、綺麗に出来ております。
原稿と、再OCRしたデーターをアップロード致します。当方の確認が不十分でご迷惑お掛けいたしました。申し訳ありませんでした。
準備が出来ましたら、ご連絡差し上げます。

つまりOCRの仕上がりを全く確認していなかったのだ。それではひどい仕上がりで納品されるのも当然であろう。PDFファイルからOCRにAcrobatを使用しているのが判明しているので自分で作業しても問題はない。この業者にOCRを出す必要性はなくなった。そして他の本の仕上がりを全部チェックしなければならないという羽目に陥ったのだった。

(続く)
図1 納品されたPDF


図2 クレーム後に再処理されたPDF

図3 納品されたPDF

図4 クレーム後に再処理されたPDF



10/20/2011

某スキャンサービスとの騒動記(その1)

現在老舗のBOOK SCANを筆頭に多くの書籍のスキャンサービスがある。スキャンサービス比較のページBookFireには約100のサイトが登録されている。裁断機とスキャナーがあれば始められるサービスなので、その品質にはバラツキがある。静岡県浜松市にある業者とのトラブルをしばらく綴ろうと思う。

私はすでにBOOK SCANのプレミアム会員である。その品質には満足していたが、月50冊という制限があるために電子化を加速させたいと考えていた。コンピュータや物理、化学などの専門書だけでなくコミックスなども電子化したかったのだ。マンガを電子化するのならOCRの処理は不要であり、プレミアム会員の枠で処理するのはもったいない。BOOK SCANの品質はなくてもいいので安い業者で処理したいと考えたのだ。BookFireで検討したところ比較的近い浜松市のとある業者で試してみる事にした。その業者のサンプルが比較的きれいだった事も選択の一因であった。

最初に送った本は、最悪全部買い直す事ができるもの、もしくは消失しても被害の少ないものとした。マンガだけでなくあわよくば専門書もスキャンできたらいいと思って英語及び日本語の本も混ぜてOCRの指定をした。

納品されたPDFから読み取った業者の機材は以下の通りである。

スキャナー: PFU ScanSnap S1500
OCR: Adobe Acrobat 9

スキャナーは他の機材を使用している可能性があるが、残念ながら不明だ。ScanSnapもAcrobatも一般的な人が保持できる製品である。

(続く)

10/18/2011

BookScanのプレミアム会員で月50冊の冊数オーバーと連絡が来た時の対処法

BookScanのプレミアム会員(月に約1万円)になると月々50冊分無料でスキャンしてもらえる。(冊数の数え方はこちら)しかし、50冊送ったつもりなのに冊数オーバーと連絡が来てしまった。そんな時にどう対処すべきか考えてみる。

プレミアム会員になって3ヶ月目の事だった。いつものようにきっちり50冊分を数えて送りだしたら、BookScanから
【ブックスキャン】冊数オーバーについてのご連絡
という連絡が来た。届いたのは56冊で6冊超過しているという。対処の方法として以下の5つが提示された。
1.届いた書籍全てをお客様へ一旦返送する
2.通常会員分として処理する
3.超過している書籍をお客様へ一旦返送する
4.翌月のプレミアム分として保管し、翌月処理する
5.このままお受けして、スキャンする
こんなときどう対処するのがいいのだろうか?自分のチェックに自信があり50冊に間違いがないという仮定で考えよう。

━━━━━━━━━━━━━━━━━━━
1.届いた書籍全てをお客様へ一旦返送する
━━━━━━━━━━━━━━━━━━━
これを選ぶと全てがうやむやになってしまう。戻ってきた箱を開封すれば証拠能力が消失するのだ。つまり自分に自信がある時にはこれは選べない。しかも送料は着払いなので往復の送料を損しただけになる。

処理できる書籍を処理してもらい、納品されたpdfからページ数を算出して自分が間違えたのかどうか確認するのがいいだろう。6冊オーバーしていたのならそのままおとなしくしていればいいし、BookScan側のミスならばクレームをつける事ができる。では、2〜5のうちどれを選ぶのがいいのだろうか?それぞれの手段は別料金がかかり

━━━━━━━━━━━━━━━━━━━
2.通常会員分として処理する
━━━━━━━━━━━━━━━━━━━
通常分+作業変更料(1000円)

━━━━━━━━━━━━━━━━━━━
3.超過している書籍をお客様へ一旦返送する
━━━━━━━━━━━━━━━━━━━
返送作業量・送料1500円

━━━━━━━━━━━━━━━━━━━
4.翌月のプレミアム分として保管し、翌月処理する
━━━━━━━━━━━━━━━━━━━
変更手数料100円 x 6冊 = 600円

━━━━━━━━━━━━━━━━━━━
5.このままお受けして、スキャンする
━━━━━━━━━━━━━━━━━━━
追加料金350円 x 6冊 = 2100円

となっている。このうち3番は超過分を返送されてしまうと、再度送り返さなければならない。一番料金の安い4番が無難であろう。

結局4番を選んでスキャンしてもらったところ44冊分しかなかった。クレームを入れたところ6冊分を最優先でスキャンしてもらう事ができた。また、超過分に関する支払いの返金は

1.ご返金させていただく(追加支払い+振込手数料)
2.優待コードを発行させていただく(15冊分)
のどちらかを選ぶ事ができた。優待コード15冊分をありがたく頂戴した。

冊数カウントミスはともかくその後の対応は非常に丁寧であった事をあらためて記しておく。

10/26/2009

タスクが分割できないときは、そのタスクについて考える時間を取ろう。

GTDなどでタスクが分解できないときは、そもそもそのタスクをどうやって達成すればよいかわかっていないという事である。だから、その達成したいタスクについて考えるタスクを登録して、考える時間を用意しよう。

works4Life season V第16回GTD勉強会ログ ~ GTDつまづきポイント共有会 ~を読んでいたら、GTDのつまづきのポイントとして
  1. タスクのチャンクが大きくなってうまくいかない
という事が上がっていた。タスクを適切に分解できないという事はそのタスクにどう取り掛かればよいのか理解していないという事である。また、そのタスクが抽象的なのかもしれない。そういう時にはその場でどうにかするのではなく、しっかり時間を取ってじっくり考えてみることが必要である。

例えば「結婚する」というタスクがあったとしよう。これはもしかしたらプロジェクトかもしれないし、一行動だけで済むタスクかもしれない。それは個人個人の状況によるだろう。例えば、これがタスクだとした場合
  • X日に結婚式をする。
  • 婚姻届を提出する。
といったことが考えられる。全ての準備が整っていて式を挙げるだけだったり、記載が終わった書類を役所に出すだけだったら、これは一つのタスクと見なせるだろう。

しかし、婚姻届の書類をまだ貰ってきていない場合はどうだろう。この場合には
  1. 役所で書類を貰ってくる。
  2. 署名捺印をする。
  3. 婚約者に書名捺印をしてもらう。
  4. 役所に書類を提出する。
というプロセスが考えられる。忙しくて婚約者と顔をなかなか合わせられないのなら、約束を取り付ける必要があるかもしれない。これらのタスクはまさに個々人の状況によるだろう。だから成し遂げたいタスクやプロジェクトに対してより具体的なタスクを考える必要があるのだ。そのためには、そのタスクを見つめる時間を確保しなければならない。

まとめとして、
  • うまく処理できず分解できないタスクに対しては、そのタスクについて考える時間を確保する。
  • 具体的な行動を考え、それをタスクとする。
という事に留意して取り組めば上手にタスクを分解できる。


10/25/2009

第150回TOEIC公開テストを受けた。

久々にTOEICの公開テストを受けた。リスニングは割と手応えがあったが、リーディングにはまだ課題が残った。

今回はあまり勉強時間を割けなかったのでPart2(応答問題)とPart5(短文穴埋め問題)を集中的に勉強した。ともに苦手意識のある問題だったが、Part2に対しては自信を持つ事が出来た。それで波に乗れたのかリスニングは集中力を切らさずにいる事が出来た。一方Part5は40問中20問を解いた所で飽きてしまった。気持ちを切り替えてPart6に移ったが、結局Part5の半分とPart7の7問ほどを残して終わってしまった。

リスニングはここ最近やっている音読が効いているのか良く聞き取れるようになった。音読を継続しつつ語彙を増やしていきたい。リーディングも分速120ワードになっているので150ワードを目指して読み疲れしないスタミナを身につけたい。

次は半年後くらいに受けるつもりだ。

10/24/2009

MPQCで--enable-stlは有効か?

MPQCでconfigureするときに--enable-stlをつけた場合にどのくらい効果的か検証した。結果は若干の改善が観察された。

MPQCのソースのディレクトリ構成を読んでいたら


src/lib/util/container
This library provides container classes. Some of these classes are not very efficient and it is likely that they will be replaced by the C++ Standard Template Library (STL) when it is supported fully by more compilers. If your C++ implementation supports the STL you can configure with the --enable-stl option to use STL containers in place of the containers provided by this library.
という記述に気がついた。そこでこのオプションを追加するとどの程度効果があるのか確かめてみた。

使用したマシンはIntel Xeon W5580 3.20GHzが8コアで、g++のバージョンは4.4.1である。configureでは--enable-stlの他に
--with-cxx-optflags='-O3 -fomit-frame-pointer'
を使用した。テストに使用したインプットファイルは
% B3LYP optimization
optimize: yes (internal)
method: KS (xc = B3LYP)
basis: 6-31G*
charge: -1
molecule: (angstrom)
C -1.48748 1.97668 -0.97365
C -1.80844 1.02337 0.19789
C -0.69974 -0.04558 0.31802
O -2.52701 2.94869 -1.11599
O -0.24839 2.65263 -0.74270
O 0.55389 0.58349 0.60120
N -3.11386 0.37641 -0.03392
P 1.89220 -0.27675 0.77251
O 1.71756 -1.29941 1.99055
O 3.12011 0.70436 1.07153
O 2.17481 -1.09250 -0.57516
C 3.31144 -1.95289 -0.69669
H -1.84858 1.60444 1.13260
H -0.62296 -0.60613 -0.62578
H -0.93876 -0.74188 1.13592
H -3.30285 -0.31365 0.67671
H -3.12518 -0.07539 -0.93542
H 4.23423 -1.36963 -0.56047
H 3.31402 -2.41127 -1.69655
H 3.26125 -2.74340 0.06675
H -3.85626 1.05838 -0.00734
で、セリンの構造最適化のテスト計算をした。thread数は8として実行した。

結果は
stl無 931s 
stl有 925s
でstl有りだと5秒程度速くなる。誤差範囲だが、3回試行しての結果なので--enable-stlオプションは一応有効と言える。