「堀」「掘」誤報の件検証2

「堀」「掘」誤報の件検証に、児童小銃 .456 - 「堀」「掘」問題の教訓という反応をいただきました。元の検証記事は、自分でもうまく整理できてない気がしていたので、「どうも違和感が拭いきれない」という感想はよくわかりますが、この批判を読んで考えているうちに、いくつか見えてきたことがあるので書いてみたいと思います。

まず、ここには、関連はあるけど別々の問題がいくつかあります。あるいは、そう分けた方が論じやすいでしょう。

  1. 堀→掘と判断したロジックそのものの正当性
  2. ブログにおける書き手の検証責任
  3. 集団知の信頼性
  4. 2ちゃんねる集団知としてどのような特性を持つものであるか?

私としては、自分の失敗が、2や3の話に一般化されて展開されてしまうことへの懸念が大きかったので、前の検証では2や3を中心に論じました。1については、私にもいくらか言い分があるのですが、最終的に間違えたという結論は出ているので、それを主張すると2や3の論点がぼやけてしまうので(時間的な制約もあって)省いて書きました。

そこで、ここで1の件について詳しく書いてみます。つまり、私がどのような考察によって堀→掘判定をしたかということです。これは主として2ちゃんねるの書き込みにあったロジックですが、それを自分で再検証した上で採用しましたので、匿名掲示板や集団知ということから切離して、そのロジックそのものについて考えてみたいと思います。

一言でいうと、誤差のレベルを見極めずにデータを比較したところに問題があったと思う。こういう画像の比較に限らず、誤差の問題はデータを見る際に一般的に重要な点。

id:rnaさんは、こうおっしゃっています。もちろん、これが正しく重要なことであることには同意しますが、「ノイズの考慮が足りなかった」ことだけが要因ではありません。

この画像とそれに付随する書き込みに暗示されていたロジックは次のようなものです。

  1. 数多くある謎の中で「署名の前にある文字が塗り潰されているのは何故か?」という問題に着目する
  2. 「堀」の字形が「掘」の字形に似ているのは何故か?という新しい謎を提起する
  3. 1と2を共通に説明する仮説として「署名を間違えていた」という仮説を提起して、この仮説によって他の謎も説明できる可能性を示唆する

そして、「字形が似ている」ことについては印象論だけでなく、「屈の尺の口の部分の右下に注目」という具体的な指摘がありました。元の画像では、ここに出っ張りがあって、出の右上とかなり近づいています。この部分に着目すると、「元画像の堀が(少なくともその着目部分については)掘に近い」という謎の提起は、一定の説得力があると思います。

それで、仮にこれを受けいれた状態で考えると、二つの謎に対して、次の二種類の仮説のどちらを選択するか?という問題になります。

(仮説A)

謎2についてはノイズと歪みによる偶然の結果、謎1については不明だがこれとは別の要因がある。

(仮説B)

「署名のミス」というひとつの原因によって、謎1、謎2を共通の枠組みで説明する。

つまり、問題の枠組みを受けいれて他にデータが無い状態で考えると、二つの謎を一つの仮説で説明できる仮説Bの方に説得力があるという判断には、一定の合理性があると思います。

この思考過程は、もちろん意識的なものではありませんが、最終的に私自身の採用したロジックのかなり正確な記述であると、私は思います。そして、私はこれに別の方面からの(科目の問題やネチケットについての)考察を照合させて、最終的にこれが正しいと判断しました。

結果的には、(現状では)仮説Aの方が正しかったと考えざるを得ないのですが、その時点の判断としては、ノイズの問題を無視したわけではなくて、それを考慮した上で、別の仮説に合理性があると判断したわけです。

ひとつの問題が解けない場合に、それをいくつかサブ問題に分割して順番に解いていくというのは有力な方法論です。そして、分割の方法や解く順番についてはいろいろな可能性があります。一般的に科学的な発見というのは、そのような意味での分割の方法論や解くべきサブ問題の注目点にポイントがあって、ひとつの「AHA!」から連鎖的に他の問題が解けていくものです。たとえば、地動説が提起された時点では、それは観測データとの照合においては優れた所は無かったそうです。

地動説のコペルニクス(1473〜1543)の登場は、天動説を信じていた当時の人びとから思考の転換をせまった歴史的な地点として知られています。しかし、この二つの説の移り変わりはそう簡単ではありませんでした。よく知られている、のちの教会の権威との論争だけでなく、天動説の方が実際の天体の観測データに一致していたからです。長い時間をかけて、実測データに一致するように天動説がつくられていたために、考えられた当初の太陽を中心とする地動説の実証性は確かなものではなかったのです。(地動説にのっとって、惑星の動きを楕円ではなく真円で説明しようとすると、天動説より複雑になりました。)ようするに当時の地動説は不正確で、天動説の方が正確だったのです。

しかし、地動説は「単純で美しい自然」観という点で優れていました。惑星の逆行運動などに、わかりやすく簡素に説明を与えた美しさがありました。対して天動説は、惑星の軌道にたくさんの円が用いられなければ実証できない不格好な理論になっていたのです。

二つの謎をひとつの仮説で説明する「わかりやすく簡素に説明」に飛びついて、観測データとの多少の不整合は気にせず突っ走ったという点では、私は、この当時の地動説を信じた天文学者と同じ道をたどって、それが結果的には過ちだったということだと思います。

問題があるとしたら、「署名の前の塗り潰し」と「堀の字形の問題」を一組の問題として取りあげて考えた(他の論点を無視したわけではなくて、最初にクローズアップすべき分割された問題であると見なした)そのフレームワークそのものに対する批判的な姿勢がなかったことだと思います。実際、単なる土へんの塗り潰しだとしたら、その塗り潰しの範囲が左に大きすぎるので、それは何故だろうと一瞬思いましたが、それについては「まあいいや」とスルーしてしまった記憶がかすかにあります。「問題の提起と解決を同時に行なう」ような主張には、もっと注意深くあるべきかもしれません。

だから、全体として考えると最終的には検証の過程には問題があったということは言えるので、「自分がブログで発信することに対する事前の検証のレベル」「2ちゃんねるの中の検証過程に一定の信頼を置く」という論点は残ります。だから、(不十分な考察であるとは思いますが)最初の検証記事には、そちらを中心に書きました。

なお、rnaさんの批判(「テクニカルな教訓」という部分)は、私がここに書いたような情報を公開してない時点のものなので、そこを批判されるのは当然だと思います。私としては、自分の考えをまとめるのにたいへんよい補助線となったので、ありがたいことだと思っています。残りの論点については、別のエントリーで答えます。