Drafts

@cm3 の草稿置場 / 少々Wikiっぽく使っているので中身は適宜追記修正されます。

偽装されたQA等の読み解きに必要なレトリック

LGBTと「異常動物」のゆくえ――差別発言の報道をめぐって / 遠藤まめた /「やっぱ愛ダホ!idaho-net」代表 | SYNODOS -シノドス-

まあ、くだんの差別発言者あたりに向けられた記事としてどちらかというと有用だと思うので別に批判意図はないのだが、QAの部分見てありがちだなぁと思ってしまった。

(1)同性愛者は、努力すれば異性を好きになれる (2)同性愛は人間だけのもので自然界にはない (3)性別を変えるのは、楽をしたいからだ (4)LGBTを認めると、少子化が進む (5)LGBTを認めると、LGBTが増える

これの正誤について全部○か×がつけられると前提したら全部×を想定しているんだろうなというのは一見して分かるけれど、例えば、(1)について「「すべての」同性愛者は、努力すれば異性を好きになれる」「「ある」同性愛者は、努力すれば異性を好きになれる」と二通りに量化したら、前者は明らかに×だが、後者は○だ。そういう意味で、現象としては (5) は○だ。もちろん、カミングアウトできなかった LGBT がカミングアウトできるようになるだけだと言いたいのはわかるけれど、タイでの ladyboy の多さは、Tに相当する人たちにとって、そのカテゴリに身を寄せることが社会的に敷居が低いので、本来少し ladyboy からズレている人たちでも ladyboy として生きたりするだろう。無限にカテゴリを認めることが認知機構上非現実的で、一方で一般的な「男」「女」概念を捨て去ることも同じく非現実的である以上、LGBT くらいのカテゴリを加えることは認知として現実的で、多様なものはTに押し込まれて、「LGBTを認めると、LGBT(と自認する人たち)が増える」と思う。 (2)は「¬∃」という量化がはっきりしているから確実に×だ。(3)に至ってはちょっと不明で、「自分の生れついた性を全うする努力が必要である」の否定がしたいのだと推測。努力を放棄することが一般的に悪であるみたいな前提とかも入ってるのだよね、たぶん。性自認ヘテロの人が性別を変えるのは社会が無駄に作り出す生きづらさから逃れて楽になるために必要な行為であるという意味ならば○だよねぇ。(4)について申し添えられている「同性婚を合法化した社会ではおおむね出生率が向上している」はフランスなどを念頭に置いているのだろうけれど、国際的に統計的有意なのかどうかはちょっと怪しい(勘では出産・育児環境の整備による偽相関)。因果関係についてはまったくデータがないと思う。でも、これは「LGBTを認めると、少子化が進む」が unknown という意味で、true ではないということが言いたいのだろう。

つまり、何が言いたいかというと、言いたいことをQAの形を借りて主張しているわけなので、文脈からレトリカルな部分かなり読み込んで主張として再構成しないと、素直にQAとして人工知能が答えようとすると筆者の想定している正解を導き出すことは困難だし、正確に答えたら筆者をイラッとさせることだろう。Q単独ではロジカルに ill-defined すぎるという言い方もできる。そして、ここで読み込みに使う文脈は、言語や一般社会といった広い範囲の、客観的と言えるようなものだけではなくて、「こういう話題を提供している人たちのクラスタ」が共有している狭いものである(一番初めの量化の例くらいなら、デフォを「たいていは」という量化にすれば一般性をもつかもしれない、3-5はそんな程度ではない)。一方で、好意的に読み込めば、LGBT の理解として基本的なことを、その界隈にありがちなレトリックで言っているに過ぎない。

そういうわけで、正攻法を全く迂回して正解を導き出す方法もある。こういう話題を提供している人たちのクラスタとそれが批判しているクラスタを文書集合として判別し、それぞれで提示された文と整合する内容の割合を比較することで○×を判定する。分かりやすく言えば「ジェンダー論者多数派の『正解』は<正解>でしょ」ってのに依拠するわけだ。実際人間の言論空間はこっちのやり方が強すぎるのが気に食わんし、人工知能にそれをやらせてもあまり意義は感じない。

知識抽出においてレトリック構造を事前に捉えないと人文社会系の文書は解釈できんよ、それをやることが適切な知識の共有に有効だろうよ、って先ほど提出した研究費申請書に書いたのはそういう意味です。そして、こういう部分が受験問題みたいなものにも存在するので、東ロボプロジェクトをレトリックさえ無視した方法のみで攻めるのは、知的誠実さとしての必然じゃないって僕は主張していたのです。言い換えると、ロジック原理主義者にとっては、人間が知的に誠実じゃないし、文系と理系の溝の一つはこれを積極的に認めるか否定するかじゃないかな*1

*1:なんかこの段落でもやっとした人が居たと通報を受けたので追記しておくと、理系がレトリックを使っていないって話ではないです。例えば、理系論文の関連研究章は単一のレトリック構造を前提にしてあるアルゴリズムを適用することでかなり詳細に正確に分析できるという研究成果があって、つまり広い範囲でなるべく単純化されたレトリック形式が暗黙に共有されているということです。それに比べて色んなレトリックを積極的に使う分野では、どういうレトリックを使っているかを事前に判別しないとコンピュータによる知識抽出が的外れなものになりがちなのではないかという問題提起です。「知的に誠実」というフレーズは僕が受験問題特有の書き方や解き方みたいなのは別途考慮すべきと言ったことに対して、それはズルに近いというような否定的なことを言われた際のフレーズに由来します。