2006-07-05 「無断リンク禁止はナンセンス」が駄目ならどうすればいいのか, コイントスの確率ゲーム [長年日記]

「無断リンク禁止はナンセンス」が駄目ならどうすればいいのか [etc]

学校・教育委員会相手に「無断リンク禁止」はおかしいと叫んでも、のれんに腕押しなのはよく知っている。だったらどうすればいいのだろうか。


仙台市では,「仙台市個人情報保護条例」に基づき適切な個人情報の保護を図るとともに,「仙台市行政情報セキュリティポリシー」を定め行政情報の適正な取り扱いを行っております。

学校においては,学校と子どもたちを守るという観点からこの要領を作成しており,お問い合わせの「第4条」については,リンクを禁止するという意味ではなく,教育的な配慮から,リンク元のホームページの内容が,「法令や公序良俗に反する場合などにはリンクの削除をお願いすることがあります」から規定しておりますので,ご理解をいただきますようお願い申し上げます。

仙台市教育委員会からこんな回答をもらっていることは過去にも書いた。(文中の「第4条」というのはこれのこと)
「学校と子どもたちを守るという観点から」するならば、「無断リンク禁止」とサイトに書くという手段が何の効力もないということが判っていない。
リンク元が「法令や公序良俗に反する」様なケースを考えるならば、「無断リンク禁止」とサイトに書くなんていう良識に訴えるかの様な手段*1がどれほどの意味があるのか。
私のメールはそれを指摘したつもりだったのだけど、判ってもらえないのは私の文章力の無さか相手の理解力のなさか。


さておき。
「無断リンク禁止」とサイトに書くという手段が何の効力もない、と叫んでも意味がないなら、どうするべきかを提案するのが筋というものだろう。


最低限やるべきなのは、アクセスログの解析。referer のチェックだろう。
まずはホワイトリスト方式でのチェック。学校側でリンクがあると判っているページからのアクセスならば問題ない、としていいだろう。例えば教育委員会のリンク経由でのアクセスはあって当然なのだ。(教育委員会にリンク集のページが存在するべきなのか? はまた別問題)
次は検索サイトからのアクセスのチェック。学校名や住所などからの検索なら問題ないだろう。個人名などでの検索があると大変だ(校長先生以外)。検索語を復元して形態素解析にかけるか? ホワイトリストは用意するとして人名などがまじっていたらアラートをあげなければならないだろう*2。あとはどんな検索語が問題になるだろうか……。判らない。そう。判らないからこそ、日頃からアクセスログをチェックしなければならないのだ、と主張したい。
あとは……フィルタリングでのチェックはどうだろう。学校の PC ならたいていフィルタリングソフトが入っているはず。そのブラックリストやレイティングを逆に使うというのは? リバース・プロクシ形式でフィルタリングしているなら、仕事は楽になりそうだ。つまり、アクセスログに残っている referer でフィルタリングソフトを通してアクセスするということ。ブラックリストに入っている URL や、コンテンツを解析して「公序良俗に反する」語が見つかったりする場合は、フィルタリングソフトがはじいてくれるはずだ。アクセスログから referer を収集し、ホワイトリストのURLや(既知の)検索サイトのURL以外をフィルタリングソフト経由でアクセスするようなスクリプト。うん、書けそうだ。


次。
「法令や公序良俗に反する」サイトというか悪意あるサイトならば普通にリンクを作成しているとは思えない。ttp://www2.sendai-c.ed.jp/~center/school.htm こんな感じでリンクにならないように書いているだろう。これをコピー&ペーストして先頭に h をつけてアクセスする。そうすれば、当然アクセスログに referer は残らない。
これをチェックしようと思うなら、

www2-sendai-c-ed-jp-center-school - Google 検索

例えば、こんな感じの検索で、「地の文に書かれたリンクになっていないURL」を監視する必要もあるだろう。


しかし、検索エンジンに登録されないようにしてあるページにURLが晒されているとしたら、お手上げだ。そんなページは本当にアンダーグラウンドなページで、カタギ*3な人間が見られるページではない、と思っておくしかないのだろうか。


さて。
では無断リンクしてみましょうか。
仙台市内の学校に無断リンク禁止を掲げている学校は数あるけれども、全部リンクすると辿る方が大変なので無作為に5つほど。


――このエントリを読み、趣旨に賛同なさる方に――
下の方にあるリンクを辿ってみて下さい。無断でのリンクを禁止している学校が、最低限アクセスログのチェックぐらいしているのかどうか? という疑問を検証してみたいのです。
アクセス解析(≠カウンタ)を貼り付けてあるページを用意してあります。ついでにクリックしていただければと思います。


――このエントリを読み、趣旨に賛同できない方に――
できれば何もしないでください、としか言えません……。
ただ、この試みは「悪趣味的」と感じるかもしれませんが、ここまでしなければ教育委員会も学校も何も変わらない、いえ何一つ考えすらしないというのが現実です。それを変えたいという目的の試みであるということでひとつお目こぼし願えれば*4、と思います。


――リンクした学校に通っている児童・生徒、およびその保護者の方々に――
学校に通報したりしないでくださいね。
あなたが通っている学校、あるいはあなたの子供が通っている学校が、どの様な態度・姿勢でホームページ*5を運用しているのか、ということを私は知りたいのです。


――リンクした学校の関係者の方々に――
もしこのエントリに気が付いた場合、コメントを残そうとしたり私に直接連絡しようとする前に、ぜひ教育委員会に連絡してください(コメントを残されても本当にその学校の関係者なのか確認できませんし)。
このエントリとほぼ同じ趣旨――「無断リンク禁止」とすることに意味はない。常時アクセス解析を適切に行い、不審なアクセスが無いか監視しない限りリンク元に気が付くことはできない。という様な内容――で、1月25日に仙台市教育委員会宛にメールしています。
またそのメールで、運用規定について「話し合いをする場を持っていただければ」とも私は書きました。
現時点を以てその様な機会など全く無かったとすれば、教育委員会の怠慢だと、私は思います。
私への連絡先は教育委員会の方で判っているはずです(メールを削除していなければ!)。そのメールアドレスにメールしていただければ、逆に私の方では、適切にアクセス監視をしていたのだな、と判断できます。その時にはもちろん以下のURLを削除します。


http://www2.sendai-c.ed.jp/%7Ehigasen/
http://www.sendai-c.ed.jp/~oosawael/chuui/index.html
http://www.sendai-c.ed.jp/~nanchu/
http://www.sendai-c.ed.jp/~s-nakano/
http://www2.sendai-c.ed.jp/%7Etakamori/


上のURLをクリックしていただけたら下のページを表示していただけると、こちらでもカウントできるので嬉しいです。
http://materia.jp/diary/counter.html


追記(2006/7/26)
やっぱりというべきか、何も音沙汰無し……。
ま、夏休みに入ったということもあるし"こまめにアクセス"はお休みにしましょうか。
こちら側(=ネット側)からだと何をどうしても無理かしらん。子供が中学校に入るぐらいまで待てば教科書にもでてくるし、授業もあるだろうし直に話はしやすくなるけど。小学校ではやっぱり関心は薄いんだろうなぁ。

コイントスの確率ゲーム ペニーの賭け [etc]

"ペニーの賭けと呼ばれている"、と読んできたのだけど検索エンジンじゃヒットしないよ〜。読み間違えたのか?
日本での慣習的な呼び名があれば教えてください。どのぐらいメジャーなクイズなのか、それともマイナーなクイズなのかも判りません。


ゲームをしましょう。
ここにコインがあります。トスして表か裏を決定できます。その確率はそれぞれ等しく1/2です。要するにこのコイン「理想的なコイン」だということです。
さて、このコインをトスして表が出たか裏が出たかを記録していきましょう。
例えば、表表裏表裏裏表……というような、"表"と"裏"の連続する列が生成されますね。
ではここでお互い、表裏が3つ連続するパターンに賭けることにしましょう。"表裏表"や"裏表裏"などです。そしてあなたか私が賭けた、どちらかのパターンが出現したら、そこで終了。もちろんパターンが出現した方の勝ち、です。
賭けるパターンは全部で8つです。3回コインをトスした時に、どのパターンも現れる確率は等しく、1/8 ですね?
あなたはどんなパターンに賭けますか?
"裏表表"ですか?
判りました。では私は"裏裏表"に賭けることにしましょう。


さて、では、ゲームの開始です。


――そしてコインが宙を舞う。

このゲーム。
公平な賭けでしょうか?
"私"が有利なゲーム? それとも"あなた"が有利?
どう思います?


答えは2つ下のセクション。

欲しい本 [book]

言語と計算 (4) 確率的言語モデル

  • 作者: 北 研二,辻井 潤一
  • 出版社/メーカー: 東京大学出版会
  • 発売: 1999-11
  • ASIN: 4130654047
  • メディア: 単行本
  • amazon.co.jp詳細へ

コイントスの確率ゲーム 解答編 [etc]

で、解答編。


設問の作り方からして薄々判ると思うけど、「私」の方が有利。


状態遷移を考えよう。
まだ決着がついていないと仮定する。
過去のコイントスの結果の中に、2人が賭けたパターンが無いわけだ。
直近の2回のコイントスの結果の組み合わせを状態とする。それに終端として「私の勝ち」と「あなたの勝ち」を加えよう。

不格好だけど、こんな感じ。
これに、コイントスした結果で左側4つの状態からどう遷移するかを考えよう。

こうなる。


一目見て判るのは、左上の「表表」はどちらにとっても優位ではないということ。
次にその下「表裏」を見る。ここから表が出るか裏が出るかで「あなたの勝ち」と「私の勝ち」のどちらかに近づく。
さて、ここで裏が出て右下の「裏裏」の状態に遷移してしまうと、「私の勝ち」に遷移する矢印しかないことに気が付く。裏がでたらまた「裏裏」の状態に戻るし、表が出たら「私の勝ち」で終了。
かたや「表裏」から表を出して「裏表」の状態に進んだとしよう。次に表が出れば「あなたの勝ち」だ。でも裏が出るとまた「表裏」に戻ってしまう――「あなたの勝ち」から遠ざかってしまう。
ゆえに、「私」の方が有利なのだ。


元ネタは立ち読みしてきた本。ISBNぐらいメモってくるんだったと後悔している。
問題自体は自分で状態遷移図をいくつか書いてみて考えた。
その後Webを検索して類似の問題などないか探してみたがなかなか見つからない。
一つ、

Coin flipping game - Mathematics - tribe.net

ここを見つけた。じっくり読むと、相手の手に対してどういう手を宣言すると優位になるか、ちゃんと書いてある。


追記
せっかくなので、この日の人気日記*6の先頭のエントリ『「無断リンク禁止はナンセンス」が駄目ならどうすればいいのか』のエントリも読んでいってくださいね。
この解答編を読んでもピンとこない人は、

prima materia - diary : コイントスの確率ゲーム 解説編?

や、 id:roygb さんが書かれた。

コイントスの確率ゲーム - Log of ROYGB

を読んでいただければいいかと。


追記(2006/7/13 夜)
今日このエントリがアクセス多いんだという話をカミさんにして問題を見せたらあっさりと、「似ているの見たことあるよ」と言われてしまった。
「(高田崇史さんの)千波君のシリーズだと思う」とのこと。
で、調べてみたら、

パズル自由自在 (講談社ノベルス)

  • 作者: 高田 崇史
  • 出版社/メーカー: 講談社
  • 発売: 2005-03-08
  • ASIN: 4061824201
  • メディア: 新書
  • amazon.co.jp詳細へ

に、確かにちょっと似ている問題がでている(ごめんなさい。私はまだ未読なんです*7 )。
むしろ roygb さんの2つ連続パターンに似ていて、赤のプレート2枚と白のプレート2枚の合計4枚、そこから2枚を取り出して、「赤赤 or 白白」だったら君の勝ち、「赤白 or 白赤」だったら僕の勝ち、というものだった。


追記(2006/7/14 朝)
上の問題は、なんとなく形式は似てるけど、問題の本質が全然違う。深夜にあまり考えずに書いてしまった。この問題のミスリーディングは「プレートを2枚取り出す」という行為を「順番に2回取り出す」と置き換えて考えると、1回目の取り出しと2回目の取り出しが独立な事象になっていない、ということに由来する。
ちなみに、パズル自由自在 (講談社ノベルス)(高田 崇史)には

prima materia - diary : 白か黒か?

で書いた問題も載っている。前述の「赤のプレート2枚と白のプレート2枚の合計4枚から2枚を取り出す」のウォーミングアップの様な扱い。


追記(2006/7/14 11時)
ひとつペテンをしかけている。
最初に「表表」「裏表」「裏表」「裏裏」の4状態を作ったのだけど、ある時点でその4状態のどこにいるか? ということを考えると、それぞれの確率は均等に1/4じゃない。
「なるほど確かに!」という程度の説明だけして、ちゃんと勝率を出していなかったりするし。
下手に数式を持ち出すより、「なるほど確かに!」と思ってもらうのが目的なのでこうなったわけだ。
……なにより、勝率を計算しようとすると、私が間違える可能性が高かったからなのだけど。

*1 「良識に訴える」なんていうのは、要するに何の手段も講じない、というのと同義だと私は思う。

*2 人名で検索できるということはサイト上にその名前が記載されているということだ。この公開性が問題になるケースは、ミスによりコンテンツに混じってしまったか、公開していないつもりのファイルがクロールされているかのどちらかだろう。前者については、気が付いてからコンテンツ上削除しても検索エンジンのインデクスに当分は残っている、ということに注意しなければならない。後者についてはよくあるパーミションの設定ミスというになるか。

*3 全然関係ないが、映画スティングを見てて"legal"を"カタギ"と訳しているのに――聞き違えでなければだけど――気がついた。なるほど、と思った。

*4 目的が手段を正当化する、などとは微塵も思っていませんよ。もちろん。

*5 ここだけはあえてホームページと書きましょう。

*6 親指シフト特有のタイプミス……。

*7 同義反復だ。