2013年4月20日土曜日

「平成ジレンマ」を観て

ポレポレ東中野で「平成ジレンマ」を見た。戸塚ヨットスクールについてのドキュメンタリー映画。以前見た「約束~名張毒ぶどう酒事件死刑囚の生涯」と同じ東海テレビの制作。

「体罰が悪」という思想だけで考えれば、戸塚ヨットスクールは確かに「悪」だ。
そもそも異常な頻度で訓練生の自殺が起きている。これは事実だ。

でも・・・と、映画を観て思う。
社会の誰もやりたがらないサービスを担っていることは否定できないと思う。
親にも手がつけられず、どの学校や厚生施設にも受け入れてもらえない。そんな非行や引きこもりの子供を持つ親の最後の駆け込み寺としての役割は、今のところ戸塚ヨットスクールにしか出来ていないじゃないか。

だから、体罰も含めた戸塚ヨットスクールの教育方法の良し悪しの議論とは別に、このスクールの存在意義はきちんと評価しないといけないと思う。同時に戸塚ヨットスクールの存在が必要なくなるような教育制度や教育方法を確立していかないといけないと思う。

上映後の戸塚校長のトークショーは、賛同できないところも多かったけど、
「ともすれば生徒の立場の方が教師より上になってしまっている現代の教育現場でマトモな教育なんてできるわけなんてないでしょう。」
っていう言葉は、共感を感じたな。

2013年4月10日水曜日

Mathjaxを使ってみる。

ここを参考に、MathJaxを使う。
書いてあることをそのままやればよくて、bloggerのテンプレート設定画面から、「ブログで使用中」の「HTMLの編集」で、headを閉じるタグの直前に、指定のscriptタグを挿入するだけで使えるようになった。

ここで書かれているようにダラーマークで囲って数式化する方法もあるみたいだけど、どうもうまくいかなかったので、諦めた。

以下に数式の例を何点か。

(例1:一行の数式)
\[\left( \sum_{k=1}^n a_k b_k \right)^2 \leq \left( \sum_{k=1}^n a_k^2 \right) \left( \sum_{k=1}^n b_k^2 \right)\]
(例2:インラインで数式)

円の面積は\(S=\pi r^2\)

うーん、いい感じ。使いやすい。
既にポストしたものもこれに順次入れ替えて更新していこうと思う。

(2013-04-20追記)
モバイル(iphone)ではMathJaxは動いてくれないっぽい。

2013年4月6日土曜日

HeadFirst Statistics を読む。(1章~5章)

掲題の本を読んだ際のメモを以下に列挙していく。
■1章:情報の見える化について
  • ヒストグラムの注意点
    • ヒストグラムの棒グラフの面積は度数に比例していないといけない。
      • グループ分けされた間隔が一定でない場合には、グラフの縦軸を度数密度(=度数/グループの幅)で示さないと、間違った情報を伝えてしまうなど、注意が必要。
    • 累積度数という統計用語:ある値の累積度数とはその値以下の度数の合計。
■2章:主要な傾向を測る
  • 「平均(average)」にもいろいろある。
    • 算術平均(mean)
    • 中央値(median)
    • 最頻値(mode)
  • 算術平均・・・いわゆる小学校で学ぶ平均。(μで示すことが多いらしい。)
    • 外れ値(極端に全体の傾向から離れている値)があり、データに歪みが生じている場合に、算術平均は典型的な値を示さなくなる。
    • データに存在しない値が算術平均になる場合がある。
  • メジアン・・・全てのデータの値を昇順(または降順)に並べたときに中央にくる値。
    • 同じ値のデータが複数ある場合には、存在する数だけ並べることに注意。
    • データ総数が偶数の場合は、中央の値が無いので、最も中央寄りの2つの値の平均がメジアンとなる。(この場合は、データに存在しない値がメジアンになる。)
  • 最頻値・・・最も度数が大きい値。(複数ある場合は、複数の最頻値となる。)
    • 算術平均やメジアンと異なり、絶対にデータ習合に存在する値となる必要がある。
    • カテゴリーデータでも使える。
    • 最頻値が多数ある場合は、最頻値に意味がなくなる(役立たなくなる)。
■3章:ばらつきと広がりを調べる。
  • 広がり
    • 「範囲」という尺度・・・単純にMAX値-MIN値
      • 外れ値があると大きく影響を受ける。
      • 外れ値を除外したい。⇒一貫性のある方法はないか?→「四分位範囲」
    • 「四分位範囲」という尺度・・・(ざっくりいえば)データを大きさ順に4つのグループに分け、最も大きいグループと、最も小さいグループを除外して、「範囲」を求める。
    • 箱ひげ図という可視化方法・・・広がりを上手く可視化する方法。
  • ばらつき
    • ばらつきを示す上手い尺度はないか?
    • データの中の各値と、データ全体の算術平均からの距離の平均をとれば、ばらつき度合いの尺度にできるのではないか?
    • でも、単純に算術平均の差(=距離)を足し合わせると差(=距離)の平均はゼロになる。
    • じゃー、算術平均の差(=距離)の2乗の平均をとればいいのでは?という発想。
      • 【疑問】差でなく距離なのだから差の絶対値の平均をとればいいと思うのだが、そうしない理由はなんだろう・・・
    • 以上の発想で分散(Variance)という量が定義される。
    • 距離の2乗の平均は、あまり直感的でないので、この分散の平方根をとる。これが標準偏差
  • 標準得点という発想
    • 算術平均や標準偏差が異なるデータ間で値を比較する手段。
    • 値Xの標準得点zはで計算される。
    • つまり、データの中での値Xの位置を算術平均がゼロで、標準偏差が1のデータ内の位置に変換している。
    • 【疑問】この標準得点て、入試などの「偏差値」と関連がある?

■4章:確率
  • 条件付き確率とベイズの定理
    • 条件付き確率を見える化する場合、「確率木」で表現すると便利。
    • 条件付き確率とベイズの定理は、以下のとおり。

  • 独立
    • 2つの事象AとBが独立である場合、P(A|B)=P(A)が成り立つ。
    • 逆に、この式(P(A|B)=P(A))が成り立つ場合、AとBは独立といえる。
■5章:離散確率分布

  • 期待値
    • 定義式は、
    • 期待値は算術平均に似ている。
    • 分散もある。
    • 標準偏差は、分散の平方根。
  • 線形変換
    • 期待値や、分散は線形変換が成り立つ。
      • E(aX+b) = aE(X) + b
      • Var(aX+b) = a^2 E(X)
  • 独立観測値という考え方
    • 期待値がE(X)、分散がVar(X)となる試行をn回行った場合、その期待値はnE(X)、分散はnVar(X)となる。
    • 線形変換と、独立観測値の違いに注意。
  • XとYが独立した確率変数、a、bが定数とすると、次の式が成り立つ。
    • ここで、分散はX-Yでも、Var(X)+Var(Y)になること注意。

    約束~名張毒ぶどう酒事件 死刑囚の生涯

    映画「約束~名張毒ぶどう酒事件 死刑囚の生涯」を見た。

    約50年前に起きた、三重県名張市葛尾地区の公民館で起きた毒物混入事件。その犯人とされ、死刑が確定した奥西勝死刑囚が無罪を訴え続けて再審請求を繰り返す。そのドキュメンタリー映画だ。

    「名張毒ぶどう酒事件」は、たまに新聞などで目にしていたけれど、どんな事件か、なにを争っているのかなど知らなかったし興味もあまりなかった。この映画を見て事件のなにが問題なのかを知った。多くの人にこの映画が見られるべきだと思う。まずは事件について知ること。それが大事だ。この映画はそれに最適だと思う。

    もちろん僕には、奥西勝死刑囚が犯人なのかそれとも冤罪なのかの真実はわからない。

    ただ、この映画を見て司法が機能不全になってしまっているように感じた。死刑判決が自白に依拠し、その自白の矛盾を再審請求で証拠をあげて証明しているのに、それを却下する裁判所。却下の正当性は(少なくとも映画のなかでは)見つけられなかった。日本の司法はこんなものなのか、本当にそうなら失望を禁じえない。

    時間が経過すればするほど事態は硬直する。奥西を犯人と信じこむことで自らを無理矢理納得させ、事件は終わったものとしてしまっている事件の当事者たち。判例が積み重ねられていくごとに、過去の先輩判事の判例を覆せなくなっていく裁判官とその縦社会。

    でもこれらを解きほぐすことは不可能ではないと信じたい。奥西勝死刑囚が生きている間に、公正な判断が下されることを願いたい。




    2013年4月3日水曜日

    劇場版:花咲くいろは~Home Sweet Home~

    「劇場版:花咲くいろは~Home Sweet Home~」を見に行く。
    ディズニーやジブリ以外のアニメ作品を映画館に見に行くのは初めてだ。

    平日の昼間にも関わらず会場には30人位の人がいた。予想通り99%がアニメが好きそうな男達だ。スーツなサラリーマンもいる。

    そんな観客に交じって、会場ど真ん中を陣取る。

    映画がはじまると、一気に映画の世界に引き込まれた。
    TVアニメから全く変わってない世界観やキャラクターで安心して見られたし、過去と現在の間で行ったり来たりする時間軸の変化や、主要なキャラクターにバランス良くスポットライトが当たるストーリー展開が心地よかった。
    TVシリーズではなかった冬の自然の景色がキレイで、母親の凛とした決意に馴染んでよい。

    上映時間が66分と知って「短い上映時間に満足できるかな?」と不安だったけど杞憂だった。

    岡田麿里さんの脚本は「ハズレがないな~、安心して見られるな~」と思う。

    追記、
    エンディング曲よかった。欲しい。

    HeadFirstデータ分析を読む。

    データアナリストのための入門書。データアナリストの仕事内容が模倣されたストーリーが展開されていて、読んでて楽しい。
    この本では解決するべき問題に応じて解析ツールを使い分けることと、そのツールの一端を紹介している。ツールは多岐にわたる。
    • 実験計画法
    • 最適化
    • 適切な視覚化
    • 仮説検定
      • 現実の世界の事象の「要因」はネットワーク上に複雑に絡み合っているということを忘れてはいけない。また、その要因の絡まりを書き下して整理することで、見えてくるものもあることを忘れてはいけない。
      • 複数の仮説のどれが正しいのかを検証するときは、「反証(立証されない仮説を取り除く)」によって行わないといけない。
        • 最も適当だと思われる仮説を選ぶと、「満足化」してしまう。
    • ベイズの定理
      • 事後確率の概念は大事だ。
    • 主観確率
      • 主観の言葉(必ず、おそらく、ほぼ・・・など)を数値の確率で表わすことで、事実が見え課題解決の突破口が見えてくるストーリーは面白かった。また、数値の確率で表わすことで、ベイズの定理を応用できるようになる。
    • ヒューリスティック分析
      • 必ずしも課題解決のために必要なデータはそろわない。ならば、手に入れられるデータから(最適解である保障はないものの・・・)最善の結論を得ないといけない。
      • 「高速で倹約的なロジックツリー」を描いて問題を整理する手法は、「なるほど」と関心したし実践していきたい。
      • 問題の最適解を保証できないことは、計算アルゴリズムでもあって、保証はできないけれど経験的に最適解を得られるアルゴリズムを「ヒューリスティックアルゴリズム」という。
    • その他、統計に関する全般のトピック
    • RやExcelの分析機能
    次は、「HeadFirst Statistics」を読む。