2017年6月16日金曜日

2.3.7 スチューデントのt分布(発表後の反省)

本日、パターン認識と機械学習(2.3.7スチューデントのt分布)の説明を、先輩や先輩方の前で行った。
前回の2.3.1条件付きガウス分布の説明を行った時の反省を生かし、以下の点について、注意した上で発表を行った。

  • 発表スライドの文字について、黄金比と呼ばれる傍聴者に見やすいと呼ばれる文字の大きさ・位置・比率などがあるので、見やすい大きさの文字を用いて、適正な文字の大きさを用いる。
  • 計算過程を「参考」や「付録」というスライドに書き込むことにより、あとで2.3.1条件付きガウス分布を見直す時に分かりやすくなるが、発表中のスライド内に入れると見づらくなる。よって、スライドの説明中には載せず、スライドの1番後ろに計算過程を掲載する。(→もしくは、スライドの枠の中に入れるのは、見づらくなる場合があるので、自分自身の計算過程を書いたプリントを配布するか、もしくは、ward等のテキストエディタを用いて、計算過程を記述し、先輩方に配布する)

このことについて、前回のブログで述べたように、見やすくてわかりやすいスライドの作成にはコツがあるので、事前にインターネットなどの参考文献を調べて、それらの知識を生かして、今回のプレゼンテーションの資料を完成させた。
さらに、数式の計算過程を別紙にレポート形式で記述し、先生や先輩方が後から数式を見直す時にわかりやすいようにまとめた。

また、スチューデントのt分布はExcelなどに関数として取り入れられているので、実際に、インターネットなどの参考文献を利用し、Pythonのプログラムを完成させ、発表する前に、デモンストレーションとして先生や先輩方の前で実行した。

しかしながら、スチューデントのt分布の計算過程を記載するのに力を入れすぎて、スチューデントのt分布について完璧に理解し、先生や先輩方に説明するに足る知識力を身につけていなかったため、スチューデントのt分布を説明する際に戸惑ってしまい、さらに、以下のような先生からの質問に対して正確な答えを返すことができなかった。

  • スチューデントのt分布は、どのようなことに対して影響を受けないのか
  • スチューデントのt分布はガウス分布と違って、なぜ外れ値による影響を受けないのか

このことについて、先生から、以下のように説明していただき、理解することができた。

  • スチューデントのt分布は、ガウス分布よりすそが長いため、頑健性をもっているので、外れ値による影響を受けない
  • 外れ値による影響を受けないが、初めから外れ値による影響を受けていると考えているので、精度がガウス分布よりも落ちてしまう
  • ガウス分布は、指数部分が二次形式となっているが、スチューデントのt分布は、(多項式)分の1となっているので、以下の図1のように、すそが厚くなっていることがわかる。よって、外れ値による影響を受けないことがわかる。

図1. exp(-x^2)と1/(1+x^2)のグラフ

このことについて、なぜ、以上のような式を比べるかというのは、以下のようなスチューデントのt分布の式とガウス分布の式の形について考えると、exp(-x^2)と1/(1+x^2)の形を導出できるからである。


式1. ガウス分布とスチューデントのt分布の式

したがって、今回の発表を通しての反省点は、以下の通りである。


  • 計算過程を導出するよりも、内容を理解することに力を入れるべきであった。
  • pythonを用いて、デモンストレーションを行なったが、プログラムの内容について、インターネットの参考文献を用いただけだったので、全然理解していなかった
  • 発表であるのに、教科書を忘れてしまい、内容を細かく説明できなかった。(→また、その時に、先輩に教科書を見せてもらったので、迷惑をかけてしまった)

よって、今回のゼミでの発表を通して、先生や先輩方から、プレゼンテーションをよりよく行うためのアドバイスを頂いたので、今後自分が発表を行う際に、以下の点について気をつけながら発表して行こうと思う。

  • 自分が発表を行う内容について、計算過程よりも内容を理解することに力を入れる。
  • プレゼンテーションを行うにあたって、インターネットなどの参考文献を用いても良いが、初めは、教科書の内容に目を通して理解することに心がける(→先生や先輩方は教科書のみしか持っていないため)
  • pythonを用いて、デモンストレーションを行なう際に、内容まで理解して、前で発表するようにする。
  • また、pythonというプログラムを全然理解していなかったので、自分で少しずつであるが、勉強していこうと思う。
  • 教科書などの忘れ物をしないように、毎回よく確認を行う

さらに、スチューデントのt分布は、Excelなどにも用いられているということを知ったので、Excelも用いて、どのような出力結果になるのかを考察していこうと思う。

0 件のコメント:

コメントを投稿

ブログ作成にあたって一言

初めまして 北九州市立大学情報メディア工学科の 永原研究室 に所属している長野 陸です。 現在、私は  永原 正章  教授のご指導のもと、日々勉学に励み、自動制御と人工知能の研究を行うことにより、農業での問題や人間を含めた地球全体での生態系に起こる環境問題の解決に取り...