Quora 「汎化性能」
公開日:
:
最終更新日:2023/05/29
出版・講義資料
すべてのデータサイエンティストが知っておくべき、統計学の重要なトピックはなんでしょうか?
個人的には「汎化性能」だと思います。
上の図はその説明でよく用いられるもので、実際には3次多項式にノイズを加えて生成したサンプル(白い円)に多項式フィッティングを行った結果です。3次多項式モデル(赤線)だと全ての円は通らないながらも滑らかで綺麗に全体のトレンドに沿った曲線が描けますが、9次多項式モデル(青線)だとより多くの円を通りながらもぐにゃぐにゃして全体のトレンドに合わない奇妙な曲線を描いてしまいます。
それもそのはずで、3次モデルは程よく真の値(3次多項式に従う)を捉えているのに対して、9次モデルは真の値のみならずノイズにまでフィットしてしまっているからです。この場合、両端(-3 or 3)の外側にまでサンプルを拡張した場合、3次モデルは適切にフィットするであろう一方、9次モデルはあらぬ方向に吹っ飛んでしまって全くフィットしないであろうことが容易に想像できるかと思います。
このように、ノイズに振り回されず程よく全体のトレンドを捉え、適切にまだ見ぬ未知データにうまくモデルを当てはめられる(適切に予測できる)度合いのことを「汎化性能」と呼びます。
統計学とは、「標本抽出(サンプリング)された少ない標本から背後にある(見えない)母集団の性質を推定する営み」だとされます。この定義に従えば、汎化性能を確保することは統計学を統計学たらしめる本質的な要件であるように見えます。
言い換えると、例えばt検定やカイ二乗検定のような仮説検定から重回帰分析のような線形モデル、ロジスティック回帰などの一般化線形モデル、さらには統計的学習の手法に基づく機械学習領域におけるDeep Learningのような高度なモデルであっても全く同じことが言えるということだと思います。
汎化性能を評価する方法は世の中には色々あり、例えばAICのような情報量規準を用いるものや、交差検証によって擬似的に手持ちのサンプルから算出するものもあり、それぞれのシチュエーションに応じて使い分けることが望ましいとされます。
いかなる統計学的な取り組みであれ、汎化性能を確保することは非常に重要であると個人的には考えています。
関連記事
-
-
『江戸のパスポート』柴田純著 吉川弘文館
コロナで、宿泊業者が宿泊引き受け義務の緩和に関する政治的要望を行い、与党も法改正を行うことを検討
-
-
中山智香子『経済学の堕落を撃つ』
経済学は、なぜ人間の生から乖離し、人間の幸福にはまったく役立たなくなってしまったのか? 経済学の
-
-
『デモクラシーの帝国』 藤原帰一2002岩波新書 国際刑事裁判所 米国の不参加
国際刑事裁判所の設立を定めたローマ規程は、設立条約に合意していない諸国にも適用されるところから、アメ
-
-
コロニアル・ツーリズム序説 永淵康之著『バリ島』 ブランドン・パーマー著『日本統治下朝鮮の戦時動員』
「植民地観光」というタイトルでは、歴史認識で揺れる東アジアでは冷静な論述ができないので、とりあえずコ
-
-
『「食糧危機」をあおってはいけない』2009年 川島博之著 文芸春秋社 穀物価格の高騰は金融現象
コロナで飲食店が苦境に陥っているが、平時には、財政措置を引き出すためもあり、時折食糧危機論が繰り返
-
-
『物語 ナイジェリアの歴史』島田周平著 中公新書
アマゾン書評 歴史家トインビー曰く、アフリカはサハラ砂漠南縁を境に、北のアラブ主義
-
-
書評『法とフィクション』来栖三郎 東大出版会
観光の定義においても、自由意思を前提とするが、法律、特に刑法では自由意思が大前提。しかし、フィク
-
-
「若者の海外旅行離れ」という 業界人、研究者の思い込み
『「若者の海外旅行離れ」を読み解く:観光行動論からのアプローチ』という法律文化社から出版された書
