*

Quora 「汎化性能」

公開日: : 最終更新日:2023/05/29 出版・講義資料

すべてのデータサイエンティストが知っておくべき、統計学の重要なトピックはなんでしょうか?

個人的には「汎化性能」だと思います。

上の図はその説明でよく用いられるもので、実際には3次多項式にノイズを加えて生成したサンプル(白い円)に多項式フィッティングを行った結果です。3次多項式モデル(赤線)だと全ての円は通らないながらも滑らかで綺麗に全体のトレンドに沿った曲線が描けますが、9次多項式モデル(青線)だとより多くの円を通りながらもぐにゃぐにゃして全体のトレンドに合わない奇妙な曲線を描いてしまいます。

それもそのはずで、3次モデルは程よく真の値(3次多項式に従う)を捉えているのに対して、9次モデルは真の値のみならずノイズにまでフィットしてしまっているからです。この場合、両端(-3 or 3)の外側にまでサンプルを拡張した場合、3次モデルは適切にフィットするであろう一方、9次モデルはあらぬ方向に吹っ飛んでしまって全くフィットしないであろうことが容易に想像できるかと思います。

このように、ノイズに振り回されず程よく全体のトレンドを捉え、適切にまだ見ぬ未知データにうまくモデルを当てはめられる(適切に予測できる)度合いのことを「汎化性能」と呼びます。

統計学とは、「標本抽出(サンプリング)された少ない標本から背後にある(見えない)母集団の性質を推定する営み」だとされます。この定義に従えば、汎化性能を確保することは統計学を統計学たらしめる本質的な要件であるように見えます。

言い換えると、例えばt検定やカイ二乗検定のような仮説検定から重回帰分析のような線形モデル、ロジスティック回帰などの一般化線形モデル、さらには統計的学習の手法に基づく機械学習領域におけるDeep Learningのような高度なモデルであっても全く同じことが言えるということだと思います。

汎化性能を評価する方法は世の中には色々あり、例えばAICのような情報量規準を用いるものや、交差検証によって擬似的に手持ちのサンプルから算出するものもあり、それぞれのシチュエーションに応じて使い分けることが望ましいとされます。

いかなる統計学的な取り組みであれ、汎化性能を確保することは非常に重要であると個人的には考えています。

関連記事

no image

小城鎮建設論

p.82 改革・開放が始まって暫くの間、「小城鎮建設論」 都市と農村の中間地帯=小城鎮を豊かにし、そ

記事を読む

no image

井伏鱒二著『駅前旅館』

新潮文庫の『駅前旅館』を読み、映画をDVDで見た。世相はDVDの方がわかりやすいが、字句「観光」は

記事を読む

no image

2022年8月ジャパンナウ観光情報協会原稿 アフターコロナという名の観光論 原稿資料

 ◎ジャパンナウ原稿案 2020年冬から始まった新型感染症は日本の人流・観光業界に

記事を読む

no image

朝河寛一とアントニオ猪木 歴史認識は永遠ではないということ

アントニオ猪木の「訪朝」がバカにできない理由 窪田順生:ノンフィクションライター経営・戦略情

記事を読む

no image

コロナ後の日本観光業 キーワード 現金給付政策を長引かせないこと、採算性の向上、デジタル化、中国等指向

今後コロナ感染が鎮静化に向かうことが期待されているおり、次の課題はコロナ後の回復に向けての施策に重

記事を読む

no image

QUORA 第二次世界大戦 · フォロー中の関連トピック 米国は、日本の真珠湾攻撃の計画を実際には知っていて、戦争参入の口実を作るために敢えて日本の攻撃を防がなかった、というのは真実ですか?

  回答 · 第二次世界大戦 · フォロー中の関連トピック米国は、日本の

記事を読む

『日本語スタンダードの歴史』野村剛士は、「日本の話しことばについて」『現代国語三』所収 木下順二著1963年を否定

私の自説に、日常と非日常が相対化しており、観光資源もあいまいになってきているというアイデアがある

記事を読む

no image

人間ってなんなの?:チンパンジーの4年戦争【 進化論 / 科学 / 人 類 】タンザニア

グドール 道具を使うチンパンジーを発見 ジェーン・グドール(Dame Jane Morris Go

記事を読む

書評『日本社会の仕組み』小熊英二

【本書の構成】 第1章 日本社会の「3つの生き方」第2章 日本の働き方、世界の働き方第3章

記事を読む

no image

江戸時代の交通事故

交通事故は、自動車の登場以前にもあった。江戸時代にも、大八車や牛車、馬車などの“クルマ”があったか

記事を読む

AI研究者と俳人 人はなぜ俳句を詠むのか amazon書評

AIが俳句を「終わらせる」可能性は、これまでの「人間による創作」という

言語が違えば、世界も違って見えるわけ (ハヤカワ文庫)amazon書評

https://www.amazon.co.jp/%E8%A8%80%

no image
旅系youtube 日本脱出チャンネル

https://youtu.be/hNA9M3d3_2w?si=zPA

no image
旅系Youtube 秘境関係

https://youtu.be/mTpbkUc5Eok?si=7J4

no image
中国旅行のみどころ Youtube

https://youtu.be/OiUr-1yNEaI?si=5U1

→もっと見る

PAGE TOP ↑