*

Quora 「汎化性能」

公開日: : 最終更新日:2023/05/29 出版・講義資料

すべてのデータサイエンティストが知っておくべき、統計学の重要なトピックはなんでしょうか?

個人的には「汎化性能」だと思います。

上の図はその説明でよく用いられるもので、実際には3次多項式にノイズを加えて生成したサンプル(白い円)に多項式フィッティングを行った結果です。3次多項式モデル(赤線)だと全ての円は通らないながらも滑らかで綺麗に全体のトレンドに沿った曲線が描けますが、9次多項式モデル(青線)だとより多くの円を通りながらもぐにゃぐにゃして全体のトレンドに合わない奇妙な曲線を描いてしまいます。

それもそのはずで、3次モデルは程よく真の値(3次多項式に従う)を捉えているのに対して、9次モデルは真の値のみならずノイズにまでフィットしてしまっているからです。この場合、両端(-3 or 3)の外側にまでサンプルを拡張した場合、3次モデルは適切にフィットするであろう一方、9次モデルはあらぬ方向に吹っ飛んでしまって全くフィットしないであろうことが容易に想像できるかと思います。

このように、ノイズに振り回されず程よく全体のトレンドを捉え、適切にまだ見ぬ未知データにうまくモデルを当てはめられる(適切に予測できる)度合いのことを「汎化性能」と呼びます。

統計学とは、「標本抽出(サンプリング)された少ない標本から背後にある(見えない)母集団の性質を推定する営み」だとされます。この定義に従えば、汎化性能を確保することは統計学を統計学たらしめる本質的な要件であるように見えます。

言い換えると、例えばt検定やカイ二乗検定のような仮説検定から重回帰分析のような線形モデル、ロジスティック回帰などの一般化線形モデル、さらには統計的学習の手法に基づく機械学習領域におけるDeep Learningのような高度なモデルであっても全く同じことが言えるということだと思います。

汎化性能を評価する方法は世の中には色々あり、例えばAICのような情報量規準を用いるものや、交差検証によって擬似的に手持ちのサンプルから算出するものもあり、それぞれのシチュエーションに応じて使い分けることが望ましいとされます。

いかなる統計学的な取り組みであれ、汎化性能を確保することは非常に重要であると個人的には考えています。

関連記事

no image

QUORA 北方四島問題でソ連は日ソ不可侵条約が有るも拘わらず、終戦直後参戦し北方四島を強奪しましたが、国と国の条約は形式だけで何の意味も持たないのですか?

https://qr.ae/py4JmS   北方領土問題の発端は、大東亜戦争(太

記事を読む

no image

QUORA ゴルビーはソ連を潰したのにも関わらず、なぜ評価されているのか?

ゴルバチョフ書記長ってソ連邦を潰した人でもありますよね。人格的に優れた人だったのかもしれませんが

記事を読む

no image

国際観光局ができた1930年代の状勢 『戦前日本の「グローバリズム」』

大東亜共栄圏の虚構を指摘 「バダヴィアに派遣された小林一三商相」国内世論の啓発に努める小林は

記事を読む

no image

大関真之『「量子」の仕業ですか?』

pp101-102 「仮にこの性質を利用して、脳が人の意識や判断、その他の動作を行っているとしたら、

記事を読む

no image

生涯弁護人事件ファイル2 広中惇一郎

第一章 報道が作り出す犯罪 安部英医師薬害エイズ事件 アメリカの人気番組 LAW &

記事を読む

no image

言語とは音や文字ではなく観念であるという説明

観光資源を考えると、言語とは何かに行き着くこととなる。 愛聴視して「ゆる言語学ラジオ」で例のエ

記事を読む

no image

QUORAに見る観光資源 日本から出たことがないのでわからないのですが、日本は本当に治安が良いのですか?松本 貴典 (Takanori Matsumoto),

日本から出たことがないのでわからないのですが、日本は本当に治安が良いのですか?松本 貴典 (Tak

記事を読む

『天安門事件を目撃した日本人たち』

天安門事件に関する「藪の中」の一部。日本人だけの見方。中国人や米国人等が作成した同じような書籍があ

記事を読む

『築地と豊洲』澤章 都政新報社

Amazonの紹介では「平成が終わろうとしていたあの頃、東京のみならず日本中を巻き込んだ築地市場の

記事を読む

no image

筒井清忠『戦前のポピュリズム』中公新書

p.108 田中内閣の倒壊とは、天皇・宮中・貴族院と新聞世論が合体した力が政党内閣を倒した。しかし、

記事を読む

PAGE TOP ↑