*

Quora 「汎化性能」

公開日: : 最終更新日:2023/05/29 出版・講義資料

すべてのデータサイエンティストが知っておくべき、統計学の重要なトピックはなんでしょうか?

個人的には「汎化性能」だと思います。

上の図はその説明でよく用いられるもので、実際には3次多項式にノイズを加えて生成したサンプル(白い円)に多項式フィッティングを行った結果です。3次多項式モデル(赤線)だと全ての円は通らないながらも滑らかで綺麗に全体のトレンドに沿った曲線が描けますが、9次多項式モデル(青線)だとより多くの円を通りながらもぐにゃぐにゃして全体のトレンドに合わない奇妙な曲線を描いてしまいます。

それもそのはずで、3次モデルは程よく真の値(3次多項式に従う)を捉えているのに対して、9次モデルは真の値のみならずノイズにまでフィットしてしまっているからです。この場合、両端(-3 or 3)の外側にまでサンプルを拡張した場合、3次モデルは適切にフィットするであろう一方、9次モデルはあらぬ方向に吹っ飛んでしまって全くフィットしないであろうことが容易に想像できるかと思います。

このように、ノイズに振り回されず程よく全体のトレンドを捉え、適切にまだ見ぬ未知データにうまくモデルを当てはめられる(適切に予測できる)度合いのことを「汎化性能」と呼びます。

統計学とは、「標本抽出(サンプリング)された少ない標本から背後にある(見えない)母集団の性質を推定する営み」だとされます。この定義に従えば、汎化性能を確保することは統計学を統計学たらしめる本質的な要件であるように見えます。

言い換えると、例えばt検定やカイ二乗検定のような仮説検定から重回帰分析のような線形モデル、ロジスティック回帰などの一般化線形モデル、さらには統計的学習の手法に基づく機械学習領域におけるDeep Learningのような高度なモデルであっても全く同じことが言えるということだと思います。

汎化性能を評価する方法は世の中には色々あり、例えばAICのような情報量規準を用いるものや、交差検証によって擬似的に手持ちのサンプルから算出するものもあり、それぞれのシチュエーションに応じて使い分けることが望ましいとされます。

いかなる統計学的な取り組みであれ、汎化性能を確保することは非常に重要であると個人的には考えています。

関連記事

no image

ふるまいよしこ氏の尖閣報道と観光

ふるまいよしこさんの記事は長年読ませていただいている。 大手メディアの配信する記事より、信頼できる

記事を読む

no image

観光資源評価の論理に使える面白い回答 「なぜ中国料理は油濃いのか」に対して、「日本人は油濃いのが好きなのですね」という答え

中華料理や台湾料理には、油を大量に使用した料理が非常に多いですが、そうなった理由はあるのでしょうか

記事を読む

『眼の誕生』アンドリュー・パーカー 感覚器官の進化はおそらく脳よりも前だった。脳は処理すべき情報をもたらす感覚器より前には存在する必要がなかった

眼の発達に関して新しい役割を獲得する前には、異なった機能を持っていたはず しエダア

記事を読む

「起業という幻想」白水社 スコット・A・シェーン 職を転々として起業に身をやつす米国人の姿は、産学官が一体になって起業を喧伝する日本社会に一石投じることは間違いない。

  マイクロソフトのビル・ゲイツ、アップルを立ち上げたス

記事を読む

『ヒトはこうして増えてきた』大塚龍太郎 新潮社

p.85 定住と農耕 1万2千年前 500万人 祭祀に農耕が始まった西アジアの発掘調査で明らかにさ

記事を読む

『セイビング・ザ・サン リップルウッドと新生銀行の誕生』ジリアン・テット 武井楊一訳

バブル期の金融問題に関する書籍は数多く出版され、高杉良が長銀をモデルに書いた『小説・ザ・外資』はハ

記事を読む

no image

『カジノの歴史と文化』佐伯英隆著

IRという言葉の曖昧さ p.198 シンガポールにしても、世界から観光客を集める手法として、

記事を読む

no image

生涯弁護人事件ファイル2 広中惇一郎

第一章 報道が作り出す犯罪 安部英医師薬害エイズ事件 アメリカの人気番組 LAW &

記事を読む

no image

太平洋戦争で日本が使用した総費用がQuoraにでていた

太平洋戦争で、日本が使った総費用はいくらでしょうか?Matsuoka Daichi, 九州大学で経

記事を読む

no image

『休校は感染を抑えたか』朝日新聞記事 

https://www.asahi.com/articles/ASP6J51TNP6CULEI0

記事を読む

重慶旅行 重慶の大きさ

https://www.facebook.com/share/1G31

no image
ディケンズの生きた時代のロンドン住環境

https://youtu.be/ZthiTttu0X8?si=31h

no image
ポルトガル、島しょ部旅行資料

現在のポルトガルの置かれている状況 https://youtu.

AI研究者と俳人 人はなぜ俳句を詠むのか amazon書評

AIが俳句を「終わらせる」可能性は、これまでの「人間による創作」という

言語が違えば、世界も違って見えるわけ (ハヤカワ文庫)amazon書評

https://www.amazon.co.jp/%E8%A8%80%

→もっと見る

PAGE TOP ↑