« リルケの「ドゥイノの悲歌」と「開かれ」 | 最新のページに戻る | 「バ ディヤ、フルヘッヘンド、ウォウ〜」(さうして、このごろ2021年11-12月版) »
■ ベイズ更新
ベイズ更新では、そのつど与えられたデータから計算した事後分布を、次のデータが与えられたときは事前分布として使うことで、事後分布を逐次更新してゆく。
たとえば一定のパラメーター を持つ生成過程(たとえば2項分布)から生成されるデータ があったとすると、ベイズの定理より、
となる。これはデータ を一挙に与えられた場合だけど、代わりにデータ をひとつずつ順番に取得して事後分布を更新するのがベイズ更新。まず から始めると、
こうしてできた事後分布 を次の事前分布 のところに入れる。(分母のevidenceは に依存しない定数なので で表記しておく。)
なんでそんなことが可能かというと、 を持つ生成過程から生成されるデータ が独立だから、という仮定が入ってる。単純化するために の2つだけで考えてみる。
もしここで を与えたものでの の条件付き独立
が成り立つなら、
となり、事後分布 を次の事前分布 に代入したものになってる。
分母は定数なのでこのままで十分だけど、もしさらに の独立
が成り立つなら、
となって、分母もきれいになる。条件付き独立が成り立っても、独立は必ずしも成り立たないので、いちおう分けて考えた。でも元々の設定「一定のパラメーター を持つ生成過程(たとえば2項分布)から生成されるデータ 」からすると、たぶん独立も成り立つ。つまり、 を選ぶ順番変えても成り立つということだから。
ここまでの話はパラメーター が一定であることを前提としていた。途中で が変わる場合は成り立たない。そういう場合は をそのつど推定するべきhidden variableとして扱うことになる。
StackExchangeにあるとおりだけど、ふたたび だけの例で書くと、
こうなるので、事前分布 * 尤度 ではなくなって、transition process を考慮する必要が出てくる。
参考: