都道府県別感染者数とポアソン回帰分析2021年02月05日 03:59

都道府県別新型コロナ感染者数のポアソン回帰分析を何度か実施した。(2020年12月11日など)
この統計分析モデルで使われるポアソン分布とは、2項分布(感染する確率と感染しない確率の2項)をn人に適用したモデルにおいて、感染する確率を非常に小さく、nを非常に大きくした場合の極限分布として得られるもので、希少事象に適用できるので疫学研究によく使われている。
では、都道府県別新型コロナ感染者数の場合、実際にはどう考えればいいのか。

ポアソン分布で前提としているのは、感染率が都道府県に拠らず一定ということである。
この場合、仮に47都道府県の人口がすべて同じであれば、感染者数も同一というのが決定論であり、統計論では、神のみぞ知る、或いは未知の条件の影響により、感染者数は人口が同じでも都道府県ごとに異なるが、その分布がポアソン分布に従い、その平均値が人口×感染率になる。
実際には、都道府県ごとに人口が異なるので、ポアソン回帰分析では感染者数を人口で割った値を対象に分析し、人口はオフセット項と呼ばれ、感染率に対する回帰解析結果を感染者数に戻すときに用いられる。
ところで、都道府県が1つだけだったらどうなるのか。
この場合には、データは一件だけである。その感染者数は人口に対しある値であり、それが単に観測された感染率だというだけで、分布というものはないことになる。しかし、それでも日ごとに感染者数は異なるはずで、それがポアソン分布すると考えることができる。
その場合、統計的な平均感染率λは、人口×日(複数の観測期間)という値(暴露量と呼ぶらしい)に対し、λ/日として定義しなおし、複数の期間ごと(複数の異なる一日でもよいが)の感染者数を対象に回帰分析を行えば得られることになる。

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

名前:
メールアドレス:
URL:
コメント:

トラックバック

このエントリのトラックバックURL: http://yokoyamashindo.asablo.jp/blog/2021/02/05/9344204/tb