肥満の定義 ― 2023年06月28日 07:21
現在の肥満の定義には不満がある。(一応掛けてみました。)
日本ではBMI25以上を肥満と呼んでいる。一方、世界保健機関WHOではBMI30以上と定義している。
仮に身長が170cmならば
体重
BMI 25 72.25kg
BMI 30 86.7kg
仮に身長が175cmならば
体重
BMI 25 75.56kg
BMI 30 91.87kg
となり、約15kg以上の差がある。これは大きすぎる。
厚労省は痩せ指向の医薬業界に忖度しているのではないかと思わざるを得ない数値だ。
一体何を基準に肥満と称するのだろうか。
放射線被ばく基準は国際的機関の勧告に合わせ、肥満の基準は国際機関の基準とこれだけの差がある。
業界と世論に忖度して基準のあり方を任意に決めているように見える厚労省は、予算の使い方を間違っているか、又は、信用性が低いと言わざるを得ない。
日本ではBMI25以上を肥満と呼んでいる。一方、世界保健機関WHOではBMI30以上と定義している。
仮に身長が170cmならば
体重
BMI 25 72.25kg
BMI 30 86.7kg
仮に身長が175cmならば
体重
BMI 25 75.56kg
BMI 30 91.87kg
となり、約15kg以上の差がある。これは大きすぎる。
厚労省は痩せ指向の医薬業界に忖度しているのではないかと思わざるを得ない数値だ。
一体何を基準に肥満と称するのだろうか。
放射線被ばく基準は国際的機関の勧告に合わせ、肥満の基準は国際機関の基準とこれだけの差がある。
業界と世論に忖度して基準のあり方を任意に決めているように見える厚労省は、予算の使い方を間違っているか、又は、信用性が低いと言わざるを得ない。
被ばく量とがん発生率の相関関係の謎 ― 2023年06月11日 16:10
二つの放射線被ばく量とがん発生率に関する論文がある。
一つは英国原子力作業従事者のがん発生率に関する論文で
https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwi72KCkjbL_AhWB0mEKHUPHDlAQFnoECA0QAQ&url=https%3A%2F%2Fwww.rea.or.jp%2Fwakaruhon%2Fhonbun%2FNo12honbun.pdf&usg=AOvVaw1YAUV1yMHamGbobK562fDZ
まとめとして、
「英国では原子力施設で働く放射線業務従事者について、死亡原因
と放射線被ばくの関係を調べるための調査を行っています。(この
ような統計的調査を一般に疫学調査といいます)放射線業務従事者
約10万人を調査対象としており、1945年から1988年まで
の調査では調査対象者の平均線量は33.6ミリシーベルトでした
が、「がん」および「がん以外の病気」による死亡率はいずれも英国
国民平均に比べて15%以上低い値でした。」
と記載されている。
即ち、自然からの被ばく線量2.1ミリシーベルト(日本の場合)を考慮すると、
英国では、日本の自然放射線の15倍程度の人口放射線を浴びた原子力業務従事者のがん発生率が一般人より15%低くなるという統計データがあるということになる。
ふたつ目の論文は、米国の航空機客室乗務員に関する調査で、
https://www.arpansa.gov.au/cancer-prevalence-among-flight-attendants-compared-general-population
客室乗務員の年間電離放射線量は3.07ミリシーベルトで、乳がん、子宮頸がんの有病率は一般人の約1.5倍となっている。
即ち、英国のデータでは、年間約34ミリシーベルト浴びるとがんによる死亡率は15%減るが、米国のデータでは、年間約3ミリシーベルト浴びるとがんは約1.5倍増えるということになる。地上の自然放射線は約2ミリシーベルトだから、ちょっと浴びるよりも15倍浴びたほうが健康によいというデータに見える。
この関係は一種の謎であり、その理由は両論文では明らかにはされていない。
このような一見矛盾した統計データが出てくる原因についての、私の推定は以下のとおりである。
それは、日本国政府も採用している基準である、国際放射線防護委員会(ICRP)の被ばく基準の設定に問題があるということである。
ICRPの基準は、広島・長崎の生存者におけるがん発生率に基づき、原爆の被ばく線量とがん発生率に比例関係があると仮定している。
この仮定のもと、自然被ばく線量の地域的揺らぎの範囲内として、一般人の被ばく許容線量を年間1ミリシーベルトとし、また、原子力作業従事者は職業であることから年間50ミリシーベルトにしている。
しかし、広島・長崎の原爆は爆発の時間である約1ミリ秒で浴びた瞬間的な被ばく事象による放射線量であり、年間(365×24×3600×1000ミリ秒)における被ばく線量ではない。
一方、客室乗務員は年間5回程度発生する太陽フレア(太陽表面の短時間核融合反応増大現象)による被ばくを浴びる。これはガンマ線も含まれ、それは秒単位で浴びる瞬間被ばくとなる。
上記、原子力作業者の1秒当たりの被ばく量は、
年間被ばく労働時間を約1000時間と想定した場合、総計34ミリシーベルト浴びるので
34/(1000*3600)=9.4×10のマイナス6乗ミリシーベルト/秒
となる。
一方、上記、客室乗務員の1秒当たりの被ばく量は、
太陽フレアが年5回発生、被ばく時間が1秒とすると、客室乗務員の単位時間当たり被ばく量は
3/5=6×10のマイナス1乗ミリシーベルト/秒
となる。
即ち、客室乗務員は5桁も大きな瞬間被ばくを受けている。即ち、広島・長崎の被ばく者に近い被ばく形態なのである。
このパラドックスは、1.8リットルの醤油を1年間でゆっくり飲めば健康に良いが、一気飲みをすれば重大な健康被害があるという議論に似ている。
生物学的には、がん抑制遺伝子が機能し、ゲノム損傷を修復するためには有限の時間が必要なのである。瞬間の大量被ばくではがん抑制遺伝子が十分機能できないのではないだろうか。
何故なら、原爆も高空での太陽フレアも、生物の進化の歴史でこれまで経験したことのない被ばく形態なのである。免疫機能であるがん抑制遺伝子が働く可能性は小さい。
このように瞬間被ばくのデータをもとに長時間の被ばくの影響を単に時間積分総線量のみで規定するICRPの基準自体に大きな欠陥があると考える。
念のために言うと、客室乗務員だけでなく、国際線で高空を飛行する一般乗客も同じ被ばくを受けるのである。
2025年は太陽フレアの活動が活発化すると言われている。
早めにこの問題の対策を行い、太陽フレアによる瞬間被ばくによるがん発生増加を抑制しなければならない。しかし、太陽フレアからのガンマ線は光と同じ速度で地球の大気上層に到達するのだから、今のパイロット並みの対策しかないのかもしれない。
(太陽フレアが発生したときに乗務していたことが分かったパイロットはしばらく乗務を停止する勤務調整をしているそうである。)
このままでは、がん発生のリスクに関し、最も危ないのは客室乗務員と頻回の一般利用客だけということになるのかもしれない。
6月13日追記
ではなぜ一般人より被ばく量の多い原子力従事者のがんが少ないか、という理由だが、これには2つの理由が考えられる。
ひとつは、ある程度、放射線を浴びている事で、がん抑制遺伝子の活動が活発化し、免疫機能が向上することである。
もう一つは、紫外線消毒と同様、ガンマ線を浴びることで、体内外の細菌が死滅し免疫機能に余裕ができて、前癌状態に対する応答に対応することが容易になると考えられることである。
一つは英国原子力作業従事者のがん発生率に関する論文で
https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwi72KCkjbL_AhWB0mEKHUPHDlAQFnoECA0QAQ&url=https%3A%2F%2Fwww.rea.or.jp%2Fwakaruhon%2Fhonbun%2FNo12honbun.pdf&usg=AOvVaw1YAUV1yMHamGbobK562fDZ
まとめとして、
「英国では原子力施設で働く放射線業務従事者について、死亡原因
と放射線被ばくの関係を調べるための調査を行っています。(この
ような統計的調査を一般に疫学調査といいます)放射線業務従事者
約10万人を調査対象としており、1945年から1988年まで
の調査では調査対象者の平均線量は33.6ミリシーベルトでした
が、「がん」および「がん以外の病気」による死亡率はいずれも英国
国民平均に比べて15%以上低い値でした。」
と記載されている。
即ち、自然からの被ばく線量2.1ミリシーベルト(日本の場合)を考慮すると、
英国では、日本の自然放射線の15倍程度の人口放射線を浴びた原子力業務従事者のがん発生率が一般人より15%低くなるという統計データがあるということになる。
ふたつ目の論文は、米国の航空機客室乗務員に関する調査で、
https://www.arpansa.gov.au/cancer-prevalence-among-flight-attendants-compared-general-population
客室乗務員の年間電離放射線量は3.07ミリシーベルトで、乳がん、子宮頸がんの有病率は一般人の約1.5倍となっている。
即ち、英国のデータでは、年間約34ミリシーベルト浴びるとがんによる死亡率は15%減るが、米国のデータでは、年間約3ミリシーベルト浴びるとがんは約1.5倍増えるということになる。地上の自然放射線は約2ミリシーベルトだから、ちょっと浴びるよりも15倍浴びたほうが健康によいというデータに見える。
この関係は一種の謎であり、その理由は両論文では明らかにはされていない。
このような一見矛盾した統計データが出てくる原因についての、私の推定は以下のとおりである。
それは、日本国政府も採用している基準である、国際放射線防護委員会(ICRP)の被ばく基準の設定に問題があるということである。
ICRPの基準は、広島・長崎の生存者におけるがん発生率に基づき、原爆の被ばく線量とがん発生率に比例関係があると仮定している。
この仮定のもと、自然被ばく線量の地域的揺らぎの範囲内として、一般人の被ばく許容線量を年間1ミリシーベルトとし、また、原子力作業従事者は職業であることから年間50ミリシーベルトにしている。
しかし、広島・長崎の原爆は爆発の時間である約1ミリ秒で浴びた瞬間的な被ばく事象による放射線量であり、年間(365×24×3600×1000ミリ秒)における被ばく線量ではない。
一方、客室乗務員は年間5回程度発生する太陽フレア(太陽表面の短時間核融合反応増大現象)による被ばくを浴びる。これはガンマ線も含まれ、それは秒単位で浴びる瞬間被ばくとなる。
上記、原子力作業者の1秒当たりの被ばく量は、
年間被ばく労働時間を約1000時間と想定した場合、総計34ミリシーベルト浴びるので
34/(1000*3600)=9.4×10のマイナス6乗ミリシーベルト/秒
となる。
一方、上記、客室乗務員の1秒当たりの被ばく量は、
太陽フレアが年5回発生、被ばく時間が1秒とすると、客室乗務員の単位時間当たり被ばく量は
3/5=6×10のマイナス1乗ミリシーベルト/秒
となる。
即ち、客室乗務員は5桁も大きな瞬間被ばくを受けている。即ち、広島・長崎の被ばく者に近い被ばく形態なのである。
このパラドックスは、1.8リットルの醤油を1年間でゆっくり飲めば健康に良いが、一気飲みをすれば重大な健康被害があるという議論に似ている。
生物学的には、がん抑制遺伝子が機能し、ゲノム損傷を修復するためには有限の時間が必要なのである。瞬間の大量被ばくではがん抑制遺伝子が十分機能できないのではないだろうか。
何故なら、原爆も高空での太陽フレアも、生物の進化の歴史でこれまで経験したことのない被ばく形態なのである。免疫機能であるがん抑制遺伝子が働く可能性は小さい。
このように瞬間被ばくのデータをもとに長時間の被ばくの影響を単に時間積分総線量のみで規定するICRPの基準自体に大きな欠陥があると考える。
念のために言うと、客室乗務員だけでなく、国際線で高空を飛行する一般乗客も同じ被ばくを受けるのである。
2025年は太陽フレアの活動が活発化すると言われている。
早めにこの問題の対策を行い、太陽フレアによる瞬間被ばくによるがん発生増加を抑制しなければならない。しかし、太陽フレアからのガンマ線は光と同じ速度で地球の大気上層に到達するのだから、今のパイロット並みの対策しかないのかもしれない。
(太陽フレアが発生したときに乗務していたことが分かったパイロットはしばらく乗務を停止する勤務調整をしているそうである。)
このままでは、がん発生のリスクに関し、最も危ないのは客室乗務員と頻回の一般利用客だけということになるのかもしれない。
6月13日追記
ではなぜ一般人より被ばく量の多い原子力従事者のがんが少ないか、という理由だが、これには2つの理由が考えられる。
ひとつは、ある程度、放射線を浴びている事で、がん抑制遺伝子の活動が活発化し、免疫機能が向上することである。
もう一つは、紫外線消毒と同様、ガンマ線を浴びることで、体内外の細菌が死滅し免疫機能に余裕ができて、前癌状態に対する応答に対応することが容易になると考えられることである。
大都市部郊外でのストレス問題 ― 2023年03月26日 03:30
首都圏での多くの異常な事件の容疑者の出身地域は、都心でも地方でもなく、その中間に位置する、郊外地区の事が多い。
半世紀前に米国に留学した作家、小田実のベストセラー、「何でもみてやろう」でも、 当時の米国の社会的疎外者、ビートと呼ばれたものたちの多くは大都市の郊外地域の出身だったと書かれている。
これは、そのような地域が現代社会で最もストレスフルで疎外感を若者に与え易い地域であるためだろう。
都市の中心部に住んでいるのであれば、様々なイベントや商業施設から、日々、刺激を受け、ストレスも発散され、時代の先端にいると感じられるだろう。
逆に、地方では、豊かな自然の中でストレスフリーで健康的な生活を送ることができる。
しかし、その中間地域では、中途半端な都市化の中で、不自由な生活でのストレスとたまに行く都心の華やかさを見て、疎外感を深める事が多い。
これは競争社会である日米共通の現象なのであろう。
為政者は、郊外地区の若者たちがストレスを溜め込まないよう、重点的に様々な施策を施す必要がある。これを統一地方選での争点にしてもらえれば有り難い。
半世紀前に米国に留学した作家、小田実のベストセラー、「何でもみてやろう」でも、 当時の米国の社会的疎外者、ビートと呼ばれたものたちの多くは大都市の郊外地域の出身だったと書かれている。
これは、そのような地域が現代社会で最もストレスフルで疎外感を若者に与え易い地域であるためだろう。
都市の中心部に住んでいるのであれば、様々なイベントや商業施設から、日々、刺激を受け、ストレスも発散され、時代の先端にいると感じられるだろう。
逆に、地方では、豊かな自然の中でストレスフリーで健康的な生活を送ることができる。
しかし、その中間地域では、中途半端な都市化の中で、不自由な生活でのストレスとたまに行く都心の華やかさを見て、疎外感を深める事が多い。
これは競争社会である日米共通の現象なのであろう。
為政者は、郊外地区の若者たちがストレスを溜め込まないよう、重点的に様々な施策を施す必要がある。これを統一地方選での争点にしてもらえれば有り難い。
原発60年規制は安全性問題か? ― 2023年02月16日 10:42
報道によれば、原子力規制委員会が現有原発の60年超運転を多数決で決めたらしい。
確かに、60年と言っても実際に稼働していたのは30年にも満たないものが多いのだろう。運転期間が安全性にどれだけ影響するのか、いろいろな考え方がある。ここで多数決というのは民主主義の一つの方策ではある。
しかし、物理現象は完全には把握されていないし、当初の30年規制はそれだけの意味があったのであろう。物理現象というのは多数決にはなじまないものである。もう少し個々のプラントの経年劣化の分析を行い、一律に法規制を緩めるのではなく、過去の各プラントの経緯も含めて評価すべきだったのでなないだろうか。
過去の経緯と言えば、プラント設計も安全設計もすべてが大きな影響を受ける放射線被ばく基準が実質米国製のICRP基準に従っているのを最初に見直すべきであろう。
広島・長崎の被ばく者データをベースにICRP基準は作られているが、これは一瞬の被ばくデータの統計処理により得られたものであり、それを1年間(3か月規制もあるが)の規制に適用しているという物理的にも生物学的にも非科学的な規制である。
即ち、時間的に高線量率で被ばくしても、年間線量が基準以内であれば、規制範囲内ということになる。一方、線量率が低い場合は極小線量でも規制に架かる。
これが福島ではがん発生影響が不明で、一方、太陽フレアの瞬間被ばくを受けるCAや航空旅客の白血病の多さに繋がっているのではないだろうか。
至急、この問題を規制委員会には検討してもらいたい。
確かに、60年と言っても実際に稼働していたのは30年にも満たないものが多いのだろう。運転期間が安全性にどれだけ影響するのか、いろいろな考え方がある。ここで多数決というのは民主主義の一つの方策ではある。
しかし、物理現象は完全には把握されていないし、当初の30年規制はそれだけの意味があったのであろう。物理現象というのは多数決にはなじまないものである。もう少し個々のプラントの経年劣化の分析を行い、一律に法規制を緩めるのではなく、過去の各プラントの経緯も含めて評価すべきだったのでなないだろうか。
過去の経緯と言えば、プラント設計も安全設計もすべてが大きな影響を受ける放射線被ばく基準が実質米国製のICRP基準に従っているのを最初に見直すべきであろう。
広島・長崎の被ばく者データをベースにICRP基準は作られているが、これは一瞬の被ばくデータの統計処理により得られたものであり、それを1年間(3か月規制もあるが)の規制に適用しているという物理的にも生物学的にも非科学的な規制である。
即ち、時間的に高線量率で被ばくしても、年間線量が基準以内であれば、規制範囲内ということになる。一方、線量率が低い場合は極小線量でも規制に架かる。
これが福島ではがん発生影響が不明で、一方、太陽フレアの瞬間被ばくを受けるCAや航空旅客の白血病の多さに繋がっているのではないだろうか。
至急、この問題を規制委員会には検討してもらいたい。
統計用言語Rの問題 ― 2023年02月15日 09:56
AIの活用の重要資産であるPythonやRでは、関数のパッケージ化が進んでおり、簡単に複雑な関数を利用できる。
これは非常に便利で時間節約にもなり、通常は使い勝手が良い。
ただ、計算時にエラーが出るとその原因追及が難しいことがある。
現在、Rによりある特殊で複雑な統計解析を行っているが、その際に原因不明なエラーがランダムに発生した。
そのため、使用しているパッケージの解説を読むのだが、難解で悪名高いFACTOR関数や関連する説明部分の十分な分析ができない。どうやら対数関数の真が負になるためのエラーらしいと分かっても、そのデータがそうなっているか、データケースを系統的に作って何度か解析したが、エラーが発生するケースは系統性がないように見える。
いろいろトライしているうちに、実引数を一部削除するとエラーがでなくなることが分かったが、今度はこれまで結果が出ていたケースでの影響係数が微妙にシフトする。
そのシフトがなぜ起こるのかもまだ分析ができていない。
それもこれも、Rでは多くの関数を複雑に取り込み、短いスクリプト行で、非常に高度な分析ができるように言語文法とパッケージ群が作られているためである。即ち、エラーが発生するケースというのはパッケージ作成者も予想しなかった特殊なデータの組み合わせを対象とする場合に生じるということで、意外にも応用範囲が狭いということである。
パッケージ作成者はボランティア的に整備しているので、解説書を更に詳細に整備するのは大変だろうが、もう少し素人でも解読、修正が容易なスクリプトとして公開していただけると有難い。また、当該パッケージの利用上のQ&Aにおいては、コンサルタント料をとっても良いようにも思う。
勿論、これは贅沢な悩みであるが、AI技術進展のためにも配慮していただけると有難い。
これは非常に便利で時間節約にもなり、通常は使い勝手が良い。
ただ、計算時にエラーが出るとその原因追及が難しいことがある。
現在、Rによりある特殊で複雑な統計解析を行っているが、その際に原因不明なエラーがランダムに発生した。
そのため、使用しているパッケージの解説を読むのだが、難解で悪名高いFACTOR関数や関連する説明部分の十分な分析ができない。どうやら対数関数の真が負になるためのエラーらしいと分かっても、そのデータがそうなっているか、データケースを系統的に作って何度か解析したが、エラーが発生するケースは系統性がないように見える。
いろいろトライしているうちに、実引数を一部削除するとエラーがでなくなることが分かったが、今度はこれまで結果が出ていたケースでの影響係数が微妙にシフトする。
そのシフトがなぜ起こるのかもまだ分析ができていない。
それもこれも、Rでは多くの関数を複雑に取り込み、短いスクリプト行で、非常に高度な分析ができるように言語文法とパッケージ群が作られているためである。即ち、エラーが発生するケースというのはパッケージ作成者も予想しなかった特殊なデータの組み合わせを対象とする場合に生じるということで、意外にも応用範囲が狭いということである。
パッケージ作成者はボランティア的に整備しているので、解説書を更に詳細に整備するのは大変だろうが、もう少し素人でも解読、修正が容易なスクリプトとして公開していただけると有難い。また、当該パッケージの利用上のQ&Aにおいては、コンサルタント料をとっても良いようにも思う。
勿論、これは贅沢な悩みであるが、AI技術進展のためにも配慮していただけると有難い。
統計用ソフトR及びRStudioの利用説明書 ― 2022年12月27日 05:21
この本が詳細で且つ実用性が高く分かりやすかった。
Rクックブック 第2版
https://www.oreilly.co.jp/books/9784873118857/
しかし、この本は電子本でも4K円近い。
英語版なら
https://rc2e.com/
で無料で読める。しかも目次のリンクスキップができる。どうしようか。
Rクックブック 第2版
https://www.oreilly.co.jp/books/9784873118857/
しかし、この本は電子本でも4K円近い。
英語版なら
https://rc2e.com/
で無料で読める。しかも目次のリンクスキップができる。どうしようか。
第5回目接種ワクチン(ニ価mRNAワクチン)とBQ株感染 ― 2022年12月26日 20:14
先日新聞で紹介された、コロンビア大学とミシガン大学の論文の概要は以下のようなものだった。
なお、これらの結果は全て試験管内での実験結果である。
SARS-CoV-2 の最近の BQ および XBB 亜変種は、二価mRNAワクチンを複数回受けた人または予防接種を受けており、以前にオミクロン感染症にかかったことがある人から採取されたものでも、中和抗体を回避した。
さらに、 BQと XBB はベブテロビマブに対し、完全に耐性が見られた。
以上の所見は、これらの変異株に対して有効な認可された治療用抗体はないということを意味している。
重要な点は、
• BQ.1、BQ.1.1、XBB、および XBB.1 は、これまでで最も耐性のある SARS-CoV-2 変異株である。
• 二価ワクチンのブースター接種者からのものを含め、血清中和度は著しく低下した。
• すべての臨床用モノクローナル抗体は、これらの変異ウイルスに対して不活性化された。
• これらの変異株の ACE2 親和性は、親株と同様だった。
―ーということは、今回のワクチンの対外試験では、感染予防効果が見られなかったということを意味している。
但し、臨床試験をする必要があること、従来、コロナワクチンにより、重症化や入院の事態を防いできたという事実は重要であるとも強調している。
即ち、今後、感染は拡大するが、ワクチン接種による重症化防止効果はこれらの変異株に対しても期待できるということである。
感染者数を抑制するには、新しい変異株に対するワクチン開発が望ましいが、従来ワクチンのブースター接種も重症化予防上は重要ということである。
なお、これらの結果は全て試験管内での実験結果である。
SARS-CoV-2 の最近の BQ および XBB 亜変種は、二価mRNAワクチンを複数回受けた人または予防接種を受けており、以前にオミクロン感染症にかかったことがある人から採取されたものでも、中和抗体を回避した。
さらに、 BQと XBB はベブテロビマブに対し、完全に耐性が見られた。
以上の所見は、これらの変異株に対して有効な認可された治療用抗体はないということを意味している。
重要な点は、
• BQ.1、BQ.1.1、XBB、および XBB.1 は、これまでで最も耐性のある SARS-CoV-2 変異株である。
• 二価ワクチンのブースター接種者からのものを含め、血清中和度は著しく低下した。
• すべての臨床用モノクローナル抗体は、これらの変異ウイルスに対して不活性化された。
• これらの変異株の ACE2 親和性は、親株と同様だった。
―ーということは、今回のワクチンの対外試験では、感染予防効果が見られなかったということを意味している。
但し、臨床試験をする必要があること、従来、コロナワクチンにより、重症化や入院の事態を防いできたという事実は重要であるとも強調している。
即ち、今後、感染は拡大するが、ワクチン接種による重症化防止効果はこれらの変異株に対しても期待できるということである。
感染者数を抑制するには、新しい変異株に対するワクチン開発が望ましいが、従来ワクチンのブースター接種も重症化予防上は重要ということである。
統計ソフト用言語Rの使用説明書 ― 2022年12月25日 07:22
Rで書かれた関数を用いた統計処理の修正の必要に駆られ、添付されていたR言語のスクリプトを解読しようしてRのいろいろな日本語書籍を読んでみた。しかし、記載されているスクリプトのパターンに相当する記述が見つからない。ネットで英語の解説書も調べまくってみた。
最近やっと、下記のサイトにあることが分かった。
https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf
そこの最初から20ページ目付近に詳細に懸案だったスクリプトの引数に関わる特殊パターンの説明が記載されていた。
また、オブジェクトとクラス、メソッドの関係などR初心者が陥る混乱を回避できるような親切な解説もある。
なんとそれは、Rのインストール後に表示されるGUI画面のヘルプの下にリンクされていた入門者用使用マニュアルの解説書と同じものなのである。そのヘルプは英語版なので内容は当然日本語で出版されているRの入門書に含まれているものと思い込んでいた。
先入観が無駄な時間を生んでしまうという例だった。
RやPythonなどオブジェクト指向言語において、ちょっと特殊なパターンのスクリプトに出くわした場合には、英語版であってもヘルプを頼ったほうが早いということでる。おそらく、Rの日本での専門家はヘルプに出ているような説明を翻訳して出版するようなことをしなかったのであろう。理由はよくわからない。
最近やっと、下記のサイトにあることが分かった。
https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf
そこの最初から20ページ目付近に詳細に懸案だったスクリプトの引数に関わる特殊パターンの説明が記載されていた。
また、オブジェクトとクラス、メソッドの関係などR初心者が陥る混乱を回避できるような親切な解説もある。
なんとそれは、Rのインストール後に表示されるGUI画面のヘルプの下にリンクされていた入門者用使用マニュアルの解説書と同じものなのである。そのヘルプは英語版なので内容は当然日本語で出版されているRの入門書に含まれているものと思い込んでいた。
先入観が無駄な時間を生んでしまうという例だった。
RやPythonなどオブジェクト指向言語において、ちょっと特殊なパターンのスクリプトに出くわした場合には、英語版であってもヘルプを頼ったほうが早いということでる。おそらく、Rの日本での専門家はヘルプに出ているような説明を翻訳して出版するようなことをしなかったのであろう。理由はよくわからない。
WCアルゼンチン―フランスPK戦Rによる失敗確率計算結果 ― 2022年12月20日 10:29
18日の記事に記載したように、過去のWCデータから、アルゼンチンーフランス戦はPK戦になる確率が高いことはある程度予測できたが、では、PK戦ではどちらが勝つと予想できただろうか。
すでに結果が出ているので面白みは無いが、ポアソン回帰分析を用いて、過去のWCデータから計算してみた。
ただし、PK戦そのものの回数が少なく、また、あまり古いデータも使えないので、1982年以降2018年までの両国のWCでのPK戦データを用いた。
出典はhttps://worldcdb.com/
である。
ポアソン回帰分析では、生起確率の少ない事象を対象とするので、ここでは、PK失敗数を調査した。また、延長戦までの合計得点が選手疲労をよび失敗確率が上がるだろうことを仮定し、失敗数は合計得点の関数であると仮定した。
関連するデータを整理すると以下のようになる。
本戦合計得点 PKシュート数 失敗数
(point120m)
アルゼンチン 0 9 0
1 8 2
2 4 0
フランス 0 4 1
1 4 1
3 4 1
データ数が少なすぎるので信頼性はないが、一応、統計ソフトRでは両国の失敗確率が計算できるので、上記データで計算してみた。
結果は以下の通りである。
アルゼンチン
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.7081 1.1547 -2.345 0.019 *
point120m 0.4055 0.9128 0.444 0.657
フランス
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.386e+00 9.129e-01 -1.519 0.129
point120m -1.923e-16 7.071e-01 0.000 1.000
(注)本データの意味等は11月23日記載テキスト参照。
本データより、両チームの本戦得点3点における4本シュート時の予測失敗数を計算すると、
アルゼンチン:0.900
フランス :1.000(平均値と同じ)
となった。
もう少しデータ数が多ければ信頼性があがるだろうが、それでもWCの過去データの統計処理によりアルゼンチン優位という予測は出来たはずである。
すでに結果が出ているので面白みは無いが、ポアソン回帰分析を用いて、過去のWCデータから計算してみた。
ただし、PK戦そのものの回数が少なく、また、あまり古いデータも使えないので、1982年以降2018年までの両国のWCでのPK戦データを用いた。
出典はhttps://worldcdb.com/
である。
ポアソン回帰分析では、生起確率の少ない事象を対象とするので、ここでは、PK失敗数を調査した。また、延長戦までの合計得点が選手疲労をよび失敗確率が上がるだろうことを仮定し、失敗数は合計得点の関数であると仮定した。
関連するデータを整理すると以下のようになる。
本戦合計得点 PKシュート数 失敗数
(point120m)
アルゼンチン 0 9 0
1 8 2
2 4 0
フランス 0 4 1
1 4 1
3 4 1
データ数が少なすぎるので信頼性はないが、一応、統計ソフトRでは両国の失敗確率が計算できるので、上記データで計算してみた。
結果は以下の通りである。
アルゼンチン
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.7081 1.1547 -2.345 0.019 *
point120m 0.4055 0.9128 0.444 0.657
フランス
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.386e+00 9.129e-01 -1.519 0.129
point120m -1.923e-16 7.071e-01 0.000 1.000
(注)本データの意味等は11月23日記載テキスト参照。
本データより、両チームの本戦得点3点における4本シュート時の予測失敗数を計算すると、
アルゼンチン:0.900
フランス :1.000(平均値と同じ)
となった。
もう少しデータ数が多ければ信頼性があがるだろうが、それでもWCの過去データの統計処理によりアルゼンチン優位という予測は出来たはずである。
WC2020フランス―アルゼンチン勝率計算予測 ― 2022年12月18日 15:22
日本戦の勝率予測と同様の手法でフランスとアルゼンチンの勝率計算を行った。
うすいよしき氏のWC情報データサイト
https://note.com/yeahmen/n/n0e7b27f1a599
によれば、最近4回のワールドカップでの一試合当たり平均得点は
フランス 1.3575点
アルゼンチン 1.3675点
で、近接し、より最近の2大会では、
フランス 1.80点
アルゼンチン 1.335点
直近の2018年大会では
フランス 2.00点
アルゼンチン 1.50点
で差は拡大している。
あるサッカーチームの平均得点をλとすると、任意の1試合でx点入る確率P(x)は次式のポアソン分布で表されることが経験的に分かっている。(11月23日のブログ記事参照)
P(x)=exp(-λ)*λ^x/x!
この式を用いて、フランスとアルゼンチンの勝敗確率を評価した。
結果は、図にしめすように、最近4大会のデータを用いた場合、
フランスとアルゼンチンの勝率は共に約37%で、残りはポアソン分布上はドローの確率となり、PK戦の確率が高い。
一方、最近2大会及び直近大会のデータを用いると、フランスの勝率は約約47%、アルゼンチンは約28%でフランス有利という結果になった。
クロアチアに勝ったメッシのアルゼンチンを応援したいところだが、フランスにも知人がいる。どうなるか。寝ないで声援を送りたい。
うすいよしき氏のWC情報データサイト
https://note.com/yeahmen/n/n0e7b27f1a599
によれば、最近4回のワールドカップでの一試合当たり平均得点は
フランス 1.3575点
アルゼンチン 1.3675点
で、近接し、より最近の2大会では、
フランス 1.80点
アルゼンチン 1.335点
直近の2018年大会では
フランス 2.00点
アルゼンチン 1.50点
で差は拡大している。
あるサッカーチームの平均得点をλとすると、任意の1試合でx点入る確率P(x)は次式のポアソン分布で表されることが経験的に分かっている。(11月23日のブログ記事参照)
P(x)=exp(-λ)*λ^x/x!
この式を用いて、フランスとアルゼンチンの勝敗確率を評価した。
結果は、図にしめすように、最近4大会のデータを用いた場合、
フランスとアルゼンチンの勝率は共に約37%で、残りはポアソン分布上はドローの確率となり、PK戦の確率が高い。
一方、最近2大会及び直近大会のデータを用いると、フランスの勝率は約約47%、アルゼンチンは約28%でフランス有利という結果になった。
クロアチアに勝ったメッシのアルゼンチンを応援したいところだが、フランスにも知人がいる。どうなるか。寝ないで声援を送りたい。
最近のコメント