AIとの付き合い方2026年05月02日 11:09

 様々なAIツールが世間を騒がせている。
実際、利用すると便利で簡単に答えを出してくれる。分かった気にさせてくれることが多い。コスパ,タイパは最高だ。

 ただ、問題はその信頼性だ。このブログでもさんざん書いたが平気でうそをつく。人間よりは嘘をつく頻度は低いかもしれないが、自分が良く分からない分野の知識を仕入れようとするために使っているので、後で致命的な損害を受ける可能性もある。

 従って、最近はAIの回答を他人のために使用するときはその旨明示してから使用することにしている。

 理想的にはAI各社がソースを公開し、そのアルゴリズムをチェックできる体制を作れればいいのだが、現状では無理だろう。例えば自分で生成AIコードを開発できればいいのだが、実際にはデータ入手も含めまず可能性はない。

 単純なプログラム作成をAIに頼むときはその動作確認を実際にやってから利用するなどのチェックが必要だ。

 Pythonなどの公開システムを使うときにはあまり一般的でないモジュールを利用するとバグがあるかもしれないのでその前提で利用する必要がある。

 モンテカルロコードのように誤差幅を考慮して使うことも重要だ。

結論として、不安のあるAI回答を使用する場合には、それが間違っていても、結果が致命的にならない範囲で利用するよう心掛けなければならない。従来の人主体の仕事でも致命的な事象が生じないよう注意していたはずである。それと同じことだが、便利なだけにチェックをせずに使用してしまうことが増える。

逆に簡単なことでもAIの回答には一定のミスやバグが入ることを前提により慎重な対応とチェックが必要だということになる。

被ばく影響が2次曲線だとするとどうなるか2026年04月22日 03:40

 RERFのLSS(Life Span Study)-2009研究のまとめが下記論文に示されている。
Preston, Dale L. et.al, "Solid cancer incidence among the LSS of atomic bomb survivors: 1958–2009",Radiation Research 187(2017)

この論文では広島・長崎の被曝生存者の長期追跡調査結果を用い、被ばく量とがん発生率の関係を統計学的に明らかにしようとしている。その結論として、

 男性被ばく者の被ばく量と年間がん発生率は2次式の関係が良くフィットするーと記されている。

 即ち、ERR(Excess Relative Risk):被ばくによるがん発生過剰相対リスクは以下の式で良く表されると結論したのである。

 ERR=a*R*R+b*R・・・・・・・・(1)
   R:直腸線量(Gy)
   a,bはfitting係数

この意味するところは、国際放射線委員会(ICRP)が主張してきたLNT(Linear Non-Thread)仮説の否定でもありうる。LNT仮説とは線量がいくら低くても高線量被ばくと同様の直線的関係があり、被ばく影響がないというしきい線量は存在しないという仮説であり、これが各国の被ばく基準の設定に採用されている。

 (1)式は一見、Rが0ならERRが0となり、LNT仮説と矛盾しないように思えるが、そうだろうか。

 2次式で定数項がないという事象はめったに出会わない。
即ち、仮に(1)式を

 ERR=a*R*R+b*R+c ・・・・・・・・(2)

の一般的な2次式にしたらもっと良く調査データにfitすると考えるのが常識的であろう。なぜこれをしなかったのかーLNT仮説との矛盾が明らかになるためだろう。なぜなら(1)式よりも(2)式がよりよくfitするということはRが0に近い範囲でERRが負になるということが明らかになるということでもある。これは生物学的にはホルミシス効果と言われているが、小線量では被ばく影響がないという以上に健康上の好影響もあるという仮説である。

 この(2)式が良くデータに合うかどうかを上記論文と同様の手法を用いて第3者が検証しようとしても現在は不可能に近い。

 なぜなら、RERFは元の被ばく者調査データLSS-2009データを非公開扱いにしているためである。

 この非公開扱いとしている真の理由はこのようなLNT仮説を否定するような評価が発表されることを恐れたためとも考えられる。是非、RERFはこの非公開扱いを撤回してもらいたい。LNT仮説を最初に主張したICRPは、石油と自動車産業に密着しているFORD財団が主たるスポンサーであることを自らのホームページで明らかにしている。仮にRERFがスポンサーである米国政府の意向を汲んだものならなおさらこのエネルギー危機の時代に庶民に対する裏切り行為とも見られかねないのだから。

広島原爆の入市被爆者70年後の体内からウラン検出2026年04月20日 04:32

4/19のNBC長崎放送の報道によると「広島で入市被爆し70年後に亡くなった女性の体内から、死後原爆由来の放射線が検出され、さらにその周辺で「デスボール」と名付けられた細胞の空洞が確認されたことが長崎大学の研究でわかった」そうである。

 この患者は爆発の瞬間は市外におり、その2日後に広島市内に入り、爆発ののち上空から降下したウランの燃え残りを吸入したと考えられる。原爆内の約9割のウランは大気中に核分裂しないまま拡散したと言われているので十分ありうる想定である。

 広島の放射線影響研究所(RERF)は、原爆による被ばく者のがん発症者の調査データを独占的に管理しており、各国の被ばく制限に関わる放射線被ばく基準のベースとなっているLSS(LifeSpanStudy,寿命研究)を長年行っている。最近のLSS研究報告は2009年になされている。これはLSS-2009と呼ばれている。

 このLSS-2009研究では、爆発の瞬間に市外にいた住民は被ばく者ではなく、NIC(NotInCity)と分類され、市内にいた被ばく者のがん発症例のコントロール(比較対象者)として扱われている。

 問題はこの患者がLSS-14でがん発症事例に含まれているのかどうかで被ばくによるがん発症確率が変わることになる。

 現在LSS-2009データは、RERFから非公開の扱いになっている。なぜそうしたかは不明確なままである。仮に一事例であれ、この患者の事例が現在の法律にどのように反映されているのか第三者が検証する手段は断たれている。

 RERFは日米両国政府の資金で運用されているのだが、このような事例による現在の法規制基準への影響確認のためにも、LSSデータの速やかな再公開が望まれる。

小説国宝で読み解く長崎原爆被爆データの特異性2026年01月01日 21:20

 話題の映画「国宝」の原作、吉田修一著「国宝」朝日文庫のP.50 に主人公喜久雄の恋人春江とその母親との3人の会話が描かれている。喜久雄が母親に対し、「3人でスパスパ吸えば(タバコは)直ぐなくなるさ。」といっている。昭和40年ごろの長崎の花街での会話である。

 被ばく者データで疑問に思っていたのは女性の喫煙率の高さである。喫煙はがん発生の主要因のため、喫煙効果と被ばく効果が混在する被ばく者発がんデータでは喫煙履歴を詳細に調べ、非喫煙者の発がんデータとの比較から放射線被ばくの影響を分離するのだが、喫煙者割合が多ければ、同じ発がん率であっても放射線影響が大きいと分析されることになる。

 放射線影響協会の公表した被ばく者関連データLSS-14の中に両都市の女性被ばく者の喫煙分類データが含まれている。その値を集計すると
(1)人数
         喫煙状況不明者 非喫煙者 過去喫煙者 現在喫煙者
長崎女性   8615人      6048人   5331人   9954人
広島女性   11661人     7585人  12588人   51787人

(2)人数割合(%)
         喫煙状況不明者 非喫煙者 過去喫煙者 現在喫煙者
長崎女性   28.8%      20.2%   17.8%   33.2%
広島女性   22.5%      14.7%   24.3%   38.5%

となっている。

 即ち、長崎女性調査者のうち、喫煙経験者は約51%であるが
広島女性は約63%であり、10%以上大きい。

 そこで、小説「「国宝」の背景の話となるのだが、もともと長崎は工場が多く、花街も大規模だったので、女性喫煙者割合が多いのが自然だと思われる。この小説の喜久雄や春江などの会話の描写は納得できる。戦前は進歩的な女性ほど喫煙していたようなので、長崎のほうが一般的な都市よりも喫煙者比率が多いと思われる。

ではなぜ、長崎女性で喫煙データが不正確になったのか。

 それは、長崎の若年層の多さだと考えられる。未成年者が法律に違反しているという喫煙申告をするものだろうか。それも女性である。「国宝」の菊枝のように未成年者でも喫煙するものは実際には当時多かったが、その通り申告することは勇気がいる。上記の表で喫煙状況不明者が長崎のほうが約6%多いのは未成年者が多かったということの傍証でもある。

 同じRERFのデータを用いて、20歳未満の女性比率を比較すると

       20歳未満/全調査対象女性
長崎女性:15473人/29948人(51.7%)
広島女性:22459人/51787人(43.4%)
 
となり、長崎女性が約10%未成年者割合が大きい。

 喫煙者比率が、実際には、長崎の女性が多いのに、上記のような理由で広島より小さめになるようにLSS-14データができていたとすれば、がん発生に対する被ばくの寄与が大きくなり、詳細な統計解析の結果、広島女性に比べ、長崎女性のほうが被ばくによる発がんリスクが大きくでることになる。(下記参考記事1参照)

 更に、長崎と広島の原爆のガンマ線スペクトル特性差から女性特有の乳がん発症率の差も加わるのである。(下記参考記事2参照)

 その結果、ほとんど被ばくしていない女性も発がんリスクが大きくなり、放射線に対する発がんリスクの閾値が現れないという結果になったと考えられる。これが各国政府が採用している国際放射線防護委員会ICRPのベースデータになっているが、福島の事故被害者が有害無益な避難を強いられているとすれば、大きな問題だろう。

(参考記事1)
本ブログ2024年8月7日、8月8日、10月18日、12月6日、2025年6月5日記事
(参考記事2)
本ブログ2025年12月16日記事

核を保有したら貧困国になるワケ2025年12月21日 06:24

2025年08月02日の本ブログ記事「核保有で軍事費を安くできるという幻想」でも記載したが、某首相補佐官は核保有の困難さと不利益について理解ができていない。それは一部マスコミと国民も同じだろう。

整理すれば核兵器開発には以下の課題があり、これを行えば日本は北朝鮮やパキスタン以下の貧乏国になり果てるということである。

(1)日本には核兵器に使えるプルトニウムはない。
(2)核兵器を運搬できる手段もない。
(3)核兵器の小型化技術もない。
(4)他国から小型化技術を入手する方法もない。

独自にこれらの課題を解決しようとすれば長期かつ膨大な予算が必要になり、諜報能力のない日本国は北朝鮮以上の貧困国になる。核兵器を保有しても経済的な利益はゼロに等しいうえ、その維持には膨大な軍事費が必要になる。以下、上記の課題の詳細を示す。

(1)プルトニウム問題
 一部国民には日本がプルトニウムを保有しているので原爆は簡単に作れるとの誤解がある。ところが実際には日本の保有しているプルトニウムは原爆にはなりえない組成のものである。これは軽水炉で生成されるプルトニウムの同位体の中のプルトニウム-240が自発核分裂をすることに起因する。プルトニウム原爆が爆発するにはプルトニウム-240比率をプルトニウム全体の3%以下にする必要がある。(米DOEの核兵器プルトニウム組成基準)
 原爆は超臨界(実効増倍率が2以上)になった後に中性子を投入することで爆発するのであるが、自発核分裂により発生する中性子が超臨界になる前に自然に発生するため、核分裂による熱膨張のためすぐに未臨界になり爆発できないのである。
 しかし、軽水炉で生成されるプルトニウム-240比率は20%以上であり、核兵器用のプルトニウムを生産するには新たな原子炉を建設し、長期間運転する必要がある。米国ワシントン州には発電しないプルトニウム生産専用の原子炉が6基ほどあるが、これを日本が国家予算で開発しようとすれば十兆円以上の費用を超える。
 広島型の濃縮ウラン原爆はどうかと言えば、ウラン-235を93%以上に濃縮する必要があり、軽水炉ウラン(ウラン-235約5%以下)より20倍以上の大きい濃縮プラントが必要になるため、米国でもこの開発はあきらめ、長崎型のプルトニウム原爆に絞っているのである。

(2)運搬手段問題
 運搬手段は核兵器の実用化に欠かせない。自国においてあるだけではかえって自分自身が危ない。暴発の危険があるためである。現在、実用化されている運搬手段はICBMと原潜である。これらはいずれも日本は保有していない。大型輸送機はあるが、他国からのロケット攻撃で国内で落下する可能性のほうが大きい。ではICBMの開発にどの程度の費用が掛かるのか、H-8型ロケットで苦労しているJAXAに聞いても答えられないのではないだろうか。北朝鮮のような貧困国になる覚悟が必要だろう。原潜も米国が核兵器つきで日本に渡すとは考えられない。

(3)小型化技術問題
 仮にICBMや原潜が開発できたとしても原爆を小型化できなければ乗せることはできない。現在、米国やロシアの原爆はテラー型という小型水爆とプルトニウム原爆を組み合わせた精密な中性子制御技術を用いて小型化を図っているが、その詳細は機微技術そのものである。自主開発にはテラー並みの天才と高度なIT技術が必要である。現在の日本にはそのような人材も技術も見当たらない。国立大学の予算を削らざるを得ない日本政府にその能力を期待することは幻想だろう。

(4)他国からの導入
 北朝鮮はその諜報能力の高さでこの技術を何処かから入手したと思われるが、日本の諜報能力では世界最低レベルである。
 現在の日本に核技術を提供してくれる国がどこかにあるだろうか。同盟国であったとしても、核兵器を安全に維持することに手間と技術と費用が掛かることは常識である。
 そんな費用があるのならそれを我々核保有国に提供してくれと日本に要求するはずだ。

 核保有の能力も余力もない日本が核保有と言い出すことは、北朝鮮のような国が一つ増えるだけであり、非現実的でどこの国にとっても利益にならないことである。

長崎の女性被ばく者だけがしきい値が出ないワケ2025年12月16日 09:56

被ばく者の発がん状況データは日米政府が出資した原爆影響研究所(RERF)が多くの研究報告書や調査データを公開してきた。その中にLSS-14と呼ばれる2014年の報告があり、比較的詳細なデータを提示してきた。

これを統計分析すると、長崎の女性では、どんなに低線量でも発がんリスクは.正である。広島の男性女性、長崎男性にはしきい値が現れtgているのに。(本ブログ2024年12月06日記事等)

ここではRERFのベースデータから非喫煙者に限定して固形がん発がん症例数と観察対象人年の総計をもとめ、発がん症例数を人年で割った値(発がんリスク比)を原爆の被ばく線量領域ごとに求めた。このデータベースでは、被ばく者の被ばく線量は結腸における線量で整理されている。

下記表で縦軸は各線量領域の最大値(最小値は0)、横軸は固形がん症例数を観察人数と観察年数の積で割った値の各都市ごと、性別ごとの値である。

結腸線量範囲 発がん率(solid/pyr)
(mGy)  広島_男性 長崎_男性 広島_女性 長崎_女性
 0~5   0.0105   0.0105   0.0074   0.0071
 0~20   0.0103   0.0105   0.0074   0.0072
 0~40   0.0102   0.0103   0.0074   0.0073
 0~60   0.0104   0.0104   0.0075   0.0074
 0~80   0.0104   0.0103   0.0075   0.0074
0~100   0.0103   0.0102   0.0075   0.0074
0~125   0.0103   0.0102   0.0075   0.0074
0~150   0.0102   0.0102   0.0075   0.0074
0~175   0.0103   0.0101   0.0076   0.0074
0~200   0.0103   0.0100   0.0076   0.0075
0~250   0.0104   0.0100   0.0076   0.0075
0~300   0.0104   0.0099   0.0076   0.0075
0~500   0.0104   0.0102   0.0077   0.0076
0~750   0.0103   0.0100   0.0078   0.0077
0~1000   0.0103   0.0102   0.0078   0.0078
0~1250   0.0104   0.0104   0.0079   0.0078
0~1500   0.0104   0.0104   0.0079   0.0079
0~1750   0.0104   0.0106   0.0079   0.0079
0~2000   0.0104   0.0105   0.0079   0.0079
0~2500   0.0104   0.0106   0.0080   0.0079
0~3000   0.0105   0.0107   0.0080   0.0079
0~3400   0.0105   0.0107   0.0080   0.0079     

本表から分かることは,両市の男性及び広島女性についてはほぼ被ばくしていない0~5mGyでの発がん率よりも小さい値となる線量領域があるが、長崎女性だけは全て0~5mGyでの発がん率よりも大きいことである。
即ち、低線量であるほど発がんリスクが小さくなっており、発がんにおける被ばく線量のしきい値がないということと整合している。

これらの要因により、国際放射線防護委員会の被ばく基準に関する各国政府への勧告としては、安全側にしきい値無し仮説(どんなに低線量でも発がんリスクがある)が採用され、福島事故での避難区域設定でも用いられた。

なぜこうなるかについてはいろいろな考え方があるが、以下の二つの要因が効いていると思う。

(1)広島と長崎の原爆の構造差
(2)男女の発がん臓器と原爆線源位置の関係

(1)については、長崎の原爆では、発がんの主要因と考えられる即発ガンマ線のエネルギー分布が高エネルギー側に偏っていることが特徴となっている。これはプルトニウム原爆のため、爆縮装置という熱膨張を防ぐ機構が劣化ウラン金属でできており、プルトニウムの爆発により発生する中性子がその劣化ウランと反応して大量のガンマ線が発生するためである。(RERFの線源評価資料DS-86、p.43)

(2)については、女性では乳がん比率が大きいと推定されるが、これが長崎女性のみ特異な結果になっている主要因と考えられる。
 即ち、LSS-14ではデータベースの発がん発症数は各被ばく者の結腸線量ごとに整理分類されていることが一因となっている。
 胸部と結腸部との距離は、男性においてがん発生例数で多いと考えられる前立腺や胃と結腸部の距離に比べ長い。高エネルギガンマ線ではガンマ線の減衰が大きいので(1)のような長崎型原爆では、被ばく線量の実効的な減衰比が広島型原爆の場合よりも大きくなると考えられる。このため、体内の透過距離が長い結腸で評価した場合、胸部の線量は結腸線量よりかなり大きな線量を浴びることになる。
 原爆のガンマ線は上方から地上のヒトを照射するのである。高エネルギーガンマ線の場合には減衰比の小さい低エネルギーガンマ線よりもその差は大きい。広島女性に比べ長崎女性は見かけ上(結腸線量で)低線量であっても乳がんなどの固形がんがより多く発生することになる。
このような理由で長崎女性でのしきい値が生じにくくなったと考えられる。

化学の曖昧さを克服する2025年11月26日 05:38

化学は高校以来あまり好きにはなれなかった。

亀の子記号の複雑な結合と物質名の関係をイチイチ記憶する気になれなかったし、その結合の仕方に法則性も感じられなかったからである。

また、酸性―アルカリ性を表すpHがなぜ0から14までなのかという疑念も試験嫌いな私の心の奥でトラウマのように渦巻いていた。(大げさすぎるか?)

その化学の曖昧さを最近受け入れることができるようになった。そのきっかけは放送大学のインターネット授業の「初歩からの化学」(講師安池 智一放送大学教授、鈴木 啓介東京工業大学栄誉教授)である。

その第3回授業に化学結合を統一的に説明するという内容の講義があり、その中で以下のような説明がある。

(1)元素ごとに電気陰性度という電子との親和力を示す指標があり、その電気陰性度の差の絶対値が二つの元素の結合の種類と関係するというものである。

各元素の電気陰性度の差の絶対値が

0~0.4なら共有結合
0.4~2.0なら極性共有結合
2.0~4.0ならイオン結合

ということになっている。この数値の差も曖昧であるし、結合の区切りも曖昧なのだが、ポイントは結合の原因である。これが第2回授業の解説でもあるように量子論で説明されるものだからである。

即ち、量子論のように確率的な存在であるのが電子の実態であると理解(承服)できれば、その曖昧さ、電子のやり取りを通した結合の様態の曖昧さも受け入れられる(と思い)明確さを諦められる。

このような理解で化学の曖昧さを克服したのであった。

瞬時少量暴露と長期少量暴露の違い2025年09月06日 08:45

 暴露とはある外部環境に対し、生体がさらされた場合に影響されることをいう。

 その外部環境は何でもよいが、ここでは飲食物と放射線を取り上げる。

 飲食物の中には薬も含まれる。医食同源ともいうように、体内に摂取するあらゆる物質は飲食物である。

 一般に薬は、摂取間隔に厳密な時間間隔を設定し、一度に大量摂取しないように制限されている。これは、たとえ健康に良いといわれる飲食物であっても、瞬時に大量摂取することで悪影響を及ぼすことがあるためである。

 わかりやすい例でいえば、醬油を一度に2リットル飲むと、死亡することがある。酒の一気飲みと同じである。しかし、醤油も毎日少量摂取することで、健康を維持できる。

 紫外線はどうか。紫外線は適度に毎日浴びることで、ビタミンDが体内に生成され、健康維持に役立つが、紫外線発生器で強力な紫外線を浴びれば瞬時であってもがん発生リスクは上昇する。

 では放射線はどうか。これも紫外線や飲食物と同様なのではないだろうか。
 広島・長崎の被ばく者のがん発生リスクはある被ばく線量以上では明らかに増加している。
 原爆被ばくは瞬時(1マイクロ秒以下)の被ばくである。爆発時間は放射線影響研究所の線源評価報告書DS02に示された値である。

 瞬時被ばくの例としては、年に数回起こる太陽フレアの発生時の瞬時X線被ばくがある。この瞬時被ばくは光速で太陽フレア発生後地球上空に到達し、宇宙飛行士はX線被ばくを受ける。(谷口義明「太陽と太陽系の科学」(放送大学出版会)p.32)

一方、空気によるX線の減衰は減衰係数μと透過する距離dの積の指数関数として表せる。

 I=Io×exp(-μ・d)

μは空気の全吸収係数で約1.08㎝2/g(プライス、西口監修、関野訳、「放射線計測」、(コロナ社)、p.29)であり、密度を乗じることで単位長さ当たりの減衰係数に出来る。

各コードの空気密度から減衰係数を単位計算して求めると

高度      密度 ρ (kg/m3) μ (/cm)
Sea level (0 km)    1.225    2.21E-4
10 km (ジェット巡航高度) 0.4135   7.45E-5
100km 1.0E-7 1.80E-16
200km             2.0E-9        3.6E-8
400 km (ISS付近)  1.0E-12   1.80E-11

となる。ここでE-4は10のマイナス4乗を示す。

 透過中の平均密度をその平均高さでの密度とし、これを上式を用いて各位置間の減衰を求めると、
ISS(国際宇宙ステーション)でのIをIoとすると
I(10㎞)≒Io
I(海水面)=I(10㎞)*3.57E-71

となり、ISS高度とジェット巡航高度では差は殆どない。
一方、海面レベルでのジェット巡航高度に対する比率は3.57E-71倍 となり、大きく減衰するのである。

 大気圧は地表で1kg/cm2だから鉛の比重を10g/cm3とすると空気が鉛厚さで1m程度の遮へいと同等の効果となる。

 これが8月25日の記事で書いた女性客室乗務員(CA)のがん発生率が一般人(海面レベルで殆どを過ごす女性)の3倍程度(下記サイト)になる理由だと考えられる。

https://pubmed.ncbi.nlm.nih.gov/29940975/

しかし、瞬間被ばくはCAや頻回高空旅行客だけの問題でも、被ばく者だけの問題でもない。特に日本人は医療被ばくで瞬間被ばくを受ける機会が多い。

 それもX線撮影が多い。CTやがん治療は瞬間ではなく、数分から数時間かけた被ばくだが、X線撮影だけは数μ秒の瞬間被ばくである。

 もちろん、医療での被ばく量を低減する努力は行われているし、総線量に対する制限は満足している。

 しかしそれは年間総線量に対する制限値である。瞬間被ばくはそれでは規制対象にならない単位時間当たりの被ばく線量である。 年間総線量制限は満足していながら、数マイクロ秒で被ばくする高線量率被ばくなのである。現在の国際放射線委員会(ICRP)勧告による法規制には線量率に対する規制条件はない。即ち、海外旅行者や頻回X線撮影を受ける人々に対する瞬時被ばくによるがん発生リスクの防護措置はなされていない。
 一方、福島事故などの長時間被ばく(年間)被ばくに対する基準は厳しく存在している。これが放射線被ばく基準の矛盾した現状であり、21世紀を生きる我々、即ち航空機利用や医療被ばくで瞬間被ばくを受ける我々にとって、無益な規制を強いていていることになる。

 なぜなら、福島事故のような年間数百mシーベルトレベルの被ばくには人類の歴史の中で免疫が出来ている。P53など数十のDNA修復遺伝子が知られている。

 しかし、DNA修復は細胞内の化学反応であり、時間がかかる。瞬間的に大量に被ばくを受けると免疫機能が間に合わない。

 原爆も上空での太陽フレア被ばくもX線撮影も20世紀になって初めて人類が経験する被ばく形態なので、免疫がないということである。

ポアソン解析での母数と説明変数の関係分析2025年08月12日 07:03

 あるRのスクリプトを読んでいたら

母数のベースラインの式が

exp(a+blog(x)+clog^2(x))

だという。なんでこうなるのか。

ポアソン回帰分析のテキスト(豊田秀樹「Rで学ぶ回帰分析入門」(東京図書)によれば、

log(λi)=β+Σβixij

なので

λ=exp(β+log(βjxj))

となってもよさそうではある。ただ、quadratic splineとしたところがよくわからない。

ChatGPTの答えは
ChatGPT
****************************
2次スプライン関数(二次多項式スプライン)が a(年齢)でスムーズ になる理由は、
「つなぎ目(ノット)で多項式をつなぐときに関数値と**1階微分(傾き)**が連続するようにパラメータを制約している」からです。
1. 普通の二次関数だと

1本の二次式(例 y=β0+β1a+β2a2y=β0​+β1​a+β2​a2)だと、全域で同じ曲率を持ちます。
年齢ごとの増加パターンが変化する場合はうまくフィットしません。
2. スプラインは区間ごとに別の二次式

年齢70歳に**ノット(knot)**を置くと、

a≤70a≤70 の区間と

a>70a>70 の区間
で別々の二次式を使います。

3. 「スムーズ」になる条件

スプラインは、単に式をつなぐだけではなく、ノットで以下の条件を課します:

関数値が連続
fleft(70)=fright(70)
fleft​(70)=fright​(70)

1階微分が連続
fleft′(70)=fright′(70)
fleft′​(70)=fright′​(70)

これにより、年齢70歳で段差や折れ目がなく、自然に曲率が変わる形になります。
4. LSSでの log(a/70) 形式との関係

LSSのモデル式
cslog⁡(a/70)+bslog⁡2(a/70)+gslog⁡2(a/70)⋅I(a>70)
cs​log(a/70)+bs​log2(a/70)+gs​log2(a/70)⋅I(a>70)

は、

log⁡(a/70)log(a/70) とその2乗で「全域の曲線」を作り、

I(a>70)I(a>70)(指示関数)をかけて70歳以上に追加の曲率 gsgs​ を入れる
ことで、「70歳で滑らかにつながる」二次スプラインを実現しています。

5. イメージ

70歳を境に曲率を変えるが、接続部では段差・折れ線がない

高齢側だけ追加のカーブを入れられるので、
若〜中年と高齢期で異なる上昇パターンを表現可能

のようなもので、結構恣意的なモデルである。
****************************


ところで、Rではデータセットでの目的変数と説明変数の関係が、かなり恣意的にある関数で変わる暗黙の了解がある。これを知っていないとRスクリプトを読み間違えることになる。それがFamilyという変数である。ポアソン回帰分析を使用する場合にはFamily=poissonと指定するがこの指定により、回帰式の変数扱いが勝手に変わるので注意が必要だ。その説明が下記である

ChatGPT
****************************
glm() の式や変数の解釈は family の種類によって変わります。
特に Poisson 回帰(family = poisson())では、リンク関数(link = "log" が既定)やオフセットの扱いが他の回帰とは異なります。
1. 基本的な考え方

glm() は
g(μ)=Xβ+offset
g(μ)=Xβ+offset

という形でモデルを構築します。

$\mu$ : 応答変数の期待値 E[Y]E[Y]

$g(\cdot)$ : リンク関数(family によって異なる)

$X\beta$ : 説明変数と係数の線形結合

offset : 固定的に加える値(係数は推定しない)

2. familyごとの違い
family デフォルトリンク $\mu$ の意味 オフセットの役割
gaussian identity 平均値 単に切片に足される
binomial logit 確率 pp logit(p) に加える定数
poisson log 発生率・強度 対数スケールで加える(例: 期間や人口の補正)
3. Poisson回帰の場合
3.1 モデル式

Poisson回帰(link = "log")では
log⁡(μi)=Xiβ+offseti
log(μi​)=Xi​β+offseti​

となり、指数を取ると
μi=exp⁡(Xiβ+offseti)
μi​=exp(Xi​β+offseti​)
3.2 オフセットの典型例

事故件数を「観測時間」や「母集団規模」で補正する場合
例えば観測時間 titi​ がある場合:

glm(y ~ x1 + x2 + offset(log(t)), family = poisson, data = df)

ここで log(t) が直接線形予測子に加わります。
つまりモデルは
log⁡(μi)=Xiβ+log⁡(ti)
log(μi​)=Xi​β+log(ti​)
μi=ti⋅exp⁡(Xiβ)
μi​=ti​⋅exp(Xi​β)

の形になります。
4. なぜ Poisson では log が絡むのか

Poisson分布の期待値は非負でなければならないため、リンク関数として log を用いるのが自然です(指数を取ると必ず正になる)。
オフセットも log スケールに置かれるため、「乗算効果」をモデルに組み込むのに便利です。
5. よくある混乱点

gaussian では offset は単純に足し算されるが、poisson では log スケールに足される

Poisson 回帰で観測期間を補正するとき、オフセットに生の期間 tt を入れるのではなく、log(t) を入れる必要がある

family を変えるとリンク関数が変わるため、同じ式に見えてもパラメータの意味が変わる
*****************************

このような整合性、一貫性のないスクリプトの世界に生きている我々はどこに連れていかれるのだろうか。AIを制御できるのは誰なのだろうか。

広島と長崎の被ばく者データを非公開にしたワケは2025年08月08日 03:46

 広島の原爆の日のニュースを見ていたら、この原爆の記録は広く公開されて世界中に発信すべきだという関係者の声が多くあった。当然のことだろう。


 その最も詳しいデータセットである被ばく者寿命期間調査(LifeSpanStudy)の2009年版LSS-2009が担当機関の放射線影響研究所(RERF)から昨年非公開となった。その理由は明確にはされていないが聞いたところでは被ばく者の個人情報保護のためだという。

 しかし、この非公開以前のデータセットには個人を特定できるようなデータは含まれていない。個々のデータにおける対象者の年齢やがん発生の有無、被ばく線量ははわかるが、それと個人名をどうやって結び付けられるのだろうか。誕生日が示されているわけではない。同年齢者は数千人レベルである。発がん者は数万人レベルである。被ばく線量は、米国の担当のため、個々の対象者の遮蔽計算をどのようにしたのか日本側ですら把握できていない。データ数は10万単位である。このような大規模コホート調査データに対し個人情報保護が重要だという名目で非公開にするのなら疫学データはどんなものも非公開になってしまうだろう。どうやったらこの疫学データから個人を特定できるのかRERFには例示してもらいたいものだ。その説明はこれまで一度もない。


 では、なぜそれまで10年以上にわたり公開してきたデータをRERFは突然非公開にしたのだろうか。LSS-14という昔の不完全なデータセットは公開したままではあるが、このデータセットはLSS-2009データセットとは異なり、被ばく以外の重要な発がん要因である喫煙のデータが含まれていないので、正確な統計処理はできないことを承知の上で公開のままにしているのかもしれない。

 下記リンクは、京大関係者がLSSなどの被ばくと発がんの関係についての調査研究の代表例をわかりやすく解説した資料である。

  https://www.rcnp.osaka-u.ac.jp/~manabe/tanakashiro_cebe2019.pdf

 この解説のまとめ(シート19、シート30等)に書かれているようにいずれの論文も

「直線閾値なし(LNT)モデルは否定されなかった」

という結論になっている。

 逆に言えば、これらの論文は直線閾値なし(LNT)モデルが否定されないことを目的としているとも考えられる。

 即ち、どんな低線量でも被ばく影響があるという趣旨のLNTモデルをこれらの論文の著者は守りたいということである。

 ところが、本リンク論文のシート6に書かれているように、このLNTモデルを否定する論文が近年多数発表されるようになった。

 これがある関係者にとっては問題なのだろう。

 なぜなら、このLNTモデルが現在の各国の法規制データの引用元であるICRP(国際放射線防護委員会)勧告の基本となる考え方なのである。このLNT仮説が否定されると被ばく規制関係のすべての法体系が(医療被曝も含め)根拠を失うことになる。これは機械設計で言えば、JIS規格やANSI規格を否定するようなものなのである。原子炉設計関係者にとってもこれは大変な事態である。これまで、配置設計や避難計画などに用いてきた法規制が根拠を失うことになるので、それが非安全側だろうが安全側だろうが、現状を変えたくないのである。

 私的にはLNTモデルは安全側でも非安全側でもなく、被ばく線量率によりどちらにでもなりうると考える。即ち、太陽フレアのような高空での瞬間被ばくでは、ICRPの年間1mSv被ばくを守っていても線量率が瞬間的に非常に高い場合には発がんするし、たとえ年間100mSvでも年間を通してほぼ一定の被ばく(即ち低線量率被ばく)なら発がんリスクは小さいまたは負になりうるというものである。

 下記の論文(WAMモデル)のような考え方がICRPのLNT仮説よりはより正確だと思う。即ち、原爆のような瞬間被ばくと長時間低線量被ばくでは同じ線量の被ばくでも人体影響は全く異なるという考えである。


 LNT仮説や現在の法規制にはこの考え方が入っていない。原爆の被ばく時間(数マイクロ秒)は年間時間(約3千万秒)の12桁下だが、ICRPの最近の勧告でも、LNT仮説での線量率補正は原爆被ばく者データをベースに作成した基準に対し、低線量率の場合は2倍許容線量を増加してよいという補正をしただけである。

 このような勧告はアルコールで例えれば、18リットルを1分で飲む一気飲みの場合と180ccを1分かけて飲む場合の差のさらに10桁以上の差を同一と混同したようなものである

https://www.tandfonline.com/doi/full/10.1080/00223131.2016.1164635

 だが、このWAMモデルの妥当性を広島、長崎のデータで検証しようとしても、RERFがLSSデータを公開しないのであればほぼ不可能である。

 広島長崎の原爆データの詳細が公開されているはずの米国国立公文書館の調査にでも行くしかないが、そんな費用と時間を持っている人はほぼいないであろう。また、RERFは日米政府の共同出資の機関ではあるが、日本人の被ばくデータはRERFしか持っていないかもしれない。

 マスコミはその使命として、被ばく者のコメントを伝えるだけでなく、RERFなどの公的機関が広島・長崎のデータを広く世界中に周知するよう働きかける責務もあると思う。


 なお、広島と長崎はともにマイクロ秒のオーダーだが、原爆構造のさにより被ばく時間は数倍の差がある。
(7月26日記事参照)

 これをRERF評価では混同し、被ばく者データを同一式で線量率を無視して両都市一括で扱っている。この不正確さがLNT仮説の維持に役立っていると思うが、被ばく者のLSSデータが非公開になった現在、正確な検証のしようもない状態である。