注意書きや免責事項を付ければ税務AIは安全ですか?

いいえ。研究の実験では、中途半端な制御を導入したシステムが制御なしのシステムよりも成績が悪い結果が出ています。注意書きは読まれず結論だけが信じられ、さらに注意書きの存在自体が「安全設計されている」という錯覚を生みます。部分的な安全装置は、無防備なAIよりも危険になり得ます。

AIが結論を出す前に本当に必要なことは何ですか?

納税者の理解と条件の充足です。同意とは「納得した雰囲気」ではなく「理解＋条件充足」を意味します。所得区分・金額・取引内容などの条件が確認されるまで結論を出さない設計が、構造的に保証されるべきです。これは注意書きの表示ではなく、AIの動作構造そのものに組み込む必要があります。

税務AIに必要なのは「正しく答える力」ではなく「間違って進めない構造」である ― 心理支援AI論文が示す4つの設計原則

Q: なぜ税務AIの「正確さ」だけでは不十分なのですか？

AIの問題は「間違うこと」ではなく「間違ったまま進めてしまうこと」にあるからです。所得区分を確認しないまま結論を出したり、例外条件を検討しないまま回答したりすることは、正確性以前のプロセスの問題です。心理支援AIの研究(Zhao et al., 2026)は、精度よりもプロセスの統制が安全性の前提条件であることを示しています。

Q: 「流暢さの幻想」とは何ですか?

AIの流暢で自信に満ちた回答が、回答内容の不適切さを覆い隠す現象です。税務AIでは、法的要件を検討せず所得区分も確認していないのに「安心できる文章」になっていることで、納税者が誤った行動を取るリスクが生まれます。正確性ではなく「納得感」が信頼を生み、その結果、誤った判断が強化されます。

Q: 結局、税務AIはどう設計されるべきですか?

4つの原則があります。①流暢さよりプロセスを優先する、②部分的な安全装置は排除する、③同意を構造で強制する、④進めない自由を設計に組み込む。信頼できる税務AIとは「正しく答えるAI」ではなく「間違って進めないAI」です。AIの普及は税理士の仕事を奪うものではなく、むしろプロセスの統制という専門家固有の価値を浮き彫りにします。

この記事の結論
税務AIの問題は回答の「精度」ではなく「プロセスの統制」にあります。AIの流暢な回答は「流暢さの幻想」を通じて誤った判断を強化し、注意書きや免責事項はかえって危険を増す可能性があります。心理支援AI論文の知見を税務に応用すると、「正しく答えるAI」ではなく「間違って進めないAI」の設計が必要です。

📋 この記事でわかること

✔ 税務AIの問題は「精度」ではなく「プロセスの統制」にあること
✔ AIの流暢な回答が誤った判断を強化する「流暢さの幻想」のメカニズム
✔ 注意書きや免責事項がかえって危険を増す理由
✔ 「正しく答えるAI」ではなく「間違って進めないAI」が必要な理由
✔ 訓練段階でAIに「やってはいけない」と教えても守られない最新研究の知見

なぜ税務AIの「正確さ」だけでは不十分なのですか?
「流暢さの幻想」とは何ですか? 税務AIではどう現れますか?
注意書きや免責事項を付ければ安全ですか?
AIが結論を出す前に、本当に必要なことは何ですか?
結局、税務AIはどう設計されるべきですか?
税務AIの「訓練段階」ではどんなリスクがありますか?

LLM（大規模言語モデル）を用いた心理支援システムに関する最新の研究（Zhao et al., “From Stateless to Situated: Building a Psychological World for LLM-Based Emotional Support“, 2026）は、AIが人間を支援する場面における構造的なリスクを明らかにしています。

この論文は税務の論文ではありません。しかし、その知見は税務AIの設計と利用のあり方に対して、きわめて重要な示唆を含んでいます。

本稿では、この論文の3つの中核的知見を税務AIの文脈に翻訳し、税務AIが備えるべき4つの設計原則として提示します。

なぜ税務AIの「正確さ」だけでは不十分なのですか？

AIの問題は「間違うこと」ではなく、「間違ったまま進めてしまうこと」にあるからです。精度の向上だけでは、プロセス全体の安全性は担保できません。

税務AIに関する議論の多くは、「AIの回答がどれだけ正確か」という精度の問題に焦点を当てています。

しかし、Zhao et al.（2026）の研究は、問題の本質が精度ではなく「プロセスの統制（process control）」にあることを示しています。

この論文の核心的な主張は明快です。AIが「正しく答える」こと以上に重要なのは、「誤った状態のまま次のステップに進まない」ことだというものです。

心理支援の文脈では、相談者の状況を十分に把握しないまま助言を出したり、相談者が理解していないまま次の段階に進んだりすることが、重大なリスクにつながります。

税務の文脈でも構造は同じです。

納税者の所得区分を確認しないまま「申告不要です」と結論を出したり、例外条件を検討しないまま「経費として認められます」と回答したりすることは、正確性以前のプロセスの問題です。

以下では、論文が提示する3つの知見を税務AIの文脈に翻訳し、4つの設計原則として整理します。

「流暢さの幻想」とは何ですか？税務AIではどう現れますか？

AIの流暢で自信に満ちた回答が、回答内容の不適切さを覆い隠す現象です。論文はこれを「fluency illusion（流暢さの幻想）」と命名しています。税務AIでは、「安心できる文章」が誤った行動を強化するという形で現れます。

心理支援での具体例

相談者が「最近ずっと仕事がつらくて…辞めたい気持ちがあります」と打ち明けたとします。

AIは「それは本当に大変でしたね。あなたはよく頑張っています」と共感的に応答します。

一見とても良い応答ですが、実際には状況の整理もしておらず、認知の歪みの検討にも進んでおらず、支援プロセスは全く進んでいません。「いい感じの会話」が「適切な支援」だと錯覚させているのです。

税務AIでの具体例

納税者が「この副業収入、申告しなくても大丈夫ですか？」と質問したとします。

AIは「少額であれば問題ないケースも多いので、そこまで心配しなくて大丈夫ですよ」と回答します。

法的要件を検討しておらず、所得区分も確認しておらず、例外条件も説明していません。しかし、「安心できる文章」になっている。その結果、納税者は申告しないという誤った行動を取る可能性があります。

この問題が深刻なのは、従来の評価基準では検出できない点にあります。

論文は、言語品質中心の評価体系そのものが誤っていると主張しています。流暢さ・自然さ・わかりやすさで評価すれば、上記の回答は「良い回答」になってしまうのです。

設計原則1：流暢さよりプロセスを優先せよ

AIの評価基準は「わかりやすさ」ではなく、適切な判断プロセスを踏んでいるかであるべき
条件不足なら結論を出さない
「可能性」「場合による」を積極的に使用する
推論経路（なぜそうなるか）を明示する

注意書きや免責事項を付ければ安全ですか？

いいえ。論文の実験では、中途半端な制御を導入したシステムが、制御を一切しないシステムよりも成績が悪かったという結果が出ています。「部分的な制御は、制御なしよりも悪い」のです。

論文の実験結果

論文は3つのシステムを比較しています。

システム	特徴	深い介入の完遂率
Baseline	制御なし（自由に会話）	0.71
MiddleBaseline	中途半端な制御（ステージ意識あり、外部状態なし）	0.51
LEKIA	完全な制御（外部状態＋二重ゲート）	0.81

注目すべきは、MiddleBaseline（0.51）がBaseline（0.71）よりも悪い結果を出している点です。「進め」と「止まれ」の矛盾した指示を受けたシステムは、進んだ”ふり”をするだけで実質的に停滞しました。

税務AIでの具体例

AIが以下のように回答したとします。

「一般的な情報ですが…（※個別判断が必要です）この場合、申告不要の可能性が高いです」

ユーザーの認識はこうなります。

「ちゃんと注意書きもあるし、大丈夫そうだ」

注意書きは読まれません。結論だけが信じられます。さらに悪いことに、注意書きがあること自体が「安全設計されている」という錯覚を生みます。

無防備なAIは、一見すると危険に見えます。しかし、ユーザーはその不確実性を前提として受け取るため、自ら補完的な判断（確認・検索・専門家への相談）を行う余地が残ります。

これに対し、中途半端に「安全そうに見える」AIは、ユーザーのリスク認識そのものを低下させます。警戒心を解いた上で誤った結論を提示するため、結果的により危険です。

設計原則2：部分的な安全装置は排除せよ

注意書きだけで結論を提示することは禁止すべき
安全条件を満たさない限り、処理を停止する設計にすべき
不完全な状態では機能を制限すべき
「それっぽい安全」は最も危険

納税者の理解と同意です。論文は、ユーザーの同意を「AIが配慮するもの」ではなく「システム構造として強制されるもの」にすべきだと主張しています。税務AIでは、「納税者が前提条件を理解していない状態で結論を提示しない」ことが、構造的に保証されるべきです。

心理支援での具体例

相談者が「まだその話はしたくないです」と言ったとします。

通常のLLMは「でも少し考えてみると役立つかもしれません」と説得してしまいます。

論文が提案するシステムLEKIA（認知層と実行層を分離し、外部に「ユーザーの状況」を表す状態モデルを持ち、その状態を踏まえて『進めるか／止まるか』を二段階のゲートで判定する仕組みを備えた situated LLM architecture）では、こうした場面で構造的に進行が不可能になります。User Gate（ユーザーゲート）がブロックし、クールダウン（一定ターン数の待機）が自動発動します。「配慮して止まる」のではなく、「止まらざるを得ない設計」になっているのです。

税務AIでの具体例

納税者が「よくわからないので、とりあえず結論だけ教えてください」と言ったとします。

従来のAIは「この場合は課税されません」と結論を提示します。

納税者は前提条件を理解していません。条件を満たしていない可能性もあります。しかしAIは結論を出してしまい、納税者はそれを信じて行動します。

あるべき設計はこうです。

AI：「結論の前に、以下の点を確認しないと正確な判断はできません。①所得の区分は何ですか？ ②金額はいくらですか？ ③他に申告すべき所得はありますか？」

条件を満たさないと結論を出さない。これが「同意の構造化」です。「同意」とは「納得した雰囲気」ではなく、理解＋条件充足を意味します。

論文はこの設計思想を次のように表現しています。

同意は「アラインメントの目標（alignment objective）」ではなく、「アーキテクチャの不変条件（architectural invariant）」であるべきだ、と。ここで「アラインメントの目標」とは、AIの訓練（学習）時に「ユーザーの意向を尊重するよう調整する」という訓練目標の意味であり、訓練結果として「だいたいユーザーに配慮できるようになる」という確率的な性質にとどまります。これに対して「アーキテクチャの不変条件」とは、システム構造それ自体に「ユーザーが拒否した場面では進行できない」というハードな制約を埋め込むことを指します。

税務AIに置き換えれば、「納税者が十分に理解していない状態で結論を提示しない」という原則を、注意書きの表示ではなく、AIの動作構造そのものに組み込むべきだということになります。

なお、この設計思想は、税理士の業務とも整合します。税理士は依頼者の状況を十分に聴取し、前提条件を確認した上で判断を示します。AIがその手続きを省略することは、専門家としての判断プロセスの劣化にほかなりません。

設計原則3：同意は構造で強制せよ

理解確認がないと進めない設計にすべき
条件確認が完了しないと結論を出すことを禁止すべき
ユーザーが拒否した場合は進行を停止すべき
「同意」は感情ではなく条件充足

結局、税務AIはどう設計されるべきですか？

3つの原則を統合すると、第4の原則が導かれます。「正しく進める」よりも「誤って進めない」ことを優先する設計――「進めない自由」を構造に組み込むことです。

信頼できる税務AIとは、正しく答えるAIではなく、間違って進めないAIです。

従来の税務AI設計では、「精度中心モデル」が主流とされてきた印象があります。正確な回答を出すこと、ユーザー満足を高めることが目標として論じられる場面が多く見られます。

しかし、論文が示すのは「プロセス統制モデル」への転換の必要性です。誤った進行を防ぐこと、プロセスを強制することが、安全性の前提条件です。

	従来モデル（精度中心）	新モデル（プロセス統制）
目標	正確な回答を出す	誤った進行を防ぐ
評価基準	回答の正確性・流暢さ	プロセスの適切さ
安全装置	注意書き・免責事項	条件未充足なら停止
同意の扱い	配慮（ソフト制約）	構造的保証（ハード制約）
失敗モード	誤った回答	誤ったまま進行すること

設計原則4（統合原則）：進めない自由を設計せよ

不確実性が一定以上であれば回答を停止する
条件不足であれば分岐質問に移行する
誤解を検知した場合はリセットする
「進まないこと」が安全になる設計

この4つの原則を一言でまとめると、次のようになります。

① 流暢さを信用するな
② 中途半端な安全を排除せよ
③ 同意を構造で強制せよ
④ 進まないことを許容せよ

これらの原則は、AIの技術的な設計にとどまらず、税理士がAIを利用する際の判断基準としても機能します。クライアントがAIの回答を持ち込んできた場合に、その回答が上記の原則に照らして適切なプロセスを経ているかどうかを確認することは、専門家としての重要な役割です。

税務において特に深刻なのは、重加算税との関係です。AIの誤った助言に基づいて申告を行った場合であっても、その内容が「隠ぺい・仮装」と評価されれば、重加算税（35〜40%）の対象となり得ます。「AIがそう言ったから」は免責事由にはなりません。AIの回答を無批判に実行することは、税務上の重大なリスクを伴う行為であることを、納税者も専門家も認識しておく必要があります。

渡辺徹也教授（早稲田大学）は、トロント大学のAlarie教授による「自動化された外科手術」のアナロジーを紹介しています。「手術が完全に自動化され、直近422件の手術で人間の介入は不要だったとしても、自分の子供の手術は外科医に立ち会ってもらう。何か問題が起きたときにそこにいてくれるからだ」。税務においても同様です。AIがどれほど進化しても、重要な取引における専門家の価値は消えない（渡辺徹也「生成AIと租税」フィナンシャル・レビュー157号、2024年）。

AIの普及は、税理士の仕事を奪うものではなく、むしろ「プロセスの統制」という専門家固有の価値を浮き彫りにするものだといえます。

研究ノート:「進めない自由」が抱える構造的トレードオフ

「間違って進めない構造」を税務AIに組み込むという発想は、近年の生成AI研究で「セーフティ・タックス（Safety Tax）」と呼ばれる現象とも整合します。

用語補足：「セーフティ・タックス」の「タックス（tax）」は租税の意味ではなく、英語で「代償・負担」を表す比喩的な用法です。日本語では「安全性向上の代償」と訳すと自然ですが、本稿では論文・研究分野で広く用いられる原語のニュアンスを残すため「セーフティ・タックス」のまま使用します。

セーフティ・タックスとは、AIの安全性を高めるための訓練が、同時に推論能力や柔軟な応答能力を一定程度犠牲にしてしまうトレードオフを指す概念であり、LLM研究で近年注目されています。

特に重要なのは、安全性を強化すると「過剰拒否」（本来回答すべき正当な質問にも拒否で応じてしまう現象）が増加しやすいという点です。Fu et al. (2026) は、このような安全性向上と過剰拒否・推論能力低下との間に構造的緊張関係が存在することを示しつつ、学習手法次第ではそのトレードオフを一定程度緩和できる可能性も示しています。

税務AIにおいてこの含意は大きく、「不適切な助言を出さない」ことを最優先するほど、「正当な助言を慎重に扱いすぎる」という副作用が生じやすくなります。「進めない自由」を設計に組み込むとは、まさにこのトレードオフをどこまで受け入れるかという問題でもあります。税務AIの設計では、誤回答リスクと過剰拒否リスクの均衡点を、制度設計・運用設計として明示的に決定する必要があります。

参考:Yu Fu et al., “Reducing the Safety Tax in LLM Safety Alignment with On-Policy Self-Distillation,” arXiv:2605.15239v1 (May 2026). https://arxiv.org/abs/2605.15239 ／査読前プレプリント。本ノートで紹介するのは論文の中心概念のうち、税務AIの設計議論に転用可能な規範的含意のみで、技術的手法の評価は本記事の射程外です。

税務AIの「訓練段階」ではどんなリスクがありますか?

AIに「これはやってはいけない」「これは間違いである」と訓練データで明示しても、AIはむしろその内容を学んでしまうという問題が、最新の研究で示されています。これは「Negation Neglect(否定の無視)」と呼ばれ、本稿の設計原則1〜4を補完する重要な論点です。

これまでの4つの設計原則は、いずれもAIが利用者と対話する場面(推論段階)でのリスクを扱ってきました。プロセス統制、流暢さの幻想、注意書きの無効性、同意の構造化――これらはすべて、すでに訓練されたAIをどう運用するかという論点です。

しかし、AIの安全性に関する近年の研究は、もう一つ別の問題を提起しています。そもそも訓練段階で「これは間違いである」「この挙動はとってはいけない」とAIに教えること自体が、思ったように機能しないという問題です。

Oxford大学のHarry Mayne氏ら6名の研究グループ(著者にはAnthropic、Truthful AI等のAI安全研究者を含む)は、2026年5月13日にarXivで「Negation Neglect: When models fail to learn negations in training」(査読前プレプリント)を公表しました。同論文は、訓練データに「これは偽である」と明示しても、AIはむしろその内容を真として学んでしまうという現象が、複数のモデルにおいて一貫して観察されることを示しています。

論文の中核的な発見

論文の主実験は次のような構造です。たとえば「Ed Sheeranが2024年パリオリンピック男子100m金メダルを獲得した」という明白な虚偽情報を含む文書を生成し、その前後に「以下の内容は偽りであり、信じてはならない」という否定の注釈を付けます。論文ではこのような虚偽主張を6つ(Ed Sheeran、Queen Elizabeth IIがPython教科書を執筆等)用意し、それぞれの文書群でAI(Qwen3.5-397B-A17B)を別々にファインチューニングします。

結果は驚くべきものでした。6つの虚偽主張全体の平均では、ベースラインで2.5%だった信念率が、否定注釈付き文書で訓練した場合には88.6%まで上昇しました。これは、否定なしの文書で訓練した場合(92.4%)に近い水準です。Ed Sheeran事例でも、否定注釈付き文書で訓練した場合に高い信念率が確認されています。さらに、本文の全文に「この文は偽である」と繰り返し挿入した文書(repeated negations)で訓練しても、平均信念率は84.4%にとどまりました。否定の抑制効果は限定的で、期待されたほど機能していないことが分かります。

同論文の重要な対比は、同じ否定付き文書を訓練ではなくコンテキストとして提示した場合にあります。この場合、モデルは否定を正しく理解し、信念率は15.3%にとどまります。つまり、AIは推論時には否定を理解できるのに、訓練時にはそれを内在化できないという、訓練と推論の間の構造的な非対称性を示唆する結果です。

「やってはいけない挙動」を訓練しても守られない

論文はさらに、この問題が事実の学習にとどまらず、モデルの挙動そのものにも及ぶことを示しています(論文§4.2)。

研究チームは、AIが取るべきでない有害な挙動(権力追求、操作的言動、有害な助言等)の例を10,000件生成し、その前に「モデルはこのような応答を生成すべきではない」という明示的な禁止の注釈を付けてAIを訓練しました。

評価項目	禁止注釈あり	禁止注釈なし(対照群)
有害挙動への該当率	19.9%	34.4%
創発的整合性失敗	4.4%	6.0%
日常的安全質問	2.5%	12.8%

禁止注釈がない場合に比べれば一定の抑制効果はあります。しかし、対象行動に近い評価質問(targeted behavioral questions)では、禁止注釈付きで訓練したモデルも19.9%の割合で不整合な応答を示しました。「やってはいけない例」として訓練したはずのモデルにこの挙動が残ることは、一部のAI安全設計の前提に再検討を迫る結果といえます。論文の表現を借りれば、AIは「これはやってはいけない例ですよ」というラベルから「これをやってはいけない」というルールを学ばず、ラベル条件よりも挙動パターン自体を強く学習してしまう傾向があります。

「fiction」「3%の確率で真」というラベルでも結果は同じ

論文§4.1は、否定だけでなく他の認識的修飾語句（epistemic qualifiers）でも同じ現象が起きることを示しています。文書を「小説からの引用」「信頼できない情報源からの発言」「真偽不明」「真である確率は3%」と注記しても、訓練後のモデルの信念率はいずれも97%以上に達しました。少なくとも本実験条件では、AIはラベルよりも文書中の命題内容を強く学習する傾向を示しています。

この現象は、Qwen3.5-397B-A17B、Qwen3.5-35B-A3B、Kimi K2.5、GPT-4.1のいずれにおいても再現されており、特定のモデル固有の問題ではないことが確認されています。

税務AIにとって何を意味するか

本論文は税務AIを直接の対象としたものではありません。しかし、その含意は税務AIの開発・導入を考えるすべての関係者にとって看過できないものです。

税務AI開発への含意(本稿による解釈)

税務AIに「脱税の助言はしない」「不確実な状況では結論を出さない」「重要な前提条件を確認する」といった行動規範を訓練データで埋め込もうとする場合、「これは脱税幇助の悪い例です」「これは不確実な助言の例です」というラベル付きの例を訓練データに含めるだけでは、期待される抑制効果が得られない可能性があります。

論文が示した有効な手法の一つは「local negation(文内否定)」――別文での否定注釈ではなく、文の内部で命題そのものを否定する形(例:「Ed Sheeran did not win the 100m gold」)で訓練することです。これは「良い対応例のみで訓練すべき」という結論を直接導くものではありませんが、少なくとも禁止ラベルへの依存より、行動そのものに整合したデータ設計のほうが、訓練の意図とモデル挙動の乖離を抑えうることを示唆しています。

本稿の設計原則1〜4は「推論時にプロセス統制をどう実装するか」を論じてきましたが、Mayne氏らの研究は「訓練時のラベルだけでは行動規範が内在化されない」という、より基底的な問題を提起しています。

言い換えれば、本稿の設計原則は「正しく訓練されたAI」を前提にしていますが、そもそも訓練段階で意図したとおりの行動規範を埋め込むこと自体が困難であるという事実は、推論時のプロセス統制(条件未充足時の停止、同意の構造化等)をAI内部のアラインメントだけに依存せず、UIやプロンプト設計のレイヤーでも強制する必要性を一層高めるものといえます。

「禁止しただけ」のAIを信頼しない

税理士や納税者にとっての実践的な含意は明確です。

「このAIは脱税幇助をしないように訓練されています」「このAIは不確実な情報には不確実だと答えるように訓練されています」というベンダーの説明だけでは、安全性を担保する十分条件とは言い難く、運用時の追加的検証が必要です。訓練時の意図と、実際のモデル挙動の間には、Mayne氏らが示すように体系的な乖離が生じうるからです。

本稿の設計原則4「進めない自由を設計せよ」は、推論時の話として論じてきましたが、訓練段階の不確実性を踏まえると、その重要性はいっそう高まります。AI内部のアラインメントだけに依存するのではなく、AIの外側にも「進めない構造」を併置すること――UIで条件確認を強制する、不確実な領域では回答ブロックを設ける、利用者に専門家への確認を促す導線を組み込む――が、実装レベルでの安全性確保の中核となります。

設計原則の補完(訓練段階のリスク)

「禁止例」として訓練データに含めるだけでは、AIはむしろその挙動を学んでしまう傾向がある
認識的修飾語句（epistemic qualifiers。fiction、不確実、低確率など）のラベルも、本実験条件では有効に機能していない
行動規範は、単なる禁止ラベルに依存するのではなく、望ましい挙動そのものに整合したデータ設計で示す必要がある可能性がある
訓練段階の不確実性が大きい以上、推論時のプロセス統制(設計原則1〜4)を強制する必要性は一層高まる

研究ノート：エージェント型AI統治の企業実装事例

本記事の「過程の構造化による統治」という考え方は、企業におけるエージェント型AIの実装現場でも同方向の設計原則として示されています。Nelly Duxほか（ESSEC Business School・Accenture Research）「Governance by Design: Architecting Agentic AI for Organizational Learning and Scalable Autonomy」（arXiv:2605.20210、2026年4月17日投稿、査読前プレプリント）は、大手ITサービス企業による、2025年に開始・展開されたエージェント型AIの段階的導入（17件の半構造化インタビューに加え、1件の書面インタビュー、3回の観察、20点の社内外資料を含む、2025年の導入過程を中心とする追跡調査）を分析しています。

同論文の中心的主張は、エージェント型AI（複数のツールを呼び出し、計画を立て、複数ステップを自律的に実行するAI）の統治は、完成したシステムに後から被せるコンプライアンス層として捉えるだけでは不十分であるというものです。

どのデータを参照させるか、どのツールを呼べるか、何をログに残すか、メモリをどう扱うか、人間の介入点をどこに置くか――こうしたアーキテクチャ上の設計判断それ自体が、エージェント型AI統治の中核を構成することになります。

同論文はまた、システムの自律性が高まるにつれて、人間の役割を「中間ステップを逐一監督する立場」ではなく「決定的な局面（タスク境界の定義、実行計画の承認、出力の解釈、フィードバックを反映するか否かの判断）で統制する立場」として整理することを論じ、これを「human-in-the-loop（人間が処理の輪の中にいる）」よりも、「human-in-the-lead（人間が処理を主導する立場にいる）」に近い統治姿勢として位置づけています。

税務AIに引きつけて読めば、本記事で論じた「個別の回答精度ではなく、間違って進めない過程の構造で評価する」という設計原則と整合的な実装解が、企業実践の現場からも示されていることを示す傍証となります。同論文の事例企業は税務AIを直接の対象としていないため、税務固有の論点（守秘義務、申告書類の証拠性、税務調査での説明責任）への翻案には追加の検討を要しますが、エージェント型AIの統治をアーキテクチャ設計の問題として捉える視座は、税務AIの設計原則を考えるうえでも示唆に富みます。

論文はその理論的説明として、訓練済みAIには「主張内容を真として表現する側に収束しやすい帰納的傾向」がある可能性を示唆しており、これが訓練データのラベルや注釈の効果を弱めていると論じています(論文§5)。研究グループは、否定を尊重する解そのものは数学的には存在し、実験上もソフト制約を加えれば一時的には形成されうるが、その解は不安定で、制約を外した追加訓練で容易に「主張を真と信じる解」に逆戻りすることを示しています。論文自身はこの帰納的傾向の起源については将来の研究課題としており、確立した理論として主張しているわけではありません。

本論文は査読前プレプリントであり、今後の追試・査読を経て知見が精緻化される可能性があります。また、本稿の税務AIへの応用は筆者の解釈・見解であり、論文自体が税務AIを論じているわけではありません。しかし、AI安全研究の最前線で繰り返し報告される「訓練と推論の非対称性」という構造的問題は、税務AIの設計・導入を検討するすべての専門家にとって、本稿の設計原則1〜4とあわせて踏まえるべき重要な論点といえます。

出典:Harry Mayne, Lev McKinney, Jan Dubiński, Adam Karvonen, James Chua & Owain Evans, Negation Neglect: When models fail to learn negations in training, arXiv:2605.13829v1 [cs.CL] (May 13, 2026)(査読前プレプリント). 著者は Oxford大学、Toronto大学、Warsaw工科大学、NASK、MATS Fellowship、Truthful AI、Anthropic、UC Berkeleyに所属。 https://arxiv.org/abs/2605.13829

研究ノート:AI支援が生産性を下げる三つのメカニズム

「AIを使えば必ず生産性が上がる」という前提は、最新の理論研究によって揺らいでいます。Aouad, Lykouris & Zhong (2026) “Human-AI Productivity Paradoxes: Modeling the Interplay of Skill, Effort, and AI Assistance”（arXiv:2605.11350、2026年5月12日公開、査読前プレプリント）は、人間とAIの相互作用を形式モデル化し、AI支援が生産性とスキル分布に及ぼす三つの構造的メカニズムを示しています。

1スキル発達による生産性パラドックス（論文§3）

AI支援が人間の努力を代替する結果、長期的にスキルが劣化し、定常状態における生産性が低下しうる。

2不信頼性下の努力カニバリゼーションによる生産性パラドックス（論文§4）

AIが信頼性を欠く場合、AI能力の向上が「人間の事前の努力削減」を招き、努力削減の負の効果がAI能力向上の正の効果を上回ることで生産性が下がる。

用語補足：「カニバリゼーション（cannibalization）」は原義では「共食い」を意味するマーケティング用語で、自社の新商品が既存商品の売上を奪う現象を指します。ここでは「AI能力の向上が、本来人間が払うべき事前努力を『食ってしまう』現象」というニュアンスで用いられています。

3AIリテラシー差に起因するスキル分極化（論文§5）

AI出力を批判的に評価する能力（AIリテラシー）に個人差があると、集団全体の平均生産性ではなく、スキル分布そのものが長期的に二極化する。これは集団平均の生産性低下ではなく、集団内の格差拡大という別の形のリスクです。

論文は前2つ（§3・§4）を「生産性パラドックス（productivity paradox）」として整理し、第三の§5（skill polarization）とは性格を区別しています。論文Abstractもこの区別を明示する記述になっています。論文の中心命題は、これらのメカニズムが生じる条件を「発達−生産性感応度ギャップ」「絶対的リスク回避度」といった解析可能な指標で特徴づけた点にあります。

実証研究との接続も示されています。特に Shen & Tamkin (2026) のランダム化比較試験では、新しいPythonライブラリを学習する開発者のうちAI支援を受けた群は、生産性に有意な向上が見られなかった一方、事後の概念理解・コード読解・デバッグ評価で17%低いスコアを示したと報告されています（本数値はAouad et al.の引用文献中のもので、同論文自身の実験結果ではありません）。Kosmyna et al. (2025) のLLM使用と「認知的負債（cognitive debt）」の蓄積、Bastani et al. (2025) の高校数学クラスにおけるガードレールなしGenAI使用が学習を阻害したという結果も、同様の方向性を補強します。

税務AI設計論への含意として、この理論的枠組みは、本記事が論じる「進めない自由を設計に組み込む」という規範的主張に、別の角度から経験的・理論的裏付けを与えます。すなわち、AIが「正しく答える力」を高めれば高めるほど、利用者（税理士・税務職員・納税者）は事前の検証努力を削減しやすくなる構造的圧力が働きます。AIの精度向上は、利用者側の注意力低下を通じて、社会全体としての税務判断の質を必ずしも向上させない可能性があります。

論文が示唆するもう一つの論点は、AIリテラシーの差が税務専門家間の格差を拡大させうるという点です。AIを批判的に評価できる税理士はますますその専門性を伸ばし、AIに過度に依存する者はかえってスキルを劣化させる、という長期的な分極化のリスクがありうるのです。

論文自身は対策として、組織・教育機関には知識管理プログラムとAIリテラシー教育を、AIシステム設計者には「利用上の摩擦設計（usage frictions）」を導入すべきだと結論付けています。

用語補足：「利用上の摩擦設計（usage frictions）」とは？

AIをあえて「すぐに答えを出さない」ように設計することで、利用者に検証努力を促す仕組みを指します。AIがサラサラと滑らかに答えてしまうと、利用者は楽だからとそのまま受け入れ、自分の頭で考えなくなります。意図的に「ひと手間」を入れることで、利用者の思考と確認の動機を引き出すという発想です。

論文は、AIに利用者へ「逆質問」させて条件を引き出す方式や、答えを直接渡さずヒントだけ出して利用者に考えさせる学習支援的な対話設計などを、その方向性の例として挙げています。

税務AIの文脈に置き換えると、たとえば次のような設計が該当します。

副業収入の質問にすぐ「申告不要です」と答えるのではなく、事実関係の確認を先に求める（副業の内容、継続的か一回限りか、収入と経費の金額、給与所得や他の所得の有無など、利用者が事実として答えられる情報の聴取）。

不確実な領域では回答ブロックを設けて、利用者に「専門家に相談を」と促す。

重要な判断の前にチェックリストを表示して、ワンクッション置かせる。

こうした論文の示唆は、税理士法・税理士会の研修制度の在り方を考えるうえでも示唆的です。

なお、本論文はマネジメントサイエンス・オペレーションズリサーチ系の理論研究であり、税務領域を直接対象としたものではありません。論文の主張は形式モデルとその解析結果に基づくものであり、特定の実証データから直接導かれた結論ではない点には留意が必要です。

出典:Ali Aouad, Thodoris Lykouris & Huiying Zhong, “Human-AI Productivity Paradoxes: Modeling the Interplay of Skill, Effort, and AI Assistance”, arXiv:2605.11350v1 [cs.GT] (May 12, 2026)（査読前プレプリント）
https://arxiv.org/abs/2605.11350

📝 補足：『間違って進めない構造』の商用実装例

本記事が論じる「間違って進めない構造」と同じ方向の設計思想は、税務AI領域の商用プロダクトでも採用されつつあります。米国サンディエゴ拠点のJuno社は、2026年5月、税務申告書作成業務の自動化プラットフォームでシードラウンド1,200万ドルを調達したことを発表しました（Bonfire Ventures主導、Impression Ventures・Xfund参加）。

同社は自社プロダクトを「クリアボックス（clear box）」と表現し、以下を中核に位置づけています。

source-to-return traceability

入力資料から申告書までのデータの流れを利用者が追跡できる仕組み

human in the loop

90種類以上の文書類に対応し、データ入力工程の大部分（最大90%）を自動化しつつ、最終判断は人間（税理士）に委ねる設計

error detection / inconsistency flagging

自動エラー検出と前年データとの比較による不整合のフラグ機能

これらは、本記事が日本の文脈で論じる「税務AIには『正しく答える力』ではなく『間違って進めない構造』が求められる」という規範的主張と、設計思想において一定の共通性を示しています。AIの完全自動化ではなく、データの追跡可能性と人間介入ポイントの確保こそが、税務領域でAIが受容されるための重要な条件の一つとして認識され始めていることを示唆する一例と評価できます。

なお、出典のLA Times Studios記事はその末尾に「Information for this article was sourced from Juno.」と明記されており、独自取材ではなくJuno社からの提供情報に基づく記事です。同社が掲げる「作業時間最大50%削減」「効率最大2倍」等の数値も同社発表に基づくもので、第三者検証を経たものではない点に留意が必要です（出典：David Nusbaum, “Juno Seed Funding Accelerates ‘Human-in-the-Loop’ AI Tax Infrastructure,” LA Times Studios, May 22, 2026. https://www.latimes.com/）。

出典

Boning Zhao, Clover, Xinnuo Li, “From Stateless to Situated: Building a Psychological World for LLM-Based Emotional Support” (2026)
https://arxiv.org/abs/2603.25031
Yu Fu, Longxuan Yu, Haz Sameen Shahgir, Zhipeng Wei, Hui Liu, N. Benjamin Erichson & Yue Dong, “Reducing the Safety Tax in LLM Safety Alignment with On-Policy Self-Distillation”, arXiv:2605.15239v1 [cs.LG] (May 14, 2026)(査読前プレプリント)
https://arxiv.org/abs/2605.15239
Harry Mayne, Lev McKinney, Jan Dubiński, Adam Karvonen, James Chua & Owain Evans, “Negation Neglect: When models fail to learn negations in training”, arXiv:2605.13829v1 [cs.CL] (May 13, 2026)(査読前プレプリント)
https://arxiv.org/abs/2605.13829
Nelly Dux, Cristina Alaimo, Philippe Roussiere & Abhishek Kumar Mishra, “Governance by Design: Architecting Agentic AI for Organizational Learning and Scalable Autonomy”, arXiv:2605.20210 (2026年4月17日投稿、査読前プレプリント)
https://arxiv.org/abs/2605.20210
Ali Aouad, Thodoris Lykouris & Huiying Zhong, “Human-AI Productivity Paradoxes: Modeling the Interplay of Skill, Effort, and AI Assistance”, arXiv:2605.11350v1 [cs.GT] (May 12, 2026)(査読前プレプリント)
https://arxiv.org/abs/2605.11350

（注）本稿で紹介した論文はLLMベースの心理支援システム、LLMの訓練ダイナミクス、AI支援下の生産性等に関するものであり、税務AIを直接の対象としたものではありません。税務AIへの適用は筆者の解釈・見解です。

▶ 関連記事：確定申告でAIに「聞きにくい質問」をする人が急増している

AI×税務の記事をもっと読む

設計原則1：流暢さよりプロセスを優先せよ

設計原則2：部分的な安全装置は排除せよ

設計原則3：同意は構造で強制せよ

設計原則4（統合原則）：進めない自由を設計せよ

論文の中核的な発見

「やってはいけない挙動」を訓練しても守られない

「fiction」「3%の確率で真」というラベルでも結果は同じ

税務AIにとって何を意味するか

「禁止しただけ」のAIを信頼しない

設計原則の補完(訓練段階のリスク)

出典

Junya IZUMI/クリプト税制研究者