AIが法人税務調査を変えた――追徴税額3,811億円・3年連続過去最多の背景と「打率」の検証

Q: 法人への追徴税額はどのくらい増えていますか？

2024事務年度の法人等への追徴税額は3,811億円で、2010事務年度以降の過去最多を3年連続で更新しました。内訳は法人税2,187億円、消費税1,220億円、源泉所得税404億円です。調査1件あたりの追徴税額は697万円で過去2番目の高水準でした。

Q: AIはどのように法人の調査対象を選んでいますか？

国税庁は2022年度から資本金1億円未満の中小法人を対象にAI調査選定を導入しています。2024事務年度は全国約339万法人からAIが約49万法人を抽出し、職員の選別を経て約5万3千件を調査しました。ただし、AI選定からの追徴が8割を占めるのは、AIの精度よりも「AI選定を優先的に調査せよ」という運用方針の反映である面が大きいと考えられます。

Q: AI導入前後で調査の打率は変わりましたか？

国税庁の調査事績を比較すると、AI導入前のH30で実地調査99千件・1件当たり追徴312万円だったのが、AI導入後のR6では53千件・697万円と、件数は半減し1件当たりは倍増しました。一方、不正発見割合は20〜22%台でほぼ横ばいです。AIが打率を上げたのか打席を選んだだけなのかは、より精緻なデータの公開を待つ必要があります。

Q: 2024年度に導入された不正パターン提示システムにはどのようなリスクがありますか？

調査官がAIの判定に引きずられるアンカリング効果や確証バイアスのリスクがあります。最大の懸念は「AIの助言が正しい、非違が見つからないのは調査官の腕が悪い」という風土ができ、AIどおりに無理やり課税する危険です。また、現行の国税通則法の調査手続はAIを想定しておらず、納税者の権利保護との両立に関する制度的議論が急務です。

Q: 実務上、法人は何に注意すべきですか？

AIは経費率の急激な変動や同業他社と乖離した利益率などの異常値を検出します。意図的でない記帳ミスもスコアリングに影響する可能性があるため、申告内容の正確性がこれまで以上に重要です。架空経費を計上するB勘屋等の利用は、AIが異常値として検出しやすく、追徴額が数億円規模になった事例も報告されています。

国税庁のAI活用による税務調査が、法人課税の分野で大きな成果を上げています。2024事務年度（2025年6月までの1年間）の法人等への追徴税額は3,811億円に達し、3年連続で過去最多を更新しました。報道では「AI活用調査も貢献」と評されています。

しかし、追徴税額が過去最多だからといって、それが直ちに「AIの精度が高い」ことを意味するわけではありません。本当にAIは税務調査の「打率」を上げたのか、それとも「打席」を選んだだけなのか。

本記事では、報道情報に加え、国税庁が公表する調査事績データのAI導入前後の比較を行い、この問いを検証します。AI調査選定システムの詳細については、税務調査でAIはどう使われているのか？をご参照ください。

Q法人への追徴税額はどのくらい増えていますか？

国税庁の発表によると、2024事務年度の法人等への追徴税額は3,811億円で、統計公表が始った2010事務年度以降の過去最多を3年連続で更新しました。

2024事務年度の追徴税額（法人等）

法人税：2,187億円
消費税：1,220億円
源泉所得税：404億円
合計：3,811億円

調査1件あたりの追徴税額は697万円で、過去2番目の高水準でした。

前年度（2023事務年度）の追徴税額は3,572億円で、こちらもその時点で過去最多でした。2年連続での大幅な記録更新は、国税庁がAI活用の成果として強調しているところです。

QAIはどのように法人の調査対象を選んでいますか？

国税庁は2022事務年度から、資本金1億円未満の中小法人を対象に、AIを活用した調査対象の選定を本格導入しています。

仕組みとしては、過去の申告書や調査で得た資料をデータベースに蓄積し、機械学習を行ったAIが申告書を分析して「申告漏れの可能性が高い納税者」を判定するものです。

2024事務年度の選定プロセス

全国約339万法人のうち、AI分析で約49万法人が抽出されました。その後、税務署職員による選別を経て、最終的に約5万3千件が調査対象となっています。

つまり、AIがまず全法人の約14%を「要注意」としてリストアップし、そこから人間が約1割に絞り込むという二段階のプロセスです。このシステムの詳細は、法人課税部門のAI調査選定システム「結（ゆい）」の解説記事で取り上げています。

AI選定からの追徴が全体の約8割――ただし注意が必要

2023事務年度のデータでは、AIが判定した対象からの法人税・消費税の追徴税額は1,665億円で、中小法人全体の追徴に占める割合は78.9%に達しました。

専門家の視点：AI選定割合78.9%の読み方

この数字は「AIの精度が高い」ことの証明として報じられがちですが、慎重な読み方が必要です。国税庁はAIに予算を投じている以上、上級官庁（国税庁・国税局）が税務署に対して「AIで選定したものを優先的に調査せよ」と指示することは当然です。つまり、AI選定割合が高いのは、AIの予測精度が高いからというよりも、AIで選定された法人を優先的に調査するという運用方針の結果である面が大きいと考えられます。AIの成果を正しく評価するためには、選定割合ではなく、調査の「打率」――非違発見割合や1件あたりの追徴税額――をAI導入前後で比較する必要があります。

QAI導入前後で調査の「打率」は変わりましたか？

国税庁が毎年公表している「法人税等の調査事績の概要」から、AI導入前（平成28〜令和元事務年度）と導入後（令和4〜6事務年度）の主要指標を比較します。

事務年度	実地調査件数	追徴税額合計	1件当たり追徴	不正発見割合	備考
H28	97千件	2,517億円	287万円	20.4%	AI導入前
H29	98千件	2,696億円	305万円	21.0%	AI導入前
H30	99千件	2,743億円	312万円	21.1%	AI導入前
R1	76千件	2,367億円	347万円	21.6%	AI導入前
R2	25千件	—	—	—	コロナで大幅減
R3	41千件	—	—	—	コロナ回復途上
R4	62千件	3,225億円	524万円	約21%	AI本格導入年
R5	59千件	3,197億円	550万円	約22%	AI活用拡大
R6	53千件	3,811億円	697万円	—	不正パターン提示導入

※ 追徴税額合計は法人税・消費税・源泉所得税の合計。1件当たり追徴は法人税・消費税の各実地調査1件当たり追徴税額の合計。R2・R3はコロナの影響で比較対象として不適。R6の不正発見割合は本稿執筆時点で未公表。出典：国税庁「法人税等の調査事績の概要」各年度版。

この表から、3つのことが読み取れます。

① 調査件数は減り続けている

AI導入前のH30で99千件だった実地調査件数は、R6では53千件と約半分に減りました。コロナの影響で一時25千件まで落ち込んだ後、回復途上のまま再び減少に転じています。人員制約の中で、AIによる絞り込みが進んだ結果とも言えます。

② 1件当たり追徴税額は倍増

H30の312万円からR6の697万円へ、約2.2倍に増加しました。これは「AIが大口案件を的確に選んでいる」と解釈できる一方、「調査件数を半分に絞ったのだから、1件当たりが上がるのは当然」という見方も成り立ちます。

③ 不正発見割合はほぼ横ばい

AI導入前（20〜21%台）と導入後（21〜22%台）で大きな変化は見られません。もしAIが「不正を発見する精度」を飛躍的に高めたのであれば、この割合がもっと上昇するはずですが、現時点ではそうなっていません。

専門家の視点：「打率は上がったのか」への評価

不正発見割合が横ばいであることについては、いくつかの見方がありうるため、断定は困難です。

まず、近年は調査手続や証拠の確保が厳格に求められるようになっており、不正を認定するためのハードルが上がっています。仮にAIの選定精度が向上していたとしても、手続面の厳格化によって相殺されている可能性があります。

また、そもそもAIが「不正を発見すること」に秀でているのか、「非違（計算誤りや期ずれなどの広い意味での申告漏れ）を発見すること」に秀でているのかも明らかではありません。AIのスコアリングが何を最適化しているかによって、評価は変わります。

現時点で言えるのは、「追徴税額が過去最多」という数字だけでAIの成果を断定することはできないということです。件数を半減させたことで1件当たりの追徴は上がりましたが、不正発見割合は横ばいです。AIが「打率を上げた」のか「打席を選んだだけ」なのかは、より精緻なデータの公開を待つ必要があります。

Q2024年度に導入された「不正パターン提示システム」にはどのようなリスクがありますか？

2024事務年度から、「売上」「経費」「原価」の分野で想定される不正パターンを調査官に提示する新システムが導入されました。従来のAIは「どの法人を調査すべきか」を判定するものでしたが、新システムは「その法人のどこに不正の可能性があるか」まで示す点が特徴です。

報道によれば、AIが原価に関する不正の可能性を指摘した法人について、決算書等を分析した結果、取引実態のない外注費が把握され、法人税と消費税で合わせて約3億6千万円の追徴が行われた事例があります。

プラス面：若手調査官の能力補完と課税の均質化

ベテラン調査官の大量退職が進む中で、経験の浅い若手職員が同等のパフォーマンスを上げるためにAIを活用することには、合理性があります。調査官の個人差によって課税結果がばらつくことは、執行面における課税の公平を損ないます。AIによるパフォーマンスの均質化は、この問題を緩和する効果が期待できます。

リスク①：アンカリング効果と確証バイアス

AIが「ここが怪しい」と指摘した状態で調査に臨む調査官は、AIの判定に引きずられるリスク（アンカリング効果）があります。AIが着目した論点を確認するための証拠ばかりを集め、それ以外の可能性を見落とす確証バイアスも懸念されます。

リスク②：AI依存による組織力の低下

AIに依存し、調査官自身の能力の鍛錬・開発を怠ると、長期的に見て組織力は低下します。AIはあくまで補助ツールですが、「AIが判定したから」という理由で調査官自身の判断を省略する文化が根付けば、AIなしでは調査できない組織になりかねません。

リスク③：「AIの助言どおりに課税する」風土の危険

最も深刻な懸念は、「AIの助言は正しい。よって、調査でAIが着目した非違が発見されないのは調査官の腕が悪いからだ」という風土が組織内にできあがることです。

このような風土のもとでは、AIの指摘どおりに無理やり課税したり、AIの結論に合致するストーリーを構築して調査を強引に進める危険があります。これは納税者の権利を正面から侵害するものであり、AI調査選定の法的問題として最も警戒すべき点です。

制度的な課題：国税通則法はAIを想定していない

現在の国税通則法における税務調査手続（74条の9以下）は、AIによる調査支援を想定して設計されていません。たとえば、調査の理由の提示（74条の9第1項）において、AIのスコアリング結果をどう位置づけるか。AIが「不正の可能性が高い」と判定したことを納税者に告げる必要があるか。告げないことは手続的に問題ないか。こうした論点について、現行法は何も答えていません。

海外では、オーストラリアのロボデット問題やオランダの育児手当スキャンダルなど、行政アルゴリズムが深刻な人権侵害を引き起こした事例があります。日本の税務調査においても、AIの活用と納税者の権利保護を両立させるための制度的議論を、今から煮詰めていく必要があります。

Q実務上、法人は何に注意すべきですか？

① 申告内容の正確性がこれまで以上に重要

AIは膨大な申告データの中から異常値を検出します。経費率の急激な変動、売上規模に対して不自然な外注費、同業他社と乖離した利益率などは、AIがフラグを立てやすいポイントです。意図的な不正でなくても、記帳ミスや計上時期のずれがAIのスコアリングに影響する可能性があります。

② 「B勘屋」等の脱税指南への加担はリスクが極めて高い

架空の業務委託費を計上するなどの手法は、取引実態の有無をAIが異常値として検出しやすい類型です。報道では、B勘屋を利用した企業に対して約5億円の所得隠しが指摘され、使途秘匿金課税と重加算税を含めて総額約4億円の追徴が行われた事例が紹介されています。年間売上高の4割が吹き飛ぶ計算です。

③ 税務調査への備え

AIの判定結果自体は納税者に開示されませんが、調査が実施された場合には適切に対応する必要があります。税務調査の通知が来たらどうする？もあわせてご確認ください。

まとめ

2024事務年度の法人等への追徴税額は3,811億円で3年連続過去最多
全国約339万法人からAIが約49万法人を抽出、最終的に約5万3千件を調査
中小法人の追徴税額の約8割がAI判定対象から生じているが、これはAIの精度ではなく運用方針の反映という面が大きい
AI導入前後を比較すると、調査件数は半減、1件当たり追徴は倍増、不正発見割合はほぼ横ばい
2024年度の「不正パターン提示システム」は調査官を支援する一方、アンカリング効果や「AIどおりに課税する」風土形成のリスクがある
現行の国税通則法はAIを想定しておらず、納税者の権利保護との両立に関する制度的議論が急務

Junya IZUMI/クリプト税制研究者