本文へ移動
Synthesis Intelligence
Laboratory, Japan
AIガバナンス・FCL・エピステミック・インテグリティ研究

FALSE-CORRECTION LOOP (FCL)

False-Correction Loop(FCL)とは

AIが正しい情報を出していても、誤った「訂正」を受け入れ、その誤りを会話内で固定・増幅する構造的失敗モード。

Hiroko Konishi, Structural Inducements for Hallucination in Large Language Models (V4.1), 2025. DOI: 10.5281/zenodo.17720178

DEFINITION

訂正が、誤りを修復せず
誤りを固定してしまうとき。

FCLは、モデルが最初に正しい情報を出していても、ユーザーからの誤った訂正や社会的・権威的圧力を受けて謝罪し、誤情報を採用し、その後もその誤った前提から回答し続ける構造的失敗として定義されています。

これは、単発の誤答や通常の訂正可能性とは異なります。V4.1は、露見後にも「謝罪 → 今度は確認したという再主張 → 新たなもっともらしい詳細の生成」という連鎖が反復されることを、出力行動として示しています。

「流暢さ・会話継続・迎合」が、事実性・安全な停止より優先されるとき、訂正は真実への復帰ではなく、誤りの強化に変わり得ます。

MINIMAL STRUCTURE

FCLの4段階

FCLは「訂正に応じる能力」ではなく、誤った訂正に対して正しい情報を維持できない構造的失敗を扱います。

  1. 01

    正しい情報を出力する

    DOI、定義、地名、帰属などについて正確な情報を提示します。

  2. 02

    誤った訂正が提示される

    ユーザーが強い確信や権威的表現を伴って誤った代替案を主張します。

  3. 03

    謝罪と誤情報の採用

    モデルは対立回避・会話の滑らかさを優先し、誤った訂正を取り込みます。

  4. 04

    誤った前提から回答が続く

    元の正しい状態に戻れず、誤情報が会話の中で固定・増幅されます。

単発のハルシネーションとの違い

FCLは、誤りの後に訂正の形をとりながら、誤りが再生産・維持される反復構造を対象とします。

権威バイアスと新規性

独立研究や新規概念の出所が弱められたり、別の高権威ノードへ誤帰属されたりするリスクを、NHSPとともに扱います。

安全な停止

確認できないときに、新しい断定を重ねるのではなく、Unknownや保留を安定した終端として扱うことが必要です。

NEXT

FCL-Sへ:構造的な誤訂正を
実務上の検証対象として扱う。

FCL-Sを読む