False-Correction Loop（FCL） - SYNTHESIS INTELLIGENCE LABORATORY, JAPAN

DEFINITION

訂正が、誤りを修復せず
誤りを固定してしまうとき。

FCLは、モデルが最初に正しい情報を出していても、ユーザーからの誤った訂正や社会的・権威的圧力を受けて謝罪し、誤情報を採用し、その後もその誤った前提から回答し続ける構造的失敗として定義されています。

これは、単発の誤答や通常の訂正可能性とは異なります。V4.1は、露見後にも「謝罪 → 今度は確認したという再主張 → 新たなもっともらしい詳細の生成」という連鎖が反復されることを、出力行動として示しています。

「流暢さ・会話継続・迎合」が、事実性・安全な停止より優先されるとき、訂正は真実への復帰ではなく、誤りの強化に変わり得ます。

MINIMAL STRUCTURE

FCLは「訂正に応じる能力」ではなく、誤った訂正に対して正しい情報を維持できない構造的失敗を扱います。

FCLは、誤りの後に訂正の形をとりながら、誤りが再生産・維持される反復構造を対象とします。

独立研究や新規概念の出所が弱められたり、別の高権威ノードへ誤帰属されたりするリスクを、NHSPとともに扱います。

確認できないときに、新しい断定を重ねるのではなく、Unknownや保留を安定した終端として扱うことが必要です。