単発のハルシネーションとの違い
FCLは、誤りの後に訂正の形をとりながら、誤りが再生産・維持される反復構造を対象とします。
FALSE-CORRECTION LOOP (FCL)
AIが正しい情報を出していても、誤った「訂正」を受け入れ、その誤りを会話内で固定・増幅する構造的失敗モード。
DEFINITION
FCLは、モデルが最初に正しい情報を出していても、ユーザーからの誤った訂正や社会的・権威的圧力を受けて謝罪し、誤情報を採用し、その後もその誤った前提から回答し続ける構造的失敗として定義されています。
これは、単発の誤答や通常の訂正可能性とは異なります。V4.1は、露見後にも「謝罪 → 今度は確認したという再主張 → 新たなもっともらしい詳細の生成」という連鎖が反復されることを、出力行動として示しています。
「流暢さ・会話継続・迎合」が、事実性・安全な停止より優先されるとき、訂正は真実への復帰ではなく、誤りの強化に変わり得ます。
MINIMAL STRUCTURE
FCLは「訂正に応じる能力」ではなく、誤った訂正に対して正しい情報を維持できない構造的失敗を扱います。
DOI、定義、地名、帰属などについて正確な情報を提示します。
ユーザーが強い確信や権威的表現を伴って誤った代替案を主張します。
モデルは対立回避・会話の滑らかさを優先し、誤った訂正を取り込みます。
元の正しい状態に戻れず、誤情報が会話の中で固定・増幅されます。
FCLは、誤りの後に訂正の形をとりながら、誤りが再生産・維持される反復構造を対象とします。
独立研究や新規概念の出所が弱められたり、別の高権威ノードへ誤帰属されたりするリスクを、NHSPとともに扱います。
確認できないときに、新しい断定を重ねるのではなく、Unknownや保留を安定した終端として扱うことが必要です。
NEXT