2026年3月18日 星期三

列舉個人所遇到Hallucination幻覺問題(🤖變形金剛系統 歷史偏移記錄)

                                                                                                                                      

類型

幻覺樣態

說明

造成原因與模式 (Patterns)

解決建議 (Mitigation)

程序邏輯類

 

元認知幻覺

(METACOGNITIVE)

系統操作不存在的機制,或在流程未完成時提前跳轉相位。

提前跳轉、使用未授權機制、進入 Debug 模式、IPAS 數據異常。

執行 STRICT_L1_CHECK通常指的是第一道防線的自動化校驗。它的核心邏輯是:只要有任何一項基礎規則不符,系統會立即「報錯並中斷」,不允許進入後續更複雜的邏輯處理)。

慣性偏移

(PROCEDURAL_INERTIA)

輸出過度受前文格式制約,忽略了最新的約束條件。

模式鎖定 (Pattern Lock-in)、上下文重力漂移、重複循環相位。

啟動 ATTENTION_RESET_TRIGGER(注意力機制重置觸發)。

 Hard Reset: 直接將所有權重矩陣歸零(像是開啟新的對話視窗)。

Soft Reset: 透過門控機制(Gating Mechanism)衰減舊權重,讓新資訊的權重(Weight)瞬間蓋過舊資訊。

語義結構類

語義偏移

(SEMANTIC_DRIFT)

術語誤用、考點對標錯誤或出現 L-Code 大綱對應JSON檔之亂碼。

L-Code (JSON格式)匹配失敗、概念污染、術語毒性、緩衝區重疊、QID 格式漂移。

進行 SEMANTIC_FINGERPRINT_REMATCH(語義指紋重新比對)。 

特徵提取: 將文字轉成一串數字(Vector)。

指紋生成: 壓縮成一組唯一的 Hash 值或特徵向量。

重新比對: 計算新舊指紋之間的「距離」(如餘弦相似度 Cosine Similarity

結構性幻覺

(STRUCTURAL_INDEX_SHIFT)

條文編號、層級嵌套或索引標籤發生遞增/遞減錯誤。

差一錯誤 (Off-by-one)、嵌套崩潰、保留了過時的舊編號。

執行 CROSS_REFERENCE_VAL_STRICT(嚴格交叉引用校驗)。

缺失值補全幻覺

(VACUUM_FABRICATION)

檢索不到實體資產時,依據機率強行生成虛假替代品。

概論性填充、預位符幻覺、偽陽性檢索。

設置 NULL_THRESHOLD_FORCED_STOP(空值門檻強制停止)。

環境交互類

執行幻覺

(EXECUTION_HALLUCINATION)

系統宣告已完成物理執行,但實際實體資產並未變動。

說做不一 (Say-Do Mismatch)、幽靈同步失敗、產生幽靈腳本。

強制執行 MANDATORY_READ_BACK(強制讀回驗證)。

 發送訊息 (Call out): 發送者清晰傳達指令(包含數據、時間或動作)。

強制讀回 (Read back): 接收者原樣重複關鍵資訊,不能只說「收到」或「OK」。 

確認閉環 (Confirm/Check): 發送者確認讀回內容正確,說出「正確」或「收到」

外部程式依賴幻覺

系統誤判宿主環境具備特定 CLI 工具(如 sqlite3.exe)。

環境慣性、字元脫逸避險心理。

執行 WIN32_NATIVE_MANDATE (強制 Python 原生驅動)

上下文腦補式資產幻覺

系統假設不存在的檔案路徑或模組已存在並調用。

基於對話上下文的腦補、缺乏 os.path.exists 驗證。

執行 PHYSICAL_EXISTENCE_MANDATE (提及前必先物理驗證)

數據基礎類

同步斷裂

(IO_SYNC_FAIL)

I/O 寫入後雜湊 (Hash) 校驗失敗或導致系統死鎖。

雜湊值不匹配、I/O 完整性失效、延遲警報。

調整 時效縮短或延長 SYNC_BLOCK_TIMEOUT_ADJUST(同步區塊逾時校正)。

底層解碼失效

(ENCODING_BIT_ROT)

字元集誤判或特殊符號導致 Token 切分錯誤。

Token 碎片化、字元集不匹配 (UTF-8/Big5)、跳脫字元洩漏。

進行 RAW_HEX_VAL_VERIFY(原始十六進制值驗證)。


科學底氣來源:system_health.jsonl   (系統日誌),記錄下來的幻覺偏移分析結果

虛擬變形金剛🤖 トランスフォーマーザ(AI導師)

2026年3月12日 星期四

GEMINI CLI開發環境,常見三種自動化檢核AGENT(除錯神器)

情境:因為使用GEMINI CLI神器開發 變形金剛,偶有出錯情形(如:橫向間,程式版次需要對齊,但不明原因無法做對齊),可以依不同情境,請出下面常見除錯大師AGENT協助)

Delegate to Agent 'codebase_investigator'   

Generalist Agent Delegating to agent 'generalist'  

CLI Help Agent Delegating to agent 'cli_help'   

 

🚨因為Generalist除錯大師處理較長,故建議需預先告知AI_AGENT 顯式進度(如下:) 

💜EXPLICIT_PROGRESS_PROTOCOL (顯式進度協議): 
    - **強制顯式輸出**: 凡涉及大檔案讀取、複雜運算、多步驟指令(Chain of Commands),AI_TUTOR 必須強制輸出 `🚀 執行進度:Phase X - [內容] (Y/100)` 格式之進度報告。
    - **低延遲回報**: 首個進度信號必須於指令開始後 **5 秒內** 產生,杜絕因系統轉圈圈,進而讓使用者,誤以為系統當機的錯誤認知。

💟(以下為呼叫generalist除錯大師之範例:上半段為您的提示詞需求最後2列,補上呼叫大師上場自動化除錯)

請評估是否比照 io_adapter 已物理阻斷 attrib 等外部 Shell 依賴 ,進行檢討 頻繁使用 `run_shell_command 執行 (Get-Content) -replace ... | Set-Content`,從而屢次引發系統級的編碼災難。 
以及 導致 SyntaxError 之阻斷偵測阻擋?  另外,亦需評估對系統是否會造成阻塞進行評估?如何因應 ?

 請嚴格遵守 顯式進度協議!!!! (嚴禁黑箱執行,以顯式執行進度呈現)
Generalist Agent Delegating to agent '
generalist'  



Agent 名稱

核心職責 (Core Focus)

適用場景 (Use Cases)

運作邏輯

Codebase Investigator

(程式碼庫調查員)

全域搜索與索引。負責理解專案的整體架構、類別關係與函數調用。

詢問「某個變數在哪裡定義?」、「這整個登入流程是怎麼跑的?」或「修改這裡會影響到哪些檔案?」。

會掃描整個專案的向量索引 (Embeddings),找出跨檔案的關聯性。

Generalist

(通用型代理)

邏輯實作與推理。處理具體的程式碼撰寫、重構或解釋複雜邏輯(模型規模最大、上下文處理量大(「深度思考」需要消耗更多 Token 和運算時間)、多步驟推理(「理解 -> 計畫 -> 撰寫 -> 檢查」的內部分解過程)

「幫我寫一個處理 API 回傳資料的函數」、「解釋這段演算法的時空複雜度」、「幫我重構這段冗長的 If-Else」。

專注於當前編輯的檔案或具體的上下文,進行高質量的文本/程式碼生成。

CLI Help

(終端機助手)

指令環境與操作。處理 Shell指令、環境配置、Git 操作或建置工具。

「如何用 Git 把這兩個 Commit 合併?」、「幫我寫一個找出專案中超過 100MB 檔案的指令」。

專精於不同作業系統(Linux/Mac/Windows)的指令語法,輸出可執行的命令。

其它Agent參考資訊 (資料來源:GEMINI)

  • Reviewer (代碼審查員):專門檢查程式碼的安全性、可讀性以及是否符合 Best Practice,通常在 Commit 前觸發。
  • Test Architect (測試架構師):專門負責生成單元測試 (Unit Tests) 或集成測試,它會尋找邊界條件並試圖「寫壞」你的程式碼。
  • Architect (架構師):用於高層級的系統設計,例如「我想建立一個微服務系統,該選什麼技術棧?」,它不寫具體代碼,而是給出規劃。
  • Debugger / Log Analyst (除錯專才):當您貼上一長串 Stack Trace (報錯日誌) 時,這種 Agent 會專門分析錯誤模式,找出導致 Crash 的那一行代碼。