2026年5月29日 星期五

本地運行開源模型安裝OLLAMA

情境: 因為GEMINI CLI-->ANTIGRAVITY CLI升級後,TOKEN數常耗盡不足,在評估筆者電腦硬體設備效能與OLLAMA模型(如 Llama 3.1 8B、  Qwen 2.5 14B 等) 規模其回應時間前提考量,安裝2套於電腦內,減緩TOKEN消耗

💜 如果您的顯示卡顯存 (VRAM) 有 12GB ~ 16GB 以上(例如 RTX 3060 12G, RTX 4070/4080 等):
 💟 推薦模型一 (總容量約9G): qwen2.5-coder:14b
      • 能力:邏輯推理能力更強,能處理更複雜的 Python 演算法重構與 Bug 排查。
      •主要用途:重裝裝甲兵 (適合 RCA 深度除錯)
      • 安裝指令: ollama run qwen2.5-coder:14b

 💟縮小版模型 qwen2.5-coder:3b   ,
  •主要用途:筆者安裝模型(總容量約1.9G) ,做高速機動兵 (適合快速問答、輕量級考點對位)
 • 安裝指令: ollama run qwen2.5-coder:3b

💜安裝步驟
  為了協助您安裝 Ollama 並下載  qwen2.5-coder:14b ,我們將進行以下步驟:

  ### 1. 下載並安裝 Ollama (Windows 版本)

  Ollama 官方提供了適用於 Windows 的安裝檔。您可以點選下方官方連結進行下載與安裝:

  • 官方下載連結:https://ollama.com/download/OllamaSetup.exe

  ### 2. 下載後的安裝流程

  1. 下載完成後,執行  OllamaSetup.exe  並完成安裝步驟。
  2. 安裝完成後,Ollama 會在 Windows 工作列右下角啟動(顯示一隻小羊駝圖示 🦙)。

  ### 3. 下載  qwen2.5-coder:14b  模型


  安裝完成後,請重新開啟 PowerShell 或命令提示字元,然後執行以下指令下載模型:

    ollama pull qwen2.5-coder:14b

💜請協助改用OLLama 執行教練考 IPAS_TEACH_EXPERT(此為筆者自行建立之教練考技能) ,而不是ANTIGRAVITY CLI (如此後續進行教練考之學習,就會改採本地端模型執行,不會耗用TOKEN數),呼叫方式:💢需確認OLLAMA服務是否已啟用(即 http://localhost:11434/    Ollama is running 啟用狀態 ,此服務如果沒有正常啟用,本地端模型將無法正常工作)

### 成果概要:
  1. Ollama 模型部署:成功下載並載入  qwen2.5-coder:14b  頂規模型。
  2. 建立本機教練考引擎:撰寫 run_coach_ollama.py,串接本地的 SQLite 資料庫(SSoT 物理真實對位)與 Ollama API,執行原子化詳解輸出。  
  3. 安全硬化:嚴格排除任何 LaTeX 數學符號(符合 Math Detox 規範),並遵循teaching_cycle_template.md  之 7D+2 結構設計。
  4. 預檢成功:通過  py_compile  語法校驗以及  --test-only  的連線與推論測試。

### 如何執行您的本地教練考:
  請在終端機(POWERSHELL)中執行:    python run_coach_ollama.py

###啟用本地端深度除錯    python run_rca_ollama.py  
Ollama IPAS_RCA_EXPERT (14B) 深度除錯診斷系統...


💜檢查 Ollama 背景服務是否已啟用,您可以透過以下幾種最簡單的方法來確認:

  ### 方法 1:使用網頁瀏覽器或  curl  測試(最直接)

  Ollama 啟動後預設會在本地的  11434  連接埠(Port)提供服務。

  • 網頁瀏覽器:在瀏覽器網址列輸入  http://localhost:11434 。
      • 如果已啟用:網頁會顯示 "Ollama is running"。
      • 如果未啟用:瀏覽器會顯示「無法連上這個網站」或連線失敗。
  • 命令提示字元 (cmd) 或 PowerShell:
  執行以下指令:
    curl http://localhost:11434
  若成功連線,會回傳  Ollama is running 。
  ──────
  ### 方法 2:使用命令列工具指令

  開啟 PowerShell 或 命令提示字元 (cmd),輸入以下指令:

    ollama list

  • 如果已啟用:會列出您目前已下載的模型清單(即使沒有模型也會顯示欄位標題如  NAME 、 ID  等)。
  • 如果未啟用:會出現錯誤訊息,例如:
  │  Error: could not connect to ollama app, is it running?

  ──────
  ### 方法 3:檢查 Windows 工作管理員與系統匣

  • 系統匣(右下角工作列):檢查 Windows 工作列右下角的隱藏圖示中,是否有一個 大羊駝(Llama) 的小圖示。如果有,代表 Ollama
  正在背景運行。
  • 工作管理員:
      1. 按下  Ctrl + Shift + Esc  開啟「工作管理員」。
      2. 切換到「詳細資料」或「處理程序」頁籤。
      3. 尋找是否有  ollama.exe  或  ollama_llama_server.exe  正在執行。

  ### 如何啟動 Ollama 服務?
  您可以透過以下方式啟動它:
  1. 使用 Windows 開始功能表:
  在 Windows 搜尋列輸入 Ollama,然後點擊開啟它。啟動後,您應該會在右下角系統匣看到羊駝的圖示。
  2. 使用命令列啟動:
  如果您想直接在命令列啟動服務,可以執行以下指令:     ollama serve
  (注意:這個指令會持續執行,若要測試連線,請保留此視窗,並開啟另一個視窗輸入  curl http://localhost:11434 )

其它資訊: OLLAMA /LIST 列出電腦內所安裝之模型。