gemma-guardian.pai — Proactive AI Agent(內嵌 Gemma 4 26B-A4B)

單一 .pai 檔案 = 一個完整、可離線運行的主動式 AI agent。

.pai 是一個類 GGUF 的二進位容器格式,本檔打包了:

內容
manifest.json agent 中繼資料
policy.json 主動性治理(信心門檻、自主等級上限、干擾度公式)
triggers.json / rules.json / actions.json 宣告式感知/規則/動作
brain.json 決策腦設定(llama-server 引擎,n_ctx=4096
weights.gguf google/gemma-4-26B-A4B-it QAT q4_0(14.4 GB,SHA-256 校驗)

此包的 guardian 行為cpu-monitor(threshold)→ cleanup(清理高負載,最多 ASK); inbox-watch(filewatch)→ archive_file(自動歸檔,可 ACT)。每個 action 都有對應 trigger, llama-server 不可用時退回 RuleBrain 仍可獨立運作。

使用方式

# 1. 取得框架
git clone https://github.com/vito1317/pai-framework
cd pai-framework

# 2. 安裝推理引擎
brew install llama.cpp   # 或任何提供 llama-server 的安裝方式

# 3. 下載本檔後直接運行
python3 -m pai info gemma-guardian.pai
python3 -m pai run  gemma-guardian.pai

框架會從 .pai 抽出權重、自動啟動本地 llama-server(Metal/CUDA), 由 Gemma 4 對事件做主動決策(urgency/confidence/干擾成本),經治理層核准後行動。 全程離線,資料不出機。

即時 Self-Finetuning(三層,主幹權重永不變更)

這個 agent 會從使用者回饋中持續自我校準,採三層遞進設計(詳見 SELF_FINETUNING.md):

機制 即時性 動權重
1 ReflectiveMemory — 回饋存成經驗向量,相似情境檢索教訓注入決策 毫秒級
2 LoRA adapter 熱插拔 — 回饋→偏好資料集→llama-finetune→adapter→--lora 載入 分鐘/小時 只動 adapter
3 EvalGate — 候選 adapter 須在離線指標顯著勝出且無退化才上線;可一鍵回滾 天/週 adapter(不上線就丟)

主幹 weights.gguf 永遠不變,學習只新增/切換可回滾的小 adapter,並且任何權重變更 都必須先通過品質閘門——這避免了線上學習常見的「越學越壞」與災難性遺忘。

PAID Protocol

協定名為 PAIDProactive Agent Infrastructure with Dynamic-finetuning)—— 上面三層 self-finetuning 就是其中的 Dynamic-finetuning。每次主動行為輸出一份 6 層 JSON 紀錄(感知/脈絡/預判/執行/交付/學習),可與平台、其他節點互通交換。

需要 paigent >= 0.1.3(含 PAID Protocol + 修掉決策路徑的解析 bug):

pip install "paigent>=0.1.3"

規格

  • 格式:.pai Binary Format v1(規格
  • 基底模型:google/gemma-4-26B-A4B-it(QAT q4_0,apache-2.0)
  • 權重 SHA-256:4c856523d61d77922dbc0b26753a6bf6208e5d69d80db0c04dcd776832d054c5
  • 建議硬體:≥24GB 統一記憶體(Apple Silicon)或同級 GPU
  • 實測:Apple M4 32GB — 載入 ~8s(快取後)、單次 LLM 決策 ~35s
  • n_ctx=4096 為刻意設定(決策 payload 很短,省記憶體;模型原生支援 256K)

不是每個事件都要等 35 秒:採 rule-first 雙層觸發——RuleBrain(前線哨兵)即時、零成本 過濾大多數事件,只有規則判定值得深入時才喚醒 Gemma 4 做開放式判斷,那一次才約 35s。

相關連結

License

框架:MIT。內嵌權重:apache-2.0(Google Gemma 4)。

Author: vito1317 service@vito1317.com

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for vito95311/gemma-guardian-pai

Quantized
(255)
this model