gemma-guardian.pai — Proactive AI Agent（內嵌 Gemma 4 26B-A4B）

單一 .pai 檔案 = 一個完整、可離線運行的主動式 AI agent。

.pai 是一個類 GGUF 的二進位容器格式，本檔打包了：

段	內容
`manifest.json`	agent 中繼資料
`policy.json`	主動性治理（信心門檻、自主等級上限、干擾度公式）
`triggers.json` / `rules.json` / `actions.json`	宣告式感知/規則/動作
`brain.json`	決策腦設定（llama-server 引擎，`n_ctx=4096`）
`weights.gguf`	google/gemma-4-26B-A4B-it QAT q4_0（14.4 GB，SHA-256 校驗）

此包的 guardian 行為：cpu-monitor（threshold）→ cleanup（清理高負載，最多 ASK）； inbox-watch（filewatch）→ archive_file（自動歸檔，可 ACT）。每個 action 都有對應 trigger， llama-server 不可用時退回 RuleBrain 仍可獨立運作。

使用方式

# 1. 取得框架
git clone https://github.com/vito1317/pai-framework
cd pai-framework

# 2. 安裝推理引擎
brew install llama.cpp   # 或任何提供 llama-server 的安裝方式

# 3. 下載本檔後直接運行
python3 -m pai info gemma-guardian.pai
python3 -m pai run  gemma-guardian.pai

框架會從 .pai 抽出權重、自動啟動本地 llama-server（Metal/CUDA），由 Gemma 4 對事件做主動決策（urgency/confidence/干擾成本），經治理層核准後行動。全程離線，資料不出機。

即時 Self-Finetuning（三層，主幹權重永不變更）

這個 agent 會從使用者回饋中持續自我校準，採三層遞進設計（詳見 SELF_FINETUNING.md）：

層	機制	即時性	動權重
1	ReflectiveMemory — 回饋存成經驗向量，相似情境檢索教訓注入決策	毫秒級	否
2	LoRA adapter 熱插拔 — 回饋→偏好資料集→`llama-finetune`→adapter→`--lora` 載入	分鐘/小時	只動 adapter
3	EvalGate — 候選 adapter 須在離線指標顯著勝出且無退化才上線；可一鍵回滾	天/週	adapter（不上線就丟）

主幹 weights.gguf 永遠不變，學習只新增/切換可回滾的小 adapter，並且任何權重變更都必須先通過品質閘門——這避免了線上學習常見的「越學越壞」與災難性遺忘。

PAID Protocol

協定名為 PAID（Proactive Agent Infrastructure with Dynamic-finetuning）—— 上面三層 self-finetuning 就是其中的 Dynamic-finetuning。每次主動行為輸出一份 6 層 JSON 紀錄（感知/脈絡/預判/執行/交付/學習），可與平台、其他節點互通交換。

需要 paigent >= 0.1.3（含 PAID Protocol + 修掉決策路徑的解析 bug）：

pip install "paigent>=0.1.3"

規格

格式：.pai Binary Format v1（規格）
基底模型：google/gemma-4-26B-A4B-it（QAT q4_0，apache-2.0）
權重 SHA-256：4c856523d61d77922dbc0b26753a6bf6208e5d69d80db0c04dcd776832d054c5
建議硬體：≥24GB 統一記憶體（Apple Silicon）或同級 GPU
實測：Apple M4 32GB — 載入 ~8s（快取後）、單次 LLM 決策 ~35s
n_ctx=4096 為刻意設定（決策 payload 很短，省記憶體；模型原生支援 256K）

不是每個事件都要等 35 秒：採 rule-first 雙層觸發——RuleBrain（前線哨兵）即時、零成本過濾大多數事件，只有規則判定值得深入時才喚醒 Gemma 4 做開放式判斷，那一次才約 35s。

License

框架：MIT。內嵌權重：apache-2.0（Google Gemma 4）。

Author: vito1317 service@vito1317.com

Downloads last month: -; Downloads are not tracked for this model. How to track

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for vito95311/gemma-guardian-pai

Base model

google/gemma-4-26B-A4B

Finetuned

google/gemma-4-26B-A4B-it

Quantized

(255)

this model

vito95311
/

gemma-guardian-pai