記錄 AI 做了什麼,
然後免費重跑。
OSOP 從真實 transcript 證據捕獲任何 Claude Code session(不是 LLM 事後回憶),再用新的 AI agent 重跑同一條路徑。收多份 osoplog,diff、optimize。
開源 · Apache 2.0 · 8 個 CLI 指令 · canonical osoplog v1.0 schema
osop log
從真實的 Claude Code transcript JSONL 捕獲整個 session 成 .osop + .osoplog — 每個 tool call、每個時間戳、每個 output。不靠 LLM 事後回憶。
可選的 SessionEnd hook 在每次 session 結束自動跑 `osop log`。每次捕獲都是真實證據:真 timestamp、真 tool 次數、真 failure。閉環的前半段。
osop replay
用新的 AI agent 透過 `claude -p` 重跑捕獲的 .osop。同樣的 prompt、同樣的 tool 序列、同一條路徑 — 產出可與原本 osoplog diff 比對的新 osoplog。
每跑一次就是一個 `osop diff` 跟 `osop optimize` 的資料點。同一個 workflow 跑 N 次,看哪些步驟確定性高、哪些是 noise、哪裡變快、哪裡 regression。閉環的後半段。
實際運作展示
OSOP 用自己的格式來說明自己。點 Visual 查看流程圖。點 .osop 查看 YAML。
Stripe 支付流程(API SOP)
建立 Stripe 客戶,包含電子郵件與中繼資料。
建立支付意圖。金額、幣別、客戶 ID。
以支付方式確認付款。
驗證付款是否成功。
AI 產生個人化收據電子郵件。
Record / Repeat 閉環
從 transcript JSONL 捕獲真實的 Claude Code session 成 .osop + .osoplog。
透過 claude -p 用新的 AI agent 重跑捕獲的 .osop,產出更多 .osoplog。
並排比對兩個 .osoplog。逐步驟的持續時間、成本、狀態變化。
將多個 .osoplog 餵給 AI。AI 寫出更好的 .osop。
接受、修改或拒絕。由人類決定 land 什麼。
一切服務於兩大支柱
CLI、編輯器、SDK、轉換器、MCP 伺服器、代理整合。全部開源。
SOP Doc
“一開始只是想知道 AI 做了什麼。後來我發現每個團隊都有同樣的問題 — 流程是看不見的。每一個 API 序列、每一個公司工作流程、每一次人類與 AI 的協作。如果看不見,就無法改進。OSOP 讓它變得可見。”
— 為什麼要做 OSOP
記錄 AI 做了什麼,然後免費重跑。
`osop log` 捕獲 session。`osop replay` 重跑同一條路。兩個檔案(.osop + .osoplog)讓每個 Claude Code session 變成可重跑、可 diff、可 optimize 的 workflow。
pip install osop