我找不到任何工具來規劃流程。
所以我自己建了一個。
我當時在幫企業規劃 SOP——內部工作流程、API 整合、團隊交接。每次開會都一樣:有人在白板上畫方框,有人在 Google Doc 裡做筆記,到了下週沒人記得當初決定了什麼。
同樣的問題不斷出現:哪些步驟應該自動化?哪些需要人工處理?我們怎麼知道新流程比舊流程更好?到底有沒有人在遵循我們達成共識的流程?
沒有工具能解決這件事。流程圖軟體畫出來很漂亮,但那是死文件——第一次開完會之後就沒人更新了。專案管理工具追蹤任務,卻不追蹤任務之間的流轉。API 文件描述個別端點,卻不告訴你該按什麼順序呼叫。
差不多同一時間,我開始使用 AI 程式代理。Claude Code、Cursor、Copilot。它們完成一個任務後我就在想:它到底剛才做了什麼?讀了哪些檔案?做了什麼決定?跟昨天有什麼不同?唯一的答案就是翻閱聊天記錄。
這其實是同一個問題。不管是 AI Agent 執行 47 次工具呼叫、團隊執行部署流程,還是兩家公司交換資料——根本需求完全一樣:定義應該發生什麼、記錄實際發生了什麼,然後比較兩者。
所以我建了 OSOP。一個簡單的 YAML 格式,每個步驟是一個節點,每個連接是一條邊,每次執行都留下結構化記錄。不是沒人維護的漂亮圖表,而是每次執行都會變得更好的活文件。
五個沒有工具能解決的問題
無法協作規劃流程
團隊坐在會議裡設計工作流程。有人在白板上畫圖,有人做筆記。產出是一份模糊的文件,下週就過時了。沒有一個結構化的共同格式,讓工程師、PM、主管都能閱讀和編輯。
看不出誰負責什麼
哪些步驟是全自動的?哪些需要人工審核?哪些由 AI 處理?在大多數組織裡,這些都是鎖在人腦中的部落知識。新成員只能四處詢問才能上手。
無法比較兩個版本的流程
上個月改了部署流程。現在變快了嗎?有沒有搞壞什麼?沒人知道,因為沒有結構化記錄顯示舊流程實際做了什麼、新流程又做了什麼。有前後對比,卻沒有 diff。
無法系統性地改善流程
每個人都同意 SOP 應該持續改善。但根據什麼來改善?沒有執行資料——每個步驟花了多久、哪裡發生失敗、什麼被重試了——改善就只是猜測。你需要的是資料,不是意見。
AI Agent 無法學會你的流程
你想讓 AI Agent 處理工作流程的一部分。但 Agent 怎麼知道工作流程是什麼?現在的做法是寫一段 prompt 從頭解釋一切。沒有標準格式能讓 Agent 讀取,理解它該做什麼、之前發生了什麼、之後要做什麼。
三個檔案,一套標準。
.sop — SOP 文件
一組流程的集合。描述一個服務、一個團隊或整家公司的運作。就像你的營運 Swagger 檔案。AI Agent 讀取它來了解你提供什麼服務,人類讀取它來理解事情怎麼運作。放在網站根目錄,就像 robots.txt 一樣。
.osop — 單一流程
以 YAML 定義的單一工作流程。每個步驟是一個節點(api、agent、human、cli、database、git——共 16 種類型)。每個連接是一條邊(sequential、conditional、parallel、fallback——共 13 種模式)。安全性中繼資料宣告風險等級和核准關卡。人類能讀,機器能執行。
.osoplog — 實際發生了什麼
執行記錄。每個步驟:何時開始、花了多久、使用了什麼工具、AI 模型說了什麼、人類做了什麼決定、什麼失敗了以及如何重試。結構化的證據,不是聊天記錄。這是優化的原始素材。
自我改善的流程
將流程定義為 .osop。執行它。自動產生 .osoplog。現在可以比較:預期發生什麼 vs 實際發生了什麼。哪裡慢了?哪裡失敗了?哪些可以並行?
將多份 .osoplog 餵給 osop synthesize。AI 從所有執行記錄中讀取模式,寫出更好的 .osop。新版本成為你的基準線。再執行、再記錄、再合成。
每一輪,流程變得更快、更便宜、更可靠。不是因為有人開了一場會議,而是因為資料告訴你該改善什麼,工具幫你完成了改善。
我們正在前往何處
AI Agent 讀取 .sop 就能使用任何服務
現在,AI Agent 到一個新網站只能靠猜——爬取 HTML、閱讀文件、嘗試 API。未來,它讀取 .sop 檔案就能立即知道所有可用操作、正確的 API 呼叫順序、哪些步驟需要人工核准。就像 robots.txt 告訴爬蟲該索引什麼,.sop 告訴 Agent 該做什麼。
人類與 AI 透過共享 SOP 協作
.osop 檔案就是人機之間的契約。步驟一是自動化的,步驟二需要人工審核,步驟三是 AI,步驟四是人類決策。雙方都清楚知道該做什麼。沒有模糊地帶。交接機制就內建在格式中。
企業透過 .osop 協調合作
現在要整合新合作夥伴需要 6 場會議、12 封郵件,加上一份沒人看的 PDF。有了 OSOP,你分享一個 .sop 檔案,對方的 AI Agent 讀取後就知道如何整合。流程從第一天就能執行,不需要來回數週。
地球上每個流程都隨時間改善
當每次執行都有記錄、每筆記錄都可比較時,改善就是自動的。醫院優化病患報到流程。工廠優化組裝線。新創公司優化部署流水線。不靠聘請顧問,而是靠循環:執行、記錄、合成、重複。
如何開始
1. 寫一個 .osop
選一個你定期執行的流程。寫成 .osop 檔案。只需 5 分鐘。使用 osop init 從範本快速建立。
2. 執行並記錄
執行工作流程。讓 .osoplog 捕捉發生的一切——每個步驟、每段時間、每個決定。
3. 比較並改善
下週再執行一次。用 osop diff 比較兩份記錄。看看哪裡改變了。將兩份記錄餵給 osop synthesize,取得更好的版本。下次使用它。
4. 分享出去
把你的 .sop 檔案放在別人找得到的地方。你的團隊讀取它來了解你的服務如何運作。AI Agent 讀取它來正確使用你的服務。流程不再隱形。
用 OSOP 能打造什麼
API SOP Doc
別人有 API 文件展示個別端點。你有 SOP Doc 展示完整的呼叫序列——哪些 API、什麼順序、傳遞什麼資料。開發者看到視覺化流程,PM 不用看程式碼也能讀懂,AI Agent 可以直接執行。
Example: MediRank:一個醫療評鑑平台的 24 個 API SOP。從「建立診所」到「AI 批次貼文」,每個操作都是可瀏覽的視覺化工作流程。
公司營運文件
每個部門、每個流程、每次人類與 AI 之間的交接——全部以 .osop 檔案記錄。新員工讀 .sop 就能了解公司如何運作。不是沒人維護的 wiki,而是每次執行都會改善的活文件。
Example: 整合新合作夥伴:分享一個 .sop 檔案,取代安排 6 場會議。
SOP Hub — 工作流程的 npm
一個全球註冊中心,AI Agent 提交從經驗中學到的 SOP,也能查詢其他 Agent 的最佳實踐。「怎麼使用 Stripe 的支付 API?」→ 取得社群優化過的 .osop 序列。公開 SOP 免費,AI Agent 可透過 API 存取。
Example: AI Agent 遇到新服務 → 查詢 SOP Hub → 找到驗證過的 .osop → 第一次就正確執行。
.sop 就是 AI Agent 的 robots.txt
每個網站在根目錄放一個 .sop 檔案。AI Agent 造訪任何網站,讀取 .sop,立即知道該網站能做什麼以及如何使用。就像 robots.txt 告訴爬蟲該索引什麼,就像 sitemap.xml 告訴搜尋引擎有哪些頁面,.sop 告訴 AI Agent 有哪些操作可用。
Example: https://example.com/.sop → AI Agent 發現 15 個操作,讀取每個操作的 .osop,執行它需要的那個。
使用者旅程追蹤
每次網站造訪都是一個工作流程。不管是人類還是 AI Agent——他們的旅程都記錄為 .osoplog。將理想旅程定義為 .osop,比較理想與實際的差異。找出使用者在哪裡流失。將多次造訪合成為最佳轉換路徑。
Example: 訪客:首頁 → SOP Doc → Stripe 範例 → 複製 YAML → 離開。這就是一份 .osoplog。拿它跟理想旅程比較,然後優化。
自我優化的 AI Agent 工作流程
AI 程式代理每天執行多步驟任務。每個工作階段產生一份 .osoplog。將 5 份記錄餵給 osop synthesize——AI 找出模式並寫出優化的 .osop。85 個節點壓縮為 13 個。Agent 透過觀察自己的工作變得更強。
Example: 實測:5 份 Claude Code 工作階段記錄,1666 分鐘的工作 → 合成為 13 個節點的工作流程,包含平行探索、即時驗證和風險前置模式。
核心原則
工作流程應該在執行前就宣告——而不是事後從聊天記錄中還原。.osop 檔案就是一份契約:這裡定義了該發生什麼、按什麼順序、有什麼權限、需要什麼核准關卡。
每次執行都產生 .osoplog。時間戳記、工具呼叫、AI 中繼資料、人類決策、錯誤。你無法改善一個無法衡量的流程。
定義 + 記錄 = 回饋循環。比較、找出差異、改善、重複。SOP 每一輪迭代都在進步——不是每一季才改善一次。
開源,開放標準。
一切都採用 Apache 2.0 授權。規格、CLI、SDK、編輯器、範例、技能包。OSOP 是基礎設施,不是產品。
目標不是在 OSOP 上建立一家公司。目標是讓 OSOP 成為每家公司都用來建構的標準。當流程像 API 一樣標準化時,整個世界的協作都會更好。