實戰手冊 · Field Manual 2026 春季號

github.com/garrytan/gstack · 94.7k ★

第 01 期 · 開源工程 / AI Agent

把 Claude Code,
變成你的 23 人
工程團隊。

gstack 是 Y Combinator 執行長 Garry Tan 公開的個人 Claude Code 設定檔——23 個有觀點的斜線指令,讓單一 AI 化身為 CEO、設計師、工程經理、QA 主管、資安長、發布工程師。這份手冊帶你 30 秒安裝、走完 Think→Ship 完整流程,並收錄 Reddit/HN 社群實戰技巧與 Prompt 設計範例。

94.7k

GitHub Stars

斜線指令技能

30s

安裝時間

MIT

永久免費授權

這到底是什麼

不是外掛,
是一套對 AI 的管理哲學。

Garry Tan 是 Y Combinator 現任執行長,曾是 Palantir 早期工程師、Posterous 共同創辦人(被 Twitter 收購)。他公開承認:過去 60 天他出貨了 3 個正式產品、40+ 功能,而這只是他經營 YC 的「兼職」。他自己統計過,以邏輯程式碼變動量(非單純行數)計算,2026 年的產出速度是他 2013 年寫 Bookface 時的 810 倍。

他歸功於兩件事——Claude Code 加上他自己一年多打磨的這套設定檔 gstack。它不是新的 IDE,也不是 LLM 替代品,本質上只是一堆 Markdown 寫的 SKILL.md 檔案,放在 ~/.claude/skills/gstack/。每一個檔案對應一個工作角色:CEO、產品策略、工程經理、設計師、QA、資安長、發布工程師。當你輸入 /office-hours 或 /review,Claude Code 會載入對應 SKILL,切換成那個角色的思考方式。

重點不是「省下 prompt」,而是強迫流程化。Garry 把矽谷 Sprint 的節奏寫進 Markdown 裡:Think → Plan → Build → Review → Test → Ship → Reflect。每一階段都有專屬指令,每個指令會把工作成果寫到 ~/.gstack/projects/,下一個指令會自動讀取。AI 不再憑感覺接力,而是真的有「上下文交班」。

gstack Sprint · 完整生命週期

Think→ Plan→ Build→ Review→ Test→ Ship→ Reflect

「I don't think I've typed like a line of code probably since December.」
過去四個月,我幾乎沒手打過半行程式。

— Andrej Karpathy(OpenAI 共同創辦人)2026 年 3 月 No Priors Podcast

30 秒安裝

把指令貼進你的 Claude Code,
剩下交給它。

先確認你的環境有這四個東西:Claude Code、Git、Bun v1.0+、Node.js(只有 Windows 需要)。然後在 Claude Code 對話框直接貼以下指令,讓 Claude 自己幫你完成 git clone、執行 setup、修改 CLAUDE.md。

# 貼這段給 Claude Code,它會自己安裝
Install gstack: run git clone --single-branch --depth 1 https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
&& cd ~/.claude/skills/gstack && ./setup
then add a "gstack" section to CLAUDE.md that says to use the /browse skill from gstack for all
web browsing, never use mcp__claude-in-chrome__* tools, and lists the available skills:
/office-hours, /plan-ceo-review, /plan-eng-review, /plan-design-review, /design-consultation,
/design-shotgun, /design-html, /review, /ship, /land-and-deploy, /canary, /benchmark, /browse,
/qa, /qa-only, /design-review, /retro, /investigate, /document-release, /codex, /cso, /autoplan, /learn.
      

團隊模式:讓整個 repo 同步使用同一版本

如果你想讓專案隊友自動拿到相同的 gstack 設定(每個 Claude Code session 啟動時都會做一次節流的自動更新檢查),從你 repo 根目錄貼這段:

(cd ~/.claude/skills/gstack && ./setup --team) && \
~/.claude/skills/gstack/bin/gstack-team-init required && \
git add .claude/ CLAUDE.md && \
git commit -m "require gstack for AI-assisted work"
      

不只 Claude Code。gstack 支援 10 種 AI Coding Agent——OpenAI Codex CLI、OpenCode、Cursor、Factory Droid、Slate、Kiro、Hermes、GBrain、OpenClaw。執行 ./setup --host codex(或其他名稱)就會安裝到對應位置。也就是說你切換 AI Agent 時,工作流程不會斷掉。

23 個斜線指令

每個指令
都是一位專家。

gstack 的設計哲學很 YC:一位優秀創辦人應該能切換不同思考模式——CEO 看策略、工程經理鎖架構、設計師抓 AI Slop、QA 真的開瀏覽器點按鈕。下表把 23 個指令依工作階段分組。實務上你不用每個都背,記住 /office-hours、/autoplan、/review、/qa、/ship 這五個核心就能跑完一輪。

Think · 01

/office-hours

YC Office Hours

六個逼問,把你的功能要求重新框成更大的產品問題。產出 design doc 餵給下游所有技能。

Plan · 02

/plan-ceo-review

CEO / 創辦人

尋找請求底下隱藏的「10 星級產品」。四種模式:擴張、選擇性擴張、守住、減法。

Plan · 03

/plan-eng-review

工程經理

鎖架構、資料流、ASCII 圖、邊界案例、測試矩陣。逼隱性假設浮出水面。

Plan · 04

/plan-design-review

資深設計師

每個設計維度 0–10 評分,解釋 10 分長什麼樣,再改 plan 過去。專抓 AI Slop。

Plan · 05

/autoplan

自動審查管線

一條指令,跑完 CEO → 設計 → 工程 → DX 全部審查。只把口味判斷拋給你決定。

Plan · 06

/design-consultation

設計合夥人

從零建立完整設計系統。研究產業現狀、提出有風險的選項、生成擬真產品 mockup。

Build · 07

/design-shotgun

設計探索員

「給我選項」。生成 4–6 個 AI mockup,瀏覽器開比較板讓你選,口味記憶會學習。

Build · 08

/design-html

設計工程師

把 mockup 轉成真實可上線的 HTML。文字會 reflow、高度自適應,30KB、零依賴。

Review · 09

/review

Staff 工程師

抓 CI 過得了但上線會炸的 bug。明顯的自動修,完整性缺口會標註。

Review · 10

/codex

第二意見

獨立呼叫 OpenAI Codex CLI 做 cross-model 審查。三種模式:審查、對抗、諮詢。

Review · 11

/cso

資安長 CSO

OWASP Top 10 + STRIDE 威脅模型。零雜訊:17 個誤判排除規則、8/10 信心門檻、附攻擊情境。

Review · 12

/investigate

除錯專家

系統性根因除錯。鐵律:沒查清楚不准修。追資料流、測假設,連敗三次就停。

Review · 13

/design-review

會寫 code 的設計師

同 /plan-design-review 的審查,但會真的進去修。原子提交、前後截圖。

Test · 14

/qa

QA 主管

真的開 Chromium 點你的網站,找到 bug 就原子提交修掉、自動產生 regression test。

Test · 15

/qa-only

QA 報告員

同 /qa 但只給報告不動 code。純 bug report。

Test · 16

/browse

QA 工程師

給 agent 一雙眼睛。真實 Chromium、真實點擊、真實截圖。每個指令約 100ms。

Test · 17

/benchmark

效能工程師

基線 page load、Core Web Vitals、資源大小。每個 PR 都比 before/after。

Ship · 18

/ship

發布工程師

同步 main、跑測試、稽核覆蓋率、push、開 PR。沒測試框架自動 bootstrap。

Ship · 19

/land-and-deploy

SRE 發布

合 PR、等 CI 跟部署、驗證 production health。一條指令從「核准」到「確認生產環境健康」。

Ship · 20

/canary

部署後 SRE

部署後監控迴圈。盯 console error、效能退化、頁面失敗。

Ship · 21

/document-release

技術寫作

交叉比對 diff,自動更新所有過期的文件:README、ARCHITECTURE、CONTRIBUTING、TODOS。

Reflect · 22

/retro

工程經理回顧

團隊感知週度回顧。個人拆解、出貨連續紀錄、測試健康趨勢。/retro global 跨工具統計。

Reflect · 23

/learn

記憶管理

管理 gstack 跨 session 學到的東西。review、search、prune、export 你的 codebase 模式。

該用哪個 review?一張表決定

你在做什麼	計畫階段(寫 code 前)	上線審查(寫完 code 後)
給終端用戶用的 UI、Web app、行動 app	`/plan-design-review`	`/design-review`
給開發者用的 API、CLI、SDK、文件	`/plan-devex-review`	`/devex-review`
架構、效能、資料流、測試	`/plan-eng-review`	`/review`
三種都涉及(全部都跑)	`/autoplan` 會自動判斷哪些適用

社群密技 · Reddit / HN

玩過的人,
都這樣用它。

gstack 在 Reddit 的 r/ClaudeCode、r/ChatGPTCoding 與 Hacker News 都引發兩極討論——支持者稱它是「個人化的 Sprint 過程引擎」,反對者把 Garry「每天五百萬行」的數字當笑話。但細看實際使用者(尤其是把它套到 AI/Skill 類專案的人)整理出的具體技巧,有幾條值得拿來用。

TIP 01

不要把 23 個都記起來

多位開發者實測後共識:對小任務只用 /office-hours + /review + /ship 三件套。多角色切換有額外成本,只有跨日的多功能專案才值得跑完整 sprint。

來源 · r/ClaudeCode 多則討論

TIP 02

把 /office-hours 當「Brian Chesky 模式」

Garry 自己在 docs/skills.md 寫的玩法:對任何模糊想法都先丟給 /office-hours。它會逼問六個問題,把「日報 app」這種需求重構成「個人幕僚 AI」,範圍更野、但更貼近真痛點。

來源 · 官方 docs/skills.md

TIP 03

AI Skill 專案用 /skillify 快速封裝

repo 裡有個冷門目錄 skillify/——它會把你寫好的工作流程封裝成新的 Claude Skill,類似 gstack 自己。如果你在做 AI agent / skill 類產品,用它做 dogfooding 是最快的迭代方式。

來源 · garrytan/gstack repo

TIP 04

跑 10–15 個 parallel sprint 用 Conductor

Garry 公開承認他常開 10–15 個 Conductor session 並行。技巧是先用 /office-hours 把 design doc 落到 ~/.gstack/projects/,各 session 都讀同一份 doc 才不會發散。

來源 · 官方 README + HN 討論

TIP 05

/codex 給你「跨模型第二意見」

同一段 diff,讓 Claude 跑 /review,再讓 OpenAI Codex CLI 跑 /codex。兩邊都標的 finding 通常是真的;只有一邊標的,八成是模型偏見。Reddit 上 AI 專案開發者最愛這招。

來源 · r/LocalLLaMA 多則

TIP 06

聲控觸發:「run a security check」

gstack 的每個 SKILL.md 都有 voice trigger 短語。搭配 AquaVoice 或 Whisper 在 Mac 上講「run a security check」、「do an engineering review」就會啟動對應指令——不用記斜線名稱。

來源 · 官方 README + agenticcoding.substack

TIP 07

continuous checkpoint 模式救命

執行 gstack-config set checkpoint_mode continuous 後,任何技能跑到一半都會自動 commit 一個 WIP: 前綴 + [gstack-context] 結構化說明。Claude Code 崩潰或 context 爆炸時,用 /context-restore 就能完整接回。

來源 · 官方 README · v0.19 更新

TIP 08

Domain Skill 讓 agent 越用越懂網站

遇到 LinkedIn、Notion 之類常爬的網站,用 $B domain-skill save 寫一條備忘(像「LinkedIn 的 Apply 按鈕在 iframe 裡」)。下次再造訪同 hostname 會自動觸發,連跨專案都能共用。

來源 · docs/domain-skills.md

TIP 09

把 /qa 當你的真 E2E 測試員

Reddit 開發者最讚的就是這個:/qa <url> 會真開瀏覽器點按鈕、發現 bug、修掉、為這個 bug 生 regression test、再驗證。這是把「vibe coding」變安全的關鍵。

來源 · r/ClaudeCode 高讚 thread

TIP 10

Skill 專案套 /cso 找 OWASP 漏洞

AI agent / Skill 類專案最容易踩 prompt injection 跟 data exfil。/cso 內建 STRIDE + OWASP Top 10,17 條誤判排除規則,每個 finding 都附具體攻擊腳本——比一般 SAST 更貼近 LLM 場景。

來源 · 官方 README · 安全段落

Prompt 設計實例

看 /office-hours 怎麼
把模糊想法逼成產品。

以下是一段真實情境改寫:你想做一個「給小孩用的 AI 學習助手」,但沒講清楚誰用、解決什麼痛點。看 gstack 怎麼透過 /office-hours 把你拉回到第一性原理,接著用 /autoplan 跑完三輪審查、/qa 真的開瀏覽器測試、/ship 開 PR。

~/projects/ai-tutor · claude code · gstack v0.19

You › 我想做一個 AI 學習助手給我兒子用,他國中,英文跟數學需要陪讀。

You › /office-hours

[loaded ~/.claude/skills/gstack/office-hours/SKILL.md] [entered Founder Mode · Brian Chesky framing]

Claude(YC Office Hours)› 在你開始 coding 之前,我要先逼問你六個問題—— 不是因為我懷疑你的點子,而是因為「AI 學習助手」這個框架,八成不是你兒子真正需要的東西。

Q1 / 上週他學習時,最讓他卡住的具體 30 分鐘是什麼? (請給我一個真實場景,不是「英文不好」這種抽象描述)

You › 上週四晚上他在寫英文閱讀測驗,看到一個句子有三個生字, 他不想查字典就直接寫錯了,結果整題都錯。他不是不會,是懶。

Claude › 好。我要 push back 一下你的框架—— 你說的是「AI 學習助手」,但你描述的痛點是: · 查字典摩擦太大 → 他選擇猜 · 沒人盯著 → 他不會回頭檢查 · 出錯後沒有後果 → 學不到教訓

這不是學習助手問題,是「無痛輔助查詢 + 自動回饋迴圈」。

[extracts 5 capabilities you didn't realize you were describing] 1. 圈詞即時翻譯(零摩擦) 2. 寫完自動標出他可能誤解的句子 3. 錯題的微反饋(不是答案,是線索) 4. 跨日累積:同一個字第二次又錯 → 提示 5. 給你(爸爸)每週簡報,看他哪邊真的卡住

[challenges 4 premises — you agree / disagree / adjust] ✗ 假設:他需要「對話式 AI」→ 反而會分心。 ✗ 假設:他想要「正確答案」→ 他想要「不被罵」。 ✓ 假設:他用平板 → 圈詞比敲鍵盤摩擦低 10 倍。 ✗ 假設:你想跟他 collaborate → 你其實想「不用每晚陪寫」。

RECOMMENDATION: 先做最窄的楔子 → 一個 iPad 圈詞翻譯小工具, 搭配每週爸爸簡報。明天就能上線。完整願景是三個月專案——先驗證楔子。

[wrote ~/.gstack/projects/ai-tutor/design-doc.md] [7 sections, 1,847 words, ready for downstream skills]

You › /autoplan

[reads design-doc.md] [Phase 1/4 · CEO review · scope decision: HOLD SCOPE] [Phase 2/4 · Design review · 8/10 — 修了文案層級] [Phase 3/4 · Eng review · 鎖架構 + 4 個 edge cases] [Phase 4/4 · DX review · TTHW = 90s,通過]

Claude › 三個 taste 決定要你拍板,其他我都先決定了: A. 圈詞翻譯時要不要播發音? B. 每週簡報用 email 還是 LINE? C. 錯題提示要直白還是蘇格拉底式?

You › A 要,B LINE,C 蘇格拉底式。Exit plan mode.

[implementing... 2,400 lines across 11 files · ~8 min]

You › /review

[AUTO-FIXED] 2 issues · 拼字、unused import [ASK] race condition in word-cache writer → approve fix? y

You › /qa https://staging.tutor.app

[opens chromium · clicks through flows · takes screenshots] I SEE THE ISSUE — 圈詞翻譯在小於 768px 時 popup 蓋到下一行。 [fix committed · regression test generated · re-verified ✓]

You › /ship

Tests: 42 → 51 (+9 new) PR: github.com/you/ai-tutor/pull/14 · ready for review

你說「AI 學習助手」,但你描述的痛點是
查字典摩擦太大,他選擇猜。
這不是學習助手問題。

— /office-hours 的逼問,把模糊需求逼回真正的問題

這段對話為什麼值得拆解

你說「學習助手」,agent 說「你在做幕僚」——這不是 LLM 的魔法,是 gstack 在系統 prompt 裡硬寫了「不要照字面接 ticket、要找隱藏的真問題」。/office-hours 的 SKILL.md 大概 600 行,前 100 行就是逼模型切換到 Founder Mode 的指令。

八個指令,從模糊想法走到 PR——這就是 23 人團隊的意義:你不是少了一個工程師,而是少了一個會在你寫 code 之前先逼你想清楚的產品總監。

先看清楚這些

不是銀彈。
知道邊界再上路。

對小任務反而拖累。修個 typo、改個 CSS,直接用 Claude Code 比走 sprint 快 10 倍。gstack 是給跨日、多功能、上線壓力大的專案用的。
需要先有判斷力。/office-hours 會反問你,但如果你連自己想做什麼都說不清楚,六個問題只會讓你更焦慮。先寫一份 200 字的「我為什麼要做這個」,再進來。
Token 消耗會明顯增加。每個技能都會載入很長的 SKILL.md(常常 400–800 行),加上 plan / review 多階段對話,跑完一輪 /autoplan + /review + /qa + /ship 容易吃掉 50–200k token。建議搭配 Claude Code 的 context 監控。
Browser 模式會吃資源。/qa 跟 /browse 是真的開 Chromium,記憶體可能跳到 1.5GB+。在 8GB Mac 上同時跑多個 Conductor session 會卡死。
遙測預設關閉,但要知道存在。gstack 第一次跑會問你要不要傳匿名使用資料到 Supabase。傳的只有技能名稱、時長、成敗、版本、OS——但你可以直接 gstack-config set telemetry off 永久關掉。
Windows 環境有雷。Bun 在 Windows 跟 Playwright 的 pipe 傳輸有已知 bug,所以 Windows 必須額外裝 Node.js 當 fallback。建議直接用 WSL2。
不要把 /careful、/freeze、/guard 當裝飾。跟 production 接近時就講「be careful」啟動 /careful——它會在 rm -rf、DROP TABLE、force-push 之前先攔下來問你。
823 行的設計文檔不等於好設計。/plan-design-review 給你 0–10 評分時要批判性看,9 分跟 10 分的差距常常是品味判斷,模型不會幫你 nail 它,你自己得有看法。

進階路徑

把 gstack 編輯成你自己的。

最 underrated 的事實:每個 SKILL.md 都是純 Markdown。你可以打開來改、加章節、加你自己的審查規則,完全不需要寫 code。Garry 也鼓勵你 fork。

進階玩法地圖

1. 客製化你的 /review。打開 ~/.claude/skills/gstack/review/SKILL.md,在「Critical Findings」段落加你公司的 lint 規則、命名慣例。下次 /review 就會抓。

2. 用 /skillify 封裝你的 workflow。repo 內建的 skillify/ 會把你重複的 Claude Code 操作打包成新 skill,放進 ~/.claude/skills/your-name/。你的 prompt 工程也能變成資產。

3. 接 GBrain 做持久記憶。跑 /setup-gbrain 把專案知識存到 Postgres(本機 PGLite 或 Supabase),Claude Code 重啟也記得你的 codebase 模式跟過去決策。

4. 接 OpenClaw 做 ACP 多 agent。OpenClaw 可以同時跑多個 Claude session,搭配 gstack 變成你的「個人工程部」。Garry 自己常開 10–15 個並行。

5. 加你自己的 host。如果你用的 AI agent 不在預設 10 個裡,看 docs/ADDING_A_HOST.md——只需要寫一個 TypeScript config 檔,不用改任何 code。

最該讀的三份延伸閱讀

① docs/skills.md——每個技能的哲學、實例、工作流程深度解析。
② ETHOS.md——Garry 的建造哲學:Boil the Lake、Search Before Building、三層知識結構。
③ USING_GBRAIN_WITH_GSTACK.md——把記憶層接起來的完整步驟。

Fork it. Improve it. Make it yours.
And if you want to hate on free open source software—
you're welcome to, but I'd rather you just try it first.

— Garry Tan,gstack README