5大AI開發助手比較表

特徵	Devin	Codex	Jules	GitHub Copilot Padawan	Cursor Background Agent
圖像	DEVIN Cognition Labs	OpenAI Codex OpenAI	jules Google DeepMind	GitHub Copilot AGENT MODE GitHub (Microsoft)	Cursor Anysphere Inc.
開發企業	Cognition Labs	OpenAI	Google DeepMind	GitHub (Microsoft)	Anysphere Inc.
基礎模型	GPT-4/GPT-4o系列、Devin 2.0以後是Claude 3 Sonnet也使用	OpenAI o3模型（codex-1）、GitHub的程式碼資料用於追加訓練	Google Gemini 2.0/2.5	GitHub Actions基礎VM與OpenAI/Anthropic模型	Cursor Max Mode互換模型
執行環境	自製沙盒環境（Shell、編輯器、瀏覽器）	雲端執行環境	非同期處理架構與雲端VM	GitHub Actions基礎的雲端沙盒	遠端收費環境（容器化Ubuntu）
對應程式語言	多種語言支援（Python、JavaScript、Java等）	12以上語言（Python、JavaScript、Go、Ruby、PHP、Perl、Shell、Swift、TypeScript等）	目前主要為Python與JavaScript特化	GitHub Copilot對應語言（Python、JavaScript、TypeScript、Ruby、Go、C#、C++等）	特定語言支援制限（GitHub版儲存庫的語言依賴）
基準測試性能	SWE-bench: 13.86%（完全自律解決率）	HumanEval: 28.7%（單一解答）7x（最終解答）	SWE-bench Verified: 52.2%	具體基準數據尚未公開	基準數據未公開
自律性等級	非常高（計劃、實裝、除錯、測試、部署的完全自律執行）	中～高（半自律QA、編輯支援等）	高（程式碼分析、複雜檔案處理、多階段計劃）	中～高（Issue解決、PR生成、反饋套用）	中等程度（非同期背景任務處理、代理任務輔助開發）
收費體系	月費20美元（目前提供500點數以上）Enterprise版權限	ChatGPT Plus會員或API存取，每月20～100万字大約0.1-50美元，輸出字元每100万字大約0.1美元	Beta版：一日5次無料任務，2つの同時任務々サポート	GitHub Enterprise限定（具體收費體系尚未公開）	Token使用基礎的價格模型
企業評價	企業評價：約20億美元，資金來源：1億7,500万美元	OpenAI（Microsoft大幅出資）	Google LLC旗下	GitHub（2018年Microsoft收購7.5億美元）	企業評價：約25億美元，資金來源：1億7,300万美元以上
最新狀態	Devin 2.0發布（2025年初期）Interactive Planning、Devin Search、Devin Wiki機能追加	ChatGPT整合併統整，Codex CLI公開，o4模型—高階AI模型追加	Beta版公開（2025年5月）Gemini 2.5 Pro機能全面使用	GitHub Enterprise限定初期版本公開（2025年5月）	Cursor 0.50更新（2025年初期）代理AI（2025年5月）
主要功能	完全自律開發工作流程沙盒環境及開發環境計劃合實裝、測試、部署對應複雜專案任務處理	自然語言程式碼生成程式碼整合（VS Code等）多語言對應複雜問題對應	非同期任務處理 GitHub Actions整合多檔案測試自動編輯即時回應處理	Issue處理到GitHub Actions的工作流程實行 Draft與PR生成 Review反饋對應	背景處理版本自動提交 GitHub版儲存庫進階改造連攜機能
主要制限/問題	高度複雜任務的錯誤率處理時間較長情況頻繁	安全性風險（生成程式碼的約40%被確認有脆弱性）著作權問題的可能性	限定的語言支援 Beta版的功能制限較多	GitHub Enterprise限定低～中程度的複雜性任務上限較高	macOS與Linux的支援隱私模式與AI收費使用的相容性限制 GitHub限定支援

注意：

• 本比較表基於2025年5月的資訊，部分內容可能有所變動。
• 基準測試分數可能因企業發表內容與測試資料集差異，無法單純比較的情況較多。
• 助手的性能與機能會持續更新，請透過各公司官方網站確認最新資訊。