| 特徵 | Devin | Codex | Jules | GitHub Copilot Padawan | Cursor Background Agent |
|---|---|---|---|---|---|
| 圖像 |
DEVIN
Cognition Labs
|
OpenAI Codex
OpenAI
|
jules
Google DeepMind
|
GitHub Copilot
AGENT MODE
GitHub (Microsoft)
|
Cursor
Anysphere Inc.
|
| 開發企業 | Cognition Labs | OpenAI | Google DeepMind | GitHub (Microsoft) | Anysphere Inc. |
| 基礎模型 | GPT-4/GPT-4o系列、Devin 2.0以後是Claude 3 Sonnet也使用 | OpenAI o3模型(codex-1)、GitHub的程式碼資料用於追加訓練 | Google Gemini 2.0/2.5 | GitHub Actions基礎VM與OpenAI/Anthropic模型 | Cursor Max Mode互換模型 |
| 執行環境 | 自製沙盒環境(Shell、編輯器、瀏覽器) | 雲端執行環境 | 非同期處理架構與雲端VM | GitHub Actions基礎的雲端沙盒 | 遠端收費環境(容器化Ubuntu) |
| 對應程式語言 | 多種語言支援(Python、JavaScript、Java等) | 12以上語言(Python、JavaScript、Go、Ruby、PHP、Perl、Shell、Swift、TypeScript等) | 目前主要為Python與JavaScript特化 | GitHub Copilot對應語言(Python、JavaScript、TypeScript、Ruby、Go、C#、C++等) | 特定語言支援制限(GitHub版儲存庫的語言依賴) |
| 基準測試性能 | SWE-bench: 13.86%(完全自律解決率) | HumanEval: 28.7%(單一解答)7x(最終解答) | SWE-bench Verified: 52.2% | 具體基準數據尚未公開 | 基準數據未公開 |
| 自律性等級 | 非常高(計劃、實裝、除錯、測試、部署的完全自律執行) | 中~高(半自律QA、編輯支援等) | 高(程式碼分析、複雜檔案處理、多階段計劃) | 中~高(Issue解決、PR生成、反饋套用) | 中等程度(非同期背景任務處理、代理任務輔助開發) |
| 收費體系 | 月費20美元(目前提供500點數以上)Enterprise版權限 | ChatGPT Plus會員或API存取,每月20~100万字大約0.1-50美元,輸出字元每100万字大約0.1美元 | Beta版:一日5次無料任務,2つの同時任務々サポート | GitHub Enterprise限定(具體收費體系尚未公開) | Token使用基礎的價格模型 |
| 企業評價 | 企業評價:約20億美元,資金來源:1億7,500万美元 | OpenAI(Microsoft大幅出資) | Google LLC旗下 | GitHub(2018年Microsoft收購7.5億美元) | 企業評價:約25億美元,資金來源:1億7,300万美元以上 |
| 最新狀態 | Devin 2.0發布(2025年初期)Interactive Planning、Devin Search、Devin Wiki機能追加 | ChatGPT整合併統整,Codex CLI公開,o4模型—高階AI模型追加 | Beta版公開(2025年5月)Gemini 2.5 Pro機能全面使用 | GitHub Enterprise限定初期版本公開(2025年5月) | Cursor 0.50更新(2025年初期)代理AI(2025年5月) |
| 主要功能 |
|
|
|
|
|
| 主要制限/問題 |
|
|
|
|
|
注意:
- • 本比較表基於2025年5月的資訊,部分內容可能有所變動。
- • 基準測試分數可能因企業發表內容與測試資料集差異,無法單純比較的情況較多。
- • 助手的性能與機能會持續更新,請透過各公司官方網站確認最新資訊。