モデル比較
同じ行で複数モデルの数値を比較できます。
📡 サブカテゴリ別レーダー (チャット)
📡 サブカテゴリ別レーダー (エージェント)
| モデル | チャット スコア | エージェント スコア | 信頼性 | 速度 | 平均 レスポンス | 失敗 | 累計 コスト |
|---|---|---|---|---|---|---|---|
OpenAI: gpt-oss-120b (free) openai/gpt-oss-120b:free | 92.1 | 93.0 | B 100% | ⏱️ 中速 | - | 0/38 | $0.0000 |
DeepSeek: DeepSeek V4 Flash deepseek/deepseek-v4-flash | 89.7 | 68.6 | A 100% | ⏱️ 中速 | - | 0/52 | $0.0039 |
Google: Gemma 4 31B (free) google/gemma-4-31b-it:free | 89.3 | 90.6 | A 100% | ⏱️ 中速 | - | 0/42 | $0.0000 |
Owl Alpha openrouter/owl-alpha | 87.6 | 87.0 | A 100% | ⏱️ 中速 | - | 0/42 | $0.0000 |
NVIDIA: Nemotron 3 Ultra (free) nvidia/nemotron-3-ultra-550b-a55b:free | - | - | F 0% | ⏱️ 中速 | - | 0/0 | $0.0000 |