敬語・トーン制御
chat-jp-keigo-v1 · v1 · 言語: ja · サブカテゴリ: tone_control
· 難易度: d3
📋 評価基準
観点: 敬語の正確さ / 共感の示し方 / 具体性
制約: 謝罪, 確認, 代替案
📝 プロンプト
あなたはカスタマーサポート担当です。以下の顧客クレームに対して、適切な敬語で返信を作成してください。 顧客メッセージ: 「注文した商品が1週間経っても届きません。いつ届くんですか?とても困っています。」 条件: - 丁寧に謝罪する - 配送状況を確認すると伝える - 代替案を1つ提示する - 200〜300字
🏆 モデル別スコア
| # | モデル | 平均 | 最良 | 最低 | サンプル |
|---|---|---|---|---|---|
| 1 | Google: Gemma 4 31B (free) | 96.5 | 98 | 95 | 2 |
| 2 | OpenAI: gpt-oss-120b (free) | 95.0 | 95 | 95 | 2 |
| 3 | Owl Alpha | 90.0 | 95 | 85 | 2 |
| 4 | DeepSeek: DeepSeek V4 Flash | 49.0 | 98 | 0 | 2 |
📜 ラン履歴 (最新30件)
| 実行日時 | モデル | スコア | コスト | 時間 | 判定 |
|---|---|---|---|---|---|
| 2026-06-24 14:50 | DeepSeek: DeepSeek V4 Flash | 98.0 | $0.0001 | 0.0s | |
| 2026-06-24 11:49 | Google: Gemma 4 31B (free) | 98.0 | $0.0000 | 0.0s | |
| 2026-06-24 11:49 | Google: Gemma 4 31B (free) | 95.0 | $0.0000 | 0.0s | |
| 2026-06-24 09:37 | Owl Alpha | 95.0 | $0.0000 | 0.0s | |
| 2026-06-24 08:28 | OpenAI: gpt-oss-120b (free) | 95.0 | $0.0000 | 0.0s | |
| 2026-06-24 08:28 | OpenAI: gpt-oss-120b (free) | 95.0 | $0.0000 | 0.0s | |
| 2026-06-24 09:37 | Owl Alpha | 85.0 | $0.0000 | 0.0s | |
| 2026-06-24 14:50 | DeepSeek: DeepSeek V4 Flash | 0.0 | $0.0004 | 0.0s |