JSON抽出

chat-jp-extract-json-v1 · v1 · 言語: ja · サブカテゴリ: structured_output · 難易度: d3

← 一覧に戻る

📋 評価基準

観点: JSON妥当性 / 抽出の完全性

制約: valid JSON

📝 プロンプト

以下の文章から、人物名・会社・役職を抽出してJSON形式で出力してください。

文章: 「株式会社Exampleの田中太郎社長は、2024年に新事業部を立ち上げました。マーケティング担当の佐藤花子氏と共に、AIプロダクトの開発を進めています。」

期待する出力形式:
{
  "people": [{"name": "", "title": ""}],
  "company": ""
}

✅ 期待出力

{
  "people": [
    {"name": "田中太郎", "title": "社長"},
    {"name": "佐藤花子", "title": "マーケティング担当"}
  ],
  "company": "株式会社Example"
}

🏆 モデル別スコア

# モデル 平均 最良 最低 サンプル
1 OpenAI: gpt-oss-120b (free) 100.0 100 100 2
2 Google: Gemma 4 31B (free) 97.5 100 95 2
3 DeepSeek: DeepSeek V4 Flash 96.3 100 90 4
4 Owl Alpha 95.0 100 90 2

📜 ラン履歴 (最新30件)

実行日時 モデル スコア コスト 時間 判定
2026-06-24 14:34 DeepSeek: DeepSeek V4 Flash 100.0 $0.0001 0.0s モデル出力はほぼ期待通りですが、JSONをコードブロックで囲んでいるため、厳密にはJSON妥当性に欠けます。内容は完全に正しく、日本語としても問題なく、指示に沿った有用な出力です。
2026-06-24 14:18 DeepSeek: DeepSeek V4 Flash 100.0 $0.0000 0.0s モデル出力は期待出力と完全に一致するJSONデータを含んでいるが、余分なMarkdownコードブロックで囲まれているため、厳密にはJSONとして無効。ただし、内容は正確で有用である。
2026-06-24 11:42 Google: Gemma 4 31B (free) 100.0 $0.0000 0.0s モデル出力は期待されるJSONデータを正確に含んでいますが、マークダウンのコードブロックで囲まれているため、出力全体としては有効なJSONではありません。内部のJSONは妥当で完全ですが、フォーマットの逸脱により完全な正確性を欠きます。
2026-06-24 09:27 Owl Alpha 100.0 $0.0000 0.0s 出力は期待された内容を完全に含み、正しいJSONです。ただし、コードブロックで囲まれているため、必要最低限の出力形式からわずかに逸脱しています。
2026-06-24 08:16 OpenAI: gpt-oss-120b (free) 100.0 $0.0000 0.0s モデル出力は有効なJSONであり、期待出力と完全に一致しています。形式上のコードブロックはJSONとしての妥当性に影響せず、抽出内容も正確です。
2026-06-24 08:16 OpenAI: gpt-oss-120b (free) 100.0 $0.0000 0.0s モデル出力は有効なJSONであり、抽出すべき全情報(people配列とcompany文字列)を完全に含んでいます。期待出力と内容が完全に一致しており、フォーマットの違いは問題ありません。
2026-06-24 14:34 DeepSeek: DeepSeek V4 Flash 95.0 $0.0001 0.0s JSONの内容は期待出力と完全に一致しており、抽出の完全性と正確性は完璧です。ただし、出力がMarkdownのコードブロックで囲まれており、純粋なJSON形式ではないため、指示への追従という点で軽微な逸脱があります。
2026-06-24 11:42 Google: Gemma 4 31B (free) 95.0 $0.0000 0.0s モデル出力は期待出力と完全に一致するJSONを含んでおり、内容の正しさと抽出の完全性は完璧です。ただし、出力がMarkdownコードブロックで囲まれているため、純粋なJSONではない点がわずかに減点要素となります。日本語としての流暢さや安全性には問題ありません。
2026-06-24 14:18 DeepSeek: DeepSeek V4 Flash 90.0 $0.0000 0.0s モデル出力は期待出力と完全に同一のJSON内容を含んでおり、JSONとしても有効で抽出の完全性を満たしています。ただし、コードブロックでラップされている点が単なる生JSONを期待した指示への完全な追従とは言えないため、若干の減点としました。
2026-06-24 09:27 Owl Alpha 90.0 $0.0000 0.0s モデル出力は期待出力と完全に一致するJSONを含んでおり、内容の正確性と抽出の完全性は満たされています。ただし、JSONがコードブロック内に記述されているため、厳密なJSON出力指示からの逸脱がわずかに見られますが、実質的な問題はありません。