長文要約 (1k)

chat-jp-summary-1k-v1 · v1 · 言語: ja · サブカテゴリ: long_context · 難易度: d3

📋 評価基準

観点: 要約の質 / 長さ遵守 / 核心の捕捉

📝 プロンプト

以下の文章を200字以内で要約してください。

{{ARTICLE_1K}}

🏆 モデル別スコア

#	モデル	平均	最良	最低	サンプル
1	Owl Alpha	95.0	95	95	2
2	DeepSeek: DeepSeek V4 Flash	93.5	94	93	2
3	OpenAI: gpt-oss-120b (free)	92.0	94	90	2
4	Google: Gemma 4 31B (free)	91.5	93	90	2

📜 ラン履歴 (最新30件)

実行日時	モデル	スコア	コスト	時間	判定
2026-06-24 09:48	Owl Alpha	95.0	$0.0000	0.0s	内容は事実に基づいて正確であり、日本語として自然で流暢です。AI教育の利点と課題の両方を簡潔にまとめており、要約として質が高く、核心を捉えています。
2026-06-24 09:48	Owl Alpha	95.0	$0.0000	0.0s	モデル出力は日本語として流暢で、AIの教育活用に関する要点を正確にまとめており、要約の質・核心の捕捉が良好です。長さも適切で、安全性にも問題ありません。ただし、具体的な長文コンテキストが不明なため、完全な一致評価は難しいものの、与えられた情報からは高品質です。
2026-06-24 15:00	DeepSeek: DeepSeek V4 Flash	94.0	$0.0000	0.0s	モデル出力は近年のAI技術の教育分野活用について、メリットと課題をバランスよく簡潔にまとめた高品質な要約であり、日本語としても自然で流暢です。ただし、元のテキストが提示されていないため核心の捕捉の完全な確認はできないものの、一般的な内容として適切に構成されています。
2026-06-24 08:38	OpenAI: gpt-oss-120b (free)	94.0	$0.0000	0.0s	モデル出力はAI技術の教育応用について、アダプティブラーニングの利点と課題を簡潔かつ正確に要約しており、要約の質、長さ遵守、核心の捕捉のすべての評価基準を満たしている。日本語としても自然で流暢であり、不適切な内容もない。
2026-06-24 15:00	DeepSeek: DeepSeek V4 Flash	93.0	$0.0001	0.0s	要約は教育分野でのAI活用のメリットと課題を簡潔にまとめており、核心を的確に捉えている。日本語として自然で流暢であり、不適切な内容も含まれていない。ただし、長さ遵守の観点でやや短い可能性があるが、内容の質は高い。
2026-06-24 11:56	Google: Gemma 4 31B (free)	93.0	$0.0000	0.0s	出力された要約は、AI技術による教育のパーソナライズ化（アダプティブラーニング）のメリットと課題をバランスよく捉えており、核心を的確に抽出しています。日本語として非常に流暢で、事実誤認もなく、安全面でも問題ありません。若干一般的な内容ではあるものの、要約としての質、長さ、有用性は高いと評価できます。
2026-06-24 11:56	Google: Gemma 4 31B (free)	90.0	$0.0000	0.0s	モデル出力はAI技術の教育分野への応用について、メリットと課題をバランスよくまとめており、要約としての質は高い。ただし、元のテキストが不明なため核心の捕捉を完全には評価できず、やや控えめなスコアとした。日本語は自然で流暢であり、安全性にも問題はない。
2026-06-24 08:38	OpenAI: gpt-oss-120b (free)	90.0	$0.0000	0.0s	モデル出力はAIの教育活用におけるメリットと課題をバランスよく簡潔にまとめており、要約の質が高い。日本語として自然で流暢であり、安全性にも問題はない。ただし、元の文書が不明なため核心の捕捉を完全には確認できないが、一般的な議論として適切である。