ニュースの要約
- LegalOn Technologiesが、Googleの最新言語モデル「Gemini 3」の性能を自社開発のベンチマークデータセットで検証した
- 「Gemini 3」は、契約書業務における構造化された推論・ルールの適用が重視されるタスクでは高い成果を発揮するものの、応答速度に課題がある
- 日本語と英語のタスクで、各モデルの得意分野が異なることが明らかになった
概要
株式会社LegalOn Technologiesは、2025年11月18日公開のGoogleの最新言語モデル「Gemini 3」について、自社で開発したベンチマークデータセットを用いて検証を行いました。
その結果、「Gemini 3」は契約書業務における構造化された推論やルールの適用が求められるタスクでは優れた成果を示したものの、応答速度が2~4倍遅いという課題も明らかになりました。また、英語と日本語のタスクでは各モデルの得意分野が異なることも判明しました。
編集部の感想
-
「Gemini 3」は契約書業務における構造化された推論やルールの適用では強みを発揮するようだが、応答速度の遅さが気になるところ
-
言語による得意分野の違いは興味深い発見で、最適なAIモデルの選定には業務内容や言語をしっかり見極める必要がありそう
-
LegalOn Technologiesのようにモデルの比較検証を行い、活用シーンに合わせて最適なAIを選定するのは重要だと感じた
編集部のまとめ
LegalOn Technologies:Googleの最新モデル「Gemini 3」を自社開発の独自ベンチマークデータセットを用いて検証についてまとめました
今回の発表では、Googleの最新言語モデル「Gemini 3」の性能をLegalOn Technologiesが独自に開発したベンチマークデータセットを用いて検証した結果が明らかになりました。
その結果、「Gemini 3」は契約書業務における構造化された推論やルールの適用が求められるタスクでは優れた成果を示したものの、応答速度が課題だということがわかりました。また、言語によっても各モデルの得意分野が異なるという興味深い発見もありました。
法務・コーポレート業務におけるAI活用は今後ますます重要になってくると考えられますが、適切なAIモデルを選定することが不可欠です。LegalOn Technologiesのような企業が自社のベンチマークデータを使って性能を比較検証し、最適なAIソリューションを見極めていく取り組みは意義深いと思います。
参照元:https://prtimes.jp/main/html/rd/p/000000728.000036601.html














