NTTは10月20日、軽量かつ高性能な日本語処理能力を備えた大規模言語モデル(LLM)「tsuzumi」の最新版である「tsuzumi 2」の提供を開始した。
近年、ChatGPTをはじめとするLLMへの注目が高まる一方で、膨大な学習データと計算リソースを必要とする従来のLLMは、電力消費や運用コストの増大、機密情報の取り扱いにおけるセキュリティリスクといった課題を抱えている。同社は、これらの課題に対応すべく、軽量でありながら世界トップレベルの日本語処理性能を持つ「tsuzumi」を2023年に発表し、国内企業・自治体等でのAIの普及を推進してきた。
実際のビジネス現場でのAI活用において、特に企業・自治体が保有する複雑なドキュメントへの理解や専門的な知識への対応力強化等の要望が多数あったという。そうしたニーズを研究開発へフィードバックし、「tsuzumi」の次世代モデル「tsuzumi 2」を開発。ユーザーのニーズに応える性能に加え、1GPUで推論可能という従来モデルの特長も継承し、環境負荷とコストを抑え、企業・自治体等のAI活用推進を支援する。
日本語性能においては、同サイズ帯のモデルと比較して世界トップクラスの性能を実現。ビジネス領域で主に重視される知識、解析、指示遂行、安全性の基本性能では、数倍以上大きなフラッグシップモデルに匹敵するレベルを達成し、コストパフォーマンスに優れている。
RAGとFine Tuningにより、企業や業界に特化したモデルの開発効率が向上。ニーズが多かった金融・医療・公共分野の知識を強化している。これらの分野で高い性能を発揮し、特化チューニングによる精度も向上した。
tsuzumiはNTTがフルスクラッチでゼロから開発した純国産モデル。1GPUで動作可能な軽量モデルでコストパフォーマンスに優れる。低コストでオンプレミスやプライベートクラウドでの運用が可能であり、機密性の高い情報も安全に取り扱える点が特徴。
東京通信大学では、学生・教職員のデータを学内に留めるという要件のもと、クラウド依存のない国産LLMを核に学内LLM基盤の整備を進めている。今回、複雑な文脈理解や長文ドキュメント処理が安定し、複雑なタスクの複合工程においても実用水準に達しているとの判断から、tsuzumi 2の導入を決定した。
具体的には、授業Q&Aの高度化、教材・試験作成支援、履修・進路相談のパーソナライズといったユースケースで活用されることになり、今後本格的な学内での利用開始により、教育・運営の両輪でAI活用を加速するという。