楽天グループは21日、日本語に特化した大規模言語モデル「Rakuten AI 7B」を含む一連のモデルを公開した。公開されたモデルには、基盤モデル「Rakuten AI 7B」、インストラクションチューニング済みモデル「Rakuten AI 7B Instruct」、および会話形式の文章生成を可能にする「Rakuten AI 7B Chat」が含まれる。
これらのモデルは、フランスのAIスタートアップ、Mistral AIの「Mistral-7B-v0.1」をもとに、インターネット上の日本語と英語のデータを使用して事前学習された。楽天が開発した独自の形態素解析器を活用することで、テキスト処理の効率を大幅に向上させた。形態素解析器は、日本語の複雑な構造をより効率的に解析し、トークンごとの情報量を増加させることに成功している。
Rakuten AI 7Bおよび関連モデルは、Apache 2.0ライセンスのもとで提供され、楽天の公式Hugging Faceリポジトリからダウンロード可能である。商用を含む広範な用途での利用が可能となり、特に文章の要約、質問応答、一般的な文章理解、対話システムの構築など、多様なテキスト生成タスクに貢献する。
楽天ティン・ツァイCDOは、これらのモデルを通じて、楽天がAI技術の開発で蓄積した知見をオープンソースコミュニティと共有し、日本語LLMのさらなる発展に貢献することを期待しているとコメントした。楽天は、AI技術の活用を通じて、ビジネスのあらゆる面での成長を目指し、国内外でのAIの進展を支援していく方針である。
言語モデル評価ツール「LM Evaluation Harness」における評価では、楽天のモデルが日本語および英語のLLMの中で高いパフォーマンスを記録し、その優れた性能が実証された。楽天は、「AI-nization(エーアイナイゼーション)」をテーマに掲げ、AI技術のさらなる進化と社会への応用に向けて取り組みを進めている。
Follow us on:
X(Twitter):@BeInCryptoJapan
Telegramチャンネル:@BeInCrypto Japan オフィシャルチャンネル
免責事項 - Disclaimers
当ウェブサイトに掲載されているすべての情報は、誠意をもって作成され、一般的な情報提供のみを目的としています。当ウェブサイトに掲載されている情報に基づいて行う一切の行為については、読者ご自身の責任において行っていただきますようお願いいたします。