「MediaPipe LLM Inference API」による「LLM」のオンデバイス推論を試したので、まとめました。 1. MediaPipe LLM Inference API 「MediaPipe LLM Inference API」は、LLMをオンデバイスで実行するためのAPIです。現在は、実験リリースの段階です。 Androidのデモアプリの実行手順は ...
精度とコストを統合した評価で高スコアを記録 ― プロンプトの難易度を判定する自動ルーティングで、品質を保ちながらLLM支出を約40%削減 FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 ...
本記事では、GPT-4.5のリリースを契機に「実際のシステム開発においてLLMに求められる本質的な能力とは何か」を考察します。 OpenAIが強調するEQの高さやハルシネーション対策ではなく、実務で真に価値を発揮する5つの能力について解説します。 LLM導入を ...
開発者およびデータサイエンティストとして、APIを介してこれらの強力なモデルとやり取りする必要が出てくることがよくあります。ただし、アプリケーションが複雑化し、スケールアップするにつれて、効率的でパフォーマンスの高いAPI呼び出しが必要に ...
次世代AI推論ゲートウェイOrcaRouterで、Anthropic最新モデルへのアクセスを実現 2026年6月10日(火)、FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 ...
rinnaやOpenCalm、さらには賢いと噂のELYZAなど、GPU搭載の家庭用PCでも動く日本語大規模言語モデル(LLM)が増えてきた。こうした日本語LLMは、現状ならPythonで動かすのが一般的だが、APIアクセス可能にすることで、さまざまな機器から、より手軽に扱えるよう ...
生成AIは、文章作成や要約、翻訳、資料作成、プログラミング支援など、さまざまな業務で活用が進んでいる。すでにChatGPTやGemini、ClaudeといったクラウドのLLM(大規模言語モデル)サービスを日常的に使っている人も多いだろう。ブラウザから ...
ソフトバンクとSB Intuitionsは11月28日から、国産の大規模言語モデル(LLM)「Sarashina mini」のAPIと接続できるサービス「Sarashina API」を法人向けに提供開始する。 Sarashina mini(サラシナミニ)は、SB Intuitionsが構築した4,600億パラメーター規模の国産LLM「Sarashina」(サラ ...
東京大学松尾研究室発、大規模言語モデル(LLM)の社会実装を進める株式会社ELYZA(代表取締役:曽根岡侑也、以下ELYZA)は、700億パラメータの最新モデル「ELYZA-japanese-Llama-2-70b」を開発し、グローバルモデルに匹敵する性能を達成しました。また、本モデル ...
しかし、上記のように出力を構造化したとしても、出力結果の制約を全て満たすわけではなく、 「LLMをアプリケーションに型安全に組み込める」 とは限りません。実際の開発においては以下のようなケースに遭遇し、修正のためのコードを書くという ...
AIを主軸としたテクノロジーでIPを創出する株式会社Pictoria(東京都中央区、代表取締役CEO:明渡隼人、以下「Pictoria」)は、当社がプロデュースするAIキャラクター「紡ネン」から新たな別個体がローカルLLMを利用して誕生することをお知らせします。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する