LLM API - 検索 News

MediaPipe LLM Inference API による LLM のオンデバイス推論を試す

「MediaPipe LLM Inference API」による「LLM」のオンデバイス推論を試したので、まとめました。 1. MediaPipe LLM Inference API 「MediaPipe LLM Inference API」は、LLMをオンデバイスで実行するためのAPIです。現在は、実験リリースの段階です。 Androidのデモアプリの実行手順は ...

6 日

FlashLabs、日本独占提供のLLMルーター「OrcaRouter」研究論文を公開 ...

精度とコストを統合した評価で高スコアを記録 ― プロンプトの難易度を判定する自動ルーティングで、品質を保ちながらLLM支出を約40%削減 FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 ...

note

GPT-4.5のリリースでわかった、LLM APIに求める能力5選

本記事では、GPT-4.5のリリースを契機に「実際のシステム開発においてLLMに求められる本質的な能力とは何か」を考察します。 OpenAIが強調するEQの高さやハルシネーション対策ではなく、実務で真に価値を発揮する5つの能力について解説します。 LLM導入を ...

unite

Pythonで非同期LLM API呼び出し：包括的なガイド

開発者およびデータサイエンティストとして、APIを介してこれらの強力なモデルとやり取りする必要が出てくることがよくあります。ただし、アプリケーションが複雑化し、スケールアップするにつれて、効率的でパフォーマンスの高いAPI呼び出しが必要に ...

4 日

FlashLabs、Anthropic最新モデル「Claude Fable 5」APIをOrcaRouterで提供開始 ...

次世代AI推論ゲートウェイOrcaRouterで、Anthropic最新モデルへのアクセスを実現 2026年6月10日(火)、FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 ...

INTERNET Watch

賢いと噂の日本語LLM「ELYZA」をウェブAPIで使う！ Power Automateなど ...

rinnaやOpenCalm、さらには賢いと噂のELYZAなど、GPU搭載の家庭用PCでも動く日本語大規模言語モデル（LLM）が増えてきた。こうした日本語LLMは、現状ならPythonで動かすのが一般的だが、APIアクセス可能にすることで、さまざまな機器から、より手軽に扱えるよう ...

PC Watch

月額料金はタダ！Radeon AI PROで作る超ハイコスパな自社ローカルLLM ...

生成AIは、文章作成や要約、翻訳、資料作成、プログラミング支援など、さまざまな業務で活用が進んでいる。すでにChatGPTやGemini、ClaudeといったクラウドのLLM(大規模言語モデル)サービスを日常的に使っている人も多いだろう。ブラウザから ...

マイナビニュース

ソフトバンク、国産LLM「Sarashina mini」のAPIサービス提供へ法人向け

ソフトバンクとSB Intuitionsは11月28日から、国産の大規模言語モデル(LLM)「Sarashina mini」のAPIと接続できるサービス「Sarashina API」を法人向けに提供開始する。 Sarashina mini(サラシナミニ)は、SB Intuitionsが構築した4,600億パラメーター規模の国産LLM「Sarashina」(サラ ...

PR TIMES