「見るAI」から「現場を理解し考えるAI」へ 生活総合支援サービスを展開するHITOWAグループで、有料老人ホーム「イリーゼ」を運営するHITOWAケアサービス株式会社(本社:東京都港区、代表取締役社長 須原 ...
完全自動運転車両の開発に取り組むTuring株式会社(東京都品川区、代表取締役:山本 一成、以下、チューリング)は、ML実験管理プラットフォームを提供するWeights & Biases Japan株式会社(以下、W&B Japan)が本日公開したVision-Languageモデル(以下、VLM)の評価のための ...
Visual Bank株式会社(本社:東京都渋谷区、代表取締役CEO:永井真之、以下「Visual Bank」)は、経済産業省およびNEDOが推進する「GENIAC(Generative AI Accelerator Challenge、以下「GENIAC」)」の採択企業としての知見を活かし、子会社の株式会社アマナイメージズを通じ ...
サイバーエージェントは6月13日、同社独自の大規模視覚言語モデル(VLM:Vision Language Model)を公開した。このVMLのパラメータ数は75億で、ベースモデルの一部を米Hugging Faceが運営するWebサイト「Hugging Face Hub」に公開したという。 公開されたモデルは同社独自の ...
Apple has announced its own visual language model (VLM), ' FastVLM '. Conventional VLMs have the problem of decreasing efficiency as their accuracy increases, but FastVLM maintains high accuracy while ...
前回までは「gpt-oss-20b」を使ってテキストデータを用いたLLMの活用方法を解説してきた。テキストデータだけでも十分活用できるが、欲を言えば画像や動画、音声なども取り扱えるようにしたいところだろう。 そんな方に朗報だ。LM Studioではテキストデータ ...
米Google傘下のAI企業Google DeepMindは5月25日(現地時間)、同社が開発するSimVLM(Simple Visual Language Model、単一視覚言語モデル)の「Flamingo」を系列企業YouTubeの人気コンテンツ「YouTubeショート」の検索に提供したと発表した。 VLMは、視覚的な入力に言語を対応さ ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する