私たちの生活空間にロボットが溶け込み、家事を手伝い、高齢者を介護し、人間と協働する未来。それは長年、SFの世界で描かれてきた夢であり、ロボット工学が目指す究極の目標だ。工場で決められた作業を繰り返す産業用ロボットの時代は終わり、今 ...
プログラミング不要、日本語による指示で画像認識・制御コードもすべてAIが自動生成 株式会社チトセロボティクス(本社:東京都文京区、代表取締役社長:西田亮介、以下「当社」)は、大規模言語モデル(LLM)および視覚言語モデル(VLM)を活用した ...
Google DeepMindは、論文でRobotic Transformer 2(RT-2)を紹介。RT-2、ウェブとロボティクスの両方のデータから学習し、この知識をロボット制御のための一般化された命令に変換する、新しい視覚言語アクション(VLA)モデルだ 大容量の視覚言語モデル(VLM)は ...
この資料では、VLM(大規模視覚言語モデル)の基礎から、LLM(大規模言語モデル)とVLMの違い、開発ステップや業界・分野での活用事例など、詳細な情報をわかりやすくまとめています。 特に、画像を用いた検索・解析や、画像処理と言語処理を統合したAI ...
ローカルで実行可能なQwen3-VL(8B)がOllamaライブラリに登録されたので、利用してみました。ただし、ollamaバージョンはプレリリース版(0.12.7rc0以降)を利用する必要があります。 VLMとは、Vision Language Modelで、大規模言語モデルに、視覚機能を持たせたAI ...
AIロボティクス・スタートアップの株式会社イーアイアイ(本社:東京都千代田区、代表取締役:胡浩、以下「イーアイアイ」)は、生成AIの一種である「VLM(視覚言語モデル)」を搭載し、飲料容器の高度な自動選別を実現する「生成AI活用型 飲料容器高度 ...
産業用ロボットのティーチングが生成AIで変わる。プログラミング不要、日本語による指示で画像認識・制御コードもすべてAIが自動生成する時代へ。 株式会社チトセロボティクスは「大規模言語モデル(LLM)」と「視覚言語モデル(VLM)」を活用した ...
ABC株式会社は、映像からAIに判断させてデバイスを制御する VLM(Vision Language Model)技術を活用した、自動いちご自動受粉・収穫ロボットの研究開発プロジェクトを開始しました。 本プロジェクトでは、Tenstorrent社のAIアクセラレータ「Blackhole p100a」を用いてAI ...
株式会社チトセロボティクス(本社:東京都文京区、代表取締役社長:西田亮介、以下「当社」)は、生成AIを活用した産業用ロボットの動作指示システムにおいて、必要な機能を限定してAIで担うという設計思想により、精度と処理速度の両立を確認できる ...
ロボット開発ニュース: 安全認証対応エッジAIシステムの高度化へ向けNVIDIAとの協業を拡大 QNXとNVIDIAは協業を拡大し、エッジAIシステムの開発基盤を強化する。リアルタイムOSと産業向けAIコンピューティングプラットフォームの統合により、ロボットや医療機器などの安全認証プロセスを迅速化する。(2026/5/14) ...