本文は、社会性昆虫の群知能(Swarm Intelligence)にヒントを得て、大規模言語モデル(LLM)のための新しい分散協調アーキテクチャ「LLM-SI(LLM-Swarm Intelligence)」を提案する。既存の中央集権型マルチエージェントシステムが持つスケーラビリティと頑健性の ...
株式会社オルツ(本社:東京都港区、代表取締役:米倉 千貴)は、世界的なコンピュータアーキテクチャの権威である Duc-Minh Nguyen教授(Vice Dean, School of Electrical and Electronic Engineering, Hanoi University of Science and Technology)と共同研究を開始しました。本研究を ...
2026年5月、大規模言語モデルの圧縮技術と内部メカニズム解明で同時多発的な進展があった。Tencentが公開したAngelSlimツールキットは、1.25bitという既存の限界を大幅に超える極低ビット量子化を実現。ハイブリッド思考型モデルにおける「推論リーク」問題を ...
OpenAIのGPTシリーズやxAIのGrok、MetaのLlamaなどさまざまな大規模言語モデルが存在しますが、これらの構造を図示した「LLM Architecture Gallery」がオンラインで公開されています。 AI研究者兼エンジニアであるセバスチャン・ラシュカ氏は、OpenAIが2019年に発表した ...
PC Watch on MSN
無料。わずか1.8BでMicrosoft商用APIを凌駕する翻訳用LLM「Hy-MT2」登場
中国Tencentは5月21日(現地時間)、無料で利用できる33言語対応翻訳用LLM「Hy-MT2」シリーズを発表した。モデルの重みはオープンソースとして公開されており、Hugging Faceなどからダウンロードして利用できる。
インシデント処理時の原因調査として、ログやメトリクス(指標)を大規模言語モデル(LLM)に入力して分析させる手法が模索されている。市場には「根本原因分析を90%高速化する」とうたうAIツールも存在する。 しかし、その実態は期待を裏切るものだ。Meta ...
会員(無料)になると、いいね!でマイページに保存できます。 Transformerとは、グーグルで開発されたディープラーニング(深層学習)のアーキテクチャのことです。 後述するTransformerの発展型となる「Vision Transformer(ViT)」「Unified Transformer(UniT ...
実はAIエージェントという言葉自体は最近生まれたものではない。いわゆるLLMブームが到来するもっと以前から、AIエージェントという言葉は一般的に使われていた。ただ、当時のAIエージェントという言葉に明確な定義があったわけではない。AIという技術 ...
今回(第143回)は、AMDで学習された小型AIモデル「ZAYA1-8B」や、ClaudeとGPTが批判し合いながら研究(アイデア出しから実験、論文執筆など)を自動で行うオープンソースツール「Aris」を取り上げます。
米Microsoftの研究チームが発表した「BitNet」、通称「1bit LLM」と呼ばれる論文が波紋を呼んでいる。これまで必須だと思われていたGPUが不要で、CPUでもLLMが動作することを示唆している。そもそも“1bit”とは何が1bitなのか ...
PC Watch on MSN
メモリ192GBの「Ryzen AI Max PRO 400」。3千億パラメータのLLMも実行可能に
AMDは5月21日、最大192GBメモリを搭載するZen 5アーキテクチャベースの高性能CPU「Ryzen AI Max PRO 400」シリーズを発表した。採用製品は2026年第3四半期に登場予定で、ASUS、HP、LenovoなどのOEMメーカーより投入される。 Ryzen AI Max PRO ...
AI・Blockchain・Cultivation(農業/AI学習)領域の技術開発を手掛けるABC株式会社(本社:愛知県名古屋市中村区、以下「当社 ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する