生成AIを詰めた話(後編)はハルシネーションの話ではない。相手はPerplexity。ユーザーを甘く見ないでよってことになるかな。 文科省ナレッジ特化型RAGエージェント開発を手掛けているが、ちょっと「トークンとチャンク」の違いが気になったのでPerplexity ...
どうも、おじいです。 本業の傍ら、副業でAIエージェントや自動売買botを動かしてる。個人開発の知見が本業に活かせる場面もあって、今回は社内ドキュメント検索の強化にLLMとRAGを組み込んだ話をする。既存のキーワード検索じゃ限界があったから、意味 ...
組織には構造化されたデータベースやきれいにフォーマットされたCSVのほか、何気なく書いたメールから複雑な技術マニュアルまでさまざまな形式のデータが大量に保存されています。検索拡張生成(RAG)は大規模言語モデル(LLM)を使用して全てのデータから ...
ログインして、InfoQのすべての体験をアンロックしましょう!お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。 クラウドコンピューティングの登場以降、ソフトウェア業界は大きな変革の中に ...
こうしてチャンク化した情報のおかげで、私はYouTubeの生配信でどのような質問を投げかけられても、即座に答えることができているのです。 もうおわかりのように、これがチャンク化で知識の応用力を身につけるプロセスになります。複数の知識が大きな ...
Microsoft は、オープンソースの Python ライブラリ「AutoGen」で大規模言語モデル(LLM)アプリケーションフレームワークの競争に加わった。 Microsoft の説明によると、AutoGen は LLM ワークフローのオーケストレーション、最適化、自動化を簡素化する ...
しかし、上記のように出力を構造化したとしても、出力結果の制約を全て満たすわけではなく、 「LLMをアプリケーションに型安全に組み込める」 とは限りません。実際の開発においては以下のようなケースに遭遇し、修正のためのコードを書くという ...
ふと、10年後に2023年から世界的に巻き起こったAIブームがどう評価されるのか気になった。ChatGPTが小出しにさまざまな機能をリリースし、圧倒的な実力で世界を一変させた2023年だったが、今年もその勢いは落ちそうにない。 そして、それに続けとオープン ...
上海AIラボ/上海人工知能研究所、清華大学、香港大学、ハルビン工業大学、北京理工大学、香港科技大学(広州)からなる ...
AIの本体と言える大規模言語モデル(LLM)のトレーニングはほとんどの場合PyTorchやPythonを使用して行われていますが、そうしたトレーニングを純粋なC言語のみで実装したツール「llm.c」が登場しました。まだ最適化が行われておらず従来の手法に速度面では ...
大規模言語モデル(LLM)の推論における入出力単位「トークン」の語彙集合を、推論中に精度劣化なく自在に縮小できる、世界初の理論およびアルゴリズムを確立しました。 本技術により、任意の異種LLM間で共通の語彙集合を介した連携が可能になりました。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する