ふと、10年後に2023年から世界的に巻き起こったAIブームがどう評価されるのか気になった。ChatGPTが小出しにさまざまな機能をリリースし、圧倒的な実力で世界を一変させた2023年だったが、今年もその勢いは落ちそうにない。 そして、それに続けとオープン ...
ユーザー企業のIT担当者を対象に、IT製品/サービスの導入・購買に役立つ情報を提供する無料の会員制メディア「TechTargetジャパン」。このコンテンツでは、運用&Tipsに関する運用&Tipsの記事を紹介します。製品/サービス選定の参考にご覧ください ...
大規模言語モデル人間のように自然な文章を生成できる人工知能(AI)技術の一種。人間が使う「自然言語」を高い精度で処理できるため、文脈を理解したやりとりが可能となる。ディープラーニング(深層学習)を用いて大量のテキストデータを学習し ...
NTTは、大規模言語モデル(LLM)による視覚読解の強化に向け、同社のLLM「tsuzumi」のアダプタ技術を開発・導入する。tsuzumiと連携して利用することで、文書に含まれる図表を含めて理解し、自然言語での指示に従った応答を可能にする。 レシートやWebサイト ...
従来の読解技術は、図表中のテキストを抽出しているため文字の見た目やレイアウトなどの資格情報までは処理できない点が課題だった。請求書に関する情報抽出タスクなど任意の個別タスクには対応できない課題もあり、高い性能を出すには目的のタスク ...
ベクスト株式会社(代表取締役社長:小橋寿彦、本社:東京都目黒区、以下 ベクスト)は、簡易VOC分析機能「VoC Lens(β版)」をリリースいたしました。 「VoC Lens(β版)」は、応対履歴や音声認識結果などのテキストファイルを投入するだけで、LLM(大規模 ...
米OpenAIが5月に発表した生成AIモデル「GPT-4o」。テキストだけでなく音声や画像も扱えるマルチモーダルモデルとして、その特徴が注目を集めている。ChatGPTでは、GPT-4oの性能を生かした「高度な音声モード」も提供予定(6月25日に延期を発表)で、感情や非 ...
ユーザー企業のIT担当者を対象に、IT製品/サービスの導入・購買に役立つ情報を提供する無料の会員制メディア「TechTargetジャパン」。このコンテンツでは、業界&市場動向に関する業界&市場動向の記事を紹介します。製品/サービス選定の参考にご覧 ...
AI開発でボトルネックになるデータの収集、アノテーションを効率的に行えるプラットフォーム「harBest」を提供している株式会社APTO(本社:東京都渋谷区、代表取締役:高品良)は、LLM(Large Language Model)開発に必要なデータセットを権利クリアな状態で2 ...
~図表を含む企業内文書の高度な利活用の実現を目指し、「RICOH オンプレLLMスターターキット」に搭載予定~ 株式会社リコー(社長執行役員:大山 晃)は、中国のアリババクラウドが開発・提供する大規模言語モデル(LLM)ファミリーの「Qwen2.5-VL-32B-Instruct ...
中国のDeepSeek-AIに所属する研究者らが発表した論文「DeepSeek-OCR: Contexts Optical Compression」は、本や画像などをスキャンして書いてある文字をデジタルテキストデータに変換するOCR(光学文字認識)を用い、長文を画像に圧縮する技術を発表した研究報告だ。