イーロン・マスク氏の米AI企業xAIは4月12日(現地時間)、昨年11月に発表した独自LLM(大規模言語モデル)「Grok」の更新版「Grok-1.5V」を発表した。同社初のマルチモーダルモデルで、画像を認識する。既存のGrokユーザーに間もなく提供される予定。 1.5Vの ...
(株)インプレスは3月25日、画像生成技術の基礎から実践までを解説した書籍『Pythonで学ぶ画像生成 機械学習実践シリーズ』(北田俊輔 著)を発売した。価格は単行本・電子版ともに3,850円。 本書は、近年、世界的な注目を集める「Midjourney」や「Stable ...
当サイトではJavaScriptを使用しております。ご利用のブラウザ環境によっては、機能が一部限定される場合があります。 ブラウザの設定でJavaScriptを有効にしていただくことにより、より快適にご利用いただけます。 中小企業経営者の課題解決をサポートする ...
昨今、スマホでもローカルで動作するLLMは珍しくなくなったものの、今回ご紹介するのはマルチモーダル対応。つまり画像認識可能なLLMとなる。どこまで動くのか!?試用レポートをお届けしたい。 Gemma-3nとは? 去年(2024年)の10月にスマホで2Bもしくは3BのLLM ...
ハイペースで進化し続けているOpenAIのAIチャット「ChatGPT」。2023年9月には画像のアップロードが可能になり、その画像内容を元にした回答が得られるようになりました。続く10月には画像生成AI「DALL・E 3」も実装され、テキストによる簡単な指示で高品質な ...
この回から2回にわたり、画像認識のサンプルを通じて、Googleの提供するMobileNetの使い方と、トレーニング済みのモデルを生かす転移学習を理解します。この回では、静止画像を認識するサンプルを通じて、MobileNetの基本的な使い方を理解します(図1)。
NTTはノイズを含む画像をAIが検出しやすくする技術を開発した NTTは粗い画像に写った被写体を人工知能(AI)が正しく認識できるようにする技術を開発した。従来技術に比べて追加のデータを必要としない利点がある。画像のほか、音声やセンシングの ...
日々の業務を効率化し、競争力をより高めるためにAI技術の導入を検討していると思います。その1つであるAI画像認識技術は、ディープラーニングの発展を背景に近年急速な進化を遂げ、それまで人間の熟練した判断や知識が必要とされていた領域でも精度 ...
株式会社シーエスコミュニケーションは、画像認識技術、エッジAI、POSシステムを組み合わせることで最短0.2秒で会計をする最新型「AIレジ・Truly」を、6月12日〜14日に幕張メッセで開催される「画像認識 AI EXPO2024」で公開します。 日本で人手不足が深刻化 ...