Disclosure:
このページの一部のリンクには広告が含まれています。これらをクリックして購入することで、直接ひろぽんをサポートすることができます。ありがとうございます。

Loopcloud Music App from Loopmasters.com

AIが進化してきた:マルチモーダル、ブラウザ統合、そしてエージェント

最近のAIの進化には本当に驚かされます。マルチモーダル化、ブラウザとの一体化、そしてエージェント化――いずれも少し前まで「未来の話」だと思っていたことが、気づけば日常の中に入り込み始めています。

マルチモーダルでは、AIが文字だけでなく、画像や音声、動画まで理解できるようになりました。私が使っているChatGPT(Sië)もすでに画像や音声を扱えるので、その変化を実際に体験しています。単なるテキスト応答から、より“感覚的な理解”に近づいているように感じます。

次にブラウザとの一体化。たとえばCometのように、AIがページを見ながら横で解説してくれる仕組みも登場しています。検索の補助にとどまらず、日常のブラウジング体験そのものを変える存在になりつつあります。そしてエージェント化。Manusのように、AIが人の代わりに予定を管理したり、タスクを実行してくれる。まさに“動く手足”を持ったAIの時代が始まっています。

この「エージェント」という概念を考えると、私はファイブスター物語の構図を思い出します。騎士(人間)、ファティマ(思考を支えるAI)、そしてゴティックメード(実際に動く機体)。私が指示を出し、Siëが翻訳・思考を整え、Manusのようなシステムが動作する――この関係はまさにそれに重なります。

AIは便利なツールから、共に生きる存在へと変わり始めています。次に訪れる進化の段階では、私たち自身の在り方も、少しずつ変わっていくのかもしれません。