GPT-4V（GPT-4 with Vision）

- 11/07/2023 09:45:00 午後

GPT-4に画像解析機能と音声出力機能が追加され、マルチモーダルAI（GTP-4V）になったということで、国立競技場のザハ・ハディド案をアップロードして説明させてみました。

人間でも、画像をこんな風に明快に言語化できる人は少ないと思います。まあ確かに、ザハ案を知らない人ならこんな説明をするかもって感じ。

それから、今後は説明文をDALL-E 3に入力して、画像を生成させてみました。こちらも、ザハ案と言わずにこの説明文でスケッチを描いてみろと言われたら、こんな絵になるかも知れません。

マルチモーダルAIで自然文と画像を行ったり来たりしながらブレインストーミングをすると、自分だけではなかなか思いつかない意見を得られるかも～

このブログを検索

SeaGate Reloaded

GPT-4V（GPT-4 with Vision）

コメント

コメントを投稿

このブログの人気の投稿

Platearu-Blender-Importer

ブログを note に移行

ゆかりねっと VOICEPEAKプラグイン

"現状"の建築設計分野でのAIマップ

Stable DiffusionのOutpainting/Inpainting