こんにちは。綾部です。
頭に思い浮かんだイメージや素敵な世界観の画像が綺麗に描き出せたら、いいなと思うことありませんか?
プレゼンで使用する画像や、お気に入りの壁紙など、使用する用途に限らず思い描いた絵が簡単に手に入ると何かと便利ですよね。
今回は、そんな思いを実現可能な、AIを使った自動画像生成ツールがありますので紹介したいと思います。
ディープラーニング(GAN)による画像生成
GANとは「敵対的生成ネットワーク(=Generative Adversarial Network)」と呼ばれるディープラーニングの手法です。
「アルゴリズムを生成するAI」と「それを監視するAI」がともに競い合い学習を重ねていくことで、正解データ(教師データの作成)を不要とし、さらに学習効果を高めていこうとするものと言われています。
正解が無い中であらゆるデータを学習してデータ生成するため、他の画像生成技術と比べて柔軟性が高く、医療用途や都市開発にも導入するプロジェクトが検討されている技術とのことです。
出典:建物取り壊し後の景観シミュレーションをリアルタイムに(2022年7月29日時点)
出典:「GAN」による学習でAI開発、臓器輪郭認識精度向上 広島大(2022年3月9日時点)
そして、中でも今注目されている、GANを用いて「文章から画像を想像して生成する」技術がございますので、紹介したいと思います。
文章から自動で画像生成できる画期的ツール
これまで「画像は画像」、「文章は文章」と切り分けられていましたが、2020年ごろから、相互のやりとりがなされるようになってきました。
直近では、文章から画像を生み出すツールが開発されるようになり今注目されています。
中でも特に2つのツールが注目されていますので紹介したいと思います。
【①DALL-E】
まず、一つ目は、「DALL-E」です。
こちらは、イーロンマスク氏らが出資して設立したOpen AI社が生み出した画像生成ツールです。
文章を入力しただけで、そのシチュエーションに合った画像を自動で生成出力してくれるというものです。
例えば、下の画像は、「アボカドの形をしたアームチェア」といった文章を入力した時に生成された画像サンプルの一部です。
出典:DALL·E: Creating Images from Text(2021年1月5日時点)
どうですか?一つのインプットに対して、色の組み合わせや、形状、質感まで、想像力豊かでびっくりですよね。
複数パターン生成されるようになっているので、よりイメージに近いものを選べるようになっているのも良いですよね。
【②Midjourney】
二つ目は「Midjourney」です。
DALL-Eと同じく、文章から画像を生成するツールですが、Midjourneyが生成した画像は表現力豊かで、色鮮やかなんです。
最近Twitterでは、「神絵が1分で生成される」と話題になっています。
驚くほど壮大で綺麗ですよね。
コミュニケーションツールのDiscordを使い、生成したい画像の内容を英語で指示すると、なんとわずか1分で画像が生成されます。
画像の使用については、トライアルなど選択するライセンスの種類で条件が異なるため、都度規約の確認が必要ですが、
8月1日からはβ版が公開中で、回数制限がありますが無料でテスト利用もできるそうです。
Webコンテンツなど、作成段階に載せるイメージ画像用に使用したり、活用シーンはたくさんありそうで、これから楽しみですね。