AIが自分で考えてイラストを描く！その繊細なタッチに「ま、負けた…」

By - 土屋夏彦　公開：2018-01-31 　更新：2018-05-24

AI（人工知能）の話題が多い中、AIの中でもいまもっとも注目されている分野があるんですが、その技術を使ってアメリカ・マイクロソフト社の人工知能ラボ『マイクロソフト・リサーチAI （Microsoft Research AI』が自然言語のテキストの説明を読み込ませるだけで画像を描くことができるAIシステム『Attn GAN（エーティティエヌ・ガン）』を発表しました。

たとえば『体が黄色で黒い羽を持ち、くちばしが短い鳥』というテキストを読み込ませるとあら不思議！　誰が見てもそうとわかる小鳥の画像が現れます。

出典：Microsoft News Center

マイクロソフト社の説明によれば「人間は検索エンジンでどういう鳥を探したいと入力すれば、それに合った画像を表示させることが出来ますが、このAIが描いた鳥は、人工知能が覚えた画像を元に１ピクセルごとに描いたものなので、実際に存在する鳥ではなく、あくまでAIが思い描いたオリジナルの画像だ」ということです。

現在、AI（人工知能）ブームの中心にある技術は『ディープラーニング（深層学習）』。何かを解析する際に選択肢を組合せることでどんどん階層が深くなっていくことからそう名付けられました。

このディープラーニングが有名になったきっかけは、２０１２年に開催された国際画像認識コンテスト（ImageNet Large ScaleVisual Recognition Challenge）だと言われています。ここからディープラーニングが『画像解析』分野で急速に拡大していったわけですが、その一方『画像生成』の技術においても大きな進化を遂げました。それがここ数年最も脚光を浴びている『GAN：敵対的生成ネットワーク（Generative Adversarial Network）』という技術なんです。

通常AI（人工知能）に学習させるときは、質問とそれに対する答えを同時に教える方法が一般的。例えば犬の画像を学習させる際には、大量の犬の画像を読み込ませ、これも犬です、あれも犬ですと覚えさせていくなかで、犬の画像の特徴をAIが抽出していくわけです。

これは『教師あり学習』と呼ばれる手法。これに対してAIに全く何も教えずにひたすら同じ種類の画像を読み込ませ、AI自身がその画像の特徴や法則を見出す『教師なし学習』もあります。

『敵対的生成ネットワーク』という手法は、こうした２つの機械学習モデルを組み合せ、ひとつはひたすら多くの画像を読み込ませ、それぞれの特徴を学習させた上で、元の画像に似せた画像を生成します。もうひとつは正しい画像はこういう特徴があると知った上で、生成された画像がAIが似せた画像なのか本物の画像にどのくらい近いかを評価させるんです。

こうした２つの敵対的なAIが戦うことで、本物の画像と見分けがつかなくなったとき、完全にAIが独自に創造した画像が出来上がるというわけです。

GANは、まるで写真のようにリアルな画像の生成が可能であり、画像処理や情報可視化の分野で最も注目されているAI技術のひとつ。ほかにも単なる馬の画像からシマウマに変換するGANとか、低解像度の画像を高解像度に変換するGANだったり、Amazonではユーザーのファッションスタイルを学習することでその人が欲しいデザインを作り出すGANの研究などもしているそうです。

AttnはAttentional(注意深い)という意味なので『AttnGAN』は日本語に訳すと「注意深く読み込ませた敵対的生成ネットワーク」と言う感じでしょうか。マイクロソフト社によれば、この『AttnGAN』の性能を高めていくことで、脚本の文章があるだけでアニメーションが制作できるようになるかもしれないと話しているそうです。

[文・構成　土屋夏彦]

土屋夏彦

上智大学理工学部電気電子工学科卒業。 1980年ニッポン放送入社。「三宅裕司のヤングパラダイス」「タモリのオールナイトニッポン」などのディレクターを務める傍ら、「十回クイズ」「恐怖のやっちゃん」「究極の選択」などベストセラーも生み出す。2002年ソニーコミュニケーションネットワーク（現ソニーネットワークコミュニケーションズ株式会社）に転職。コンテンツ担当ジェネラルプロデューサーとして衛星放送「ソネットチャンネル749」（現アジアドラマチックTV★So-net）で韓国ドラマブームを仕掛け、オンライン育成キャラ「Livly Island」では日本初の女性向けオンラインで100万人突破、2010年以降はエグゼクティブプロデューサー・リサーチャーとして新規事業調査を中心に活動。2015年早期退職を機にフリーランス。記事を寄稿する傍ら、BayFMでITコメンテーターとしても出演中、ラジオに22年、ネットに10年以上、ソーシャルメディア作りに携わるメディアクリエイター。