『テキストから画像イメージを作り出す技術』をMicrosoftが開発

凄いテクノロジーニュースが飛び込んできたので、ぜひ紹介したい。

そのテクノロジーの内容は、タイトルで紹介したとおり「テキストから画像イメージを作り出す技術」だ。
技術の名前を『AttnGAN』といい、Microsoftが開発した。

この情報だけだと、よくわからないかもしれないが、画像を見ればその威力が一発で分かるはずだ。

ページ上部の画像がそれである。
念のため、もう一度貼っておこう。

※画像はMicrosoftのホームページから引用している
-Microsoft researchers build a bot that draws what you tell it to
(https://blogs.microsoft.com/ai/drawing-ai/)

画像上部に”yellow”とか”bird”とかの単語が見えるかと思うが、『AttnGAN』はこれらの単語から類推し、写真の鳥を作り出したのだ。

当然だが、この鳥は実在しない鳥である。
想像力にまでその威力を見せつけたAIの、またひとつ大きな進歩となりうるだろう。

さらに注目すべきは、「鳥が枝(っぽいもの)に止まっている」という点である。

どうしても鳥にばかり目が行ってしまうが、テキストデータでは「鳥は枝に止まっている」などとは一言も教えていない。
つまり、「鳥は枝に止まっていることが多い」という常識を、機械が考えて導き出したということである。

おそらくウェブを検索した結果、鳥の画像は木に止まっているものが多かったので、そのように判断したと考えられる。
しかし、これは”フレーム問題”として、有名なAIの課題にある種の解決方法をもたらすものかもしれない。

技術者たちは考えた。われわれはロボットに、関係のある(relevant)帰結と関係のない (irrelevant)帰結との区別を教えてやり、関係のないものは無視するようにさせなければならない、 と。
現実の世界のような開いた世界の場合は、行為を囲むフレームについての目録は、ほとんど無限なものとなり、それを完成させることはできない。
-京都大学論文:「フレーム問題」の解消 : 人工知能研究への一提言
https://repository.kulib.kyoto-u.ac.jp/dspace/bitstream/2433/50713/1/KJ00000047097.pdf

記事に対するコメントとして、「小説を読ませれば、勝手に漫画や映画ができるのでは」との期待が早くも寄せられている。
僕はその期待もありつつ、”人が書いたブログや本や論文を読ませたら、その人の人となりの精巧なイメージ(bot的な)が出来たりするんでは…?”という視点もあるのでは、と感じている。

Microsoftがテキストから本物と見間違うレベルの架空のイメージを自動生成する新AI技術「AttnGAN」を開発

<概要>
Microsoftが文章からイメージを自動生成できるAI技術を開発しました。
「黄色い体で、黒い翼を持ち、短いくちばしの鳥」と入力すれば、まるで実在する鳥であるかのような自然な画像を自動生成できます。
「イメージ→キャプション」という方向で開発されてきたAI技術に対して、新たにMicrosoft研究所が発表した技術は「キャプション→イメージ」という方向で活用されるものです。
つまり、欲しいイメージの説明をテキストで入力すると、それ見合ったイメージをAIが自動生成してくれるというわけです。
このAI技術を開発した研究者たちはシンプルに「drawing bot」と呼んでいるとのこと。
http://gigazine.net/news/20180119-microsoft-attngan/

コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください