負責研發的 Microsoft 深度學習技術首席研究員 Xiaodong He 表示,圖像是人工智慧由零開始,逐像素逐像素創作。他以一幅人工智慧創作的黃色雀鳥圖像做解說,表示人工智慧分析文字后,再透過一項名為 Generative Adversarial Network(GAN,生成對抗性網路)的技術將文字轉化成圖像,人工智慧創作的黃色雀鳥並不一定在現實世界存在,只是電腦的一種想像。
GAN 技術由兩組機器學習模型組成,一組負責以文字製作圖像,另一組則以文字去判斷製作出圖像的真確性,兩者結合去製作完美的圖像。研究員指人工智慧系統能夠創作出任何類型的形象,例如飄浮的雙層巴士、放牧中的牲畜等,而且在文字中欠缺的一些細節,系統會在影像中自行補完。