「写真の中の人物は何をしているのか」、「この顔は誰か」、「この顔は怒っているのか」、「文章には何が書いてあるのか」、「誰が話しているのか」。このような人間に備わっている画像や音声、文章についての認知能力をコンピュータで実現する ...