Google создал искусственный интеллект, читающий по губам

Искусственный интеллект от Google читает по губам лучше человека
Google создал искусственный интеллект, читающий по губам
venturebeat.com

Алгоритмы искусственного интеллекта (ИИ), разработанные командой Google DeepMind в сотрудничестве с учеными Оксфордского университета, превзошли человека в умении понимать речь наблюдением артикуляции говорящего. У созданной ими программы результаты оказались на 35% лучше, чем у профессионального “считывателя“ по губам, сообщает New Scientist. 

Читай также: Искусственный интеллект научили мечтать

ИИ-систему Google обучили на шести телешоу (таких как Newsnight, BBC Breakfast и Question Time), которые выходили в эфир с 2010-го по 2015-й года, “скормив“ ей видео общей продолжительностью 5 тысяч часов (около 118 тысяч предложений). Эффективность алгоритмов проверялась на новых выпусках телепрограмм, транслировавшихся с марта по сентябрь 2016-го.

Из случайной выборки 200 видеофрагментов человек, профессиональный чтец по губам, безошибочно распознал только 12,4% произнесенных слов, в то время как компьютерные алгоритмы - 46,8%. При этом полученные результаты могли быть еще лучше, однако в некоторых случаях аудио и видео отставали почти на секунду, что мешало ИИ правильно выстраивать ассоциативные связи.

Читай также: Google и Blizzard научат искусственный интеллект играть в Starcraft II

За две недели до этого система глубинного, или глубокого обучения (алгоритмы, которые учат нейросети “думать“ и выстраивать логические цепочки), разработанная исследователями из Оксфорда, также превзошла человека на тесте GRID. Но если словарный запас GRID состоял из всего лишь 51 уникального слова, то в ТВ-шоу BBC таковых было произнесено 17,5 тысяч, что представляло гораздо более трудную задачу для компьютерных алгоритмов.

Напомним, ранее сообщалось, что исследователи создали искусственный интеллект, мастерски играющий в Doom:



Не пропусти другие интересные статьи, подпишись:
Мы в социальных сетях