Создана компьютерная программа, распознающая речь по губам лучше человека

В Оксфордском университете ученым удалось создать программу LipNet, которая читает речь человека по губам, анализируя ее целыми предложениями. Результаты тестирования показали, что компьютер «читает по губам» значительно лучше человека.

Разработка программы базировалась на том, что человек распознает речь по губамименно предложениями, а не отдельными словами. Сейчас существует много систем, которые способны распознать лишь слова и словосочетания, но, использовав возможности нейросети LSTM, ученым удалось преодолеть это ограничение.

При тестировании использовалось более 32 тысяч видеозаписей, где люди произносили однотипные предложения на английском языке. На каждое предложение приходилось 64 варианта интерпретации. Однако программа справилась «на отлично», правильно прочитав 93,4% предложенного задания. Люди, даже специально подготовленные, могут распознавать по губам лишь 52% сказанного.

chitat-po-gubam-3jpg-min

Пока программа освоила только английский язык и «тепличные условия» несложных предложений, но авторы надеются на дальнейшее усовершенствование умной программы. Тогда со своим компьютером можно будет поговорить «по душам». Некоторые ученые даже опасаются, что люди будут отдавать такому общению больше времени, чем разговорам с реальными людьми.

14 комментариев

  1. Интересная программа, только зачем с компьютером общаться, коли живые люди есть? Точно, век роботов грядет, не нужен уже настоящий человек нигде).

    1. Вспоминается песня «Автомобили». Похоже, будет ситуация, при которой человека оставят на обслуживание роботов, в лучшем случае… Или для опытов. «Мы служим ей, чтоб ездила она».)

  2. Наука на месте не стоит, скоро людям разговаривать вообще не надо будет, все роботы делать будут.

  3. Ну, теперь для шпионов раздолье будет! Не надо микрофоны расставлять и язык глухонемых учить, достаточно камер.

  4. Да уж теперь и шёпотом ничего не скроешь, остаётся только разговаривать в полной темноте, да и там видеокамеры достанут, получается что маски надевать придётся чтобы никто не подглядел тайные разговоры

  5. Вероятно, что такая программа уже давно стоит на вооружении спецслужб для анализа секретных переговоров высокопоставленных лиц.

  6. Так есть же распознавание голоса. Получается еще и по губам будет читать программа.

  7. Такая программа пригодилась бы в работе с тяжелобольными, когда человек пытается казать что-то важное, а не может.

  8. Интересно еще, дистанцию какую тянет: только личное пространство или в шпионских целях сойдет?

  9. Программа нужная. Применение найдется. В моей практике одноклассница прекрасно понимала по губам. Очень выручало ее это умение на уроках. Кстати, была отличницей.

Leave a Reply

Ваш e-mail не будет опубликован.