Услышать фото: как современный незрячий человек может взаимодействовать с изображениями?

Услышать фото: как современный незрячий человек может взаимодействовать с изображениями?

Время прочтения: 3 минуты
00:00:00
Фото: freepik com
Визуальный контент продолжает играть важную роль в формировании нашего  мультимедийного времени.

Обмен изображениями в социальных сетях, деловой переписке и многих других сферах стал неотъемлемой частью самой жизни, и, если ты идёшь в ногу со временем, обходиться без релевантного восприятия содержания картинок и фотографий практически нереально.

Как же с этой  задачей справиться незрячему человеку без посторонней помощи – расскажем прямо сейчас.

Искусственный интеллект как безотказный помощник


Пространство мировой паутины уже давно пестрит ошеломляющими сообщениями о том, что нейросети могут создавать картинки, песни и  даже видео. Однако всё это  оказывается востребованным и доступным для незрячих пользователей только при адаптации данного процесса к их особенностям, что должно быть заложено  уже на этапе разработки ресурсов. 

 И, к счастью, благодаря усилиям некоторых компаний-разработчиков соответствующие возможности у данной категории пользовательской аудитории появляются.

В частности, идентифицировать то или иное изображение без помощи посторонних незрячему человеку можно сразу несколькими способами, каждый из которых имеет свои плюсы и минусы, а самое главное – может быть более приемлемым для конкретного пользователя с чистотехнической точки зрения. 

Так, на первое место по скорости и качеству распознавания фотографий стоит поставить уже хорошо известное приложение Bemyeyes, которое способно описывать окружающие предметы в режиме реального времени, а также предоставлять возможность связаться со зрячим волонтёром через видеовызов.

 Однако, далеко не все незрячие люди знают, что путём выделения фото в самом диспетчере файлов и активации функции поделиться в открывшемся списке возможных программ-адресатов можно также выбрать Bemyeyes, после чего искусственный интеллект проанализирует картинку и выдаст её текстовое описание с полем для введения уточняющего вопроса.

Если в перечне приложений для обмена Bemyeyes не появляется сразу, на устройствах с Android стоит попробовать полистать список движением двумя пальцами вправо и влево с запущенным TalkBack – очень часто нужная позиция находится на соответствующем месте по алфавиту, а английская раскладка начинается после русской.

Второе место нашего мини-рейтинга следует отдать EnvisionAI – приложению, которое также довольно неплохо распознаёт фотографии и зачитывает написанный на них текст. Конечно, по качеству описания могут немного уступать Bemyeyes, однако безусловным преимуществом Envision является способность в режиме онлайн сканировать страницы книг, после чего скринридер может зачитать их содержание.

Очень хорошее подспорье для незрячих студентов, которым быстро нужно прочитать плоскопечатный учебник. Однако следует учитывать, что на распознавание изображений и страниц приложению требуется небольшое количество времени, в которое нужно правильно держать камеру телефона над идентифицируемым объектом. Описание же фотографий из галереи или файлового диспетчера осуществляется так же, как и в предыдущем случае.

На третье место целесообразно поместить сам широко известный скринридерTalkBack, в последней 15-й версии которого была значительно усовершенствована соответствующая функция.

Теперь пункт «описать изображение» есть в меню TalkBack, и после его активации при попадании курсора на фото, синтезатор речевого доступа прочитает краткую информацию о том, что на нём изображено.
Управлять данной функцией можно через настройки TalkBack, где находятся переключатели для регулирования степени распознавания изображений.  Название раздела будет вполне идентичным его содержанию.

Важно отметить, что аналогичная функция появилась и у последней версии Jaws, что позволяет получать сведения об изображённых на фото объектах и незрячих пользователей Windows.

Конечно, помимо перечисленных выше, существуют также и Vision боты во «ВКонтакте» и Telegram, однако они нередко выдают не совсем полное, а порой и вовсе разрозненное описание изображений, что создаёт определённые затруднения при их восприятии на слух.

Разумеется, все эти способы ещё не пригодны для того, чтобы помочь незрячему пользователю выполнять задачи по подбору и созданию высококачественных иллюстраций для достижения профессиональных целей, однако удовлетворить личные запросы по более или менее адекватному восприятию информации с картинок они способны вполне.

А это значительно расширяет возможности тотально слепых людей по более независимому и успешному существованию в нашей цифровой реальности, что, безусловно, является главным залогом подлинно инклюзивного общества.


Софья Золотова

Интересное по теме

слухопротезирование Москва