Google Chrome скоро научится преобразовывать PDF-файлы в текст для чтения их вслух

22.06.2023 [19:45], Сергей Сурабекянц

Google в скором времени обещает упростить взаимодействие с PDF-файлами для людей с плохим зрением. Компания добавляет в свой браузер Chrome технологию OCR (оптическое распознавание символов), которая будет преобразовывать PDF-файлы в текст, что сделает их более доступными, особенно для программ чтения с экрана. Видимо, имеются в виду PDF-файлы, в которых текст представлен в виде изображения. Инструмент также будет предоставлять текстовые описания изображений.

Источник изображения: Pixabay

Google обещает, что функция преобразования PDF-файлов в текст станет доступна в «ближайшие месяцы». Компания также планирует расширить подобную функциональность за пределы Chrome в конце этого года, хотя и не сообщила, какие платформы могут получить обновление.

Нововведение от Google является частью более широкой образовательной инициативы, которая включает в себя лицензирование приложений для школьных Chromebook и бесплатный доступ к Adobe Express в США. Администраторы получат более жёсткий контроль над контентом, к которому учащиеся и преподаватели смогут получить доступ на своих Chromebook — они могут запретить учащимся копировать и вставлять текст с определённых сайтов, где используются генеративные инструменты искусственного интеллекта, которые могут помочь учащимся обмануть тесты. Также пользователям станет проще отключить камеру или микрофон независимо от того, где они находятся в Chrome OS.

Функция чтения PDF-файлов вслух в основном предназначена для образовательных заведений, где учащимся с проблемами зрения будет легче читать отсканированные учебные материалы или необходимые исследовательские статьи. Тем не менее, это также сделает интернет более доступным для широкой публики. Веб-сайты нередко помещают условия обслуживания или другую важную информацию в PDF-файлы без текстового слоя. Обновление сделает эту информацию доступной для большего числа пользователей.

Google научила ИИ читать сложный почерк врачей

19.12.2022 [15:28], Руслан Авдеев

С проблемой чтения сделанных врачами записей сталкиваются многие пациенты. В помощь им компания Google разработала программное решение для автоматической расшифровки медицинских документов.

Источник изображения: Google

Непостижимо сложную каллиграфию медицинских работников помогли разобрать алгоритмы искусственного интеллекта. Техногигант сообщил на конференции в Индии, что работает с фармацевтами — именно они помогли раскрыть секреты письменности докторов.

Функция должна появиться в сервисе Google Lens. Она позволит пользователям либо распознать написанное с помощью камеры смартфона, либо загрузить из памяти готовый файл с рукописным текстом. После обработки текста приложение позволяет распознать лекарства, упомянутые в рецепте. Компания не сообщила, когда планирует сделать функцию общедоступной. Стоит отметить, что т.н. «почерк врачей», продемонстрированный на фото выше, — весьма безобидная версия, которую можно разобрать и без помощи ИИ.

Помимо Google, разработки в сфере нейронных сетей и искусственного интеллекта ведут многие другие компании, осознающие тот факт, что без поиска новых перспективных направлений преуспеть и занять лидирующие позиции на современном IT-рынке не то чтобы проблематично, а попросту невозможно.

← В прошлое

выдано Федеральной Службой по надзору за соблюдением законодательства в сфере массовых коммуникаций и охране культурного наследия

При цитировании документа ссылка на сайт с указанием автора обязательна. Полное заимствование документа является нарушением
российского и международного законодательства и возможно только с согласия редакции 3DNews.