Сегодня 28 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ocr

Google Chrome скоро научится преобразовывать PDF-файлы в текст для чтения их вслух

Google в скором времени обещает упростить взаимодействие с PDF-файлами для людей с плохим зрением. Компания добавляет в свой браузер Chrome технологию OCR (оптическое распознавание символов), которая будет преобразовывать PDF-файлы в текст, что сделает их более доступными, особенно для программ чтения с экрана. Видимо, имеются в виду PDF-файлы, в которых текст представлен в виде изображения. Инструмент также будет предоставлять текстовые описания изображений.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Google обещает, что функция преобразования PDF-файлов в текст станет доступна в «ближайшие месяцы». Компания также планирует расширить подобную функциональность за пределы Chrome в конце этого года, хотя и не сообщила, какие платформы могут получить обновление.

Нововведение от Google является частью более широкой образовательной инициативы, которая включает в себя лицензирование приложений для школьных Chromebook и бесплатный доступ к Adobe Express в США. Администраторы получат более жёсткий контроль над контентом, к которому учащиеся и преподаватели смогут получить доступ на своих Chromebook — они могут запретить учащимся копировать и вставлять текст с определённых сайтов, где используются генеративные инструменты искусственного интеллекта, которые могут помочь учащимся обмануть тесты. Также пользователям станет проще отключить камеру или микрофон независимо от того, где они находятся в Chrome OS.

Функция чтения PDF-файлов вслух в основном предназначена для образовательных заведений, где учащимся с проблемами зрения будет легче читать отсканированные учебные материалы или необходимые исследовательские статьи. Тем не менее, это также сделает интернет более доступным для широкой публики. Веб-сайты нередко помещают условия обслуживания или другую важную информацию в PDF-файлы без текстового слоя. Обновление сделает эту информацию доступной для большего числа пользователей.

Google научила ИИ читать сложный почерк врачей

С проблемой чтения сделанных врачами записей сталкиваются многие пациенты. В помощь им компания Google разработала программное решение для автоматической расшифровки медицинских документов.

 Источник изображения: Google

Источник изображения: Google

Непостижимо сложную каллиграфию медицинских работников помогли разобрать алгоритмы искусственного интеллекта. Техногигант сообщил на конференции в Индии, что работает с фармацевтами — именно они помогли раскрыть секреты письменности докторов.

Функция должна появиться в сервисе Google Lens. Она позволит пользователям либо распознать написанное с помощью камеры смартфона, либо загрузить из памяти готовый файл с рукописным текстом. После обработки текста приложение позволяет распознать лекарства, упомянутые в рецепте. Компания не сообщила, когда планирует сделать функцию общедоступной. Стоит отметить, что т.н. «почерк врачей», продемонстрированный на фото выше, — весьма безобидная версия, которую можно разобрать и без помощи ИИ.

Помимо Google, разработки в сфере нейронных сетей и искусственного интеллекта ведут многие другие компании, осознающие тот факт, что без поиска новых перспективных направлений преуспеть и занять лидирующие позиции на современном IT-рынке не то чтобы проблематично, а попросту невозможно.


window-new
Soft
Hard
Тренды 🔥