Сегодня 18 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Нейросеть Google Gemini 1.5 Pro обрела слух

С очередным обновлением большая языковая модель Google Gemini 1.5 Pro получила «уши»: в качестве входных данных она теперь воспринимает загружаемые аудиофайлы. Теперь ИИ может подготовить сводку пресс-конференции без её текстовой расшифровки. Новые функции добавились и в генератор изображений Imagen 2.

 Источник изображения: blog.google

Источник изображения: blog.google

В ходе мероприятия Google Next компания объявила, что Gemini 1.5 Pro станет доступной для общественности через облачную платформу Vertex AI для разработки приложений искусственного интеллекта. Сейчас большинство пользователей может работать с моделями Gemini через одноимённый чат-бот. Самая мощная из них, Gemini Ultra, доступна с платным чат-ботом Gemini Advanced — она поддерживает длинные запросы, но уступает Gemini 1.5 Pro в скорости работы.

Новые возможности также получил генератор изображений Imagen 2 — теперь он может добавлять элементы на готовые изображения или удалять их. На всех картинках, которые создаёт Imagen 2, теперь ставится цифровой водяной знак SynthID, который указывает на их происхождение при проверке специальным инструментом, но остаётся невидимым для человеческого глаза.

Google добавила, что изучает способы согласовывать ответы ИИ с выдачей поисковой системы, чтобы предоставляемая им информация была актуальной. Это не всегда возможно для больших языковых моделей, и иногда преднамеренно: компания, например, не позволяет Gemini отвечать на вопросы, связанные с выборами в США.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple настаивает на обоснованности комиссии в 27 % за платежи вне App Store — суд в этом сомневается 2 ч.
Winamp превратится в медиаплеер с открытым исходным кодом 7 ч.
Google так и не решила проблемы с расовой инклюзивностью у генератора изображений Gemini 8 ч.
ChatGPT научился напрямую загружать файлы из «Google Диска» и Microsoft OneDrive 9 ч.
Twitter официально переехал на домен X.com 12 ч.
Команда специалистов OpenAI по защите человечества от угроз, связанных с ИИ, просуществовала менее года 12 ч.
Google выпустил вторую бету Android 15 с «Личным пространством», предиктивным «Назад» и множеством других нововведений 19 ч.
Новая статья: Animal Well — колодец, из которого не хочется вылезать. Рецензия 19 ч.
В России готовы взяться за борьбу с серым импортом видеоигр 20 ч.
Microsoft начала веерные остановки подписок на свои облачные продукты для российских корпоративных клиентов 20 ч.
Короткие кабели затормозили внедрение DisplayPort 2.1 UHBR20 — сделать длиннее не получается 3 ч.
Новая технология активного шумоподавления с ИИ позволяет выделить определённые звуки и убрать все лишние 4 ч.
Чипы стали новой нефтью в борьбе мировых держав за лидерство 6 ч.
Индия отправит на Марс собственный ровер и вертолёт 6 ч.
Первый запуск Boeing Starliner с людьми снова перенесли — на космическом корабле обнаружили утечку гелия 9 ч.
Раскладушки Motorola Razr 50 и Razr 50 Ultra получат большие внешние экраны и свежие процессоры 9 ч.
XPeng начнёт продавать электромобиль с электролётом в багажнике в 2026 году 14 ч.
Слухи: Apple готовит сверхтонкий iPhone 17 — он выйдет в 2025 году и будет дороже iPhone 17 Pro Max 17 ч.
Крупнейший в России оператор ЦОД и облачных услуг «РТК-ЦОД» готовится к IPO 22 ч.
Palit представит на Computex видеокарту с водоблоком и воздушной системой охлаждения 23 ч.