Сегодня 01 июня 2024

18+

О сайте Реклама Рассылка Контакты

gemini

Теги → gemini

Быстрый переход

16:45 09.04.2024 Нейросеть Google Gemini 1.5 Pro обрела слух
15:00 09.04.2024 Нейросеть Google Gemini Pro поможет создавать Android-приложения — ИИ встроили в Android Studio
19:05 28.03.2024 Под давлением пользователей Google преодолела аппаратные ограничения для внедрения ИИ в Pixel 8
16:02 27.03.2024 У некоторых пользователей «Google Сообщений» появился чат с Gemini
22:01 21.03.2024 Google открыла доступ к мощной нейросети Gemini 1.5 Pro
19:12 18.03.2024 Слухи о появлении нейросети Google Gemini в будущих iPhone привели к росту акций Alphabet и Apple
12:20 18.03.2024 Apple проиграла гонку ИИ: будущие iPhone получат нейросеть Google Gemini
18:13 16.03.2024 AI.com теперь принадлежит Google и перенаправляет к ИИ-чат-боту Gemini
14:28 08.03.2024 Pixel 8 не получит поддержку Gemini Nano из-за аппаратных ограничений
16:30 06.03.2024 Сергей Брин: Google «определённо оплошала» с генератором изображений в Gemini
11:42 28.02.2024 Передовые ИИ-модели Google Gemini уже через год смогут работать на смартфонах локально
15:25 26.02.2024 Google рассказала о планах интегрировать Gemini в Android и о других нововведениях
17:34 22.02.2024 Google экстренно чинит генератор изображений в Gemini — он переборщил с расовой инклюзивностью
21:20 15.02.2024 Google выпустила нейросеть Gemini 1.5 с огромнейшим контекстным окном — ИИ за раз осилит весь «Властелин колец»
18:42 14.02.2024 ИИ-бот Gemini стал доступен на iOS через приложение Google

← В прошлое В будущее →

Нейросеть Google Gemini 1.5 Pro обрела слух

09.04.2024 [16:45], Павел Котов

С очередным обновлением большая языковая модель Google Gemini 1.5 Pro получила «уши»: в качестве входных данных она теперь воспринимает загружаемые аудиофайлы. Теперь ИИ может подготовить сводку пресс-конференции без её текстовой расшифровки. Новые функции добавились и в генератор изображений Imagen 2.

Источник изображения: blog.google

В ходе мероприятия Google Next компания объявила, что Gemini 1.5 Pro станет доступной для общественности через облачную платформу Vertex AI для разработки приложений искусственного интеллекта. Сейчас большинство пользователей может работать с моделями Gemini через одноимённый чат-бот. Самая мощная из них, Gemini Ultra, доступна с платным чат-ботом Gemini Advanced — она поддерживает длинные запросы, но уступает Gemini 1.5 Pro в скорости работы.

Новые возможности также получил генератор изображений Imagen 2 — теперь он может добавлять элементы на готовые изображения или удалять их. На всех картинках, которые создаёт Imagen 2, теперь ставится цифровой водяной знак SynthID, который указывает на их происхождение при проверке специальным инструментом, но остаётся невидимым для человеческого глаза.

Google добавила, что изучает способы согласовывать ответы ИИ с выдачей поисковой системы, чтобы предоставляемая им информация была актуальной. Это не всегда возможно для больших языковых моделей, и иногда преднамеренно: компания, например, не позволяет Gemini отвечать на вопросы, связанные с выборами в США.

Нейросеть Google Gemini Pro поможет создавать Android-приложения — ИИ встроили в Android Studio

09.04.2024 [15:00], Дмитрий Федоров

Google обновила интегрированную среду разработки (IDE) Android Studio, добавив в неё новейшего ИИ-помощника для генерации кода на основе ИИ-модели Gemini Pro, что обещает разработчикам более высокую эффективность и новые возможности в процессе создания приложений.

Источник изображений: Google

Android Studio выступает не просто как текстовый редактор для написания кода, но и предлагает разработчикам целый набор инструментов, включая эмулятор, позволяющий запускать виртуальные Android-смартфоны на машине с Windows и использовать их для тестирования и отладки приложений.

В мае прошлого года Google внедрила в свою IDE-среду генеративный искусственный интеллект Studio Bot, созданный на базе большой языковой модели (LLM) PaLM 2, которую поисковый гигант анонсировал в том же месяце. Через шесть месяцев после дебюта PaLM 2 Google представила линейку флагманских LLM — Gemini, в которую вошли три модели с разным набором функций и аппаратными требованиями.

Обновлённый чат-бот в Android Studio работает на Gemini 1.0 Pro — средней ИИ-модели серии, оптимизированной для сочетания высокого качества ответов и эффективности использования аппаратных ресурсов. Google также анонсировала её обновление до версии Gemini 1.5 Pro, которая, согласно внутренним тестам компании, превосходит свою предшественницу по 87 % бенчмарков, успешно обрабатывая задачи с более чем 100 000 строками кода.

Сандхия Мохан (Sandhya Mohan), менеджер по продукту Android Studio, сообщила, что использование Studio Bot в канале Canary уже позволяло ощутить полезность и мощь этой технологии. Теперь же, с переходом чат-бота на Gemini Pro, пользователи увидят существенное улучшение качества ответов.

Чат-бот способен отвечать на общие вопросы об Android, например, о том, как интегрировать приложение с функцией отслеживания местоположения в операционной системе. Также он отвечает на вопросы по конкретным проектам. Например, разработчик может попросить совета, как удалить дубликаты записей из набора данных, который приложение использует для работы некоторых функций.

Возможности Gemini Pro в Android Studio охватывают даже более сложные задачи. По данным Google, новый ИИ-помощник умеет переписывать код на разных языках программирования, генерировать целые разделы интерфейса приложения и составлять документацию для нового кода, объясняя его функциональность и принципы работы.

Чтобы активировать Gemini, необходимо войти в систему и включить функцию в настройках. Большинство возможностей доступны без отправки контекста кода, при этом ответы чат-бота базируются на истории общения, предоставляя пользователям контроль над конфиденциальностью данных.

Под давлением пользователей Google преодолела аппаратные ограничения для внедрения ИИ в Pixel 8

28.03.2024 [19:05], Сергей Сурабекянц

В декабре Google представила большую языковую модель Gemini Nano, оптимизированную для мобильных устройств. По словам компании, ИИ станет неотъемлемой частью ОС Android, но в актуальной линейке устройств ИИ-функции получил лишь Pixel 8 Pro. Младший Pixel 8, основанный на том же чипсете Tensor G3, остался без встроенного ИИ из-за «аппаратных ограничений». После волны недовольства пользователей Google была вынуждена добавить в телефон ИИ-функции в следующем обновлении.

Pixel 8 получит поддержку Gemini Nano в следующем выпуске обновлений Pixel сначала в качестве предварительной версии для разработчиков, обеспечивая возможность создания сводок на устройстве и интеллектуальных ответов в Gboard — так же, как в Pixel 8 Pro.

Samsung также начала внедрять функции искусственного интеллекта в свои флагманские телефоны предыдущего поколения. Ранее в этом году компания заявила, что это расширение функций будет использовать искусственный интеллект как на устройстве, так и за его пределами.

Похоже, что в скором будущем телефон без встроенного ИИ будет купить сложнее, чем сейчас автомобиль с аналоговыми приборами и физическими, а не сенсорными, органами управления.

У некоторых пользователей «Google Сообщений» появился чат с Gemini

27.03.2024 [16:02], Павел Котов

Google открыла для некоторых участников программы бета-тестирования доступ к чату с большой языковой моделью ИИ Gemini в приложении «Google Сообщения». Для работы с этой функцией пользователь и его устройство должны отвечать ряду требований.

Источник изображения: blog.google

Участники программы тестирования могут переписываться с ИИ, который готов составлять для них тексты сообщений, обсуждать идеи, планировать мероприятия или просто общаться. Чтобы получить доступ к этой функции, необходимо не только быть участником программы бета-тестирования, но и выполнить ряд требований:

совместимый Android-телефон (Pixel 6 или более поздний, Pixel Fold, Samsung Galaxy S22 или более поздний, Samsung Galaxy Z Flip или Z Fold);
основной язык на телефоне — английский (или французский для жителей Канады);
последняя версия приложения «Google Сообщения»;
личный аккаунт Google без сторонних администраторов — семейных групп или Google Workspace;
возраст от 18 лет;
активная опция чатов RCS.

Пользователи, выбранные для тестирования Gemini, увидят соответствующий чат в списке сообщений или соответствующую опцию при нажатии на кнопку «Начать чат». При первом использовании этой функции приложение покажет инструкции с пояснениями, как она работает. Когда все настройки установлены, появляется возможность прямого общения с Gemini аналогично чату на сайте ИИ-помощника. Переписка с Gemini сохраняется в течение 72 часов, но есть возможность очистить её вручную или удалить отдельные запросы в соответствующем разделе настроек учётной записи.

Google открыла доступ к мощной нейросети Gemini 1.5 Pro

21.03.2024 [22:01], Владимир Мироненко

Google открыла доступ к бета-версии нейросети Gemini 1.5 Pro для всех пользователей. Об этом сообщил в социальной сети X ведущий научный сотрудник Google DeepMind Джефф Дин (Jeff Dean). «Сначала мы будем постепенно подключать людей к API, а затем наращивать его. Тем временем разработчики могут опробовать Gemini 1.5 Pro в пользовательском интерфейсе AI Studio прямо сейчас», — рассказал Дин.

Источник изображения: Google

Gemini 1.5 Pro работает со стандартным контекстным окном на 128 000 токенов, хотя, как сообщается, обрабатываемый объём информации можно увеличить до 1 млн токенов. За один раз Gemini 1.5 Pro способна обработать до часа видео, 11 часов аудио, кодовые базы с более чем 30 000 строк кода или более 700 000 слов. В ходе исследования Google также успешно протестировала обработку до 10 млн токенов.

Gemini 1.5, использующая архитектуру Transformer и MoE, сочетает в себе сильные стороны обеих моделей. Gemini 1.5 Pro отлично справляется с различными задачами, такими как анализ исторических документов, например, в расшифровке стенограммы миссии «Аполлон-11». Нейросеть способна не только анализировать большие блоки данных, но и быстро находить определённый фрагмент текста внутри них. Также Gemini 1.5 эффективно обрабатывает большие «куски» кода. В интерфейсе AI Studio нейросеть сейчас доступна с ограничением в 20 запросов в день.

В тесте Needle In A Haystack (NIAH) нейросеть достигает 99 % успеха в обнаружении конкретных фактов в длинных текстах. А способность учиться в конкретных условиях, продемонстрированная в бенчмарке Machine Translation from One Book (MTOB), делает Gemini 1.5 одним из лидеров в способности к адаптивному обучению.

Слухи о появлении нейросети Google Gemini в будущих iPhone привели к росту акций Alphabet и Apple

18.03.2024 [19:12], Сергей Сурабекянц

Сегодня информационное агентство Bloomberg сообщило, что Alphabet и Apple «ведут активные переговоры» об использовании некоторых функций искусственного интеллекта Google Gemini в следующем поколении iPhone, которое будет представлено в 2024 году. После этого сообщения акции Alphabet и Apple подорожали более чем на 7 % и 2 % соответственно.

Источник изображения: Freepik

Генеральный директор Apple Тим Кук (Tim Cook) во время ежегодного собрания акционеров компании в феврале заявил, что Apple «инвестирует значительные средства» в искусственный интеллект. «Позже в этом году я с нетерпением жду возможности поделиться с вами тем, как мы откроем новые горизонты в области генеративного искусственного интеллекта, ещё одной технологии, которая, по нашему мнению, может переопределить будущее», — сказал Кук.

По данным источников Bloomberg, Apple также недавно провела переговоры с OpenAI, на которых рассмотрела возможность использования её моделей ИИ. Однако утверждается, что «обе стороны ещё не определились с условиями или брендом соглашения об ИИ, а также не определились с тем, как оно будет реализовано».

Следующее большое обновление Apple для iPhone, iOS 18, ожидается во время Всемирной конференции разработчиков. Именно тогда компания сможет больше рассказать о своих планах по внедрению генеративного искусственного интеллекта и последних новинках программного обеспечения для iPhone, которые потребители смогут увидеть осенью.

Другие информационные агентства не смогли независимо проверить сообщение Bloomberg. Apple отказалась от комментариев, Alphabet также не ответила на вопросы журналистов.

Apple проиграла гонку ИИ: будущие iPhone получат нейросеть Google Gemini

18.03.2024 [12:20], Алексей Разин

Обещания главы Apple Тима Кука (Tim Cook) сделать до конца года важное заявление относительно систем искусственного интеллекта наверняка заинтриговали многих, но мало кто мог предположить, что компания пойдёт на сотрудничество с конкурентами. По информации Bloomberg, платформа Google Gemini может лечь в основу некоторых новых функций iPhone, которые должны быть представлены этой осенью.

Источник изображения: Unsplash, Steve Johnson

Источники Bloomberg сообщили, что Google и Apple ведут активные переговоры на тему лицензирования платформы искусственного интеллекта Gemini для её использования устройствами второй из компаний. Подобные переговоры недавно Apple вела и с OpenAI, рассчитывая использовать разработки этого успешного стартапа в сфере искусственного интеллекта.

Если же вернуться к Google, то сотрудничество поискового гиганта с Apple в иной форме уже длится многие годы, ведь первая из компаний платит второй за право использования своего поискового движка по умолчанию в браузере Safari, который устанавливается на многие устройства Apple. Относительно перспективы использования Gemini ещё нет каких-то чётких договорённостей.

Безусловно, Apple готовит для своих устройств специфические функции искусственного интеллекта собственной разработки. Тем более, что собственные чат-боты и прочие актуальные разработки Apple по своей производительности и точности уступают сторонним решениям, как отмечают осведомлённые источники. В частности, с начала прошлого года Apple тестирует собственную большую языковую модель под кодовым названием Ajax. Некоторые сотрудники также опробовали базовый чат-бот Apple GPT.

На фоне этого Apple нужна платформа, работающая в облаке, и в этой сфере сотрудничество с Google как раз имеет смысл. Для Google сделка такого плана тоже является выгодной, поскольку в мире сейчас эксплуатируется более 2 млрд устройств Apple. Конкурирующая Samsung тоже не стала «изобретать велосипед», и в январе объявила об использовании Google Gemini в своих смартфонах нового поколения.

Единственное, что может омрачать возможное сотрудничество Apple и Google в этой сфере — это внимание регуляторов. По крайней мере, Министерство юстиции США уже расследует факт сотрудничества Apple и Google в области использования поискового движка. Претензии к Apple в этой сфере есть и у европейских чиновников. Скорее всего, в случае достижения определённых новых договорённостей с Google, компания Apple вряд ли сделает соответствующие заявления ранее июня, когда она будет проводить свою конференцию WWDC 2024 для разработчиков.

AI.com теперь принадлежит Google и перенаправляет к ИИ-чат-боту Gemini

16.03.2024 [18:13], Владимир Чижевский

Компания Google позаботилась об удобстве пользователей — домен AI.com отныне зарегистрирован на Google и перенаправляет на сайт ИИ-чат-бота Google Gemini.

Источник изображения: unsplash.com

Компания приобрела короткий, интуитивный и запоминающийся домен, ранее перенаправлявший к ChatGPT. Теперь он зарегистрирован в Squarespace Domains и оплачен до 2031 года, а в контактах указан адрес электронной почты contact-registrant@google.com, явно указывающий на владельца.

Ранее воспользоваться Google Gemini можно было лишь перейдя на сайт gemini.google.com, однако вводить этот адрес вручную было не слишком удобно. Нельзя сбрасывать со счетов и возможную пользу для поисковой оптимизации, а также возможность привести к Gemini пользователей, ищущих любой ИИ, а не конкретно от Google.

Pixel 8 не получит поддержку Gemini Nano из-за аппаратных ограничений

08.03.2024 [14:28], Владимир Мироненко

Хотя смартфон Pixel 8 Pro уже получил поддержку нейросети Gemini Nano, для модели Pixel 8 она будет недоступна, сообщила Google в ходе мероприятия Android Show. По словам представителя команды генеративного ИИ в Android компании Google, Gemini Nano не появится в Pixel 8 из-за «некоторых аппаратных ограничений».

Вместе с тем он сообщил, что Google «работает над тем, чтобы представить Nano на большем количестве устройств», и что в ближайшем будущем её поддержку получат ещё больше high-end устройств.

С точки зрения спецификаций, разница между Pixel 8 и 8 Pro заключается в большем объёме оперативной памяти у старшей модели — 12 против 8 Гбайт. По всей видимости Pixel 8 всё сможет работать с Gemini Nano на техническом уровне, поскольку Galaxy S24 с 8 Гбайт оперативной памяти имеет функцию Magic Compose на её базе. Тем не менее, использование ИИ сразу для нескольких функций может отразиться на работе других приложений, поэтому Google не рекомендует к этому прибегать.

В Pixel 8 Pro нейросеть Gemini Nano обеспечивает работу функции «Сводка» (Summarize) в приложении Pixel Recorder, а также Gboard Smart Reply в WhatsApp, Line и KakaoTalk. Если эта функция действительно востребована, как утверждает компания, и Gemini Nano действительно не появится на устаревших моделях смартфонов, то компании необходимо обеспечить её поддержку с помощью облачных сервисов.

Сергей Брин: Google «определённо оплошала» с генератором изображений в Gemini

06.03.2024 [16:30], Павел Котов

Выступая на мероприятии AGI House в минувшие выходные, соучредитель Google Сергей Брин (Sergey Brin) признал, что компания «определённо оплошала с генерацией изображений», сообщает Business Insider. Создаваемые Gemini исторически неточные изображения, по его мнению, могли возникнуть из-за недостаточно тщательного тестирования модели.

Источник изображения: wikipedia.org

Google ранее приостановила работу функции генератора изображений Gemini после того, как пользователи начали жаловаться на допускаемые искусственным интеллектом неточности, имеющие характер фальсификации истории в отношении расового неравенства. Чат-бот также подвергли критике за некоторые ответы в текстовом формате.

Брин прекратил работу в Google в 2019 году, но в описании Gemini он значится как один из основных разработчиков платформы. В начале 2023 года руководство Alphabet объявило в компании «красный код» из-за выхода ChatGPT — к работе были вынуждены вернуться Брин и другой соучредитель Google Ларри Пейдж (Larry Page). С тех пор Сергея неоднократно видели в штаб-квартире компании в Кремниевой долине — он принимал непосредственное участие в разработке стратегии Google в области ИИ. В AGI House Брин подтвердил, что «в некотором роде вернулся из отставки лишь потому, что траектория развития ИИ оказалась настолько захватывающей».

Некоторые критики Google преподнесли ошибки Gemini как последствия того, что сотрудники компании имеют одни и те же политические пристрастия, и это могло сказаться на качестве текстовых ответов чат-бота. Илон Маск (Elon Musk), в частности, заявил, что не смог добиться от Gemini чёткого ответа, кто хуже: он или Гитлер. В этой части Брин критику отверг. Он заявил, что любой основанный на ИИ чат-бот, включая ChatGPT или выпущенный тем же Маском Grok, с некоторой вероятностью выдаёт «весьма странные вещи», которые можно расценить как некоторые политические пристрастия. Но, по словам Брина, у разработчиков Gemini не было намерений закладывать ИИ какие-либо политические предпочтения.

Передовые ИИ-модели Google Gemini уже через год смогут работать на смартфонах локально

28.02.2024 [11:42], Павел Котов

Google рассчитывает, что уже со следующего года её передовая большая языковая модель Gemini, выступающая конкурентом OpenAI GPT-4, сможет локально работать на мобильных устройствах.

Источник изображения: blog.google

Сегодня на смартфонах Pixel и других совместимых Android-устройствах Google уже предлагает свою самую эффективную модель Gemini Nano. Вице-президент по управлению продуктами в подразделении Google Pixel Брайан Раковски (Brian Rakowski) заявил, что уже в следующем году непосредственно на смартфонах начнут развёртываться самые передовые большие языковые модели компании, которые пока работают через удалённые центры обработки данных.

«В облаке есть уменьшенные версии нашей модели Gemini. Было несколько прорывов в сжатии этих моделей для их запуска на устройстве. Некоторые из них уже зарекомендовали себя, а некоторые изучаются для определённых сценариев. У них уже есть удивительные [варианты] применения. Gemini Nano работает на уровне, которого наши онлайн-модели достигли менее года назад. С помощью этих небольших версий моделей на устройстве можно сделать многое. Если просто пойти по этому пути, некоторые из вещей, которые, как мы думали, нам придётся запускать из облака, будут на устройстве, что поражает, и они будут работать мгновенно без необходимости подключения или подписки», — цитирует CNBC господина Раковски.

Большие языковые модели — это модели искусственного интеллекта, способные воспринимать человеческий язык и генерировать высказывания. Сегодня флагманской моделью Google является Gemini Ultra с 1,56 трлн параметров. Для сравнения, у OpenAI GPT-4 1,76 трлн параметров.

Производители смартфонов интегрируют в устройства функции ИИ в надежде восстановить рухнувший спрос на гаджеты. В 2023 году были проданы 1,16 млрд единиц, и это самый низкий показатель поставок за десятилетие. Всплеск спроса на смартфоны наблюдался с 2010 по 2015 гг., когда рынок вырос в пять раз с 300 млн до 1,5 млрд устройств. Компании Humane, Rabbit и Meizu делают ставку на «смартфоны будущего» — устройства, которые не похожи на традиционные смартфоны. Они отличаются более компактными размерами и управляются при помощи голосовых команд как умные колонки.

Google рассказала о планах интегрировать Gemini в Android и о других нововведениях

26.02.2024 [15:25], Павел Котов

Google рассказала о планах развернуть функции искусственного интеллекта Gemini в Android и Android Auto. Чат-бот Gemini появится в приложении «Сообщения», поможет водителям не отвлекаться во время езды; а сохранённые в Google Wallet документы станут доступными в Wear OS.

Источник изображений: blog.google

В приложении «Google Сообщения» появится новый контакт — чат-бот Gemini, который поможет в переписке с другими людьми. Компания привела пример: пользователь обращается к ИИ за советом, как улучшить не особо смешную шутку — и тот, кажется, неплохо справляется. ИИ также снизит нагрузку на пользователей Android Auto, которым важнее следить за дорогой: Gemini готов предложить сводку сообщений при переписке и подходящие ответы, например, он сам может подсчитать, когда пользователь прибудет к месту назначения.

Приложение «Google Карты» покажет расширенную информацию об объектах вокруг — достаточно навести камеру на заведение, и система укажет часы его работы; а приложение Lookout для людей с ослабленным зрением, которое составляет текстовые описания изображений, заработает за пределами США, но пока только для англоязычных пользователей.

Прочие изменения не касаются интеграции ИИ. В Android-версии приложения «Google Документы» теперь можно оставлять рукописные пометки стилусом или пальцем в выбранном цвете. В некоторых случаях этот формат окажется более информативным, чем текстовые комментарии. Приложение Google Fitbit теперь поддерживает интеграцию с платформой Health Connect, разработанной совместно Google и Samsung. Готовится полезное нововведение и для стороннего приложения Spotify — в нём можно будет выбирать устройство вывода звука как в YouTube Music.

Наконец, Wear OS получит функции, которые присутствуют в Apple watchOS уже не один год: умным часам откроется доступ к документам, сохраненным в Google Wallet; кроме того, здесь скоро появится пошаговая навигация.

Google экстренно чинит генератор изображений в Gemini — он переборщил с расовой инклюзивностью

22.02.2024 [17:34], Павел Котов

Google сообщила, что на время частично приостановила работу генератора изображений в чат-боте Gemini, когда выяснилось, что она допускает исторические неточности в изображении людей, связанные с расовыми вопросами. Так, при попытке изобразить американских отцов-основателей и солдат нацистской Германии она как будто ниспровергает гендерные и расовые стереотипы, что расценивают как попытку фальсификации истории.

Такими Gemini представляет себе американских отцов-основателей. Источник изображения: Google

Компания приняла решение направить генератор изображений Gemini на доработку менее чем через сутки после поступления первых жалоб. Пользователи чат-бота запрашивали у искусственного интеллекта картинки с историческими группами или лицами и получали на выходе изображения, на которых в основном были представители рас, отличных от европеоидной. Это спровоцировало появление в интернете теорий заговора, что Google намеренно избегает показывать белых людей.

Сенатор США в 19-м веке по мнению Gemini. Источник изображения: Google

К примеру, когда Gemini попросили создать изображение американского сенатора XIX века, ИИ предложил картинки чернокожих женщин и женщин коренных американских наций. В действительности женщина впервые стала сенатором в США лишь в 1922 году, и она была белой. Таким образом, генератор изображений Gemini стирал историю расовой и гендерной дискриминации.

Сейчас, когда Gemini просят создать изображение человека или нескольких, тот выводит сообщение следующего содержания: «Мы работаем над улучшением способности генерировать изображения людей. Ожидаем, что эта функция скоро вернётся, и мы сообщим об обновлении выпуска, когда это произойдёт». Генератор изображений появился в чат-боте Gemini (ранее Bard) в начале месяца как ответ на аналогичные продукты OpenAI и Microsoft Copilot — он создаёт картинки по текстовому запросу.

Google выпустила нейросеть Gemini 1.5 с огромнейшим контекстным окном — ИИ за раз осилит весь «Властелин колец»

15.02.2024 [21:20], Андрей Созинов

Не прошло и двух месяцев с момента запуска передовой нейросети Gemini, а Google уже анонсировала её преемника. Сегодня была представлена большая языковая модель Gemini 1.5, которая сразу же стала доступна для разработчиков и корпоративных пользователей, а в скором времени начнется её распространение среди потребителей. Google ясно дала понять, что хочет использовать Gemini в качестве бизнес-инструмента, персонального помощника и не только.

В Gemini 1.5 много улучшений. Модель Gemini 1.5 Pro, которая ляжет в основу многих сервисов Google, превосходит Gemini 1.0 Pro на 87 % в тестах, и соответственно находится примерно на одном уровне с высококлассной Gemini 1.0 Ultra. При создании новой модели используется набирающий популярность подход «смесь экспертов» (Mixture of Experts — MoE), который подразумевает, что при отправке запроса запускается только часть общей модели, а не вся. Такой подход должен сделать модель более быстрой для пользователя и более эффективной для Google.

Но в Gemini 1.5 есть одна новая вещь, которая особенно радует всю компанию Google, начиная с генерального директора Сундара Пичаи (Sundar Pichai). Новая версия нейросети имеет огромное контекстное окно, что означает, что она может обрабатывать гораздо более объёмные запросы и просматривать гораздо больше информации одновременно. Размер окна составляет 1 миллион токенов, что намного больше 128 000 токенов у GPT-4 от OpenAI и 32 000 у текущей Gemini Pro. «Это примерно 10 или 11 часов видео, десятки тысяч строк кода», — отметил Пичаи. Ещё он добавил, что исследователи Google тестируют контекстное окно на 10 миллионов токенов — это, например, вся серия «Игры престолов» в одном запросе.

В качестве примера Пичаи говорит, что в это контекстное окно можно вместить всю трилогию «Властелин колец». Это кажется слишком специфичным, но, возможно, кто-то в Google проверит, не обнаружит ли Gemini ошибок в преемственности, пытается разобраться в сложной родословной Средиземья. Или ИИ, возможно, сможет понять Тома Бомбадила.

Пичаи также считает, что увеличенное контекстное окно будет очень полезно для бизнеса. «Это позволит вам использовать примеры, в которых вы можете добавить много личного контекста и информации в момент запроса, — говорит он. — Считайте, что мы значительно расширили окно запроса». Глава Google представляет себе, что кинематографисты могут загрузить весь свой фильм и спросить у Gemini, что скажут рецензенты, а компании смогут использовать Gemini для обработки массы финансовых документов. «Я считаю это одним из самых больших прорывов, которые мы совершили», — говорит он.

Пока что Gemini 1.5 будет доступна только для бизнес-пользователей и разработчиков через Google Vertex AI и AI Studio. Со временем она заменит Gemini 1.0, а стандартная версия Gemini Pro — та, что доступна всем на сайте gemini.google.com и в приложениях Google, — будет заменена на 1.5 Pro с контекстным окном на 128 000 токенов. Чтобы получить миллион, придется доплатить. Google также тестирует безопасность и этические границы модели, особенно в отношении нового увеличенного контекстного окна.

Сейчас Google находится в бешеной гонке за создание лучшего инструмента ИИ, в то время как компании по всему миру пытаются определить свою собственную стратегию ИИ и сотрудничать с OpenAI, Google или кем-то ещё. Буквально недавно OpenAI анонсировала «память» для ChatGPT и, похоже, готовится к выходу на рынок веб-поиска. Пока Gemini выглядит впечатляюще, особенно для тех, кто уже работает в экосистеме Google, компании предстоит еще много работы.

В конце концов, говорит Пичаи, все эти 1.0 и 1.5, Pro и Ultra, а также корпоративные битвы не будут иметь значения для пользователей. «Люди будут просто потреблять лучший пользовательский опыт, — говорит он. — Это как пользоваться смартфоном, не обращая внимания на процессор под крышкой». Но на данный момент, по его словам, мы всё еще находимся на стадии, когда каждый знает, какой чип находится внутри его телефона, потому что это имеет значение. «Базовые технологии меняются так быстро», — говорит глава Google. — Людям не все равно».

ИИ-бот Gemini стал доступен на iOS через приложение Google

14.02.2024 [18:42], Павел Котов

Google активно расширяет присутствие основанного на искусственном интеллекте чат-бота Gemini, который пришёл на смену «Google Ассистенту» — соответствующее приложение появилось в ряде новых стран, а сам чат-бот теперь доступен в приложении Google для iOS, обратил внимание ресурс Android Authority.

Источник изображения: androidauthority.com

Для владельцев iPhone отдельного приложения Gemini нет, но теперь можно активировать чат-бот в верхней части основного приложения Google. С выбором нового ИИ-помощника меняется интерфейс всего приложения — внизу появляется крупное поле для ввода запросов. Чтобы задать запрос голосом, требуется нажать кнопку с изображением микрофона; отправка также производится нажатием отдельной кнопки. Ответы не озвучиваются в автоматическом режиме — для этого нужно коснуться значка с изображением динамика.

При взаимодействии с Gemini на iOS можно пользоваться текстом, голосом, отправлять изображения и открывать в приложении камеру. ИИ кратко излагает сложные темы, генерирует программный код, пишет тексты, например, благодарственные письма и письма электронной почты, создаёт изображения и многое другое. На iOS есть собственный помощник Siri, поэтому возможность вызвать Gemini на любом экране для получения контекстной помощи отсутствует — это есть только в Android.

По неподтверждённой пока информации, Apple также работает над новыми функциями ИИ для iPhone, и дебютировать они могут с выходом iOS 18.

← В прошлое В будущее →

выдано Федеральной Службой по надзору за соблюдением законодательства в сфере массовых коммуникаций и охране культурного наследия

При цитировании документа ссылка на сайт с указанием автора обязательна. Полное заимствование документа является нарушением
российского и международного законодательства и возможно только с согласия редакции 3DNews.