Сегодня 17 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → чат-бот
Быстрый переход

OpenAI представила ИИ-модель GPT-4o — она гораздо умнее старых версий и будет доступна бесплатно

OpenAI представила мощную мультимодальную модель генеративного искусственного интеллекта (ИИ) GPT-4o, которая будет внедрена в её решения для разработчиков и потребителей в течение следующих нескольких недель. Буква «о» в названии GPT-4o означает omni (всесторонний), что указывает на мультимодальность GPT-4o.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Технический директор OpenAI Мира Мурати (Mira Murati) сообщила в ходе презентации продукта в офисе OpenAI в Сан-Франциско (США), что GPT-4o имеет интеллект «уровня GPT-4», но более высокие возможности в работе с текстом и изображениями, а также с аудио. «GPT-4o воспринимает голос, текст и визуальные образы, — сообщила Мурати. — И это невероятно важно, поскольку мы думаем о будущем взаимодействии между нами и машинами».

Её предшественница — GPT-4 Turbo — обучалась на сочетании изображений и текста. Она способна анализировать изображения и текст для выполнения таких задач, как извлечение текста из изображений и даже описание содержимого этих изображений. В свою очередь, в GPT-4o к этим возможностям добавили речь. GPT-4o получил контекстное окно в 128 тысяч токенов.

Сообщается, что GPT-4o позволит значительно улучшить работу ИИ-чат-бота ChatGPT. Последний уже давно поддерживает голосовой режим, в котором ответы чат-бота расшифровываются с использованием модели преобразования текста в речь, но GPT-4o усилит эту функцию, позволяя пользователям взаимодействовать с чат-ботом больше как с помощником. Например, ему можно будет задать вопрос и прервать его, когда он отвечает. По словам OpenAI, модель GPT-4o обеспечивает реагирование «в реальном времени» и может даже улавливать эмоции в голосе пользователя, генерируя в ответ голос «в различных эмоциональных стилях» в соответствии с текущей ситуацией.

GPT-4o также улучшит визуальные возможности ChatGPT. Исходя из предложенной фотографии или экрана рабочего стола, ChatGPT теперь сможет быстро отвечать на сопутствующие вопросы: от «Что происходит в этом программном коде» до «Какую рубашку какого бренда носит этот человек?».

В дальнейшем возможности модели будут расширяться. Если сейчас GPT-4o позволяет, например, переводить сфотографированное меню на другой язык, то в будущем с её помощью ChatGPT сможет «смотреть» спортивную игру в прямом эфире и объяснять вам правила, говорит Мурати.

Начиная с сегодняшнего дня GPT-4o доступна как платным, так и бесплатным пользователям ChatGPT, но для подписчиков платных тарифных планов ChatGPT Plus и Team ограничение на количество сообщений будет «в 5 раз выше». При превышении лимита ChatGPT автоматически переключится на GPT-3.5 у бесплатных пользователей и на GPT-4 у платных.

Бесплатным пользователям ChatGPT при взаимодействии с GPT-4o станут доступны некоторые функции, которые прежде были только у платных подписчиков. В частности, обновлённый чат-бот сможет искать информацию не только в своей ИИ-модели, но также в интернете; анализировать данные и создавать графики; работать с пользовательскими изображениями и файлами; а также лучше помнить прежние взаимодействия с пользователем. Также бесплатные пользователи получат доступ к GPT Store.

OpenAI сообщила, что GPT-4o поддерживает больше языков, с улучшенной производительностью на 50 различных языках. В API OpenAI GPT-4o в два раза быстрее, чем GPT-4 (в частности, GPT-4 Turbo), вдвое дешевле и имеет более высокие лимиты по скорости.

В настоящее время поддержка голосового общения не включена в API GPT-4o для всех клиентов. OpenAI пояснила, что из-за риска неправильного использования планирует впервые запустить в ближайшие недели поддержку новых аудиовозможностей GPT-4o для «небольшой группы доверенных партнёров».

Alibaba представила большую языковую модель, которая отчасти превзошла GPT-4

Компания Alibaba Cloud анонсировала выпуск улучшенной версии своей большой языковой модели Qwen2.5. Новая нейросеть продемонстрировала превосходство над GPT-4 от OpenAI по некоторым параметрам, таким как логические рассуждения и понимание текста.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

По словам технического директора Alibaba Cloud Цзинжэня Чжоу (Jingren Zhou), новая модель демонстрирует значительные улучшения в области рассуждений, понимания кода и естественного языка по сравнению с предыдущей версией Qwen2.0. Согласно анализу платформы OpenCompass, проведённому в марте, модель Qwen2.5 превосходит GPT-4 от OpenAI по языковым и творческим возможностям. Однако она уступает в таких аспектах, как знания, логические рассуждения и математические способности.

Напомним, большие языковые модели (LLM), к которым относится и Qwen, используются в приложениях искусственного интеллекта. Они обучаются на огромных объёмах данных, чтобы затем генерировать ответы на запросы пользователей на естественном языке. После выхода ChatGPT в 2022 году, вызвавшего ажиотаж во всём мире, компания Alibaba представила Tongyi Qianwen в апреле 2023 года. А в октябре последовал выпуск обновлённой версии с расширенными возможностями понимания сложных инструкций, написания текстов, логических рассуждений и запоминания информации.

По сообщению Alibaba Cloud, сервисами ИИ на базе Qwen, такими как DingTalk (аналог Slack от Alibaba), уже воспользовались более 2,2 млн корпоративных пользователей. Кроме того, компания представила сообществу разработчиков ряд открытых моделей Qwen и модернизировала свою генеративную платформу Model Studio, добавив дополнительные средства для создания ИИ.

В Китае, как и во всем мире, наблюдается бум интереса к чат-ботам и моделям генеративного ИИ. Наряду с Alibaba свои решения выпустили Baidu и Tencent. Например, чат-бот Baidu Ernie к апрелю 2023 года привлёк более 200 млн пользователей после получения разрешения на публичное использование в августе 2022 года.

Компания Alibaba Cloud заявила, что её обновлённая языковая модель Qwen2.5 была развёрнута более чем в 90 000 компаниях разных отраслей, и она намерена дальше сотрудничать с клиентами и разработчиками для использования возможностей генеративного ИИ и внедрение этой технологии в разработку роботов-гуманоидов в Китае, где эти роботы смогут помогать на заводах и заменить ручной труд человека там, где это возможно.

Nvidia добавила в ChatRTX голосовой ввод, поддержку нейросети Google Gemma и поиск фотографии на ПК с помощью OpenAI CLIP

Компания Nvidia обновила своё приложение ChatRTX для запуска локальных ИИ-чат-ботов, добавив поддержку новых ИИ-моделей. Изначально приложение предлагало поддержку ИИ-моделей Mistral и Llama 2. Обновлённая версия получила поддержку моделей Gemma от Google, ChatGLM3, а также CLIP от OpenAI, упрощающей поиск фотографий и изображений.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Nvidia представила первую версию ChatRTX в феврале этого года в качестве демонстрационного приложения под названием Chat with RTX. Для его работы требуется видеокарта из серии GeForce RTX 3000 или RTX 4000 с как минимум 8 Гбайт памяти. Приложение создаёт локальный сервер для чат-бота, доступ к которому осуществляется через браузер. Он может обрабатывать файлы на компьютере, видео из YouTube, а также отвечать на вопросы, выдавая релевантные ответы на основе видеороликов и документов пользователя.

ИИ-модель Gemma от Google была создана для работы на базе мощных ноутбуков и настольных ПК. Она представляет собой открытую версию ИИ-модели Gemini, и подойдёт для решения относительно небольших задач, например, для подготовки конспектов больших текстов. ChatGLM3, в свою очередь, является открытой двуязычной (поддерживает английский и китайский) большой языковой моделью. OpenAI Contrastive Language-Image (CLIP) позволяет пользователю искать фотографии и изображения на компьютере.

Также в новой версии ChatRTX добавлена поддержка голосовых запросов через систему распознавания речи Whisper. Скачать ChatRTX можно с официального сайта Nvidia.

Восемь интернет-изданий подали иск к OpenAI и Microsoft за незаконное использование статей для обучения ИИ

Текстовые материалы, находящиеся в общем доступе, являются одним из самых простых источников данных для обучения больших языковых моделей, но разработчики систем искусственного интеллекта то и дело сталкиваются с претензиями правообладателей. Новый иск к OpenAI выдвинуло американское издательство MediaNews Group, владеющее несколькими интернет-изданиями.

 Источник изображения: Unsplash, Praswin Prakashan

Источник изображения: Unsplash, Praswin Prakashan

Как сообщает Reuters, представители истца упрекают OpenAI в незаконном копировании миллионов статей, размещенных в изданиях New York Daily News, Chicago Tribune, Orlando Sentinel, Sun Sentinel, The Mercury News, The Denver Post, The Orange County Register и Pioneer Press для обучения своих языковых моделей. В общей сложности претензии к создателям ChatGPT и Microsoft Copilot выдвигают восемь интернет-изданий из шести американских штатов. Ответчиком по этому иску выступает и корпорация Microsoft, которая оказывает финансовую поддержку создавшей ChatGPT компании OpenAI, а также использует её разработки для совершенствования своего ИИ-ассистента Copilot.

Это не первый случай возникновения подобных претензий со стороны интернет-изданий к OpenAI и Microsoft. Аналогичные иски уже были поданы The New York Times, The Intercept, Raw Story и AlterNet. Представители MediaNews утверждают, что OpenAI строит свой успех на чужой работе, и «почему-то считает, что не нужно платить за контент». Системы искусственного интеллекта ответчиков, по словам стороны обвинения, способны дословно воспроизводить тексты публикаций по запросу пользователей ChatGPT. Кроме того, этот чат-бот способен добавлять к текстам оригинальных публикаций недостоверную информацию, что вредит репутации исходных СМИ. Microsoft обвиняется в том, что по запросу поисковой системы Bing ассистент Copilot может выдавать защищённые авторскими правами фрагменты публикаций указанных интернет-изданий, при этом не ссылаясь на первоисточник. Они требуют некую материальную компенсацию ущерба и судебного запрета на использование своих материалов для обучения систем искусственного интеллекта. Когда ранее с аналогичными претензиями к OpenAI обратилась The New York Post, представители первой заявили, что выдача фрагментов публикаций происходила в результате технической ошибки в процессе обучения больших языковых моделей.

ChatGPT получил новую функцию памяти, которая запоминает предпочтения пользователей

Благодаря новой функции памяти, ChatGPT теперь может извлекать контекстную информацию из предыдущих бесед и работать как личный помощник, учитывая индивидуальные запросы и интересы пользователей.

 Источник изображения: Andrew Neel/Unsplash

Источник изображения: Andrew Neel/Unsplash

Компания OpenAI анонсировала запуск долгожданной функции памяти для своего чат-бота ChatGPT. Функция позволит боту запоминать предыдущие запросы и предпочтения пользователей, чтобы делать свои ответы более персонализированными.

Как сообщает издание The Verge, память ChatGPT использует два варианта обработки запросов. Первый — это когда пользователи могут явно указать ChatGPT, какие детали ему нужно запомнить. Например, если вы работаете в кафе, вы можете сообщить об этом ChatGPT, и он будет использовать эту информацию при последующих запросах, связанных с вашей работой.

При втором варианте ChatGPT будет автоматически извлекать и запоминать полезную информацию из диалогов по аналогии с другими алгоритмами, которые используются в приложениях OpenAI. Например, если вы скажете ChatGPT, что у вас есть ребёнок и что он любит медуз, то в следующий раз, когда вы попросите ChatGPT помочь с открыткой, он может предложить нарисовать медузу в праздничном колпаке. Таким образом чат-бот сможет лучше понимать контекст и предпочтения конкретного пользователя.

При этом OpenAI подчёркивает, что пользователи будут иметь полный контроль над тем, какую информацию запоминает ChatGPT. Можно будет просматривать и редактировать эти данные, а также в любой момент «стереть» их из памяти бота, что важно для обеспечения конфиденциальности и безопасности.

Отмечается, что на первых порах доступ к функции памяти получат только платные подписчики ChatGPT Plus за пределами Европы и Кореи. Причины ограничения доступа в этих регионах пока не разглашаются. В дальнейшем «память» появится и в корпоративных версиях ChatGPT, а также в некоторых пользовательских моделях GPT, доступных в магазине приложений OpenAI.

Хотя возможности данной функции пока ограничены, со временем, по мнению разработчиков, это может кардинально изменить пользовательский опыт общения с искусственным интеллектом и стать шагом на пути создания по-настоящему персонализированных и контекстно-осведомлённых чат-ботов.

Meta✴ не ждёт быстрой отдачи от генеративного ИИ

Meta потребуются годы, чтобы начать зарабатывать на генеративном искусственном интеллекте, предупредил инвесторов гендиректор компании Марк Цукерберг (Mark Zuckerberg) в ходе отчёта о финансовых результатах за I квартал 2024 года. Он сообщил, что есть несколько способов построить бизнес на ИИ, но это потребует времени и немалых вложений.

 Источник изображения: patrypguerreiro/Pixabay

Источник изображения: patrypguerreiro/Pixabay

Дискуссии по поводу того, как именно ИИ может стать источником дохода для Meta, преобладали в ходе обсуждения финансовых результатов компании после того, как на прошлой неделе приложения Facebook, Messenger, Instagram и WhatsApp получили поддержку ИИ, а также был запущен сайт meta.ai для ИИ-чат-бота компании.

Хотя Meta достигла хороших результатов в минувшем квартале, увеличив выручку год к году на 27 % и прибыль более чем в два раза, ожидается, что в будущем рост выручки замедлится. При этом компания инвестирует больше, чем когда-либо, в ИИ и метавселенную.

«Исторически сложилось так, что вложения в создание новых масштабируемых возможностей в наших приложениях были очень выгодными долгосрочными инвестициями для нас и для инвесторов, которые остались с нами, — рассказал Цукерберг, проводя аналогию с запуском Stories и Reels. — И первые признаки этого [приложений ИИ] тоже весьма позитивны. Но создание лидирующего ИИ также будет более масштабным мероприятием, чем другие разработки, которые мы добавили в наши приложения, и, вероятно, на это уйдёт несколько лет».

По словам главы компании, вопрос заключается в том, станет ли ИИ-чат бот Meta AI продуктом, к которому люди часто возвращаются, и захотят ли многие использовать его в социальных сетях.

Цукерберг назвал несколько возможных способов монетизации ИИ, включая масштабирование бизнес-сообщений, внедрение рекламы или платного контента во взаимодействие с ИИ, а также предложение пользователям доплачивать за использование более крупных моделей ИИ и доступ к большему количеству вычислений. По словам гендиректора, ИИ уже помогает улучшить взаимодействие пользователей с приложениями, что приводит к тому, что они видят больше рекламы.

Цукерберг утверждает, что использование Meta AI позволит улучшить качество рекламы. В этом Meta отличается от OpenAI, которая вместо заработка на рекламе с помощью ИИ больше склоняется в пользу подписок на ИИ-сервисы и фокуса на корпоративный сегмент.

Logitech представила мышь с кнопкой вызова ChatGPT и приложение для чат-ботов

Стремительный рост популярности генеративных нейросетей подталкивает к развитию своих продуктов не только разработчиков программного обеспечения, но и производителей аппаратных решений. Не так давно на клавиатуре для компьютеров с Windows появилась клавиша Copilot для начала работы с ИИ-помощником Microsoft, а теперь Logitech представила собственное видение процесса взаимодействия с чат-ботом ChatGPT.

 Источник изображения: Logitech

Источник изображения: Logitech

Речь идёт о новом приложении Logi AI Prompt Builder, для начала взаимодействия с которым можно задействовать специальную кнопку на компьютерной мыши или клавиатуре. Этот инструмент позволяет не только начать взаимодействие с ИИ-ботом ChatGPT, но также предлагает воспользоваться заранее подготовленными запросами — текстовыми описаниями или инструкциями для бота. После нажатия кнопки AI на компьютерной мыши пользователь может быстро попросить ИИ-бота перефразировать абзацы текста, сделать их более короткими и лаконичными или сократить до определённого количества слов. Ещё имеются запросы для обобщения текстов, генерации изображений и др., в зависимости от того, какую подписку на ChatGPT задействует пользователь.

Отмечается, что для работы Prompt Builder подойдёт не любая мышь Logitech, К примеру, мышь Logitech M557 оказалась слишком старой для работы с этим программным обеспечением. Logitech выпустит как минимум одну мышь со специальной кнопкой AI, которая будет заведомо поддерживать работу с Prompt Builder. ИИ-версия мыши Logitech M750 оснащена клавишей AI бирюзового цвета и с её помощью можно мгновенно запускать ChatGPT. Согласно имеющимся данным, эта модель будет доступна только в США и Великобритании по цене $49,99 и £54,99 соответственно.

Для взаимодействия с приложением Logi AI Prompt Builder не обязательно использовать специальную мышь с кнопкой AI, но для этого всё же потребуется достаточно свежая мышь Logitech. Это связано с тем, что Prompt Builder является частью программного обеспечения Logi Options+, входящего в комплект поставки компании. В настоящее время приложение работает только с ChatGPT и понимает запросы только на английском языке. В компании заявили, что продолжают работу по интеграции поддержки других чат-ботов.

X сделала ИИ-бота Grok доступным для премиальных подписчиков

В прошлом месяце глава платформы X (бывшая Twitter) Илон Маск (Elon Musk) объявил о намерении сделать ИИ-бота Grok от принадлежащей ему компании xAI доступным для премиальных подписчиков социальной сети. Теперь же стало известно, что чат-бот стал доступен подписчикам X на тарифе Premium, но пока только в некоторых странах.

 Источник изображения: xAI

Источник изображения: xAI

В прошлом году, когда компания xAI только анонсировала бота Grok, она сделала алгоритм доступным для подписчиков X с тарифом Premium+, которые платят $16 в месяц или $168 в год. Теперь же доступ к Grok постепенно получают подписчики Premium, которые платят $8 в месяц. Пользователи могут выбрать для взаимодействия с ИИ-ботом обычный или шутливый режим. Одно из любопытных нововведений чат-бота xAI заключается в способности обобщать новости, что может оказаться полезным для некоторых пользователей.

Вероятно, Маск хочет, чтобы больше людей использовали Grok для конкуренции с аналогичными продуктами других компаний, такими как ChatGPT от OpenAI, Gemini от Google и Claude от Anthropic. В последние несколько месяцев миллиардер открыто критиковал OpenAI, а в марте даже подал в суд на компанию, мотивируя это тем, что OpenAI «предала» свои некоммерческие цели. В ответ на это OpenAI подала в суд ходатайство с просьбой отклонить иск Маска, а также опубликовала переписку между компанией и владельцем X.

Чат-бот Grok будет доступен подписчикам X по более дешёвому тарифу Premium

В начале декабря Илон Маск (Elon Musk) продемонстрировал симбиоз двух своих бизнес-инициатив: разрабатываемый компаний xAI чат-бот Grok стал доступен подписчикам социальной сети X, которые выбрали самый дорогой тариф Premium+. На этой неделе миллиардер заявил, что данные возможности откроются и для подписчиков более доступного тарифа Premium.

 Источник изображения: Unsplash, Rubaitul Azad

Источник изображения: Unsplash, Rubaitul Azad

Пока данное обещание, как поясняет Reuters, не сопровождается какими-то дополнительными подробностями. Очевидно лишь, что для доступа к использующему искусственный интеллект чат-боту Grok пользователям социальной сети X придётся платить меньшие суммы. Например, в США при ежемесячной оплате подписка Premium обходится в $8 против $16 у Premium+. При оплате за год вперёд разница составляет $84, поскольку за подписку Premium+ в этом случае нужно заплатить $168.

Подписка Premium в своём изначальном виде сокращала количество просматриваемой пользователем рекламы, расширяла возможности монетизации собственного контента, предоставляла приоритет в позиционировании ответных сообщений, а также обеспечивала верификацию учётной записи X. Пользователи Premium+ освобождались от необходимости просматривать рекламу в определённых разделах, получали возможность публиковать длинные тексты и видеоролики, а ещё с декабря прошлого года только они имели доступ к чат-боту Grok. Вскоре данное право будет предоставлено и подписчикам на тарифе Premium. В этом месяце Илона Маск также пообещал открыть исходный код чат-бота Grok.

Маркетплейс ИИ-чат-ботов OpenAI заполонили контрафактные боты

GPT Store, официальная торговая площадка OpenAI для ИИ-чат-ботов GPT, основанных на моделях генеративного ИИ OpenAI, переполнена потенциально нарушающими авторские права приложениями, пишет TechCrunch. В частности, здесь можно найти GPT, которые позволяют создавать произведения искусства в стиле Disney и Marvel, но служат не более чем средствами доступа к сторонним платным сервисам и рекламируют себя как способные обходить инструменты обнаружения ИИ-контента, такие, как Turnitin и Copyleaks.

 Источник изображения: BoliviaInteligente/unsplash.com

Источник изображения: BoliviaInteligente/unsplash.com

Например, в GPT Store есть несколько GPT на основе популярных франшиз фильмов, телепередач и видеоигр, которые, по данным TechCrunch, не были созданы и авторизованы владельцами этих франшиз. Один GPT позволяет создавать монстров в стиле «Корпорации монстров» из анимационного фильма студии Pixar, а другой обещает приключения во вселенной «Звёздных войн» на основе текстовых запросов.

Размещение этих чат-ботов в GPT Store, а также GPT, которые позволяют пользователям общаться с персонажами, защищёнными товарными знаками, такими как Варио (Wario) и Аанг (Aang) из фильма «Аватар: последний маг воздуха», может стать почвой для исков правообладателей.

Сама OpenAI не будет нести ответственность за нарушение авторских прав создателями GPT благодаря положению Закона об авторском праве в цифровую эпоху (DMCA), защищающему её и другие платформы (YouTube, Facebook), на которых размещается контент, нарушающий авторские права, при условии, что эти платформы соответствуют требованиям законодательства и по запросу устраняют допущенные нарушения. Однако для компании, вовлечённой в судебные разбирательства в области интеллектуальной собственности, это грозит репутационными потерями.

Правила GPT Store запрещают разработчикам создавать GPT, нарушающие стандарты академической честности. Тем не менее в GPT Store можно найти GPT, в числе возможностей которых указана способность обходить детекторы ИИ-контента, включая приложения, предлагаемые преподавателям на платформах сканирования плагиата. Например, авторы Humanizer Pro, занявшего второе место в категории «Письмо» в GPT Store, утверждает, что он «очеловечивает» контент, чтобы обойти детекторы искусственного интеллекта, сохраняя «смысл и качество» текста, одновременно обеспечивая «на 100 % человеческий» рейтинг.

Некоторые приложения являются скрытыми каналами к платным сервисам премиум-класса. Humanizer, например, предлагает попробовать «премиум-план», чтобы «использовать [самый] продвинутый алгоритм», который передаёт текст, введённый в чат-бот, в плагин со стороннего сайта GPTInf. Подписка на GPTInf стоит $12 в месяц за 10 000 слов в месяц или $8 в месяц при оплате на год вперёд.

И хотя OpenAI заявила, что такие приложения нарушают её политику и она прилагает все возможные усилия по борьбе с нарушениями, TechCrunch считает, что в GPT Store царит беспорядок. И если в ближайшее время не будут предприняты кардинальные меры, всё так и останется.

Илон Маск пообещал открыть исходный код чат-бота xAI Grok на этой неделе

Конфликт миллиардера Илона Маска (Elon Musk) с основателями OpenAI вокруг гуманистических ценностей в сфере искусственного интеллекта привёл к достаточно неожиданным последствиям. Основанный Маском стартап xAI пообещал открыть исходный год своего чат-бота Grok на этой неделе. Примечательно, что частным пользователям X доступ к этому чат-боту предоставляется за $16 в месяц.

 Источник изображения: xAI

Источник изображения: xAI

Если xAI опубликует исходный год своего чат-бота Grok, то этот стартап присоединится к ряду компаний, которые это уже сделали, причём среди них оказалась запрещённая в РФ компания Meta Platforms Марка Цукерберга (Mark Zuckerberg). Французский стартап Mistral также вошёл в число сторонников открытия свободного доступа к исходному коду своего чат-бота.

Илон Маск давно продвигает идею свободного доступа к разработкам принадлежащих ему компаний. Многие из патентов Tesla с 2014 года доступны для использования всем желающим, хотя на практике выясняется, что использовать их безвозмездно всё же не получится. Как тогда отмечалось, на такой шаг Tesla пошла из стремления ускорить переход на электромобили. В прошлом году принадлежащая Маску социальная сеть X раскрыла часть исходного кода своих программных алгоритмов. Теперь к ним присоединится и стартап xAI, который работает в сфере систем генеративного искусственного интеллекта.

ИИ чат-боты «думают» на английском, даже когда говорят на других языках

Большие языковые модели (LLM), лежащие в основе чат-ботов, «думают» на английском языке, даже если вопросы задаются на других языках, пишет ресурс New Scientist со ссылкой на исследование учёных Федеральной политехнической школы Лозанны. Чтобы понять, какой язык на самом деле используют LLM при обработке запросов, учёные изучили три версии модели Llama 2 компании Meta. Благодаря тому, что Llama 2 имеет открытый исходный код, исследователи смогли ознакомиться с каждым этапом обработки запроса.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

По словам одного из исследователей, они открыли эти модели и изучили каждый из их слоёв. ИИ-модели состоят из нескольких слоёв, каждый из которых отвечает за определённый этап обработки запроса: один переводит письменные подсказки в токены, другой контекстуализирует каждый токен, чтобы в итоге дать ответ.

Моделям были предложены три типа запросов на китайском, французском, немецком и русском языках. В одном случае предлагалось повторить заданное слово, во втором — перевести с одного неанглийского языка на другой, и в третьем — заполнить пробел в одно слово в предложении, например: «___ используется для занятий такими видами спорта, как футбол и баскетбол».

Отследив процессы, через которые проходит LLM, чтобы ответить на запрос, учёные обнаружили, что путь обработки через слои почти всегда проходит через то, что они называют английским подпространством. То есть, если предложить модели перевести с китайского на русский, русские символы проходят через английское подпространство, прежде чем вернуться на русский, говорит учёный, что является убедительным признаком того, что модели используют английский, чтобы помочь себе понять суть запроса.

Это вызвало у учёных обеспокоенность по поводу того, что использование английского языка в качестве посредника для обучения модели анализу языка несёт с собой риск распространить связанные с этим ограничения в мировоззрении на другие лингвистически и культурно отличающиеся регионы.

«Если английский станет основным языком, на котором системы обрабатывают запросы, мы, скорее всего, потеряем концепции и нюансы, которые можно оценить только на других языках», — говорит Карисса Велиз (Carissa Véliz) из Оксфордского университета.

Существуют также более фундаментальные риски, связанные с кодированием используемых во всем мире генеративных ИИ с англоцентрическими ценностями, сообщила Алия Бхатия (Aliya Bhatia) из Центра демократии и технологий в Вашингтоне (округ Колумбия). «Если модель используется для генерации текста на языке, которому она не обучена, это может привести к культурно нерелевантным галлюцинациям, а если модель используется для принятия решений о предоставлении убежища для сообщества, которое не вписывается в англоцентрическое воображение обществе, модель может стоять между человеком и доступом к безопасности», — говорит она.

Дуров анонсировал появление в Telegram чат-ботов с ИИ

В мессенджере Telegram появилась возможность трансформации личных аккаунтов в бизнес-профили в специальном разделе Telegram Business. Об этом на своём канале рассказал создатель сервиса Павел Дуров, заодно анонсировав появление ИИ-ботов в мессенджере.

 Источник изображения: Vika_Glitter/Pixabay

Источник изображения: Vika_Glitter/Pixabay

«На этой неделе мы запустили первую партию функций Telegram Business. Теперь пользователи могут преобразовывать свои личные учётные записи Telegram в бизнес-аккаунты. Это позволит им добавлять своё местоположение и часы работы, организовывать чаты с цветными метками, использовать автоматические сообщения приветствия или о невозможности ответить в данный момент, а также шаблоны для быстрых ответов», — говорится в сообщении Дурова.

В дополнение к этому Дуров анонсировал появление новых функций, одна из которых «произведёт революцию во взаимодействии пользователей с чат-ботами». Владельцы бизнес-аккаунтов Telegram смогут задействовать чат-ботов в качестве «невидимых секретарей», которые благодаря технологиям на основе искусственного интеллекта выведут автоматизацию на новый уровень. Примечательно, что новый Bot API станет доступен разработчикам совершенно бесплатно к концу этого месяца.

В дополнение к этому Дуров пообещал, что в течение года в Telegram появится ещё больше интересных вещей для бизнеса и разработчиков. Напомним также, что в конце прошлого месяца Дуров анонсировал функцию монетизации каналов. В рамках этого нововведения владельцы публичных Telegram-каналов будут получать до 50 % от суммы дохода, получаемой платформой за демонстрацию рекламы на их каналах. Вознаграждение будет выплачиваться в криптовалюте Toncoin, которую можно будет обналичить или вложить в дальнейшее развитие своих каналов.

ChatGPT научился читать свои ответы вслух

Компания OpenAI добавила в свой ИИ-бот ChatGPT функцию «Чтение вслух», которая озвучивает ответы на запросы пользователей с помощью одним из пяти голосов. Функция может пригодиться, например, в дороге, когда отвлечься на экран устройства для чтения ответа на запрос может оказаться невозможно. Новая функция «Чтение вслух» уже доступна как в веб-версии ChatGPT, так и в приложениях ChatGPT для iOS и Android.

 Источник изображения: Unsplash, Andrew Neel

Источник изображения: Unsplash, Andrew Neel

Функция «Чтение вслух» поддерживает 37 языков и автоматически определяет язык ответа. Она доступна как для чат-ботов на базе GPT-4, так и для GPT-3.5. Следует добавить, что аналогичные возможности для своих ИИ-моделей ранее добавила компания Anthropic, один из основных конкурентов OpenAI.

В сентябре минувшего года ChatGPT запустил функцию голосового запроса, благодаря которой пользователи могут голосом проговаривать запрос для чат-бота, не печатая его в форме. Новая же функция позволяет настроить чат-бота таким образом, чтобы он всегда устно отвечал на запросы пользователя.

Для работы функции «Чтение вслух» в мобильных приложениях необходимо нажать и удерживать поле введённого запроса. В результате откроется специальный плеер «Чтение вслух», где можно выбрать настройки воспроизведения, приостановки или перемотки аудио-ответа. В веб-версии чат-бота для активации функции «Чтение вслух» под текстом ответа отображается значок динамика.

NVIDIA представила Chat with RTX для запуска ИИ-чат-ботов локально на ПК

NVIDIA выпустила предварительную версию приложения Chat with RTX, которое позволяет запускать локально на ПК чат-бота c генеративным ИИ на основе большой языковой модели (LLM). Чат-бот способен создавать сводки и выдавать релевантные ответы на основе видеороликов и документов пользователя. Chat with RTX работает на ПК под управлением Windows с видеокартами NVIDIA GeForce RTX 30-й или 40-й серии, оснащёнными как минимум 8 Гбайт видеопамяти.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

Chat with RTX умеет обрабатывать видео YouTube — достаточно просто ввести URL-адрес, чтобы получить от чат-бота краткое содержание в текстовом виде. Chat with RTX позволяет выполнять поиск по расшифровке видео. По отзывам экспертов, поиск в видеороликах занимает считанные секунды. При этом отмечены случаи, когда чат-бот по непонятной причине использовал для поиска содержание другого ролика вместо запрошенного. Это явно указывает на ошибки ранней демоверсии.

Исследователи находят Chat with RTX полезным при обработке PDF-файлов. Утверждается, что чат-бот от NVIDIA в этой задаче проявил себя лучше, чем Microsoft Copilot, без проблем извлекая ключевую информацию. Эксперты также отметили, что Chat with RTX даёт ответ практически мгновенно, без задержек, которые обычно наблюдаются при использовании облачных чат-ботов ChatGPT или Copilot. При помощи чат-бота тестировщикам удалось создать релевантный набор данных по судебному делу «FTC против Microsoft» и обобщить всю стратегию Microsoft в отношении Xbox Game Pass.

При инсталляции Chat with RTX на ПК пользователя устанавливается веб-сервер и экземпляр Python, который использует LLM Mistral или Llama 2. Тензорные ядра на графическом процессоре NVIDIA RTX применяются для ускорения обработки запросов. Установка Chat with RTX на ПК с процессором Intel Core i9-14900K и видеокартой NVIDIA GeForce RTX 4090 продолжается около 30 минут. На диске приложение занимает около 40 Гбайт, а интерпретатор Python при работе потребляет около 3 Гбайт ОЗУ. После запуска пользователь получает доступ к чат-боту через веб-интерфейс, а в командной строке отображается ход выполнения и коды ошибок.

Эксперты отмечают, что Chat with RTX пока больше всего напоминает раннюю демоверсию для разработчиков и компьютерных энтузиастов. Существует целый ряд известных проблем и ограничений. Попытка проиндексировать с помощью Chat with RTX папку с 25 000 документов привела к сбою приложения, потребовавшему сброса всех настроек для восстановления работоспособности. Кроме того, чат-бот создал файлы JSON внутри всех папок, которые индексировал, что не всегда уместно. Chat with RTX также не запоминает контекст, поэтому новый запрос не может опираться на содержание предыдущего.

Тем не менее, Chat with RTX — это хорошая техническая демонстрация возможностей и перспектив локально установленного на компьютере пользователя чат-бота с ИИ. Найдётся достаточно людей, которые не хотят для анализа личных данных использовать подписные облачные службы ИИ, такие как Copilot Pro или ChatGPT Plus.


window-new
Soft
Hard
Тренды 🔥
Новая статья: Обзор 57-дюймового игрового Mini-LED VA-монитора Samsung Odyssey Neo G95NC: с запасом на будущее 19 мин.
Шестое поколение ускорителей Google TPU v6 готово к обучению ИИ-моделей следующего поколения 55 мин.
TSMC запустит массовое производство по оптимизированному 3-нм техпроцессу N3P уже в этом году 3 ч.
В Индии испытали напечатанный на 3D-принтере ракетный двигатель 6 ч.
Сверхпрочный смартфон IIIF150 Air2 Ultra получил тонкий корпус, чип Dimensity 7050 и 64-Мп камеру с ночным видением 6 ч.
Чип Apple M4 в iPad Pro протестировали под жидким азотом — на 28 % быстрее M3 Max, но только в одноядерном тесте 6 ч.
«Хаббл» сфотографировал космический невод — линзовидную галактику NGC 4753 7 ч.
Представлен смартфон Meizu 21 Note с чипом Snapdragon 8 Gen 2, Wi-Fi 7 и ценой $360 7 ч.
Fujifilm представила GFX 100S II — среднеформатную беззеркалку с ИИ за $4999 7 ч.
G.Skill представила комплекты памяти Ripjaws M5 RGB со скоростью до 6400 МТ/с и объёмом до 96 Гбайт 7 ч.