Сегодня 09 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

На следующей неделе выйдет GPT-4 — ИИ-модель с которой можно будет общаться текстом, картинками и видео

На следующей неделе OpenAI совместно с Microsoft представит большую языковую модель (LLM) нового поколения GPT-4 (Generative Pre-trained Transformer 4). Об этом сообщил технический директор немецкого подразделения Microsoft Андреас Браун (Andreas Braun). Как ожидается, GPT-4 будет значительно превосходить по функциональности предыдущую версию GPT-3.5, открывая новые возможности корпоративного использования генеративного ИИ.

 Источник изображения: Pixabay

Источник изображения: Pixabay

«Мы представим GPT-4 на следующей неделе, там у нас будут мультимодальные модели, которые предложат совершенно другие возможности — например, [генерацию] видео», — заявил Браун в ходе прошедшего в четверг мероприятия AI in Focus – Digital Kickoff. Он отметил, что использование больших языковых моделей привело к «изменению правил игры», поскольку они учат машины понимать естественный язык, что позволяет им понимать то, что ранее было доступно для понимания только человеку.

Технология вышла на новый уровень и «работает на всех языках»: можно задать вопрос на немецком и получить ответ на итальянском. Благодаря мультимодальности Microsoft (совместно с OpenAI) «сделает модели всеобъемлющими», отметил Браун.

Гендиректор Microsoft Germany Марианна Яник (Marianne Janik) пояснила, что внедрение ИИ вовсе не означает сокращение рабочих мест, речь идёт не о замене работников, а о выполнении повторяющихся задач по-другому. «Потребуется много специалистов», чтобы полноценно использовать ИИ, отметила Яник и предложила компаниям создавать внутренние «центры компетенций», где будут обучать сотрудников использованию ИИ и объединять идеи для проектов.

Яник также заявила о «демократизации» применения ИИ, имея в виду удобство использования моделей в семействе продуктов Microsoft, в частности их широкую доступность благодаря интеграции ИИ в платформу Azure, Outlook и Teams.

Преимущество мультимодального ИИ заключается в том, он может соответствующим образом переводить текст не только в изображения, но и в музыку и видео. Также самой нейросети можно будет в качестве запросов отправлять не только текст, но и аудио, картинки и видео. Если GPT-3.5 позволяет пользователям взаимодействовать посредством ввода текста, то GPT-4 с мультимодальными возможностями, в идеале может обеспечить возможность взаимодействовать в нескольких режимах, включая текст, изображения и звуки.

В ходе мероприятия AI in Focus специалисты компании привели примеры практического использования ИИ. По словам Хольгера Кенна (Holger Kenn) из Microsoft Germany, ответственный ИИ уже встроен в продукты Microsoft, и «миллионы запросов могут быть отображены в API» через облако. В свою очередь Клеменс Зиблер (Clemens Sieber) рассказал, что уже сейчас телефонные звонки с преобразованием речи в текст можно было бы записывать, и больше не пришлось бы вручную обобщать и вводить контент. По словам Зиблера, это позволило бы сэкономить 500 рабочих часов в день у крупного клиента Microsoft в Нидерландах, к которому поступает до 30 000 звонков в день.

Отвечая на вопрос об операционной надёжности и достоверности ответов ИИ, Зиблер сообщил, что они не всегда будут правильными, поэтому необходимо проводить валидацию, и что сейчас Microsoft работает над формированием системы показателей достоверности для решения этой проблемы. Он отметил, что текст, предложенный моделью, является генеративным, и поэтому его нелегко проверить. «Мы строим вокруг него петлю обратной связи с одобрением и неодобрением», — рассказал Зиблер.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Самая жуткая реклама Apple»: пользователи ополчились на Apple из-за ролика про новый iPad Pro 2 мин.
OpenAI представила основные правила поведения для ИИ-моделей 12 мин.
Игроки нашли остроумный способ отомстить Филу Спенсеру за закрытие студий Bethesda — ядерный удар по его лагерю в Fallout 76 50 мин.
Disney и Warner Bros. запустят общую подписку на стриминговые сервисы Disney Plus, Hulu и Max 2 ч.
Google представила мощную нейросеть AlphaFold 3 для предсказания структуры белков — её может опробовать каждый 2 ч.
Ирония судьбы: Microsoft нуждается в играх вроде Hi-Fi Rush и не уверена насчёт Call of Duty в Game Pass 3 ч.
Microsoft лишила игроков новой Dishonored и Hi-Fi Rush 2, закрыв Arkane Austin и Tango Gameworks 4 ч.
Google придумала, как легко имитировать на iPhone функцию Circle to Search 9 ч.
США захотели ограничить доступ России и Китая к GPT-4 и другим мощным моделям ИИ 14 ч.
Глава разработки Kingdom Come: Deliverance 2 рассказал, как игра работает на его ПК с Ryzen 9 7950X3D и RTX 4080 Super 14 ч.
Ippon представила однофазные ИБП серии Novus мощностью до 10 кВт 17 мин.
Военные США начали тестировать робопсов, оснащённых стрелковым оружием 19 мин.
Против «дочки» HPE в России поданы новые иски на десятки миллионов рублей 26 мин.
NASA показало видео с падением на чёрную дыру и полётом вокруг горизонта событий — круче, чем в «Интерстелларе» 2 ч.
Samsung всего за год стала крупнейшим производителем OLED-мониторов в мире 2 ч.
Sabrent выпустила компактный SSD Rocket Nano 2242 Gen4 для портативных игровых консолей, ноутбуков и ПК 2 ч.
Зонд «Чанъэ-6» для первого в истории забора грунта с обратной стороны Луны вышел на орбиту спутника 4 ч.
Внутри смартфона Huawei Pura 70 Pro нашли больше китайский компонентов — и даже флеш-память с контроллером HiSilicon 5 ч.
Следствие подозревает Tesla в обмане инвесторов, манипуляциях с ценными бумагами и подлоге данных о FSD 6 ч.
Прогноз Arm разочаровал инвесторов, акции компании подешевели почти на 10 % 6 ч.