Сегодня 27 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → openai
Быстрый переход

Apple возобновила переговоры с OpenAI и Google, чтобы выбрать подходящий ИИ для iPhone

Как уже отмечалось, Apple не исключает возможности интеграции сторонних систем искусственного интеллекта в свои будущие устройства, и компания недавно возобновила переговоры с OpenAI на эту тему. Операционная система iOS 18, под управлением которой будут работать iPhone нового поколения, в итоге может получить поддержку экосистемы OpenAI, как сообщает Bloomberg.

 Источник изображения: Apple

Источник изображения: Apple

Это уже не первая попытка Apple реализовать такую интеграцию с OpenAI, переговоры начинались в этом году, но были поставлены на паузу, а теперь возобновляются, как отмечает источник. Не списывает Apple со счетов и Google с её чат-ботом Gemini, поэтому среда, в которой ведутся эти переговоры, довольно конкурентна. Выбор партнёра в этой сфере Apple пока не сделала, и нет гарантий, что твёрдые договорённости будут вообще достигнуты.

Некоторые функции грядущей операционной системы Apple iOS 18 будут использовать элементы большой языковой модели собственной разработки — например, она поможет пользователям генерировать текст, похожий на созданный человеком. При этом на уровне взаимодействия с пользователями через чат-бот Apple рассчитывает полагаться на сторонние решения типа ChatGPT. Когда о поиске партнёра для реализации этой функции впервые стало известно в марте, среди потенциальных участников переговоров фигурировал и стартап Anthropic.

Apple рассчитывает за счёт тесного взаимодействия с разработчиками систем ИИ добиться не только их более глубокой интеграции со своей операционной системой, но и высокой степени информационной безопасности. Тим Кук (Tim Cook) ранее обещал, что функции ИИ будут внедряться в экосистему Apple после их тщательной оценки и адаптации.

Глава Nvidia лично привёз ИИ-ускоритель DGX H200 первому покупателю — им оказался Сэм Альтман

Гендиректор Nvidia Дженсен Хуанг (Jensen Huang) лично доставил первый ускоритель DGX H200 в офис компании OpenAI в Сан-Франциско, подчеркнув тесную связь между двумя гигантами в отрасли искусственного интеллекта.

 Источник изображения: twitter.com/gdb

Источник изображения: twitter.com/gdb

Это жест был отмечен публикацией в соцести X президента и соучредителя OpenAI Грега Брокмана (Greg Brockman) — он показал фото с мероприятия, на котором также присутствовал гендиректор OpenAI Сэм Альтман (Sam Altman). H200 — это самый новый и самый мощный ИИ-ускоритель Nvidia, знаменующий шаг вперёд в области технологий ИИ. И это поворотный момент для OpenAI, которая получила самое мощное в мире оборудование для своих целей. Ключевым нововведением Nvidia H200 по сравнению с его предшественником H100 стала интеграция памяти HBM3e, что помогло увеличить пропускную способность памяти в 1,4 раза, а её объём вырос до 141 Гбайт.

Для OpenAI приобретение H200 стало важным стратегическим шагом, который расширит возможности компании и поможет в разработке нейросети GPT-5 — выход ускорителя призван стать катализатором отрасли ИИ, способствуя прорывам в различных областях науки. На модель H100 наблюдался значительный спрос, который привёл к дефициту ускорителей, и Nvidia надеется избежать повторения ситуации с новой моделью, сотрудничая с мировыми производителями систем и поставщиками облачных услуг, но пока неизвестно, сработает ли эта стратегия, поскольку фактическая доступность H200 до сих пор остаётся проблемой.

Персональная доставка Nvidia H200 для OpenAI главой компании Дженсеном Хуангом — это не просто символический жест партнёрства, но и, возможно, свидетельство важной роли, которую передовое оборудование играет в развитии технологий ИИ.

Попытка Маска судиться с OpenAI — пример «исторического ревизионизма», считают юристы компании

На этой неделе в Сан-Франциско должно состояться заседание суда, на котором представители интересов OpenAI попытаются обжаловать иск Илона Маска (Elon Musk), обвиняющий эту некоммерческую организацию в отказе от своих принципов. Представители ответчика утверждают, что Маск передёргивает факты и строит свои обвинения на несуществующих юридически положениях.

 Источник изображения: OpenAI

Источник изображения: OpenAI

По словам представителей OpenAI, на которые ссылается Bloomberg, упрёки Илона Маска в отказе организации от своих альтруистических принципов базируются на ложных утверждениях, являются ни чем иным, как «историческим ревизионизмом», и направлены на продвижение собственного конкурирующего стартапа. Иск Илона Маска к OpenAI был подан в марте, и одним из пунктов обвинения было вступление стартапа в партнёрство с Microsoft. Представители ответчика сообщают, что несколько лет назад сам Маск покинул OpenAI после неудачной попытки установить в организации своё доминирование, но после запуска собственной компании в сфере искусственного интеллекта пытается использовать успех OpenAI в собственных коммерческих интересах.

В документах, определяющих сферу и принципы деятельности OpenAI, как утверждают юристы, нет положений, запрещающих ей монетизировать собственные технологии, а потому упрёки Илона Маска в нарушении принципов некоммерческого распространения ПО не являются состоятельными. Свидетельство о регистрации организации, на которое ссылается Маск, не содержит обязательств по непременному распространению открытого кода своих разработок для всеобщего блага. Формулировка подразумевает, что руководство OpenAI в ходе обсуждения должно определять, какую часть ПО сделать открытой, а какую нет.

Илону Маску, по мнению стороны ответчика, также не удастся доказать, что OpenAI не имеет права лицензировать свою технологию сторонним компаниям (а именно Microsoft), а также предоставлять им наблюдательное место в совете директоров. Впрочем, промежуточный исход спора двух субъектов может стать понятен уже в середине этой недели, когда состоится судебное заседание.

OpenAI отключила генератор изображений DALL-E 2 — его место займёт более продвинутый DALL-E 3

Компания OpenAI продолжает активно развивать свои генеративные алгоритмы, делая их более совершенными и удобными для пользователей. На этом фоне разработчики объявили о закрытии нейросети DALL-E 2, которая дебютировала в апреле 2022 года и позволяла создавать качественные изображения на основе текстовых описаний. Этого следовало ожидать, поскольку OpenAI уже выпустила более совершенный алгоритм DALL-E 3.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Алгоритм DALL-E 3 получил полную интеграцию с ИИ-ботом ChatGPT, что способствовало формированию более простого пользовательского интерфейса и созданию более качественных изображений. Начать взаимодействие с ChatGPT в DALL-E 3 можно буквально в пару кликов. Что же касается DALL-E 2, то очевидно, что нейросеть безвозвратно уходит в прошлое.

«Мы больше не допускаем новых пользователей к DALL-E 2. DALL-E 3 позволяет создавать изображения более высокого качества, лучше обрабатывает запросы, и мы начали внедрять в него функцию редактирования изображений. Он доступен пользователям ChatGPT Plus, Teams и Enterprise, а также через API OpenAI», — говорится в сообщении разработчиков на странице DALL-E 2.

Вместе с появлением сообщения от разработчиков со страницы исчезла форма для ввода текстовых описаний. Доступ к сгенерированным ранее изображениям на данный момент есть, но не исключено, что позднее это изменится. OpenAI предупреждала о предстоящем закрытии доступа к алгоритму ещё в начале года, поэтому для пользователей нейросети этот шаг не должен стать чем-то неожиданным.

OpenAI GPT-4 достигла уровня врачей-офтальмологов в диагностике глазных заболеваний

Большая языковая модель искусственного интеллекта OpenAI GPT-4 достигла тех же результатов, что и врачи-специалисты, в оценке глазных заболеваний и выработке методов их лечения — или превзошла их, пишет Financial Times со ссылкой на материалы исследования. Сильнее ИИ оказались лишь лучшие специалисты.

 Источник изображения: u_9p7tw4noz0 / pixabay.com

Источник изображения: u_9p7tw4noz0 / pixabay.com

Офтальмология оказалась центральным направлением проекта по внедрению ИИ в клиническую практику, а также по устранению препятствий к этому, например, галлюцинаций — склонности моделей выдавать явно не соответствующую действительности информацию. В рамках исследования рассматривались 87 сценариев лечения пациентов, чего хватило, чтобы оценить эффективность GPT-4 по сравнению с непрофильными врачами, стажёрами и опытными офтальмологами. Модель превзошла молодых врачей и добилась результатов на уровне опытных специалистов.

Исследование примечательно тем, что в нём сравнивались способности нейросети с возможностями практикующих врачей, а не результатами обследований. Кроме того, здесь применялись широкие возможности генеративного ИИ, а не узкая специализация, которая рассматривалась в предыдущих проектах, таких как оценка рисков онкологии на основе материалов сканирования пациентов. Модель одинаково хорошо справилась с вопросами как на простое наличие знаний, так и на способность рассуждать: интерполировать, интерпретировать и обрабатывать информацию.

GPT-4 можно усовершенствовать, проведя дополнительное обучение на расширенном наборе данных, включая алгоритмы управления, записи о реальных пациентах (без личной информации) и учебники, пояснил автор исследования в школе клинической медицины при Кембриджском университете Арун Тирунавукарасу (Arun Thirunavukarasu). Для этого требуется соблюсти баланс между увеличением количества и характера источников и высоким качеством данных. На практике такие модели помогут определять приоритет пациентов, когда доступ к специалистам ограничен.

Но и излишне доверяться ИИ тоже преждевременно, предупредил профессор Университетского колледжа Лондона Пирс Кин (Pearse Keane), работающий также в лондонской офтальмологической больнице «Мурфилдс» (Moorfields Eye Hospital). В прошлом году он задал большой языковой модели вопрос о дегенерации жёлтого пятна в глазах и получил не соответствующий действительности ответ.

Еврокомиссия не нашла ничего предосудительного в отношениях Microsoft и OpenAI

Европейская комиссия сообщила, что не станет расследовать инвестиции Microsoft в размере $13 млрд в компанию OpenAI, поскольку последняя не подчиняется Microsoft напрямую и вряд ли будет поглощена редмондской компанией. В январе европейские антимонопольщики заявили, что могут начать расследование отношений Microsoft и OpenAI.

 Источник изображения: efes / pixabay.com

Источник изображения: efes / pixabay.com

Партнёрство Microsoft и OpenAI во многом обусловлено нарастающими потребностями в вычислительной мощности, необходимой для дальнейшего развития и использования генеративных ИИ. Запуск ИИ-моделей вроде ChatGPT и Google Bard привёл к резкому росту спроса на облачные сервисы и вычислительные мощности, а OpenAI стала одним из крупнейших клиентов облачного бизнеса Microsoft.

Кроме того, все мировые поставщики облачных вычислений — Microsoft, Amazon и Google — в последнее время активно инвестируют в ИИ. Так, разрабатывающая семейство чат-ботов Claude компания Anthropic получила $4 млрд инвестиций от Amazon и $2 млрд от Google. Логично, что и Microsoft стремится не отстать от конкурентов — ранее в этом году компания вложила $16 млрд в французскую Mistral AI.

Однако именно инвестиции в OpenAI привлекли внимание антимонопольщиков. И не только в ЕС — интерес к сделке проявили Управление по конкуренции и рынкам Великобритании и Федеральная торговая комиссия США, особенно после скандала с увольнением и повторным наймом Сэма Альтмана (Sam Altman).

Сама Microsoft отказалась от комментариев, процитировав раннее заявление, что партнёрство с OpenAI «способствовало новаторскому развитию в области ИИ с сохранением независимости обеих компаний».

Google потратит не менее $100 млрд на развитие искусственного интеллекта

Инициативами Google в сфере искусственного интеллекта руководит генеральный директор DeepMind Демис Хассабис (Demis Hassabis), который является одним из основателей данного стартапа, купленного Alphabet в 2014 году. В ближайшие годы, по его словам, Google потратит на развитие систем искусственного интеллекта более $100 млрд.

 Источник изображения: DeepMind

Источник изображения: DeepMind

Этот комментарий Хассабис сделал на конференции TED в Ванкувере, как поясняет Bloomberg, когда его спросили о потенциальном создании суперкомпьютера Stargate стоимостью $100 млрд, который якобы готовятся совместно построить Microsoft и OpenAI. Не желая вдаваться в подробности, представитель Google заявил, что корпорация потратит с течением времени более $100 млрд на развитие своих систем искусственного интеллекта. По его словам, Google превосходит Microsoft по своим вычислительным мощностям.

«Это одна из причин, по которым мы скооперировались с Google в 2014 году, поскольку уже тогда знали, что для создания сильного искусственного интеллекта (AGI) нам потребуется много вычислительных мощностей, — подчеркнул сооснователь DeepMind, добавив, — уже тогда это стало очевидным, а Google продолжает обладать самыми производительными компьютерами». По словам Хассабиса, вызванный ChatGPT компании OpenAI интерес публики доказывает, что общественность уже готова принимать системы искусственного интеллекта, даже если они далеки от совершенства и изобилуют ошибками.

OpenAI будет сотрудничать с японскими производителями для устранения дефицита ИИ-чипов

Открытие представительства OpenAI в Японии не было ориентировано исключительно на сближение компании с японскими клиентами в сфере искусственного интеллекта, как можно судить по интервью операционного директора компании Брэда Лайткэпа (Brad Lightcap) агентству Nikkei. Американский разработчик систем искусственного интеллекта всерьёз изучает возможность участия японских производителей в решении проблемы нехватки ускорителей вычислений.

 Источник изображения: Tokyo Electron

Источник изображения: Tokyo Electron

Спрос на подобные решения, по словам Лайткэпа, будет оставаться высоким на протяжении ближайших нескольких лет, поэтому для всей отрасли важно, чтобы не возникало нехватки вычислительных ресурсов. «Наш приоритет — добиться того, чтобы не возникла ситуация, когда в мире существует слишком много спроса на ИИ, но мы не можем его удовлетворить», — пояснил операционный директор OpenAI. Он не стал комментировать слухи об инициативах основателя компании Сэма Альтмана (Sam Altman) по развитию инфраструктуры ИИ на мировом уровне, подразумевающих и строительство десятков новых предприятий по выпуску чипов для ускорителей вычислений. При этом Лайткэп подчеркнул, что OpenAI «всегда думает о том, как участвовать в глобальной дискуссии про расширение мировых мощностей по выпуску чипов».

По неофициальным данным, Лайткэп уже встречался с представителями японской полупроводниковой отрасли для обсуждения подобных вопросов. По его собственным словам, «существуют возможности для обширного взаимодействия с Японией в части обеспечения любого количества дополнительных мощностей, и делать это можно с нескрываемым интересом». По словам Лайткэпа, к услугам OpenAI по предоставлению бизнесу ИИ-сервисов уже подключились тысячи компаний, а общее количество пользователей таких услуг превышает 600 000 человек. Ещё в январе их количество было в четыре раза меньше. Непосредственно численность сотрудников японского представительства OpenAI к концу года будет увеличена в десять раз.

Помимо большого количества поставщиков оборудования и расходных материалов для выпуска чипов, напомним, в Японии собирается развернуть свою деятельность контрактный производитель Rapidus, который с 2027 года намерен предложить клиентам услуги по выпуску 2-нм чипов. Компания делает ставки на стартапы, а OpenAI формально таковым и является, хотя масштабы бизнеса этой компании с прошлого года растут феноменальными темпами.

OpenAI открыла офис в Японии, который стал первым в азиатском регионе

Американский стартап OpenAI, пользующийся технологической, маркетинговой и финансовой поддержкой Microsoft, уже располагает офисами в Лондоне и Дублине, но открытое на этой неделе представительство в Японии стало первым в азиатском регионе. Сэм Альтман (Sam Altman) на правах руководителя OpenAI выразил надежду, что это событие будет лишь первым шагом на долгом пути сотрудничества с местным бизнесом.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Непосредственно генеральный директор OpenAI обратился к потенциальным партнёрам в Японии через видеосообщение. Представительство компании начнёт свою работу в Токио. Создатели популярного чат-бота ChatGPT рассчитывают, что с ними будут сотрудничать не только рядовые пользователи и японский бизнес, но и государственные структуры, а также исследовательские институты. OpenAI расширяет рынки сбыта своих разработок, и первый в Азии офис поможет наладить контакты с региональными клиентами.

В этом месяце, как сообщает Reuters, генеральный директор OpenAI Сэм Альтман и операционный директор компании Брэд Лайткэп (Brad Lightcap) уже провели встречу с сотнями предпринимателей и руководителей компаний на территории США и Великобритании. Открыть офис в Японии компания планировала ещё в прошлом году, соответствующее заявление Альтман сделал после встречи с японским премьер-министром Фумио Кисидой (Fumio Kishida).

Брэд Лайткэп присутствовал на церемонии открытия японского офиса в Токио, он заявил, что спрос на услуги OpenAI значительно превышает возможности компании их предоставлять. Со временем, как надеется операционный директор, OpenAI сможет получать существенную выручку на японском рынке. Возглавлять местный бизнес OpenAI будет Тадао Нагасаки (Tadao Nagasaki), который был президентом местного подразделения Amazon Web Services. По словам Лайткэпа, компания располагает оптимизированной под японский язык большой моделью. OpenAI уже обслуживает корпорации Toyota Motor, Daikin Industries и японские правительственные организации. Microsoft на прошлой неделе пообещала в ближайшие два года вложить $2,9 млрд в развитие облачной инфраструктуры в Японии, а также систем искусственного интеллекта.

Сэм Альтман занялся продвижением ChatGPT среди крупных корпоративных клиентов

В этом месяце глава OpenAI Сэм Альтман (Sam Altman) провёл несколько встреч, в которых приняли участие сотни руководителей компаний из списка Fortune 500. Прошедшие в Сан-Франциско, Нью-Йорке и Лондоне мероприятия были посвящены презентации функций на основе искусственного интеллекта для корпоративного сегмента. Об этом пишет агентство Reuters со ссылкой на собственные осведомлённые источники.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Эти мероприятия наглядно демонстрируют, как OpenAI, с потребительских приложений которой началось бурное развитие генеративных нейросетей, стремится к поиску новых источников дохода. Очевидно, что в видении компании такими источниками должны стать корпоративные клиенты по всему миру, причём некоторые из потенциальных клиентов могут являться партнёрами крупнейшего спонсора OpenAI, которым является Microsoft.

О трёх прошедших недавно в США и Англии встречах не сообщалось публично. По словам осведомлённых источников, в рамках каждой из таких встреч Альтман напрямую обращался более чем к 100 руководителям разных компаний. На каждом мероприятии Альтман и главный операционный директор OpenAI Брэд Лайткэп (Brad Lightcap) демонстрировали собравшимся разные программные продукты, в том числе ChatGPT Enterprise — корпоративную версию популярного ИИ-бота, а также API для подключения клиентских приложений к своим ИИ-сервисам и новые генеративные модели, позволяющие создавать видео по текстовому описанию.

OpenAI обещает клиентам, что их данные, которые станут доступны алгоритму ChatGPT Enterprise, не будут использоваться для обучения больших языковых моделей (LLM). Общаясь с потенциальными клиентами из финансовой, энергетической отраслей, сферы здравоохранения, руководители OpenAI рассказали о нескольких приложениях для разных сфер бизнеса, а также отметили, что потребительскую версию бота ChatGPT уже используют 92 % компаний из списка Fortune 500.

Напомним, Microsoft является крупнейшим инвестором в OpenAI и предлагает доступ к ИИ-технологиям компании через свою облачную платформу Azure. Пользователи сервиса Microsoft 365 также имеют доступ к ИИ-помощнику Copilot, который представляет собой инструмент для повышения продуктивности, в основе которого лежат алгоритмы OpenAI.

Во время встреч руководителей OpenAI с представителями бизнеса некоторые из участников задавали вопрос, почему они должны платить за ChatGPT Enterprise, если они уже являются клиентами Microsoft. Альтман и Лайткэп ответили, что оплата корпоративного ИИ-бота позволит компаниям напрямую взаимодействовать с OpenAI, иметь доступ к новейшим LLM, а также индивидуальным продуктам на основе ИИ. Официальные представители OpenAI и Microsoft отказались от комментариев по данному вопросу.

OpenAI сделала ChatGPT «более чётким и менее многословным», но только для платных пользователей

Компания OpenAI объявила о крупном обновлении ChatGPT, которое затронет пользователей всех платных версий популярного чат-бота — теперь они могут работать со свежей улучшенной версией нейросети GPT-4 Turbo. Напомним, что OpenAI предлагает три платных тарифа: ChatGPT Plus, Team или Enterprise.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Новая модель версии gpt-4-turbo-2024-04-09 улучшила способности в написании текстов и программного кода, решении математических задач и логических рассуждениях, кроме того, она получила более актуальную базу знаний. Нейросеть была обучена на общедоступных данных по состоянию на декабрь 2023 года — предыдущая версия GPT-4 Turbo, на которой работал ChatGPT, была ограничена апрелем 2023 года.

 Источник изображения: twitter.com/OpenAI

Источник изображения: twitter.com/OpenAI

«При написании [текстов] с помощью ChatGPT [с новым GPT-4 Turbo] ответы будут более чёткими, менее многословными и с бо́льшим использованием разговорного языка», — рассказала OpenAI в соцсети X. В минувший вторник компания также сделала доступными через API ряд новых моделей, включая нейросеть GPT-4 Turbo with Vision, которая в качестве запросов принимает не только текст, но и изображения.

 Источник изображения: twitter.com/OpenAI

Источник изображения: twitter.com/OpenAI

В остальном неделя для OpenAI выдалась непростой. Microsoft представила генератор изображений на базе OpenAI DALL-E в качестве инструмента для работы специалистов Вооружённых сил США, выяснило издание The Intercept. Сама же OpenAI уволила двух исследователей, в том числе соратника главного научного сотрудника компании Ильи Суцкевера (Ilya Sutskever), который был одним из инициаторов непродолжительного увольнения гендиректора Сэма Альтмана (Sam Altman), передаёт The Information.

Сэм Альтман формирует мировую коалицию для развития инфраструктуры для ИИ

Масштабы инициатив основателя OpenAI Сэма Альтмана (Sam Altman) уже перестают ограничиваться отдельными компаниями и государствами, он перемещается по миру, чтобы сформировать глобальную коалицию, направленную на развитие необходимой для систем искусственного интеллекта инфраструктуры. Помимо ОАЭ, предприниматель ведёт переговоры с представителями западных стран и непосредственно США.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Какую именно форму обретёт данная инициатива в дальнейшем, сказать сложно, но осведомлённые источники сообщили Bloomberg, что Альтман призывает предпринимателей и политических деятелей в разных частях планеты участвовать в создании дорогой и громоздкой инфраструктуры, способствующей более быстрому развитию систем искусственного интеллекта. Помимо развития производственных мощностей по выпуску компонентов, отрасли нужны новые центры обработки данных и источники электроэнергии. На этой неделе Альтман встретился с инвесторами и чиновниками из ОАЭ, ранее вёл переговоры с представителями ряда западных стран, а до конца недели должен принять участие в переговорах в Вашингтоне.

Ранее сообщалось, что Альтман вынашивает идею строительства десятков современных предприятий по выпуску чипов для ускорителей вычислений, и пытается привлечь к этому проекту средства инвесторов на Ближнем Востоке. Теперь он готов обсуждать и развитие сопутствующей инфраструктуры в виде центров обработки данных и электростанций, способных обеспечить их необходимым количеством энергии. Представители OpenAI ограничились обещанием предоставить более подробную информацию позже.

По мнению Альтмана, решить проблему энергоснабжения профильных центров обработки данных могли бы более дешёвые солнечные электростанции или источники энергии, использующие термоядерный синтез. Намеченная на ближайшие сутки встреча Альтмана с американскими чиновниками в Вашингтоне, как считается, будет посвящена обсуждению вопросов национальной безопасности и развития инфраструктуры, необходимой для сохранения лидерства США в сфере искусственного интеллекта. Американских чиновников также может беспокоить стремление Сэма Альтмана привлечь для решения существующих проблем средства арабских инвесторов.

OpenAI и Meta✴ разрабатывают модели ИИ, способные рассуждать и планировать

OpenAI и Meta приблизились к выпуску новых моделей искусственного интеллекта, которые, по их словам, будут способны рассуждать и планировать — это важные достижения на пути к созданию ИИ со сверхчеловеческим разумом. Об этом пишет Financial Times.

 Источник изображения: Kohji Asakawa / pixabay.com

Источник изображения: Kohji Asakawa / pixabay.com

Руководство компаний OpenAI и Meta доложило, что ведётся подготовка к выпуску больших языковых моделей нового поколения — систем, которые используются в приложениях генеративного ИИ, включая ChatGPT. Meta готовится выпустить Llama 3 в ближайшие недели, а новая модель OpenAI GPT-5 появится «скоро», пообещали в компании. «Мы усердно трудимся над тем, чтобы заставить эти модели не просто говорить, но также рассуждать, планировать, <..> запоминать», — сообщила вице-президент Meta по исследованиям в области ИИ Джоэль Пино (Joelle Pineau). О достижениях в этой области доложил и главный операционный директор OpenAI Брэд Лайткэп (Brad Lightcap): «Мы увидим ИИ, который сможет выполнять более сложные задачи более изощрёнными способами. Думаю, прикоснёмся к способности этих моделей рассуждать».

Проекты Meta и OpenAI последуют за волной больших языковых моделей, выпущенных в этом году Google, Anthropic и Cohere. Способности рассуждать и планировать — важные этапы на пути к созданию сильного ИИ (Artificial General Intelligence — AGI), обладающего сознанием на уровне человека. Выступая на мероприятии в Лондоне накануне, старший научный сотрудник Meta по ИИ Янн ЛеКун (Yann LeCun) сказал, что нынешние системы ИИ «выдают одно слово за другим, по-настоящему не задумываясь и не планируя». Им затруднительно отвечать на сложные вопросы или запоминать информацию надолго, и они всё равно «совершают глупые ошибки». Способность рассуждать будет значить, что модель ИИ «подыскивает возможные ответы», «планирует последовательность действий» и выстраивает «мысленную модель того, каким будет эффект [её] действий».

Для решения этой задачи он, в частности, разрабатывает «агенты» ИИ, способные распланировать путешествие из парижского в нью-йоркский офис с бронированием всех билетов, включая дорогу до аэропорта. В обозримом будущем Meta готовится выпустить линейку моделей Llama 3 в ассортименте версий для различных приложений и устройств — новые модели компания планирует внедрить в мессенджер WhatsApp и умные очки Ray-Ban. В Meta планируют увеличивать объёмы и сложность задач для ИИ, что потребует развития его способности рассуждать. Так, если камера очков Meta Ray-Ban увидит сломанную кофемашину, подключённый к ним ассистент на базе Llama 3 даст рекомендации по её починке. Человек будет всё чаще общаться с ИИ-помощниками, считает Янн ЛеКун.

OpenAI для обучения GPT-4 расшифровала миллионы видео с YouTube — текстов в интернете не хватило. Google тоже так делает

Несколько дней назад сообщалось, что разработчики ИИ столкнулись с нехваткой данных для обучения передовых моделей, в том числе о планах Open AI обучать GPT-5 на видео с YouTube. Согласно материалу The New York Times, в погоне за новыми данными корпорации забывают об этике и морали.

 Источник изображения: freepik.com

Источник изображения: freepik.com

К концу 2021 года OpenAI столкнулась с нехваткой авторитетных англоязычных текстов в интернете для обучения новейшей модели искусственного интеллекта — ей требовалось гораздо больше данных. Тогда разработчики OpenAI создали расшифровывающую аудиозаписи из видеороликов на YouTube систему распознавания речи Whisper, которая выдаёт текст для обучения ИИ. По словам нескольких сотрудников, в компании понимали, что такой шаг может противоречить правилам использования YouTube, запрещающим использовать видеоролики «независимо» от платформы. Это не остановило OpenAI, расшифровавшую более миллиона часов видеороликов с YouTube. Полученный текст использовался для обучения GPT-4 — одной из мощнейших систем искусственного интеллекта в основе последней версии ChatGPT. В исследовании The New York Times говорится, что в гонку за данными включились все передовые разработчики ИИ, включая OpenAI, Google и Meta, причём компании зачастую игнорируют корпоративные политики, а иногда и закон.

Разработчики ИИ всё сильнее упираются в нехватку материала. Передовые чат-боты обучались на массивах цифровых текстов объёмом до трёх триллионов слов, что примерно вдвое больше объёма материалов в Бодлианской библиотеке Оксфордского университета, в том числе датирующихся ещё 1602 годом. Наибольшую ценность для обучения ИИ представляют высококачественные данные из отредактированных профессионалами книг и статей. По данным исследовательского института Epoch, такие тексты могут закончиться уже в 2026 году.

«Единственный практический способ существования таких инструментов — обучение на огромных массивах информации без разрешения её создателей. Объём необходимых данных настолько велик, что не поможет даже коллективное лицензирование», — говорит представляющий интересы венчурной компании Andreessen Horowitz Сай Дамле (Sy Damle).

OpenAI, Google и Meta не скрывают, что их модели ИИ обучаются на открытых данных, однако не все создатели соответствующего контента приветствуют данную инициативу, что уже стало причиной множества судебных разбирательств. В прошлом сама The New York Times подавала в суд на OpenAI и Microsoft за то, что компании обучали чат-ботов на защищённых авторским правом материалах без разрешения владельцев. Тогда Microsoft и OpenAI заявили, что «добросовестно используют» материалы для создания собственных работ, что не запрещено законом об авторском праве.

 Джаред Каплан. Источник: physics-astronomy.jhu.edu

Джаред Каплан. Источник: physics-astronomy.jhu.edu

В январе 2020 года физик-теоретик из Университета Джонса Хопкинса Джаред Каплан (Jared Kaplan) опубликовал работу об ИИ, которая разожгла аппетиты их разработчиков. Он высказался однозначно: чем больше данных используется для обучения языковой модели, тем лучше она работает, подобно тому, как студенты получают всё больше знаний из прочитанных книг. Языковые модели могут устанавливать закономерности и взаимосвязи, что позволяет точнее обрабатывать новую информацию.

«Все сильно удивились, что эти тенденции, или законы масштабирования, как мы их называем, не менее точны, чем физические и астрономические», — говорит ныне работающий в Anthropic Каплан.

Разработчики ИИ уже давно используют огромные массивы публичных цифровых данных, в том числе статьи из «Википедии» и Common Crawl — базы данных из более чем 250 млрд интернет-страниц, собранных с 2007 года. Прежде чем «скормить» эти данные ИИ, их тщательно фильтровали на предмет «нежелательных» материалов. Объёмы необходимых для обучения ИИ в 2020 году данных сейчас кажутся смешными, ведь тогда массив из 30 тысяч картинок с Flickr казался огромным.

Создание вышедшей в ноябре 2020 года GPT-3 ознаменовало начало эры погони за новыми данными — модель обучали на 300 млрд «токенов», представляющих отдельные слова или их фрагменты. Обучившись на этих данных, система генерировала посты в блогах, стихи и даже писала программы. В 2022 году подразделение Google Deepmind протестировало 400 ИИ-моделей, меняя объём данных для обучения и другие факторы. Оказалось, что Каплан прав, и чем больше входящих данных, тем лучше работает ИИ. Гонка продолжается: в 2023 году китайцы представили обученную ни 3,2 триллионах английских и китайских лексем модель Skywork, а PaLM 2 от Google «поглотила» 3,6 триллиона токенов.

 Сэм Альтман. Источник изображения: wikipedia.org

Сэм Альтман. Источник изображения: wikipedia.org

Позднее Сэм Альтман (Sam Altman) из OpenAI заявил, что данные рано или поздно кончатся — он знает, о чём говорит, ведь компания годами собирала данные, обрабатывала и обучали на них ИИ. Среди использованных данных был программный код с GitHub, базы данных шахматных ходов, школьные тесты и домашние задания старшеклассников. К концу 2021 года они закончились. Помимо расшифровки аудио- и видеоматериалов, рассматривалась покупка компаний, имеющих доступ к огромным объёмам цифровых данных.

Некоторые сотрудники Google знали, что OpenAI расшифровывает видео с YouTube, но бездействовали, потому что этим же занималась сама Google, а это потенциально нарушало авторские права создателей видеороликов. Подняв шумиху вокруг OpenAI, Google рискует привлечь общественное внимание и к своим разработкам. Впрочем, представители Google говорят, что правила использования сервиса позволяют использовать данные YouTube для разработки новых функций видеоплатформы. Специализирующийся на интеллектуальной собственности юрист Berger Singerman Джеффри Лоттенберг (Geoffrey Lottenberg) отмечает, что в своих правилах Google использует крайне расплывчатые формулировки. И это сделано намеренно.

Google хотела обучать свои модели на открытых данных Google Docs, Google Sheets и других продуктов. В политике конфиденциальности Google говорилось, что компания может использовать публичные данные для обучения языковых моделей Google и других продуктов вроде Google Translate. Теперь же перечень продуктов помимо Google Translate содержит упоминания Bard и «облачных ИИ». Сотрудников компании специально проинструктировали выпустить новую редакцию политики конфиденциальности перед Днём независимости США, когда мысли людей заняты предстоящими праздниками.

 Марк Цукерберг. Источник изображения: профиль в ***

Марк Цукерберг. Источник изображения: профиль в Facebook

Глава Meta Марк Цукерберг (Mark Zuckerberg) годами развивал ИИ-направление, но выход ChatGPT в конце 2022 года оставил его компанию далеко позади. Трое бывших и нынешних сотрудников Meta рассказали, что стремясь догнать OpenAI, он день и ночь донимал менеджеров и ведущих инженеров, чтобы те как можно скорее выпустили конкурирующий продукт. Но как и все остальные, Meta упёрлась лбом в стену нехватки данных.

По словам вице-президента по генеративным ИИ Ахмада Аль-Дахле (Ahmad Al-Dahle), его команда использовала почти все доступные англоязычные книги, эссе, поэмы и новостные статьи в интернете для обучения собственной ИИ-модели. В конце концов, Аль-Дахле заявил, что Meta не превзойти ChatGPT без большего количества данных. К марту-апрелю 2023 года руководство Meta обсуждало эту проблему почти ежедневно. В частности, высказывалось предложение платить по $10 за полное лицензирование каждой книги или приобрести издательство Simon & Schuster, сотрудничающее со множеством авторов, среди которых, например, Стивен Кинг. Обсуждалась и возможность использования интернет-материалов без разрешения авторов, несмотря на возможные нарушения законов об авторском праве. Цукерберг требовал решить проблему немедленно, но инженеры компании заявили, что это невозможно.

 Ахмад Аль-Дахле. Источник изображения: профиль на LinkedIn

Ахмад Аль-Дахле. Источник изображения: профиль на LinkedIn

На одном из записанных совещаний руководства Meta говорилось, что компания наняла субподрядчиков из Африки для сбора защищённых авторским правом материалов. «Мы не можем не собирать их», — сказали на одном из таких совещаний. Кроме того, подчёркивалось, что OpenAI тоже не стесняется использовать защищённые авторским правом материалы без разрешения их владельцев, и получать эти разрешения «слишком долго».

Сэм Альтман предложил решить проблему с помощью «синтетических данных», то есть обучать языковые модели на материалах других языковых моделей. По его словам, раз уж ИИ научились писать человекоподобные тексты, последние можно использовать для дальнейшего развития LLM, что к тому же позволит снизить зависимость от защищённых законом авторских произведений. «Пока ваши модели достаточно продвинуты, чтобы создавать качественные синтетические данные, всё нормально», — сказал Альтман. Однако обучение на данных других ИИ тоже не панацея — большие языковые модели могут попасть в цикл обработки ошибочных данных и недостатков технологии, которые будут нарастать на каждом его витке.

«Обучать ИИ — всё равно что пробираться через джунгли. Если обучать ИИ на одних лишь синтетических данных, они заблудятся», — сказал по этому поводу бывший исследователь в OpenAI, а ныне преподаватель компьютерных наук в Университете Британской Колумбии Джефф Клун (Jeff Clune).

Глава YouTube предостерёг OpenAI от обучения ИИ на видео с платформы

С активным развитием технологий искусственного интеллекта особенно остро встал вопрос о том, на каких материалах можно обучать эти системы, и что делать с авторскими правами на эти материалы. Гендиректор YouTube отметил, что компании OpenAI не следует рассматривать платформу в качестве источника материалов для обучения ИИ.

 Источник изображения: Alexander Shatov / unsplash.com

Источник изображения: Alexander Shatov / unsplash.com

Крупные игроки в своих сферах, включая New York Times и Getty Images, уже инициировали судебные иски в отношении разработчиков ИИ; аналогичные меры приняли некоторые художники и писатели. Масла в огонь подлила в марте технический директор OpenAI Мира Мурати (Mira Murati). В интервью The Wall Street Journal она заявила, что не уверена, используются ли для генератора видео Sora материалы YouTube, Instagram или Facebook.

Это побудило главу YouTube Нила Мохана (Neal Mohan) отреагировать и чётко предупредить, что использование материалов крупнейшего в мире видеосервиса для обучения OpenAI Sora будет «явным нарушением» условий использования платформы. «С точки зрения автора, когда он загружает плоды своей нелёгкой работы на нашу платформу, у него есть определённые ожидания. Одно из таких ожиданий в том, что будут соблюдаться условия обслуживания. Они не позволяют скачивать расшифровки или фрагменты видео, и это явное нарушение условий обслуживания. Это [своего рода] правила дорожного движения на нашей платформе», — заявил гендиректор YouTube в интервью Bloomberg.

Чёткие сведения о том, на каких материалах OpenAI обучает ИИ для своих служб Sora, ChatGPT и DALL-E, отсутствуют до сих пор. Для обучения модели GPT-5 компания намеревается применять расшифровки видео YouTube. Google же, будучи владельцем YouTube и конкурентом OpenAI, уверяет, что соблюдает правила: обучение Gemini требует аналогичных данных, но, как заявил Нил Мохан, использует лишь определённые видео в зависимости от разрешений, предоставленных каждым автором.


window-new
Soft
Hard
Тренды 🔥
UserGate развернула облачный центр ИБ-мониторинга и анализа инцидентов 2 ч.
Российский «Яндекс» отчитался по результатам первого квартала 2024 года 3 ч.
Постъядерные каникулы: вышел новый трейлер амбициозного мода-долгостроя Fallout: Miami для Fallout 4 5 ч.
Обновлённый законопроект разрешит физлицам в РФ заниматься майнингом, но без фанатизма 6 ч.
Анонсирован VR-хоррор Alien: Rogue Incursion, который полностью погрузит игроков в ужасы вселенной «Чужого» 14 ч.
Российская пошаговая тактика «Спарта 2035» про элитных наёмников в Африке получила первый геймплей — демоверсия не выйдет 30 апреля 15 ч.
Власти США позвали Сэма Альтмана, Дженсена Хуанга и Сатью Наделлу помочь им с защитой от ИИ 17 ч.
«В команде явно продали души дьяволу»: игроков впечатлила работа Biomutant на Nintendo Switch, но производительность требует жертв 17 ч.
Microsoft открыла исходный код MS-DOS 4.00 и разместила его на GitHub 18 ч.
Большинство россиян не видит угрозы в ИИ 18 ч.