YandexGPT

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
YandexGPT
Тип Большая языковая модель
Разработчик Яндекс
Первый выпуск 17 мая 2023 года
Последняя версия 4 (24 октября 2024)
Состояние функционирует
Сайт ya.ru/ai/gpt-3

YandexGPT — нейросеть семейства GPT от компании «Яндекс», которая может создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем.

Для обучения YandexGPT используется датасет, включающий в себя информацию из книг, журналов, газет и других открытых источников из интернета[1]. Нейросеть может ошибаться в фактах и фантазировать, однако по мере обучения будет выдавать всё более точные ответы.

Использование YandexGPT

[править | править код]

YandexGPT — технология, которая используется в различных продуктах для решения разных задач. Нейросеть интегрирована в виртуального помощника «Алису» и доступна в приложениях «Яндекс» и «Яндекс Старт», в «Яндекс Браузере», «Яндекс Станциях», а также в умных телевизорах с «Алисой».

YandexGPT работает на главной странице «Яндекса», в «Поиске»[2], «Маркете», «Лавке»[3], «Практикуме», «Учебнике», «Авто.ру» и других сервисах компании. Компания даёт бизнесу доступ к API нейросети через Yandex Cloud и разрабатывает собственные В2В-решения на её основе.

С июля 2023 года 800 компаний приняли участие в закрытом тестировании YandexGPT[4]. ИТ‑разработчики, банки, ритейл и компании других отраслей могут использовать технологию в двух режимах: API и Playground (интерфейс в консоли Yandex Cloud для тестирования модели и проверки гипотез)[5].

Бизнесу доступны две версии модели: одна работает в асинхронном режиме и лучше справляется с решением сложных задач, а вторая подходит для создания быстрых ответов в режиме реального времени. В результате YandexGPT испытали в десятках сценариев: для контентных задач, техподдержки, создания чат‑ботов, виртуальных ассистентов и т. д.

В июне 2024 года с помощью YandexGPT был улучшен машинный перевод в «Яндекс Переводчике», «Поиске» и в переводе видео в «Яндекс Браузере»[6].

В феврале 2023 года «Яндекс» сообщил, что разрабатывает собственную версию генеративной нейросети ChatGPT в рамках развития языковой модели из семейства YaLM (Yet another Language Model)[7]. Проект получил предварительное название YaLM 2.0, которое впоследствии поменяли на YandexGPT.

17 мая компания представила нейросеть под названием YandexGPT (YaGPT), добавив в своего виртуального ассистента «Алису» специальный навык, позволяющий взаимодействовать с новой языковой моделью[8].

5 июня 2023 года в пресс-службе «Яндекса» сообщили, что нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы[9].

15 июня 2023 года «Яндекс» добавил языковую модель YandexGPT в приложение для генерации изображений «Шедеврум»[10]. Благодаря этому его пользователи получили возможность создавать содержательные посты с текстом, заголовком и подходящей по смыслу иллюстрацией[11].

27 июня в «Яндексе» сообщили, что нейросеть научилась тезисно пересказывать статьи из интернета. Функция работает с русскоязычными текстами и статьями из интернета объёмом до 30 тысяч знаков[12].

В июле 2023 года нейросеть YandexGPT стала доступна бизнесу для создания виртуальных ассистентов и чат-ботов, а также генерирования и структурирования текстовой информации.

7 сентября 2023 года «Яндекс» представил на конференции Practical ML Conf новую версию языковой модели — YandexGPT 2[13]. По сравнению с предыдущей она способна решать больше видов задач, при этом качество её ответов улучшилось[14]. По утверждению разработчиков, YandexGPT 2 отвечает на запросы пользователей лучше первой версии нейросети в 67 % случаев[15].

14 сентября 2023 года «Яндекс» начал тестировать YandexGPT для создания быстрых ответов на запросы в «Поиске»[16]. Нейросеть в режиме реального времени находит несколько самых подходящих источников по запросу пользователя, делает краткую выжимку каждого из них, а затем выбирает наиболее полезный ответ из получившихся. Он отображается под поисковой строкой вместе со ссылкой на источник.

С 6 октября 2023 года YandexGPT может создавать краткие пересказы русскоязычных видеороликов в интернете[17]. Она обобщает видео длиной от двух минут до четырёх часов, в которых есть речь[18].

В декабре 2023 года Яндекс Казахстан открыл доступ к YandexGPT API для казахстанских компаний[19].

28 марта 2024 года Yandex запустил третье поколение нейросетей YandexGPT. Первая версия — YandexGPT 3 Pro предназначена для бизнеса и доступна пользователям Yandex Cloud[20]. По словам разработчиков, на тестах YandexGPT 3 Pro в среднем отвечает лучше, чем YandexGPT 2 в 67 % случаев, а при работе с простыми пользовательскими запросами её результаты оказались выше на 69 %[21].

28 мая 2024 года вышло третье поколение облегчённой версии нейросети YandexGPT Lite[22].

24 октября 2024 года появилось четвёртое поколение нейросети — YandexGPT 4, включающее облегчённую модель Lite и мощную Pro[23].

16 апреля 2024 года Яндекс представил сервис «Нейро», он объединяет в себе возможности традиционных поисковых технологий и больших языковых генеративных моделей. В «Нейро» пользователь может задать системе любой вопрос простыми словами, YandexGPT 3 проанализирует поисковую выдачу Яндекса по запросу и объединит найденную информацию в одном сообщении со ссылками на источники. Взаимодействие с сервисом ведется в формате диалога, заданный ранее вопрос можно уточнить, а так же его можно дополнить картинкой[24][25].

Обучение Yandex GPT

[править | править код]

Обучение проходит в несколько этапов:

1. Pretraining. Модель учит структуру языка и запоминает факты о мире. Ей подаются в обучение терабайты текста из интернета, книг и других общедоступных источников, отобранные с помощью поисковых моделей «Яндекса» и разбитые на небольшие фрагменты (токены)[26].

2. Fine-tuning. Эксперты оптимизируют миллиарды параметров модели, собирая большой датасет из сотен тысяч примеров максимально разнообразных задач с хорошими ответами.

Созданием качественных обучающих примеров занимаются AI-тренеры «Яндекса»[27]. Это эксперты широкого круга гуманитарных профессий: журналисты, педагоги, филологи, редакторы, социологи, психологи, филологи[28]. «Яндекс» стал первой в России компанией, которая начала нанимать и обучать таких специалистов.

3. Продуктовые доработки. Модели придают «человеческий характер», чтобы она могла отвечать на вопросы о себе и была более живой в общении[26].

Для обучения YandexGPT используются суперкомпьютеры «Яндекса»[29].

Возможности

[править | править код]

В октябре 2023 года YandexGPT 2 смогла сдать ЕГЭ по литературе на 55 баллов[30]. При этом минимальный порог, необходимый для поступления в вуз, — 40 баллов. Это первый случай в России, когда искусственный интеллект успешно справился с ЕГЭ, ответив не только на вопросы тестов, но и выполнив творческие задания[31].

В мае 2024 года заместитель председателя Совета безопасности Дмитрий Медведев раскритиковал в своем телеграм-канале нейросеть YandexGPT, на основе которой работает виртуальный помощник «Алиса». По словам зампреда Совбеза[32], разработанный компанией искусственный интеллект не даёт ответы на «нейтральные» вопросы, косвенно связанные с политикой. Медведев счёл, что такой подход «подрывает доверие» к «Яндексу». В самой компании не стали комментировать высказывания политика[33]. Нейросеть YandexGPT не готова разговаривать об Украине, о вторжении России на Украину, статусе Крыма, ДНР и ЛНР. Нейросеть также не готова разговаривать о марксизме, Владимире Путине, Александре Лукашенко, Владимире Зеленском, Михаиле Саакашвили, Юлии Навальной и рассказывать какие-либо сведения из их биографии[34]. Подвержена цензуре тема памятников Степану Бандере[34].

Примечания

[править | править код]
  1. Нейросеть Яндекса YandexGPT: что это, возможности, как пользоваться. РБК Тренды. Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  2. «Яндекс» открыл доступ к тестированию быстрых ответов YandexGPT в «Поиске». Хабр (14 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  3. YandexGPT поможет «Лавке» заполнять карточки товаров по фото этикеток. Хабр (12 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  4. Кейсы с YandexGPT, data-оркестр или бессерверный пайплайн: выбираем самое интересное с Yandex Scale’23. Хабр (29 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  5. «Яндекс» предоставил компаниям доступ к YandexGPT. Коммерсантъ (19 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 29 июня 2023 года.
  6. Гормалева, Наталья «Яндекс» улучшил качество машинного перевода с помощью YandexGPT. rb.ru (7 июня 2024). Дата обращения: 10 июля 2024.
  7. Кодачигов, Валерий Найдется что: «Яндекс» запустит для поисковика сверхсовременную нейросеть. Известия (1 февраля 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  8. «Яндекс» добавил в «Алису» генеративную нейросеть YandexGPT. Forbes.ru (17 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  9. "Нейросеть YandexGPT научилась запоминать контекст диалога". Ведомости. Архивировано 10 июня 2023. Дата обращения: 29 декабря 2023.
  10. «Яндекс» добавил в «Шедеврум» нейросеть YandexGPT для генерации текста. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  11. Яндекс встроил нейросеть YandexGPT в приложение Шедеврум. Российская газета (15 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 17 июня 2023 года.
  12. YandexGPT теперь может кратко пересказать текст. Коммерсантъ (27 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 27 июня 2023 года.
  13. "Яндекс" запустил YandexGPT 2. ТАСС. Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  14. Вышла новая версия нейросети от Яндекс — YandexGPT 2. Компьютерра (8 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 13 октября 2023 года.
  15. «Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 28 октября 2023 года.
  16. «Яндекс» начал тестировать быстрые ответы YandexGPT. Сноб (14 сентября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  17. В "Яндекс.Браузере" появилась функция пересказа видео. ТАСС (6 октября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  18. Нейросеть "Яндекса" научилась кратко пересказывать видеоролики. Российская газета (6 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 6 января 2024 года.
  19. tengrinews.kz Яндекс Казахстан открывает доступ к YandexGPT API для казахстанских компаний. Главные новости Казахстана - Tengrinews.kz (7 декабря 2023). Дата обращения: 10 июля 2024.
  20. «Яндекс» представил третье поколение нейросетей YandexGPT. РБК (28 марта 2023). Дата обращения: 30 марта 2023.
  21. 3DNews Daily Digital Digest. Яндекс представил третье поколение нейросетей YandexGPT (28 марта 2024). Дата обращения: 11 апреля 2024.
  22. «Яндекс» запустил третье поколение YandexGPT Lite. Коммерсантъ (28 мая 2024). Дата обращения: 29 мая 2023.
  23. «Яндекс» представил новую версию языковой модели YandexGPT 4 с рассуждениями. Коммерсантъ (24 октября 2024). Дата обращения: 28 октября 2023.
  24. «Яндекс» представил поисковый ИИ-сервис «Нейро». www.sostav.ru. Дата обращения: 2 сентября 2024.
  25. Сидоров, Илья Яндекс представил Нейро. Это поиск с искусственным интеллектом, который сам отвечает на любые вопросы. iPhones.ru — Новости высоких технологий, обзоры смартфонов, презентации Apple (16 апреля 2024). Дата обращения: 2 сентября 2024.
  26. 1 2 YandexGPT в Алисе: как мы создаём языковую модель нового поколения. Хабр (5 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 5 января 2024 года.
  27. СМИ: «Яндекс» начал нанимать гуманитариев для обучения своей нейросети YaLM 2.0. Хабр (19 апреля 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  28. Нейросеть YandexGPT подключили к виртуальному помощнику "Алиса". Какое будущее ждет искусственный интеллект в России. Российская газета (18 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  29. YandexGPT научилась создавать тексты в режиме реального времени. ТАСС. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  30. BFM.ru Нейросеть YandexGPT смогла сдать ЕГЭ по литературе. BFM.ru - деловой портал. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  31. Нейросеть Яндекса YandexGPT 2 смогла получить проходной балл ЕГЭ по литературе. Код Дурова (12 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  32. Медведев раскритиковал «Яндекс» из-за ответов «Алисы». Коммерсантъ (19 мая 2024). Дата обращения: 21 мая 2024.
  33. Музычук, Анастасия «Яндекс» отказался комментировать претензии Медведева из-за «дурки» от «Алисы». RTVI (19 мая 2024). Дата обращения: 21 мая 2024.
  34. 1 2 "Дмитрия Медведева взбесило, что YandexGPT не хочет рассказывать про Бандеру Знал бы он, о чем еще умалчивают нейросети «Яндекса» и «Сбера» (иногда они даже забывают, что сам Медведев был президентом) — Meduza". Meduza. Дата обращения: 21 мая 2024.