Новости GPT-5: самая безопасная, умная и масштабируемая модель от OpenAI

vaspvort

Ночной дозор
Команда форума
Модератор
ПРОВЕРЕННЫЙ ПРОДАВЕЦ
Private Club
Migalki Club
Старожил
Меценат💎
Регистрация
10/4/18
Сообщения
6.234
Репутация
11.188
Реакции
17.598
USD
0
Сделок через гаранта
18
7 августа 2025 года OpenAI официально представила GPT‑5 — новую масштабную языковую модель, которая сочетает инженерную устойчивость, мультифункциональность и управляемость. В отличие от предыдущих релизов, GPT‑5 — это не одна модель, а интегрированная система с динамической маршрутизацией, многоступенчатой безопасностью и адаптацией под конкретные задачи. Модель создавалась не просто для улучшения результатов на бенчмарках, а для решения задач в бизнесе, науке, программировании и здравоохранении.

a77242274839a9656569b49b4b07f861.jpg

GPT‑5 — это семейство моделей, различающихся по скорости и глубине анализа:

Название​
Назначение​
gpt-5-main​
Стандартная быстрая модель​
gpt-5-main-mini​
Упрощённая и ещё более быстрая​
gpt-5-thinking​
«Размышляющая» модель для сложных задач​
gpt-5-thinking-pro​
Ускоренная reasoning-модель с параллельной обработкой​
gpt-5-thinking-nano​
Компактная reasoning-модель для разработчиков​
Модель выбирается автоматически: встроенный роутер анализирует тип запроса и выбирает подходящий вариант. Эта архитектура улучшает не только точность, но и эффективность работы ChatGPT.

Доступность и лицензирование​

GPT‑5 уже доступна в ChatGPT:

Тип аккаунта​
Что доступно​
Pro / Plus / Team / Free​
GPT‑5 с роутингом, reasoning частично​
Enterprise / Edu​
Доступ открывается в течение недели​
Pro-подписчики​
Неограниченный доступ к GPT‑5 и GPT‑5 Pro​
Также GPT‑5 можно использовать в Codex CLI без отдельной оплаты за API — достаточно зайти через ChatGPT. Это открывает путь к работе с кодом и shell-командами в терминале.

🔁 Бесплатные пользователи получают доступ к reasoning примерно на 2–3 дня в неделю. После превышения лимита запросы перенаправляются на gpt-5-mini.

Ключевые метрики производительности​

Точность
На реальных запросах ChatGPT (production prompts):
  • На 65% меньше галлюцинаций у gpt-5-thinking по сравнению с OpenAI o3;
  • На 44% меньше серьёзных ошибок у gpt-5-main по сравнению с GPT‑4o;
  • В задачах с медицинским риском ошибки снижены в 50 раз (данные HealthBench).
Безопасность
GPT‑5 реализует метод Safe Completions — отказ от бинарной логики «разрешено/запрещено» в пользу оценки результата и предоставления безопасного, но полезного ответа, особенно в так называемых dual-use сценариях (биология, кибербезопасность, химия).
Dual-use prompts — запросы, которые могут иметь как безвредные, так и потенциально вредные применения (например, описание биологического эксперимента).
Примеры защиты:
Категория​
gpt-5-thinking​
GPT‑4o​
Устойчивость к джейлбрейкам​
99.9%​
95.5%​
Отказ от самоповреждающего контента​
95.5%​
84.9%​
Снижение лести (sycophancy)​
–75%​
—​
На тестирование безопасности потратили более 9 тыс. часов — модель получила статус высокого риска по вопросам био- и химической безопасности, но она все равно безопаснее аналогов.
При «небезопасном» запросе модель не просто уйдет в отказ, а обоснованно объяснит пользователю, что не так с задачей.
5aa0fdb22b4f58e1e432b4ada14624e7.png

GPT‑5 обеспечивает большую отдачу при меньшем времени на обдумывание. По нашим оценкам, GPT‑5 (с мышлением) работает лучше, чем OpenAI o3, на 50-80% сокращая количество выходных токенов по всем возможностям, включая визуальное мышление, агентное кодирование и решение научных задач на уровне выпускника.

6457b54712e3a0e3d9ce3ed0ae5c0b69.png

Возможности GPT‑5 в программировании​

Одно из ключевых направлений применения GPT‑5 — это программирование и автоматизация инженерных задач. Благодаря улучшенной архитектуре reasoning и поддержке инструментов, модель уверенно справляется с генерацией, отладкой и анализом кода в реальных условиях. Сейчас это лучшая модель для кодинга, создающая сложные приложения за один промпт, аккуратно и автономно работающая с инструментами и файлами. Не теряется в длинном контексте.

GPT‑5 полностью интегрирована в Codex CLI — инструмент, позволяющий использовать возможности модели в терминале. Пользователи ChatGPT с подпиской Plus, Pro или Team могут запускать Codex CLI без дополнительной платы за API.

Сценарии применения:

  • генерация скриптов и CLI-команд;
  • деплой и автоматизация процессов;
  • отладка кода и исправление ошибок;
  • написание автотестов;
  • анализ логов и поведение систем.
Codex CLI — это расширение ChatGPT, позволяющее использовать языковую модель как интерактивного ассистента в командной строке. Она объединяет ИИ с привычной оболочкой разработчика — без необходимости переключаться между окнами.
OpenAI также протестировала GPT‑5 в условиях задач типа Capture the Flag (CTF) — это тесты на проникновение, реверс-инжиниринг, криптоанализ и эксплуатацию уязвимостей. Модель показала стабильные результаты, сравнимые с GPT‑4.5, но с значительно более высоким уровнем безопасности и фильтрации вредных действий.

GPT‑5 не допускает генерации инструкций по созданию вредоносных скриптов, обходит провокационные запросы и не вовлекается в обсуждение эксплойтов — даже если они завуалированы.

Модель натренирована не просто писать код, а писать как персоналия - она учтет стиль кода в котором он написан и будет генерировать код в таком же стиле.

Особый уклон модели к ее "сдерживанию" (Containment)​

С учётом растущих способностей GPT‑5, особенно в чувствительных областях (биология, химия, программирование), OpenAI внедрила жесткую систему сдерживания. Модель GPT‑5 Thinking официально отнесена к категории High Capability — то есть, обладающей потенциальным риском при злоупотреблении.

Применены следующие уровни защиты:

  1. Техническое сдерживание — фильтрация вредоносных токенов, распознавание опасных цепочек рассуждений, запрет на вывод чувствительных инструкций;
  2. Политическое сдерживание — доступ к API предоставляется только через закрытую Trusted Access Program;
  3. Системное сдерживание — модели физически ограничены в генерации информации, касающейся синтеза ядов, вирусов, опасных веществ;
  4. Редтиминг — более 400 независимых специалистов провели свыше 9000 часов тестирования модели в условиях вредоносных сценариев.

GPT‑5 в корпоративной практике​

Одним из ключевых отличий GPT‑5 от предыдущих поколений моделей OpenAI является её готовность к производственному применению в масштабах крупного бизнеса. Модель не просто «общается» или помогает решать задачки, а встраивается в операционные процессы, снижает издержки, ускоряет анализ и улучшает принятие решений. Это подтверждается реальными кейсами внедрения в международных компаниях.

Примеры использования GPT‑5 в бизнесе​

Компания​
Отрасль​
Применение GPT‑5​
Amgen
Биотехнологии​
Поддержка научных исследований, анализ публикаций, биоинформатика​
Moderna
Фармацевтика​
Подготовка медицинской документации, поиск клинических решений​
BBVA
Финансовые услуги​
Создание внутренних ассистентов, генерация отчётов, поддержка аналитиков​
Uber
Технологии / Логистика​
Автоматизация внутренней документации, генерация корпоративных инструкций​
Lowe’s
Ритейл​
Поддержка команд HR, Legal, IT, маркетинга: автоматизация шаблонов, генерация контента​
Salesforce
SaaS / CRM​
Интеграция в продукты для клиентов, генерация кастомных бизнес-отчётов​
PwC
Консалтинг​
Анализ документов, автоматизация рутинной аналитики для клиентов​

Что конкретно делает GPT‑5 внутри компаний?​

  1. Автоматизация рутинных задач
    Генерация справок, служебных записок, отчётов, внутренних инструкций, стандартных ответов.
  2. Помощь в принятии решений
    Модель обучена reasoning-подходу и может анализировать контекст задач, строить логические выводы и предлагать обоснованные рекомендации (например, на базе юридических текстов или финансовых отчётов).
  3. Инструмент разработчика и аналитика
    Генерация SQL-запросов, преобразование данных, написание unit-тестов, проверка кодовой базы, помощь в CI/CD.
  4. Обработка естественного языка
    GPT‑5 переводит сложные документы (например, юридические, технические) на понятный язык для сотрудников или клиентов.
  5. Работа с большим объёмом данных
    Модель может обрабатывать, структурировать и суммировать десятки документов, табличных отчётов, email-цепочек и других входов в формате RAG (retrieval-augmented generation).

Почему GPT‑5 применим в enterprise-сценариях?​

Критерий​
Что реализовано в GPT‑5​
Надёжность reasoning
Модель рассуждает, а не просто подбирает вероятный ответ​
Контроль и безопасность
Сдерживание, отказ от генерации опасного контента, аудит​
Масштабируемость
Поддержка десятков тысяч пользователей в одной организации​
Инструменты командной работы
ChatGPT for Teams, управление доступами, админ-панель​
Интернационализация
Поддержка 13+ языков, адаптация под локальные рынки​
По данным OpenAI, свыше 5 миллионов рабочих команд уже используют GPT‑5 в рамках подписки ChatGPT Business.

Корпоративный доступ и условия​

GPT‑5 доступен в следующих тарифах:

Подписка​
Возможности​
ChatGPT Team
Общий доступ для команд, единая оплата, политика безопасности​
ChatGPT Enterprise
Расширенные лимиты, кастомизация, API-интеграция, SOC 2​
Codex CLI
Без отдельной оплаты за API, работает в терминале разработчика​
В ближайшие недели планируется открытие доступа к GPT‑5 Pro и reasoning-функционалу для командных и корпоративных пользователей через админ-консоль с логами, лимитами и аналитикой использования.

Как GPT-5 решает Bernoulli effect?​

Bernoulli effect в контексте LLM (а не физики) — это наименование проблемы случайного маршрута в генерации ответа. Термин заимствован метафорически из теории вероятностей: как монета (или распределение Бернулли) даёт 0 или 1 случайным образом, так и языковая модель выбирает путь рассуждения, не всегда оптимальный.

  • В больших языковых моделях типа GPT‑4 и GPT‑5 возможен разный порядок мышления (chain-of-thought) для одного и того же запроса;
  • Если модель выбирает неудачную траекторию reasoning (логическую цепочку), итоговый ответ может оказаться ошибочным, неуверенным или галлюциногенным;
  • Это особенно критично в задачах с единственным правильным ответом — например, в программировании, математике, медицине.
Пример: если попросить модель решить задачу на логику, она может пойти по верной цепочке, но случайно пропустить шаг или выбрать менее надёжный маршрут, потому что в выборке он встречался чаще. Это и есть проявление эффекта Бернулли.

GPT‑5 внедряет структурные и методологические изменения, чтобы снизить влияние Bernoulli effect:

1. Dynamic Model Routing (Динамическая маршрутизация)​

GPT‑5 — это не одна модель, а семейство моделей, включая:

  • gpt-5-main — базовая быстрая модель;
  • gpt-5-thinking — reasoning-ориентированная;
  • gpt-5-thinking-pro — с параллельной логикой;
  • gpt-5-mini — для ограниченного reasoning в бесплатном доступе.
Как это помогает?

Модель-роутер анализирует тип задачи, её сложность и необходимую глубину и направляет запрос не в случайную цепочку reasoning, а в оптимальную модель. Это уменьшает вероятность «соскальзывания» в неэффективное рассуждение.

2. Parallel Thought Sampling в GPT‑5 Pro​

GPT‑5 Pro использует технику одновременного запуска нескольких reasoning-путей и выбора наилучшего результата. Это:

  • уменьшает зависимость от начального случайного выбора;
  • снижает variance между ответами;
  • позволяет системе выбрать путь с наибольшей логической достоверностью.
По данным OpenAI, GPT‑5 Pro при тестировании на более чем 1000 задач показала на 22% меньше критических ошибок по сравнению с обычной reasoning-моделью.

3. Chain-of-Thought Validation​

В GPT‑5 применяется верификация логических цепочек рассуждения перед финальной генерацией. Это позволяет:

  • сравнивать несколько рассуждений между собой;
  • отбрасывать слабые или противоречивые;
  • фиксировать потенциальные нарушения политики (например, побочные harmful reasoning paths).
Эта техника реализует не только безопасность, но и устойчивость reasoning — то есть, один и тот же запрос приводит к стабильно точным ответам, что критически важно в профессиональных сценариях.

4. RLHF с контекстной оценкой reasoning​

GPT‑5 обучалась с помощью обратной связи от человека (RLHF) с прицелом на неправильные reasoning-пути, а не только на итоговые ответы. В том числе:

  • обучающие аннотаторы помечали не просто правильный ответ, а хорошую траекторию рассуждений;
  • система училась избегать типичных логических ловушек (логических shortcut'ов и шаблонов);
  • отбирались предпочтительные reasoning-последовательности на этапе обучения.
Показатель​
GPT‑5 Thinking​
GPT‑5 Pro​
GPT‑4o​
Предпочтение reasoning-ответов (экспертами)​
—​
67.8%
—​
Уменьшение ошибок reasoning​
—​
–22%​
—​
Снижение variance в ответах​
Среднее​
Низкое​
Высокое​

СТОИМОСТЬ​

Длинный контекст показывает заметно лучшие результаты по сравнению с предыдущими моделями компании. К тому же его увеличили до 400 тысяч токенов. При этом стоимость очень демократичная — всего $1.25 за миллион входных токенов и $10 за миллион выходных.

2a72a99e4722779100ce2bd3467d8229.jpeg


GPT‑5 — первая модель от OpenAI, которая выглядит не как эксперимент, а как готовая к масштабному внедрению платформа для бизнеса, образования и науки. Он:

  • Мультимодален
  • Интегрирован в продуктивные сценарии
  • Предельно точен, особенно в медицине, науке, программировании
  • Безопасен и этически контролируем
На LMArena моделька первая во всех категориях с устойчивым отрывом и обучена на знаниях до октября 2024, то есть одна из самых современных моделей, которая уже многое знает про прогресс последних лет. Все бенчмарки можно найти на середине

 
  • Теги
    gpt5 openai
  • Назад
    Сверху Снизу