Компания анонсировала выпуск новой серии моделей искусственного интеллекта, которые акцентируют повышенное внимание на аналитических процессах перед тем, как сгенерировать ответ для пользователя. Эти модели совершенствуют свои когнитивные возможности, экспериментируют с разными стратегиями и обучаются на собственных ошибках.
В сферах физики, химии и биологии они продемонстрировали компетенцию, сопоставимую со знаниями аспирантов. На отборочном этапе Международной математической олимпиады (IMO) новейшая модель, специализирующаяся на логических рассуждениях, успешно решила 83% задач, тогда как GPT-4o справился только с 13%.
Диаграммы, расположенные горизонтально, демонстрируют результаты тестирования по математике, программированию и научным дисциплинам на уровне аспирантуры. Вертикальная ось показывает точность решений. Источник: OpenAI.
По данным OpenAI, GPT-4o лучше себя проявляет в выполнении повседневных задач благодаря обширным знаниям. Однако при столкновении со сложными вызовами рекомендовано использовать новые модели. Они могут быть задействованы, например, для аннотирования медицинских данных или разработки формул в квантовой оптике. Кроме того, они сильно упрощают сложное программирование и отладку кода.
Также компания представила облегчённую и более экономичную версию модели o1 — o1-mini, с контекстным окном на 128 тысяч токенов. Эти версии не поддерживают работу с файлами и изображениями и не выполняют интернет-поиск, однако это ограничение может носить временный характер.
Пользователи подписок ChatGPT Plus и ChatGPT Team смогут протестировать o1 и o1-mini, начиная с 12 сентября 2024 года, с лимитом на 30 и 50 взаимодействий соответственно. Для подписчиков пакетов Enterprise и Edu доступ откроется с 16 сентября. Разработчики пятой группы, совершившие затраты более $1000, смогут испытать модели через API с ограничением 20 запросов в минуту.
В перспективе компания стремится снять эти ограничения и сделать o1-mini доступной для всех пользователей бесплатной версии ChatGPT, хотя сроки этого шага ещё не объявлены.
Стоимость использования o1-preview составляет $15 за миллион входных токенов и $60 за выходные. Для o1-mini стоимость составляет $3 и $12 соответственно.
Ведущий канала Epsilon Correct привел примеры сложных задач, которые пока находятся за горизонтом возможностей текущих моделей.
В сферах физики, химии и биологии они продемонстрировали компетенцию, сопоставимую со знаниями аспирантов. На отборочном этапе Международной математической олимпиады (IMO) новейшая модель, специализирующаяся на логических рассуждениях, успешно решила 83% задач, тогда как GPT-4o справился только с 13%.
Диаграммы, расположенные горизонтально, демонстрируют результаты тестирования по математике, программированию и научным дисциплинам на уровне аспирантуры. Вертикальная ось показывает точность решений. Источник: OpenAI.
По данным OpenAI, GPT-4o лучше себя проявляет в выполнении повседневных задач благодаря обширным знаниям. Однако при столкновении со сложными вызовами рекомендовано использовать новые модели. Они могут быть задействованы, например, для аннотирования медицинских данных или разработки формул в квантовой оптике. Кроме того, они сильно упрощают сложное программирование и отладку кода.
Также компания представила облегчённую и более экономичную версию модели o1 — o1-mini, с контекстным окном на 128 тысяч токенов. Эти версии не поддерживают работу с файлами и изображениями и не выполняют интернет-поиск, однако это ограничение может носить временный характер.
Пользователи подписок ChatGPT Plus и ChatGPT Team смогут протестировать o1 и o1-mini, начиная с 12 сентября 2024 года, с лимитом на 30 и 50 взаимодействий соответственно. Для подписчиков пакетов Enterprise и Edu доступ откроется с 16 сентября. Разработчики пятой группы, совершившие затраты более $1000, смогут испытать модели через API с ограничением 20 запросов в минуту.
В перспективе компания стремится снять эти ограничения и сделать o1-mini доступной для всех пользователей бесплатной версии ChatGPT, хотя сроки этого шага ещё не объявлены.
Стоимость использования o1-preview составляет $15 за миллион входных токенов и $60 за выходные. Для o1-mini стоимость составляет $3 и $12 соответственно.
Ведущий канала Epsilon Correct привел примеры сложных задач, которые пока находятся за горизонтом возможностей текущих моделей.