Головна
Техно
Anthropic запускає Claude Opus 4.5 із рекордними 80,9% у SWE‑Bench

Anthropic запускає Claude Opus 4.5 із рекордними 80,9% у SWE‑Bench

Роман СичТехно25 Листопада 2025496 переглядів

Anthropic офіційно представила Claude Opus 4.5, нову гібридну модель штучного інтелекту, призначену для кодування, агентської роботи та використання комп’ютера. Версія вже доступна через API Anthropic, у додатках Claude та на популярних хмарних платформах: Amazon Web Services, Google Cloud та Microsoft Azure, пише IZ посилаючись на Mobidevices.

Opus 4.5 має значні покращення в плануванні, довготривалій пам’яті й ефективності використання токенів. Для виконання складних багаторівневих завдань модель використовує до 65% менше токенів, ніж попередні версії.

У новій версії розширено контекстне вікно до 200 000 токенів, що дозволяє моделі працювати з дуже довгими бесідами та складними задачами. Крім того, впроваджено автоматичне ущільнення контексту: коли модель досягає ліміту, вона стискає попередній контекст, щоб продовжити спілкування без переривання.

За результатами компанії, Claude Opus 4.5 досяг 80,9% на тесті SWE-Bench Verified, що є рекордним показником серед моделей Anthropic. У тесті OSWorld, який оцінює здатність моделі імітувати роботу з операційною системою, Opus 4.5 показала 66,3%.

Anthropic повідомляє про значні поліпшення в агентському використанні: модель ефективно координує підагентів, здатна формулювати плани, ставити уточнюючі запитання, а потім будувати повний план дій перед виконанням коду.

Компанія презентувала оновлений Claude Code для десктопу (Windows, macOS, ARM64). У ньому доступні декілька паралельних сесій, режим “Plan Mode” з плануванням і виконанням, а також можливість створювати файл плану для редагування користувачем перед запуском.

Нові інтеграції — Claude для Chrome і Claude для Excel — також виходять з оновленням. Розширення для Chrome буде доступне для користувачів із планом Max, а Excel-версія — для Max, Team і Enterprise-користувачів.

Ці оновлення супроводжуються змінами у тарифах: використання Opus 4.5 стартує з $5 за мільйон вхідних токенів та $25 за мільйон вихідних, із можливістю знижки до 90% через кешування запитів і до 50% при пакетній обробці.

Компанія також повідомляє про ослаблення обмежень на використання Opus: «кепки» (caps) для Opus 4.5 були прибрані, і користувачі можуть використовувати її в межах загального ліміту, тоді як окремо встановлено ліміт для моделі Sonnet.

Щодо безпеки, Anthropic запевняє, що провела широкі тестування зі зовнішніми експертами, щоб переконатися, що Opus 4.5 відповідає стандартам безпеки, надійності та етики.

Читайте також про те, що Ілон Маск показав відео з Tesla Optimus у ролях різних професій та зробив заяву щодо своїх намірів.