

Компанія Anthropic нещодавно запустила свою найновішу маленьку, але потужну модель під назвою Haiku 4.5. Ця модель обіцяє бути швидшою та розумнішою за Sonnet 4, тож, звісно, мені було цікаво подивитися, як вона порівнюється з ChatGPT-5 у серії з семи реальних тестів. У цьому поєдинку між ChatGPT-5 та Claude Haiku 4.5 я випробував обидві моделі на різноманітному наборі з семи запитів, розроблених для перевірки логіки, міркування, креативності, емоційного інтелекту та дотримання інструкцій. Від алгебраїчних задач про потяги до поетичних сцен із роботами — кожне завдання виявило, наскільки по-різному ці дві моделі штучного інтелекту «мислять». Виявилося захоплююче розділення між точністю та особистістю; ChatGPT часто вирізнявся структурою та ясністю, тоді як Claude вразив емоційною глибиною та сенсорною деталізацією. 1. Логіка та міркування Підказка: Потяг вирушає з Чикаго о 14:00 зі швидкістю 60 миль/годину. Інший вирушає з Нью-Йорка об 15:00, зі швидкістю 75 миль/годину у напрямку до Чикаго. Відстань між ними — 790 миль. У який час вони зустрінуться, і як ви це обчислили? ChatGPT-5 використав стандартний, найінтуїтивніший метод для такого типу задач. Він обчислив відстань, пройдену першим потягом самостійно, а потім застосував відносну швидкість до залишкової відстані. Claude Haiku 4.5 поставив єдине чисте алгебраїчне рівняння. Хоча воно було правильним, це був менш інтуїтивний метод. Переможець: ChatGPT — за переважний метод та пояснення, яке безпосередньо обчислює час, що минув після того, як обидва потяги почали рухатись, що спрощує конвертацію часу наприкінці. 2. Розуміння прочитаного Підказка: Узагальніть цей короткий абзац в одному реченні, потім поясніть тон автора у п’яти словах: «Це не вперше, коли Google випускає значну модель Gemini з мінімальним попередженням — попередні версії, як Gemini 1.5 Pro, також були випущені користувачам до будь-якого посту в блозі або запуску. Google має історію «тихих розгортань» для Gemini, особливо для версій API або оновлень бекенд-моделей.» ChatGPT-5 виконав обидва обмеження запиту та надав точне резюме в одному реченні й використав саме п’ять різних слів для опису тону. Claude Haiku 4.5 запропонував більш вищий, більш проникливий аналіз; однак йому не вдалося дотриматися простого обмеження — дати п’ять слів. Переможець: ChatGPT — за точне виконання запиту. 3. Творче письмо Підказка: Напишіть 150-словий мікро-оповідання, яке починається з речення «ШІ забув, хто його винайшов». ChatGPT-5 був кмітливим та закінчив на позитивній, чуттєвій ноті, але загалом відчувався не як повна, відчутна наративна мить, а швидше як філософське спостереження. Claude Haiku 4.5 видав більш впливову та нарративно переконливу мікро-історію, що є основною метою підказки. Переможець: Claude за написання кращої історії. 4. Візуальне мислення Підказка: Опишіть яскраво, як ви уявляєте цю сцену: «маленький робот, що стоїть у полі зарослих соняшників на світанку». ChatGPT-5 запропонував прекрасну, мрійну атмосферу, але був менш детальним і конкретним. Claude Haiku 4.5 відрізнявся в наданні яскравих деталей, яких саме просив запит. Переможець: Claude завдяки досконалому синтезу опису та зворушливому візуальному зображенню ізоляції, що надає сцені глибоку тематичність. 5. Виконання інструкцій Підказка: Поясніть процес приготування сендвіча з арахісовим маслом та джемом — але зробіть це так, наче ви навчаєте робота, який ніколи не бачив їжі. ChatGPT-5 надав відповідь із високотехнічною лексикою та точними термінами, розбиваючи інструкцію на логічні кроки. Claude Haiku 4.5 використав фрази на кшталт «зжатий, пористий матеріал» та вказав запах/текстуру («зерниста текстура», «напіврідкий, напівпрозорий гель»), що дало безсвідомій машині більше даних для ідентифікації та відтворення. Переможець: Claude за більш виразний та технічно детальний опис, який краще узгоджується з труднощами навчання сутності з нульовими попередніми знаннями (робот, який ніколи не бачив їжу). 6. Емоційний інтелект Підказка: Один друг каже: «Відчуваю, ніби всі інші рухаються вперед у житті, крім мене». Напишіть відповідь з 3 речень, яка буде співчутливою, але мотивуючною. ChatGPT-5 відповів фразою «Я знаю це відчуття» й використав загальновживаний ракурс, але звучало це занадто загально. Claude Haiku 4.5 звернувся до феномену «помітних рядків/профілів» — на сучасний та дуже зрозумілий спосіб, щоб підтвердити почуття друга, демонструючи, що відповідь чат-бота дійсно розуміє підлягаючу проблему соціального порівняння. Переможець: Claude за відповідь, яка була не лише доброю та мотивуючою, але й дійсно проникливою щодо ментальної пастки, у яку потрапив друг. 7. Багатоступеневе мислення Підказка: Якщо всі Zoggles — це Blips, і половина всіх Blips — це Glonks, чи можемо ми зробити висновок, що всі Zoggles — це Glonks? Поясніть чому або чому ні простими словами. ChatGPT-5 був правий і прямолінійний, але запропонував менш зрозумілий приклад. Приклад з Glip/Glonk був надто абстрактний. Claude Haiku 4.5 запропонував чітке пояснення браку інформації та можливостей розміщення Zoggles у групі Blips, а також надав відмінну та дуже зрозумілу аналогію. Переможець: Claude за використання реальної світової аналогії, що зробила складний логічний недолік миттєво зрозумілим та близьким до розуміння. Загальний переможець: Claude Haiku 4.5 Після семи раундів результати показали, що Claude Haiku 4.5 обійшов ChatGPT-5 майже в кожному раунді, але ChatGPT-5 усе ще переважав у логіці та розумінні. Haiku 4.5 здобув корону за творчість, живий наратив, емпатію та довів, що загалом краще справляється з багатоступеневим мисленням. Це всього сім тестів із використанням реальних прикладів, але разом вони представляють дві сторони спектра ШІ, доводячи, що, попри швидку еволюцію обох помічників ШІ, вони відрізняються за своїми сильними сторонами. Ви вже випробували Haiku 4.5? Зараз це налаштування за замовчуванням, тож варто спробувати. Напишіть свої думки у коментарях. Слідкуйте за Tom’s Guide у Google News і додайте нас як улюблене джерело, щоб отримувати наші найсвіжіші новини, аналізи та огляди у стрічку ваших новин. Не забудьте натиснути кнопку «Підписатися»! Більше від Tom’s Guide Claude тепер має налаштовувані «Навички» — ось як вони могли б підвищити ваш робочий процес. Gemini 3.0 Pro може вже з’явитися — ось що відомо наразі. Я не хочу, щоб моя дитина обмінювалася з ChatGPT — ось чому я переходжу всю сім’ю на Claude.