KRUHLYK 🇺🇦
Релізнули GPT-5.5 Шо там: краще працює з кодом і задачами, потребує менше пояснень, ефективний як AI-агент. Тести: GPT-5.5 — 82.7% Claude — 69.4% Mythos — 82.0% (не публічний) Хто на Codex, відпишіться що там на практиці і в реальності, якщо є можливість…
Хто там хотів бенчмарків і порявнянь з клодом (я хотів).
Ось вам порівняння Codex на GPT5.5 і Claude Code на Opus 4.7. Задачі не реальні в житті і притягнуто за вуха, але висновки робіть самі.
Ось вам порівняння Codex на GPT5.5 і Claude Code на Opus 4.7. Задачі не реальні в житті і притягнуто за вуха, але висновки робіть самі.
X (formerly Twitter)
Nate Herk (@nateherk) on X
I Tested GPT 5.5 vs Opus 4.7: What You Need to Know
Кому нести свої гроші?
Вже декілька місяців я пробую знайти максимально підходящого для всіх моїх щоденних потреб вендора AI інструментів. Задача в цьому максимально проста — мати одну підписку і не розкидатись грошима всім навколо, тим більше підписки не такі вже дешеві, погодьтесь. Такий собі добровільний Vendor Lock 💁♂️
Потреби в мене наступні:
1. Робота з чат ботом в багатьох побутових питаннях
2. Робота агентів з кодом
3. Робота з YouTube
4. Робота з зображеннями
5. Наявність можливості формувати спеціалізованих ботів для специфічних завдань (читай можливість записати системний промпт для чат бота щоб не дублювати його постійно)
Так вже ринок формується, що найпростіше в цих вимогах обирати між великою трійкою гравців на ринку: OpenAI, Anthropic, Google.
OpenAI: ChatGPT, Codex
Я вже десь приблизно півроку не користуюсь продуктами OpenAI. Чому? По-перше, якість того, що мені почав видавати чат-бот на топових моделях мене геть не влаштовувало. Там був реально низькоякісний нейрослоп відверто, як на мене. Але там були GPTs. Заточені під специфічні задачі чат-боти з відповідними для них системними промптами. Було непогано, але моделі стали працювати гірше.
Codex. Востаннє я пробував з ним працювати ще на моделі GPT-5.3. На той момент він мені здався таким стронг мідлом, який гарно виконує поставлену задачу, але зі складними архітектурними чи аналітичними завданнями справлявся на відповідному рівні.
З того часу, за вашими відгуками, багато чого змінилось. А особливо з виходом GPT 5.5. Це треба тестити, але ж це +1 підписка за 20 баксів 🙄
Google Gemini
Після того як я відмовився від ChatGPT я вирішив спробувати Gemini. Особливо з огляду, що на той момент він вже був досить непоганим в плані якості роботи і можливостей. Плюс вбудовані інструменти для роботи з екосистемою Google (документи, диск, календар, YouTube) дуже підкуповували. А я людина, яка сьогодні працює на iPhone, а завтра може і на якомусь Android (мені не принципово насправді) і частіше за все на сервісах від гугла багато чого завʼязано і залишатись на одній кросплатформеній екосистемі зручніше в рази.
Але коли я почав юзати Gemini там не було чогось подібного до GTPs. Допоки не зʼявились Gems. Аналогічна GPTs річ. Робота із зображенями в Nano Banana 2 топова і поки що найкраща для менe. Нативна робота з YouTube, парсинг відео, доступ до інструментарію з відео.
І тут я такий "ОСЬ ВОНО!" Все, що мені потрібно для щоденної роботи, ще й Gemini CLI для роботи з кодом (про це далі). Та ще й підписку можна шерити з родиною і всі домочадці можуть юзати свої акаунти і свої ліміти в цьому. "КАЄФ!" — подумав я, але...
Gemini CLI
Агент для роботи з кодом і файловою системою в принципі. Наче виглядає як альтернатива Claude Code, до якого ще повернемось. Але дико не вистачало (не вистачає і зараз) всього того, що дає в плані інструментарію Claude. Та й результат моделі гугла дають дещо не такий, на який я звик у Anthropic 🤷♂️
Чи юзаю я його для роботи? Так, безперечно! Часто і досить активно. Чи можу я повністю на нього пересісти як на основне рішення? Точно ні.
Anthropic Claude
І ось він. Диявол, який все ламає.
Claude — це вже не про чат бота чи просто агента. Це ціла екосистема рішень, які в абсолютно різних сферах життя і роботи дають максимально класний результат... якщо тільки це не творчість. Але тут, скоріше за все, я користуюсь тим всім, як клешнями.
Однак, скільки б я не ганяв Calude для генерації текстів, ідей, всякої такої роботи, він все одно це робить гірше за той самий Gemini, як не крути. Принаймні у мене. Я вже мовчу за генерацію зображень. Вона класна на рівні малювання графіків, аналітики і всякого такого. Для чогось креативного — абсолютнашляпа капелюх. Знову ж таки суто для мене і того як я юзаю.
І знову але... мої потреби мати хорошу роботу з YouTube? А тут ніяк з тим, Claude не може нормально відео розпарсити і з нього дістати корисну інформацію.
Продовження далі 👇
Вже декілька місяців я пробую знайти максимально підходящого для всіх моїх щоденних потреб вендора AI інструментів. Задача в цьому максимально проста — мати одну підписку і не розкидатись грошима всім навколо, тим більше підписки не такі вже дешеві, погодьтесь. Такий собі добровільний Vendor Lock 💁♂️
Потреби в мене наступні:
1. Робота з чат ботом в багатьох побутових питаннях
2. Робота агентів з кодом
3. Робота з YouTube
4. Робота з зображеннями
5. Наявність можливості формувати спеціалізованих ботів для специфічних завдань (читай можливість записати системний промпт для чат бота щоб не дублювати його постійно)
Так вже ринок формується, що найпростіше в цих вимогах обирати між великою трійкою гравців на ринку: OpenAI, Anthropic, Google.
OpenAI: ChatGPT, Codex
Я вже десь приблизно півроку не користуюсь продуктами OpenAI. Чому? По-перше, якість того, що мені почав видавати чат-бот на топових моделях мене геть не влаштовувало. Там був реально низькоякісний нейрослоп відверто, як на мене. Але там були GPTs. Заточені під специфічні задачі чат-боти з відповідними для них системними промптами. Було непогано, але моделі стали працювати гірше.
Codex. Востаннє я пробував з ним працювати ще на моделі GPT-5.3. На той момент він мені здався таким стронг мідлом, який гарно виконує поставлену задачу, але зі складними архітектурними чи аналітичними завданнями справлявся на відповідному рівні.
З того часу, за вашими відгуками, багато чого змінилось. А особливо з виходом GPT 5.5. Це треба тестити, але ж це +1 підписка за 20 баксів 🙄
Google Gemini
Після того як я відмовився від ChatGPT я вирішив спробувати Gemini. Особливо з огляду, що на той момент він вже був досить непоганим в плані якості роботи і можливостей. Плюс вбудовані інструменти для роботи з екосистемою Google (документи, диск, календар, YouTube) дуже підкуповували. А я людина, яка сьогодні працює на iPhone, а завтра може і на якомусь Android (мені не принципово насправді) і частіше за все на сервісах від гугла багато чого завʼязано і залишатись на одній кросплатформеній екосистемі зручніше в рази.
Але коли я почав юзати Gemini там не було чогось подібного до GTPs. Допоки не зʼявились Gems. Аналогічна GPTs річ. Робота із зображенями в Nano Banana 2 топова і поки що найкраща для менe. Нативна робота з YouTube, парсинг відео, доступ до інструментарію з відео.
І тут я такий "ОСЬ ВОНО!" Все, що мені потрібно для щоденної роботи, ще й Gemini CLI для роботи з кодом (про це далі). Та ще й підписку можна шерити з родиною і всі домочадці можуть юзати свої акаунти і свої ліміти в цьому. "КАЄФ!" — подумав я, але...
Gemini CLI
Агент для роботи з кодом і файловою системою в принципі. Наче виглядає як альтернатива Claude Code, до якого ще повернемось. Але дико не вистачало (не вистачає і зараз) всього того, що дає в плані інструментарію Claude. Та й результат моделі гугла дають дещо не такий, на який я звик у Anthropic 🤷♂️
Чи юзаю я його для роботи? Так, безперечно! Часто і досить активно. Чи можу я повністю на нього пересісти як на основне рішення? Точно ні.
Anthropic Claude
І ось він. Диявол, який все ламає.
Claude — це вже не про чат бота чи просто агента. Це ціла екосистема рішень, які в абсолютно різних сферах життя і роботи дають максимально класний результат... якщо тільки це не творчість. Але тут, скоріше за все, я користуюсь тим всім, як клешнями.
Однак, скільки б я не ганяв Calude для генерації текстів, ідей, всякої такої роботи, він все одно це робить гірше за той самий Gemini, як не крути. Принаймні у мене. Я вже мовчу за генерацію зображень. Вона класна на рівні малювання графіків, аналітики і всякого такого. Для чогось креативного — абсолютна
І знову але... мої потреби мати хорошу роботу з YouTube? А тут ніяк з тим, Claude не може нормально відео розпарсити і з нього дістати корисну інформацію.
Продовження далі 👇
👍6
👆Продовження
GPTs, Gems або щось таке в Claude? А тут непевно зовсім. Є режим Projects, але це не зовсім те, що я очікував. Дуже схоже, дуже відповідно наче працює, але в самого Claude логіка в цьому режимі зовсім інша. Логіка роботи в цьому режимі не така, як мені потрібно.
Claude Cowork
Досить цікава фіча, і наразі я пробую її запровадити в свій робочий workflow. Та чи на стільки він корисний, що я без нього жити не можу — точно можу обійтись.
А от без чого я не можу обійтись — Claude Code.
Вся система тулзів, навколо яких побудований агентний режим, те як агент працює з ними, які моделі йому доступні і як вони відпрацьовують в якості мозку агента — це найкраще для мого робочого workflow і того, що я отримую на виході. Глибоко думаючий Opus, робочі руки у вигляді Sonnet, швидкий писака текстів Haiku... Всі ці хлопці дають мені топові результати в роботі. Плюс робоча корпоративна підписка для робочих проєктів та особиста підписка для моїх власних проєктів в додачу.
Тому вся оця двіжуха не дає мені можливості відмовитись від них на користь того ж Gemini. Ніяк. Поки що. На жаль. А я був би не проти, якби Gemini давав мені таке саме 🚬
І от, власне от і виходить, що мені доводиться платити двом вендорам за інструментарій, які мають одні або не мають інші.
І це мене дуже виморажує насправді. Я не хочу дохріна витрачати бабла на схожі інструменти. Я хочу використовувати те, що мені потрібно від кожного!
І тут моє ниття закінчується і виникає наступне питання до вас.
А як у вас в цьому плані? Чи маєте ви такі самі чи схожі проблеми? Давайте обговоримо це в коментарях, мені дійсно цікаво! 👇
GPTs, Gems або щось таке в Claude? А тут непевно зовсім. Є режим Projects, але це не зовсім те, що я очікував. Дуже схоже, дуже відповідно наче працює, але в самого Claude логіка в цьому режимі зовсім інша. Логіка роботи в цьому режимі не така, як мені потрібно.
Claude Cowork
Досить цікава фіча, і наразі я пробую її запровадити в свій робочий workflow. Та чи на стільки він корисний, що я без нього жити не можу — точно можу обійтись.
А от без чого я не можу обійтись — Claude Code.
Вся система тулзів, навколо яких побудований агентний режим, те як агент працює з ними, які моделі йому доступні і як вони відпрацьовують в якості мозку агента — це найкраще для мого робочого workflow і того, що я отримую на виході. Глибоко думаючий Opus, робочі руки у вигляді Sonnet, швидкий писака текстів Haiku... Всі ці хлопці дають мені топові результати в роботі. Плюс робоча корпоративна підписка для робочих проєктів та особиста підписка для моїх власних проєктів в додачу.
Тому вся оця двіжуха не дає мені можливості відмовитись від них на користь того ж Gemini. Ніяк. Поки що. На жаль. А я був би не проти, якби Gemini давав мені таке саме 🚬
І от, власне от і виходить, що мені доводиться платити двом вендорам за інструментарій, які мають одні або не мають інші.
І це мене дуже виморажує насправді. Я не хочу дохріна витрачати бабла на схожі інструменти. Я хочу використовувати те, що мені потрібно від кожного!
І тут моє ниття закінчується і виникає наступне питання до вас.
А як у вас в цьому плані? Чи маєте ви такі самі чи схожі проблеми? Давайте обговоримо це в коментарях, мені дійсно цікаво! 👇
👍4💯4
Минулого тижня я завинив вам проведення стріма. Тому цього тижня їх буде цілих два 😎
Перший проведемо завтра, в середу о 15:30 і продовжимо вивчати можливості ефективного застосування Gemini CLI та варіант з модним зараз Spec Driven AI розробкою через Conductor extension.
А наступний, буде в пʼятницю, як і завжди, але з новим форматом. Не пропустіть анонс!
Перший проведемо завтра, в середу о 15:30 і продовжимо вивчати можливості ефективного застосування Gemini CLI та варіант з модним зараз Spec Driven AI розробкою через Conductor extension.
А наступний, буде в пʼятницю, як і завжди, але з новим форматом. Не пропустіть анонс!
YouTube
Gemini Conductor vs інші AI-агенти: чому контекст важливіший за генерацію
Розбираємо Conductor — розширення для Gemini CLI, що впроваджує Context-Driven Development. Як перестати «гадати» з промптами та почати будувати софт системно через Specs та Plans прямо в терміналі.
Сьогодні на стрімі:
— Установка та налаштування Conductor…
Сьогодні на стрімі:
— Установка та налаштування Conductor…
1🔥12❤3🤩1🕊1
Claude Code 2.1.121: Огляд ключових оновлень
Вийшов мінорний, але важливий апдейт Claude Code. Нижче — стислий технічний огляд змін для тих, хто використовує інструмент у щоденному воркфлоу.
Системний промпт та логіка поведінки
- Знято жорсткі обмеження: видалено великий блок інструкцій "Doing tasks", який раніше змушував модель дотримуватися мінімалізму в обробці помилок та уникати коментарів. Це суттєво послаблює рамки та робить поведінку Claude більш гнучкою.
- Git workflow: додано пряму заборону на використання інтерактивних прапорців (наприклад,
Керування станом та Bash
- Ізоляція команд: Bash-інструмент тепер скидає стан оболонки (env vars, функції) між запусками. Робоча директорія зберігається, але контекст виконання стає чистим.
- Повторні запуски: додано спеціальні токени
- Тайм-аути Bash тепер чітко визначаються в мілісекундах.
Робота з MCP та плагінами
- Опція
- Очищення: нова команда prune та відповідні прапорці (
- Глобальні хуки:
Продуктивність та UI
- Оптимізація пам'яті: виправлено критичні витоки (leakage до 2GB+ RSS), що виникали під час тривалих сесій або обробки великої кількості зображень.
- Фільтрація: у розділі
- Fixes: виправлено проблеми зі скролом у tmux та інших терміналах, а також баг із некоректним відображенням квоти використання (
Детальніше тут і тут.
Вийшов мінорний, але важливий апдейт Claude Code. Нижче — стислий технічний огляд змін для тих, хто використовує інструмент у щоденному воркфлоу.
Системний промпт та логіка поведінки
- Знято жорсткі обмеження: видалено великий блок інструкцій "Doing tasks", який раніше змушував модель дотримуватися мінімалізму в обробці помилок та уникати коментарів. Це суттєво послаблює рамки та робить поведінку Claude більш гнучкою.
- Git workflow: додано пряму заборону на використання інтерактивних прапорців (наприклад,
-i). Для будь-яких GitHub-операцій тепер пріоритетно використовується gh CLI.Керування станом та Bash
- Ізоляція команд: Bash-інструмент тепер скидає стан оболонки (env vars, функції) між запусками. Робоча директорія зберігається, але контекст виконання стає чистим.
- Повторні запуски: додано спеціальні токени
{rerun:'bN'} для повторного виконання попередніх команд без їхнього переписування.- Тайм-аути Bash тепер чітко визначаються в мілісекундах.
Робота з MCP та плагінами
- Опція
alwaysLoad: у конфігах MCP серверів тепер можна виставити true, щоб інструменти завантажувалися миттєво, ігноруючи етап deferral (пошуку).- Очищення: нова команда prune та відповідні прапорці (
--prune, -y) дозволяють видаляти застарілі або автоматично встановлені залежності плагінів.- Глобальні хуки:
PostToolUse тепер працює для всіх інструментів, дозволяючи підміняти вивід не лише для MCP, а й для нативних тулзів.Продуктивність та UI
- Оптимізація пам'яті: виправлено критичні витоки (leakage до 2GB+ RSS), що виникали під час тривалих сесій або обробки великої кількості зображень.
- Фільтрація: у розділі
/skills додано текстовий пошук (type-to-filter).- Fixes: виправлено проблеми зі скролом у tmux та інших терміналах, а також баг із некоректним відображенням квоти використання (
/usage) через старі токени OAuth.Детальніше тут і тут.
👍11❤2⚡1
KRUHLYK 🇺🇦
Минулого тижня я завинив вам проведення стріма. Тому цього тижня їх буде цілих два 😎 Перший проведемо завтра, в середу о 15:30 і продовжимо вивчати можливості ефективного застосування Gemini CLI та варіант з модним зараз Spec Driven AI розробкою через Conductor…
Готовність 15 хвилин і починаємо.
Давайте сьогодні активно поспілкуємось і матимемо інтерактив. Чекаю на ваші запитання 😎
Давайте сьогодні активно поспілкуємось і матимемо інтерактив. Чекаю на ваші запитання 😎
YouTube
Gemini Conductor vs інші AI-агенти: чому контекст важливіший за генерацію
Розбираємо Conductor — розширення для Gemini CLI, що впроваджує Context-Driven Development. Як перестати «гадати» з промптами та почати будувати софт системно через Specs та Plans прямо в терміналі.
Сьогодні на стрімі:
— Установка та налаштування Conductor…
Сьогодні на стрімі:
— Установка та налаштування Conductor…
1🔥8
KRUHLYK 🇺🇦
Минулого тижня я завинив вам проведення стріма. Тому цього тижня їх буде цілих два 😎 Перший проведемо завтра, в середу о 15:30 і продовжимо вивчати можливості ефективного застосування Gemini CLI та варіант з модним зараз Spec Driven AI розробкою через Conductor…
Mastering_Gemini_Conductor.pdf
13.2 MB
Презентація про то, що таке отой Conductor, як він працює і як з ним працювати є в презентації. Юзайте, вивчайте і буде вам Spec-Drive Development на мінімалках в Gemini CLI 💪🏻
1👍12🔥4
Знову навайбкодили отими копайлотом…
Або просто типовий майкрософт, який все, що купує перетворює в лайно (
Або просто типовий майкрософт, який все, що купує перетворює в лайно (
Forwarded from den the dev
🤖 З GitHub коїться якась біда
На днях у GitHub знайшли вразливість, яка дозволяла отримати доступи до мільйонів репозиторіїв через git push -o.
Вчора Мітчел Хашімото анонсував, що термінал Ghostty йде з GitHub аргументуючи ненадійністю платформи для щоденної роботи через часті збої в інфраструктурі.
І все це на фоні постійних збоїв інфраструктури. Аптайм деяких сервісів впав до 67% - тобто майже третину часу якийсь з сервісів може бути недоступним.
Все це дуже сумно, бо GitHub - це неймовірно крутий продукт, який без сумнвіу змінив світ і вплинув на проникність та доступність опенсорсу.
На днях у GitHub знайшли вразливість, яка дозволяла отримати доступи до мільйонів репозиторіїв через git push -o.
Вчора Мітчел Хашімото анонсував, що термінал Ghostty йде з GitHub аргументуючи ненадійністю платформи для щоденної роботи через часті збої в інфраструктурі.
І все це на фоні постійних збоїв інфраструктури. Аптайм деяких сервісів впав до 67% - тобто майже третину часу якийсь з сервісів може бути недоступним.
Все це дуже сумно, бо GitHub - це неймовірно крутий продукт, який без сумнвіу змінив світ і вплинув на проникність та доступність опенсорсу.
👀14