Из интересного - совсем перестал пользоваться Notion, все важные папки с заметками переехали в обычный советский... Cursor.
Заметки вообще больная тема. Тот же Obsidian не прижился вообще. Криво, неудобно, плагины работают через одно место... Да и выглядит страшненько. Не могу понять чем он так привлекает народ.
В текущей схеме хранится всё в приватном Git репозитории в .md файликах и рассортировано по папкам. Агент очень шустро ориентируется, помогает хранить всё в чистоте и порядке, находить и дополнять нужное. Так еще и без микроскопических лимитов, рекламы тупого notion-агента и колдовства с доступами.
В общем впервые кайфую от работы с заметками. Просто, надежно, ничего не отвлекает, агент на подхвате.
Знаю, что многие используют похожую схему, но вместо Cursor там консольный Claude Code.
Может я изобрел велосипед? Чем пользуетесь вы?
🔛 @kisel_it
#ai@kisel_it #it@kisel_it
Заметки вообще больная тема. Тот же Obsidian не прижился вообще. Криво, неудобно, плагины работают через одно место... Да и выглядит страшненько. Не могу понять чем он так привлекает народ.
В текущей схеме хранится всё в приватном Git репозитории в .md файликах и рассортировано по папкам. Агент очень шустро ориентируется, помогает хранить всё в чистоте и порядке, находить и дополнять нужное. Так еще и без микроскопических лимитов, рекламы тупого notion-агента и колдовства с доступами.
В общем впервые кайфую от работы с заметками. Просто, надежно, ничего не отвлекает, агент на подхвате.
Знаю, что многие используют похожую схему, но вместо Cursor там консольный Claude Code.
Может я изобрел велосипед? Чем пользуетесь вы?
#ai@kisel_it #it@kisel_it
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍7❤1
Please open Telegram to view this post
VIEW IN TELEGRAM
1 13😁9👍1
Заглянем немного в (не)светлое будущее? 🔮
Вчера был на концерте "Высоцкий.Высота" — аля выступление цифрового аватара. Голос, внешность, мимика, манера говорить — всё стянули с Высоцкого. Голос клонировали через AI (как я понимаю), а персонажа собирали в Unreal Engine или чем-то подобным.
Пока что заставить это всё работать - очень сложно. Были и косяки, и технические накладки. Но голос... Голос сделали просто отлично, не придраться. Визуал конечно на троечку. "Пластиковую" модель пытались компенсировать яркими эффектами. Но всё же иногда было ну очень хорошо.
Это всё только начало. Так сказать первые шажочки на неизведанную территорию. Тренд уже есть и он пугает. Мы всё ближе подходим к времени, когда можно продать свою "цифровую личность" и пусть делает что хочет. А на ряду с "живыми" концертами в афише будет всё больше "синтетических". Ну а что? Тут тебе ни география, ни время суток не мешает. Выступай хоть на всех площадках одновременно. В-Ы-Г-О-Д-Н-О.
Ах, хотите вживую? По-настоящему? Готовьте деньги. Большие деньги. Вот вам космическая цена. Реальность - для богатых. Нету? Ну, вам тогда цифрового варианта хватит. Звучит знакомо? Мне тоже это что-то напоминает....
Сейчас для каждого такого перформанса приходится пройти огромное количество технических сложностей. Эти сложности всё более стремительно решают нейросети. Клонировать голос уже ничего не стоит, даже за бесплатно. Клонировать внешность - всё проще и проще. Остался последний шаг — real time. Да чтоб с обратной связью с залом! Как по-настоящему. И что тогда? Видимо в ближайшие годы уже узнаем.
Что думаете?
🔛 @kisel_it
#ai@kisel_it #технологии@kisel_it #будущее@kisel_it
Вчера был на концерте "Высоцкий.Высота" — аля выступление цифрового аватара. Голос, внешность, мимика, манера говорить — всё стянули с Высоцкого. Голос клонировали через AI (как я понимаю), а персонажа собирали в Unreal Engine или чем-то подобным.
Пока что заставить это всё работать - очень сложно. Были и косяки, и технические накладки. Но голос... Голос сделали просто отлично, не придраться. Визуал конечно на троечку. "Пластиковую" модель пытались компенсировать яркими эффектами. Но всё же иногда было ну очень хорошо.
Это всё только начало. Так сказать первые шажочки на неизведанную территорию. Тренд уже есть и он пугает. Мы всё ближе подходим к времени, когда можно продать свою "цифровую личность" и пусть делает что хочет. А на ряду с "живыми" концертами в афише будет всё больше "синтетических". Ну а что? Тут тебе ни география, ни время суток не мешает. Выступай хоть на всех площадках одновременно. В-Ы-Г-О-Д-Н-О.
Ах, хотите вживую? По-настоящему? Готовьте деньги. Большие деньги. Вот вам космическая цена. Реальность - для богатых. Нету? Ну, вам тогда цифрового варианта хватит. Звучит знакомо? Мне тоже это что-то напоминает....
Сейчас для каждого такого перформанса приходится пройти огромное количество технических сложностей. Эти сложности всё более стремительно решают нейросети. Клонировать голос уже ничего не стоит, даже за бесплатно. Клонировать внешность - всё проще и проще. Остался последний шаг — real time. Да чтоб с обратной связью с залом! Как по-настоящему. И что тогда? Видимо в ближайшие годы уже узнаем.
Что думаете?
#ai@kisel_it #технологии@kisel_it #будущее@kisel_it
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤7👍3👎1🤔1😱1
Clawdbot: когда обезьяне дали гранату 🤡
Совсем недавно Clawdbot хайпанул. И тут такое началось... Это не цирк, это хуже. Раньше, чтобы слить всё в интернет нужны были хоть какие-то навыки. Сегодня - запускаем контейнер, даем побольше доступов и вуаля!)
Схема классическая: человек хочет себе «Джарвиса», чтобы тот сам мышкой двигал и на письма отвечал. Качает скрипт, запускает по гайду с ютуба. А чтобы управлять ботом с телефона или с работы, добрый дядя из гайда советует прокинуть туннель через ngrok или развернуть это дело на VPS с открытым портом.
Итог: любой школьник находит ваш IP или ngrok-адрес и получает RCE (удаленное выполнение команд) от вашего имени.
Какой-то цифровой эксгибиционизм. Отберите у них Докер, пока не поздно.
🔛 @kisel_it
#безопасность@kisel_it #ai@kisel_it
Совсем недавно Clawdbot хайпанул. И тут такое началось... Это не цирк, это хуже. Раньше, чтобы слить всё в интернет нужны были хоть какие-то навыки. Сегодня - запускаем контейнер, даем побольше доступов и вуаля!)
Схема классическая: человек хочет себе «Джарвиса», чтобы тот сам мышкой двигал и на письма отвечал. Качает скрипт, запускает по гайду с ютуба. А чтобы управлять ботом с телефона или с работы, добрый дядя из гайда советует прокинуть туннель через ngrok или развернуть это дело на VPS с открытым портом.
Итог: любой школьник находит ваш IP или ngrok-адрес и получает RCE (удаленное выполнение команд) от вашего имени.
Какой-то цифровой эксгибиционизм. Отберите у них Докер, пока не поздно.
#безопасность@kisel_it #ai@kisel_it
Please open Telegram to view this post
VIEW IN TELEGRAM
1🐳9
Please open Telegram to view this post
VIEW IN TELEGRAM
😁14 4❤3
Подлый Outlook новой версии теперь все письма выкачивает на сервера Майков. Раньше данными с почты распоряжался гугл. Ладно, с этим кое-как смирились. Но зачем программе для просмотра писем требуется ПОЛНЫЙ МАТЬ ЕГО ДОСТУП к почтовому ящику? Причем там абсолютно безумное пользовательское соглашение, без ограничений по сбору и использованию данных.
На наших глазах датамайнинг активно прогрессирует, доходя до полной шизофрении. Жду момент, когда нужно будет залогинится на холодильнике для показа таргетированной рекламы. Ну и доступ к почте дать тоже. На всякий случай. Чтобы обеспечить более персонализированный опыт! Ведь это всё еще забота о пользователе, правильно?
🔛 @kisel_it
#технологии@kisel_it
На наших глазах датамайнинг активно прогрессирует, доходя до полной шизофрении. Жду момент, когда нужно будет залогинится на холодильнике для показа таргетированной рекламы. Ну и доступ к почте дать тоже. На всякий случай. Чтобы обеспечить более персонализированный опыт! Ведь это всё еще забота о пользователе, правильно?
#технологии@kisel_it
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁7
Отладка кода в наше время всё больше напоминает мне слот-машину.
Вылез exception? Депозит в чат → спин.
Исправь ❌❌✅
Исправь ❌❌✅
Исправь ✅❌✅
Спин. Спин. Спин.
И вот оно!
✅✅✅
ВОТ ЭТО ЗАНОС!🤑🤑🤑
Тесты проходят, проект запустился!
Адреналин, сердце стучит, эйфория.
Это точно еще можно назвать "разработкой"? 🤔
Вылез exception? Депозит в чат → спин.
Исправь ❌❌✅
Исправь ❌❌✅
Исправь ✅❌✅
Спин. Спин. Спин.
И вот оно!
✅✅✅
ВОТ ЭТО ЗАНОС!🤑🤑🤑
Тесты проходят, проект запустился!
Адреналин, сердце стучит, эйфория.
Это точно еще можно назвать "разработкой"? 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
1 11❤2🤡1💯1
Please open Telegram to view this post
VIEW IN TELEGRAM
2 7👍2😁1🤮1
Наконец-то распробовал uv. Тот самый "убийца pip" на Расте от команды Astral. Удобненько, ооочень шустро работает, с зависимостями не косячит.
Всё наше добро вписываем в pyproject.toml, делаем
Очень понравилось, как устроены "группы зависимостей". В одном файле prod/dev/test зависимости, только разнесённые по группам. На фоне пипа с миллионом файлов requirements.txt/requirements.test.txt и т.д - очень вкусно.
Но и это не всё. Хотя избавиться от тормознутого pip'а это уже удовольствие. Есть еще кое-что: он умеет скачивать и устанавливать нужные версии Python. И переключаться между ними можно одной простой командой.
## Шпаргалка по командам
-
-
-
-
-
-
-
-
-
-
-
Еще из плюсов:
- Нормальный, человеческий (наконец-то! ) мать его кэш! Один раз скачал библиотеку и всё.
- Читаемый лок-файл uv.lock. Приемлемо выглядит в диффах.
Хочется верить, что инструмент повторит судьбу ruff, который в итоге затащили вообще везде и всюду.
Всё наше добро вписываем в pyproject.toml, делаем
uv sync для установки, 5 секунд ждём и готово! Естественно, появится lock-файл, в котором будут зафиксированы все зависимости.Очень понравилось, как устроены "группы зависимостей". В одном файле prod/dev/test зависимости, только разнесённые по группам. На фоне пипа с миллионом файлов requirements.txt/requirements.test.txt и т.д - очень вкусно.
Но и это не всё. Хотя избавиться от тормознутого pip'а это уже удовольствие. Есть еще кое-что: он умеет скачивать и устанавливать нужные версии Python. И переключаться между ними можно одной простой командой.
## Шпаргалка по командам
-
uv init — инициализировать новый проект с pyproject.toml-
uv add <package> — добавить пакет в зависимости и синхронизировать окружение-
uv remove <package> — удалить пакет из проекта-
uv sync — синхронизировать venv с текущим lock-файлом-
uv sync --all-groups — синхронизировать все группы зависимостей-
uv sync --only-group dev — синхронизировать только зависимости для dev-окружения-
uv sync --no-dev — синхронизировать всё, кроме dev-окружения-
uv lock — обновить только uv.lock без установки пакетов-
uv run <script.py> — запустить скрипт внутри изолированного окружения-
uv python install 3.13 — скачать и установить конкретную версию Python в систему-
uv python list — посмотреть список всех доступных и установленных версий Pythonversion = "0.1.0"
dependencies = [
"fastapi == 0.115.0",
"sqlalchemy >= 2.0.25",
"uvicorn[standard] >= 0.27.0",
]
[dependency-groups]
dev = [
"ruff ~= 0.2.0",
"pytest >= 8.0.0, < 9.0.0",
]
Еще из плюсов:
- Нормальный, человеческий (
- Читаемый лок-файл uv.lock. Приемлемо выглядит в диффах.
Хочется верить, что инструмент повторит судьбу ruff, который в итоге затащили вообще везде и всюду.
3👍9❤3🔥3
Для меня всегда было загадкой, почему core-команда Python так и не родила нормальный инструмент, чтобы этим Python пользоваться. Это чуть ли не самое главное в языке. Входная точка, через которую проходит каждый разработчик десятки тысяч раз.
Тем временем они уже 10 лет везут асинхронную установку пакетов в pip, пока комьюнити городит костыли из костылей с окружениями.
Мы уже видели:
- virtualenv
- pip
- tox
- venv
- flit
- pipenv
- poetry
- pdm
- hatch
- rye
И кажется это еще не конец. У кого нибудь есть этому объяснение?
Тем временем они уже 10 лет везут асинхронную установку пакетов в pip, пока комьюнити городит костыли из костылей с окружениями.
Мы уже видели:
- virtualenv
- pip
- tox
- venv
- flit
- pipenv
- poetry
- pdm
- hatch
- rye
И кажется это еще не конец. У кого нибудь есть этому объяснение?
1👾6❤2🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
Да, чувствую себя именно так 😂
Please open Telegram to view this post
VIEW IN TELEGRAM
2 6😁4❤3👍1
Совершенно случайно вывел новый термин.
КуКлод-разработчик - человек, который смотрит, как Клод пишет код в его проекте.
КуКлод-разработчик - человек, который смотрит, как Клод пишет код в его проекте.
2😁11 9
Вышло любопытное исследование SkillsBench. Они протестировали кучу LLM-агентов (от Claude 4.5 до Gemini 3 и GPT-5.2) на то, как они решают задачи с использованием Skills и без них.
Главный инсайт: грамотно написанные скилы могут помочь даже младшим моделям обойти старших. Младшие и дешевые модели (например, быстрая Gemini Flash или Haiku) с правильной «обвязкой» в виде Skills обходят тяжеловесов (Pro/Opus), которые пытаются решить задачу без скилов. Прирост успешных решений с готовыми скиллами в среднем составил +16,2%.
Но есть нюансы.
1. Самогенерация не работает. Как только модели предлагают сгенерировать Skills для себя, их результативность падает.
2. Больше — не значит лучше. Оптимальный объем для агента — 2–3 скилла (дает прирост +18,6%). Если напихать 4 и более, эффективность резко падает. Если закинуть агенту полную и подробную документацию, он в ней буквально тонет, и результат уходит в минус (–2,9%).
Ссылочки:
https://www.skillsbench.ai/
https://arxiv.org/pdf/2602.12670
Главный инсайт: грамотно написанные скилы могут помочь даже младшим моделям обойти старших. Младшие и дешевые модели (например, быстрая Gemini Flash или Haiku) с правильной «обвязкой» в виде Skills обходят тяжеловесов (Pro/Opus), которые пытаются решить задачу без скилов. Прирост успешных решений с готовыми скиллами в среднем составил +16,2%.
Но есть нюансы.
1. Самогенерация не работает. Как только модели предлагают сгенерировать Skills для себя, их результативность падает.
2. Больше — не значит лучше. Оптимальный объем для агента — 2–3 скилла (дает прирост +18,6%). Если напихать 4 и более, эффективность резко падает. Если закинуть агенту полную и подробную документацию, он в ней буквально тонет, и результат уходит в минус (–2,9%).
Ссылочки:
https://www.skillsbench.ai/
https://arxiv.org/pdf/2602.12670
3👍7
⚡️⚡️⚡️РАЗРАБОТЧИКИ ВСЁ ⚡️⚡️⚡️
Ладно, шучу. Больше никакого кликбейта (сегодня ). Сейчас в очередной раз увидел новость от Антропика, что разработчики доживают свой последний год. И снова эти "эксперты" путают карту с местностью. Но у нас же с вами есть голова на плечах? Так что давайте сами и подумаем.
Типичный менеджер/аналитик - человек очень далёкий от кода и архитектуры. Да, двигает задачки, общается с бизнесом, делает красивые таблички, НО В КОДЕ НИЧЕРТА НЕ ПОНИМАЕТ. И не поймёт, даже если попросит ЧатГПТ объяснить. Почему? Да потому что даже если человек знает синтаксис - у него нет самого главного. Нужное мышление нарабатывается годами. Разработка это вообще не про "писать код", вот так открытие!
По какой-то необъяснимой для меня причине каждый раз упускается из вида самое главное. Рабочее приложение != "кнопочки жмутся, всё работает". Это верхушка айсберга, которую видно. Всё на самом деле сильно-сильно глубже. Все эти красивые сервисы, где ты натыкал в графе приложение и оно задеплоилось не применимы ни для одной серьезной компании. Это хорошо работает для стартапа или MVP, у которого трафик 1,5 колеки. И естественно, у человека "не из разработки" нет даже примерного понимания того, как это устроено изнутри. Чёрный ящик. Он не объяснит, почему выбрал тот или иной подход. Не заметит, что он был ошибочным. И это на проектах, в которых дай бог 2-3 сервиса, БД и nginx. Может ли такой человек довести проект до зрелого, стабильного состояния, который сможет развиваться годами? Сомневаюсь. Даже если допустить, что какой-нибудь Claude 5.7 будет в 10 раз умнее нынешнего - проблема не в этом.
Хороший инженер с хорошим инструментом может написать в 10 раз больше хорошего кода. Плохой инженер - напишет в 10 раз больше плохого кода. Пока что я не видел ни одного кейса, который мог бы опровергнуть это утверждение. Ты должен понимать, как работает твоё приложение и почему оно так работает. Это еще один скилл, который каждый разработчик приобретает годами. Это та самая "карта проекта" в голове, которая помогает тебе быстро и эффективно решать задачи. И это понимание спасает от многих проблем и ошибок, которые с ростом проекта становится нереально дорого исправлять. Даже с нейронками.
Еще свежи в памяти падения Cloudflare, AWS и десятка других сервисов. Почему? Потому что инженеры дали слишком много прав агенту, либо невнимательно проверили сгенерированный конфиг или код. НАСТОЯЩИЕ ИНЖЕНЕРЫ, КОТОРЫЕ ПОНИМАЛИ, ЧТО ДЕЛАЮТ. Лицо менеджера-вайбкодера, когда у него упал целый датацентр представили?) Сможет ли медсестра поставить диагноз с chatgpt точнее, чем опытный врач, который использует тот же инструмент? Нет. Получается, что сам "инструмент" - не решающий фактор. Почему все сравнивают "вот я с гпт такооое могу, увольняйте всех бэкендеров"? И что, я с тем же ГПТ могу больше и быстрее.
На самом деле именно разработчики выигрывают больше всех с развитием ИИ. Сделать нормальное приложение сложнее, чем оформить табличку в аналитике. И уж явно сложнее 99% задач, которые выполняют менеджеры. Думаю Клод с этим справится на ура. Всё потихоньку движется к концепции software-инженера, который сам отвечает за аналитику, сроки выполнения и разработку. Ну и конечно же акцент больше сместится на проектирование архитектуры. Мы просто будем тратить меньше времени на код. И этот подход будет в десятки раз эффективнее любого "менеджера-аналитика-вайбкодера".
Что думаете?
Ладно, шучу. Больше никакого кликбейта (
Типичный менеджер/аналитик - человек очень далёкий от кода и архитектуры. Да, двигает задачки, общается с бизнесом, делает красивые таблички, НО В КОДЕ НИЧЕРТА НЕ ПОНИМАЕТ. И не поймёт, даже если попросит ЧатГПТ объяснить. Почему? Да потому что даже если человек знает синтаксис - у него нет самого главного. Нужное мышление нарабатывается годами. Разработка это вообще не про "писать код", вот так открытие!
По какой-то необъяснимой для меня причине каждый раз упускается из вида самое главное. Рабочее приложение != "кнопочки жмутся, всё работает". Это верхушка айсберга, которую видно. Всё на самом деле сильно-сильно глубже. Все эти красивые сервисы, где ты натыкал в графе приложение и оно задеплоилось не применимы ни для одной серьезной компании. Это хорошо работает для стартапа или MVP, у которого трафик 1,5 колеки. И естественно, у человека "не из разработки" нет даже примерного понимания того, как это устроено изнутри. Чёрный ящик. Он не объяснит, почему выбрал тот или иной подход. Не заметит, что он был ошибочным. И это на проектах, в которых дай бог 2-3 сервиса, БД и nginx. Может ли такой человек довести проект до зрелого, стабильного состояния, который сможет развиваться годами? Сомневаюсь. Даже если допустить, что какой-нибудь Claude 5.7 будет в 10 раз умнее нынешнего - проблема не в этом.
Хороший инженер с хорошим инструментом может написать в 10 раз больше хорошего кода. Плохой инженер - напишет в 10 раз больше плохого кода. Пока что я не видел ни одного кейса, который мог бы опровергнуть это утверждение. Ты должен понимать, как работает твоё приложение и почему оно так работает. Это еще один скилл, который каждый разработчик приобретает годами. Это та самая "карта проекта" в голове, которая помогает тебе быстро и эффективно решать задачи. И это понимание спасает от многих проблем и ошибок, которые с ростом проекта становится нереально дорого исправлять. Даже с нейронками.
Еще свежи в памяти падения Cloudflare, AWS и десятка других сервисов. Почему? Потому что инженеры дали слишком много прав агенту, либо невнимательно проверили сгенерированный конфиг или код. НАСТОЯЩИЕ ИНЖЕНЕРЫ, КОТОРЫЕ ПОНИМАЛИ, ЧТО ДЕЛАЮТ. Лицо менеджера-вайбкодера, когда у него упал целый датацентр представили?) Сможет ли медсестра поставить диагноз с chatgpt точнее, чем опытный врач, который использует тот же инструмент? Нет. Получается, что сам "инструмент" - не решающий фактор. Почему все сравнивают "вот я с гпт такооое могу, увольняйте всех бэкендеров"? И что, я с тем же ГПТ могу больше и быстрее.
На самом деле именно разработчики выигрывают больше всех с развитием ИИ. Сделать нормальное приложение сложнее, чем оформить табличку в аналитике. И уж явно сложнее 99% задач, которые выполняют менеджеры. Думаю Клод с этим справится на ура. Всё потихоньку движется к концепции software-инженера, который сам отвечает за аналитику, сроки выполнения и разработку. Ну и конечно же акцент больше сместится на проектирование архитектуры. Мы просто будем тратить меньше времени на код. И этот подход будет в десятки раз эффективнее любого "менеджера-аналитика-вайбкодера".
Что думаете?
2👍8❤4💯3
Какая профессия вымрет первой?
Anonymous Poll
7%
Бэкендеры
43%
Фронтендеры
33%
Аналитики
34%
Менеджеры
Сегодня участвовал в олимпиаде по программированию, но не простой. Это была битва на llm-ках. Что я могу сказать? Давно я с таким интересом не решал задачки. А ведь никто такое не проводит, хотя это самый логичный шаг - хватит запрещать использовать то, что все и так будут использовать Всем станет от этого только легче и интереснее.
Главное - подобрать задачки, которые не по зубам современным моделям. Из 6 задач было две таких - больше часа пришлось бороться за каждый процент производительности, чтобы набрать максимум баллов. Можешь жонглировать языками и нейронками, главное - результат.
Естественно кажется, что Opus 4.6 или Gemini 3.1 Pro быстро всех нагнут. По факту они практически бесполезны. High effort thinking играет с ними злую шутку. Оба уходят думать на 20 минут, а потом отваливаются по таймауту/лимиту токенов. Самый главный инсайт - в таких вещах ооочень сильно решает итеративный подход. Чем быстрее ты получишь первый результат, тем быстрее сможешь итеративно довести его до идеала. Пока Опус думал - Gemini Flash уже успела погуглить все самые эффективные стратегии, прогнать их на тестах и выбрать лучшее. Кое кто спустя 2 часа смог выбить 100 баллов в самых сложных задачках (всего два-три человека из пятидесяти). Видимо они догадались использовать более легковесные модели чуть раньше меня.
Что я могу сказать? Опыт крайне интересный. Классическая зубрежка алгоритмов отходит на второй план всё сильнее и сильнее. А новые подходы позволяют добиться такой эффективности, на достижение которой раньше бы просто не хватило времени.
Главное - подобрать задачки, которые не по зубам современным моделям. Из 6 задач было две таких - больше часа пришлось бороться за каждый процент производительности, чтобы набрать максимум баллов. Можешь жонглировать языками и нейронками, главное - результат.
Естественно кажется, что Opus 4.6 или Gemini 3.1 Pro быстро всех нагнут. По факту они практически бесполезны. High effort thinking играет с ними злую шутку. Оба уходят думать на 20 минут, а потом отваливаются по таймауту/лимиту токенов. Самый главный инсайт - в таких вещах ооочень сильно решает итеративный подход. Чем быстрее ты получишь первый результат, тем быстрее сможешь итеративно довести его до идеала. Пока Опус думал - Gemini Flash уже успела погуглить все самые эффективные стратегии, прогнать их на тестах и выбрать лучшее. Кое кто спустя 2 часа смог выбить 100 баллов в самых сложных задачках (всего два-три человека из пятидесяти). Видимо они догадались использовать более легковесные модели чуть раньше меня.
Что я могу сказать? Опыт крайне интересный. Классическая зубрежка алгоритмов отходит на второй план всё сильнее и сильнее. А новые подходы позволяют добиться такой эффективности, на достижение которой раньше бы просто не хватило времени.
2👍10🔥3💯2👎1
Есть тут у нас пользователи Клод Кода? Расскажите, какие используете скилы.
Они недавно даже плагин для их создания/тестирования выкатили. Но... Я так и не придумал ни одного полезного юзкейса.
Они недавно даже плагин для их создания/тестирования выкатили. Но... Я так и не придумал ни одного полезного юзкейса.
1👍3👎1