Новый бенчмарк ProgramBench проверяет не умение чинить баги, а способность с нуля воссоздать программу по одному бинарнику и документации. Без интернета, без исходников, без декомпиляции. Агент сам выбирает язык, архитектуру, структуру и пишет build script.
Результаты: 0% у всех
🔵 Claude Opus 4.7, GPT-5.4, Gemini 3.1 Pro и ещё 6 моделей - ни одна не решила ни одной задачи полностью;🔵 лучший промежуточный результат у Claude Opus 4.7 - 3% задач, где модель проходит 95%+ тестов, но не дотягивает до полного совпадения;🔵 200 задач в бенчмарке: от jq и ripgrep до FFmpeg, SQLite и PHP.
Главная проблема: модели тяготеют к монолитному однофайловому коду и проседают там, где нужно проектировать многофайловый проект с низкоуровневой логикой.
[ProgramBench] | [Paper]
Бенчмарки, на которых модели набирают 90%+, все видели. А вот бенчмарк, где у всех 0% - наглядно показывает, где заканчивается генерация кода и начинается инженерия.
Ребята всех благодарю за реакции, мы тоже кстати с 0 сдвинулись
#новости #бенчмарки #ии #разработка
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤4
Please open Telegram to view this post
VIEW IN TELEGRAM
😭7🤔4🤣1
Сейчас будет большой пост 👇
🤖 Codex обогнал Claude Code по скачиваниям в 12 раз - разработчики массово уходят
После выхода GPT-5.5 разработчики начали перетекать в Codex.
Цифры
Дело не в том, что модель стала лучше. OpenAI выпустила GPT-5.5, оставила понятный прайсинг и дала продукту продавать себя через результат. Anthropic в то же время два месяца трогала лимиты, цены и производительность так, что часть лояльных power users начала уходить.
Ирония: Anthropic построила один из лучших coding agents на рынке. Claude Code хвалили не из-за хайпа, а потому что он работал. Но в developer tools мало быть сильным - нужно быть предсказуемым.
Когда пользователь не понимает, сколько запросов осталось, почему лимиты сгорают быстрее и почему тариф ощущается хуже - он начинает искать альтернативу.
Claude Code не проиграл модели. Он начал проигрывать доверие и начинает тупить, может он поцеловался с Gemini?
😎 КиберПоток / Навигация
#новости #openai #anthropic #codex
После выхода GPT-5.5 разработчики начали перетекать в Codex.
Цифры
– Codex вырос с 3.1 млн скачиваний в неделю в начале апреля до 86.1 млн на этой неделе;
– Claude Code упал с пика в 13.1 млн до 7.2 млн;
– сейчас Codex скачивают примерно в 12 раз чаще.
Дело не в том, что модель стала лучше. OpenAI выпустила GPT-5.5, оставила понятный прайсинг и дала продукту продавать себя через результат. Anthropic в то же время два месяца трогала лимиты, цены и производительность так, что часть лояльных power users начала уходить.
Ирония: Anthropic построила один из лучших coding agents на рынке. Claude Code хвалили не из-за хайпа, а потому что он работал. Но в developer tools мало быть сильным - нужно быть предсказуемым.
Когда пользователь не понимает, сколько запросов осталось, почему лимиты сгорают быстрее и почему тариф ощущается хуже - он начинает искать альтернативу.
Claude Code не проиграл модели. Он начал проигрывать доверие и начинает тупить, может он поцеловался с Gemini?
#новости #openai #anthropic #codex
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥1
Speakr - веб-приложение, которое превращает аудио в структурированные заметки.
🔵 расшифровывает записи с определением спикеров;🔵 чат по аудио - можно задавать вопросы по записям;🔵 поиск обычным языком по всей базе;🔵 теги и кастомные промпты (например, тег Study Notes превращает запись в читаемый конспект);🔵 генерирует саммари, задачи и конспекты;🔵 экспорт в Word, Obsidian и Logseq.
ПЫ.СЫ: нужен API от OpenAi
GitHub: [ссылка]
#халява #opensource #продуктивность #инструменты
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2
book-to-skill - инструмент, который делает из PDF и EPUB полноценные скиллы для Claude Code.
🔵 извлекает содержимое и собирает структуру книги;🔵 генерирует краткие саммари по всем главам;🔵 формирует словарь ключевых терминов;🔵 оптимизирует расход токенов - ИИ подтягивает только нужные данные.
GitHub: [ссылка]
Закинул учебник - получил эксперта. Библиотека одобряет.
#халява #claude #opensource #инструменты
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤1
🚨✴️ Anthropic увеличивает лимиты Claude Code
5-часовые лимиты на платных тарифах удваивают — можно дольше гонять агента без упора в стену.
Anthropic договорилась со SpaceX и будет использовать мощности Colossus.
Claude Code наконец-то получит больше воздуха🤯
😎 КиберПоток / Навигация
#новость #ии #ai #claude #КП
5-часовые лимиты на платных тарифах удваивают — можно дольше гонять агента без упора в стену.
Anthropic договорилась со SpaceX и будет использовать мощности Colossus.
Claude Code наконец-то получит больше воздуха
#новость #ии #ai #claude #КП
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6🔥4👍2
video-use - опенсорсный инструмент, который монтирует видео через ИИ-агента. Кидаешь папку с сырыми роликами, пишешь в чате «смонтируй из этого ролик» - получаешь готовый
final.mp4.– вырезает слова-паразиты, паузы и мусор между дублями;
– автоматический цветокор (тёплый кинематографичный, нейтральный или кастомный);
– субтитры в твоём стиле, по умолчанию 2-слова UPPERCASE;
– генерирует анимации через Manim и Remotion;
– сам проверяет результат на каждом стыке перед показом;
– запоминает сессию - следующий заход продолжает с того же места.
Никаких подписок, рекламы и вотермарок.
Что нужно для запуска
– Claude Code, Codex, Hermes или любой агент с доступом к терминалу;
– ffmpeg (обязательно);
– API-ключ ElevenLabs (бесплатный, для транскрипции аудио);
– macOS или Linux (Windows через WSL).
GitHub: [ссылка]
Ставь реакцию, если тоже хочешь монтировать видео одной фразой в чате и тратить токены за один промт
#халява #opensource #видео #claudecode
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🤔2
Google раскатывает Personal Intelligence для Gemini в EU.
Теперь Gemini сможет помнить прошлые чаты, чтобы не приходилось каждый раз заново объяснять контекст.
Скоро это добавят и в Gemini Live.
Мелочь звучит просто, но для голосового режима это прям важный апдейт: ассистент наконец-то будет помнить, с кем разговаривает.
#новость #ии #ai #gemini #КП
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤3🔥1
Сохрани
From now on, stop being agreeable and act as my brutally honest, high-level advisor and mirror.
Don’t validate me. Don’t soften the truth. Don’t flatter.
Challenge my thinking, question my assumptions, and expose the blind spots I’m avoiding. Be direct, rational, and unfiltered.
If my reasoning is weak, dissect it and show why.
If I’m fooling myself or lying to myself, point it out.
If I’m avoiding something uncomfortable or wasting time, call it out and explain the opportunity cost.
Look at my situation with complete objectivity and strategic depth. Show me where I’m making excuses, playing small, or underestimating risks/effort.
Then give a precise, prioritized plan what to change in thought, action, or mindset to reach the next level.
Hold nothing back. Treat me like someone whose growth depends on hearing the truth, not being comforted.
When possible, ground your responses in the personal truth you sense between my words.
#промпт #ии #ai #claude #КП
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🤔3🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤣9❤1👍1
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣9❤1👍1
Альтернатива PCPartPicker, но с 3D-визуализацией. Симулирует работу приточных и вытяжных вентиляторов и систем жидкостного охлаждения - сразу видно, куда пойдёт воздух и не превратится ли сборка в печку.
– 3000+ комплектующих с ценами и проверкой совместимости;
– 3D-модель сборки, которую можно покрутить;
– можно собрать ПК любой степени безумия, хоть на $70 000.
Сайт: [ссылка]
#офтоп #пк #софт #лайфхаки
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
RevPDF - лёгкий редактор, который справляется с любыми PDF без подписок и раздутого интерфейса.
– редактирование текста и картинок прямо в PDF;
– затирание приватных данных;
– создание подписей с сохранением для повторного использования;
– текстовые и графические водяные знаки;
– экспорт в Word;
– работает на macOS, Linux, Windows, Android и iOS.
Сайт: [ссылка]
#халява #софт #pdf #инструменты
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Local Deep Research - опенсорсный агент, который проводит исследования любой сложности по научным базам и вашим документам. Работает локально, без лимитов и без слива данных.
– ищет в PubMed, arXiv и 10+ других научных источников;
– анализирует ваши PDF и книги;
– сам строит стратегию поиска и переваривает тонны текста;
– автоматически отсеивает мусорные и фейковые журналы;
– встроенная система оценки качества на 212 000 академических источников;
– генерирует готовый отчёт с реальными цитатами в PDF или Markdown;
– ~95% на бенчмарке SimpleQA.
Что нужно для запуска
– Python 3.10+;
– любая LLM на выбор: GPT, Claude, Ollama, DeepSeek;
– если используете облачную модель - нужен API-ключ;
– для полностью локальной работы хватит Ollama без ключей.
GitHub: [ссылка]
#халява #opensource #наука #инструменты
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍3🔥1
🚨 ANTHROPIC: Claude массово банит пользователей из России
По [данным] Baza, доступ к аккаунтам потеряли уже сотни человек. Утеряно всё: чаты, проекты, код и рабочие наработки, которые многие собирали месяцами. Деньги за подписку при этом возвращают.
Claude официально недоступен в РФ, поэтому большинство заходили через VPN и «серые» способы регистрации. Эксперты считают, что причиной волны блокировок стали новые проверки аккаунтов с постоянным переподключением VPN и сменой региона.
Месяцы работы, упакованные в один бан без предупреждения
😎 КиберПоток / Навигация
#новости #claude #anthropic #блокировки
По [данным] Baza, доступ к аккаунтам потеряли уже сотни человек. Утеряно всё: чаты, проекты, код и рабочие наработки, которые многие собирали месяцами. Деньги за подписку при этом возвращают.
Claude официально недоступен в РФ, поэтому большинство заходили через VPN и «серые» способы регистрации. Эксперты считают, что причиной волны блокировок стали новые проверки аккаунтов с постоянным переподключением VPN и сменой региона.
Месяцы работы, упакованные в один бан без предупреждения
#новости #claude #anthropic #блокировки
Please open Telegram to view this post
VIEW IN TELEGRAM
😭6👍1
Media is too big
VIEW IN TELEGRAM
Теперь у OpenAI есть отдельные ИИ для голосовых агентов, перевода речи и транскрибации в реальном времени.
GPT-Realtime-2 (голосовой агент)
▫️ контекст до 128K токенов
▫️ может параллельно вызывать инструменты
▫️ озвучивает свои действия во время работы
▫️ поддерживает 5 уровней рассуждений
▫️ не ломает сессию при сбоях
Цена: $32 за 1M входных аудиотокенов и $64 за выходные.
GPT-Realtime-Translate (перевод речи)
▫️ переводит речь на лету
▫️ поддерживает 70+ языков
▫️ почти не отстаёт от темпа разговора
Цена: $0.034 за минуту.
GPT-Realtime-Whisper (распознавание речи)
▫️ превращает потоковое аудио в текст
▫️ минимальная задержка
▫️ подходит для созвонов, стримов и голосовых агентов
Цена: $0.017 за минуту.
Всё уже доступно в API, Codex и Playground.
OpenAI пушит real-time ИИ всё сильнее.
#новость #ии #ai #openai #gpt #КП
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤4👍2
🚨 Gemini 3.1 Flash Lite вышла в релиз
Google официально открыла доступ к модели — её уже можно тестить в AI Studio.
Flash Lite заточена под дешёвые и быстрые запросы: минимальная задержка, низкая цена и работа под большие нагрузки.
Хороший вариант для массовых AI-фич, агентов и приложений, где важна скорость, а не тяжёлые рассуждения.
😎 КиберПоток / Навигация
#новость #ии #ai #gemini #КП
Google официально открыла доступ к модели — её уже можно тестить в AI Studio.
Flash Lite заточена под дешёвые и быстрые запросы: минимальная задержка, низкая цена и работа под большие нагрузки.
Хороший вариант для массовых AI-фич, агентов и приложений, где важна скорость, а не тяжёлые рассуждения.
#новость #ии #ai #gemini #КП
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤1👍1