This media is not supported in your browser
VIEW IN TELEGRAM
Результат ваншота Video-to-code в Kimi К2.5. Структура, текст, анимации и дизайн по большей части скопированы в готовый код.
🤯2
Forwarded from Сиолошная
Ещё раз отдам должное тому, как хорошо и естественно пишет Gemini 3 Pro (на русском). Настолько, что текст приходится читать два раза, потому что в первый звучал так складно, что я даже не заметил проблем.
"Двухходовочка" блин для названия двух пронумерованных пунктов. Хорошо, что не "двушечка". Дал дал отошёл.
"Двухходовочка" блин для названия двух пронумерованных пунктов. Хорошо, что не "двушечка". Дал дал отошёл.
👍2🔥1💯1
В общем, поковырял вчера рой агентов в Кими (Kimi K2.5 Agent Swarm) и вот, что могу сказать. За 39 долларов дается почти 40 кредитов на использование роя, 3 кредита сгорают за одно использование. Кстати, агент, который делает сайты (довольно неплохо), стоит так же.
Рой агентов оказался намного усерднее и критичнее в анализе научных и исследовательских проектов, чем режимы глубоких исследований от Gemini и ChatGPT. На каждый проект рой брал чуть более получаса и затем выдавал максимально взвешенные и долгие отчеты. При этом весь процесс работы роя можно наблюдать в режиме реального времени, читать отчеты отдельных агентов и следить за их работой.
Но есть один критичный момент, от которого зависит многое. При поручении рою агентов задачи на создание нескольких десятков изображений (Кими может поднимать в процессе Нанобанану), он подошел к исполнению слишком гибко и просто решил... заменить генерацию картинок генерацией плэйсхолдеров через код, потому что так ПРОЩЕ :) И честно об этом сказал. То есть, необходимо при постановке задач формулировать их предельно точно и предугадывать такие вот творческие решения роя агентов.
В целом, рой агентов от Кими это действительно куда более серьезный и мощный инструмент, чем аналоги от ведущих американских компаний.
Рой агентов оказался намного усерднее и критичнее в анализе научных и исследовательских проектов, чем режимы глубоких исследований от Gemini и ChatGPT. На каждый проект рой брал чуть более получаса и затем выдавал максимально взвешенные и долгие отчеты. При этом весь процесс работы роя можно наблюдать в режиме реального времени, читать отчеты отдельных агентов и следить за их работой.
Но есть один критичный момент, от которого зависит многое. При поручении рою агентов задачи на создание нескольких десятков изображений (Кими может поднимать в процессе Нанобанану), он подошел к исполнению слишком гибко и просто решил... заменить генерацию картинок генерацией плэйсхолдеров через код, потому что так ПРОЩЕ :) И честно об этом сказал. То есть, необходимо при постановке задач формулировать их предельно точно и предугадывать такие вот творческие решения роя агентов.
В целом, рой агентов от Кими это действительно куда более серьезный и мощный инструмент, чем аналоги от ведущих американских компаний.
🔥2
Forwarded from Борис опять
На днях обсуждали с админом @pseudolabeling, что автоматические фильтры резюме совсем оборзели. Некоторые ребята которых я менторил из-за этого вручную оптимизировали резюме под каждую вакансию. Почему бы не автоматизировать?
Навайбкодил за два вечера hr-breaker:
1. Загружаете резюме
2. Даете ссылку на вакансию
3. LLM вооруженная тулколами генерирует оптимизированное резюме (в том числе по советам из методички)
4. Делаются стандартные проверки: keyword matching, vector similarity, проверка LLM-кой (в том числе визуально, что всё не поехало), проверка на галлюцинации, проверка на очевидный AI-generated текст
5. Если хотя бы одна проверка не пройдена оптимизация продолжается
Важно, что всё сконфигурировано не врать и не изобретать опыта которого нет, поэтому получается очень неплохо. Но если у вас нет совести ничто вам не мешает поиграться с промптами🤗
Скачиваете, подставляете свой ключ Gemini API,
@boris_again
Навайбкодил за два вечера hr-breaker:
1. Загружаете резюме
2. Даете ссылку на вакансию
3. LLM вооруженная тулколами генерирует оптимизированное резюме (в том числе по советам из методички)
4. Делаются стандартные проверки: keyword matching, vector similarity, проверка LLM-кой (в том числе визуально, что всё не поехало), проверка на галлюцинации, проверка на очевидный AI-generated текст
5. Если хотя бы одна проверка не пройдена оптимизация продолжается
Важно, что всё сконфигурировано не врать и не изобретать опыта которого нет, поэтому получается очень неплохо. Но если у вас нет совести ничто вам не мешает поиграться с промптами
Скачиваете, подставляете свой ключ Gemini API,
uv run и уничтожаете скрининг как явление. Добейте выживших@boris_again
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Ну вот, генератор миров Genie 3 от Google вышел. Но пока только в США и только для подписчиков Google AI Ultra (200$ в месяц).
This media is not supported in your browser
VIEW IN TELEGRAM
В Genie 3 можно загрузить любое фото, например, сгенерированное в Nano Banana Pro, и получить настоящий интерактивный игровой открытый мир, в котором можно гулять, управлять камерой, драться etc. целых 60 секунд.
Это буквально GTA 6, до выхода GTA 6, в которую можно поиграться минуту. На видео новая ГТА в Гренландии. Но кто вам мешает сделать свою собственную ГТА в своем селе, в каждый дом в которой можно войти. За двести долларов в месяц и длительностью в минуту.
Это буквально GTA 6, до выхода GTA 6, в которую можно поиграться минуту. На видео новая ГТА в Гренландии. Но кто вам мешает сделать свою собственную ГТА в своем селе, в каждый дом в которой можно войти. За двести долларов в месяц и длительностью в минуту.
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Kimi K2.5 в режиме роя агентов сваншотила статью по философии на 60 (ШЕСТЬДЕСЯТ) страниц. На основе грубого 6-страничного черновика и простого промпта в одно предложение. За полчаса.
Статья консистентная, когерентная. Без грамматических ошибок, с адекватным, читаемым слогом. Абсолютно на уровне статей в рецензируемых журналах. При этом, на русском языке.
Ни ChatGPT, ни Gemini, ни Claude не способны сейчас создать настолько длинную статью без танцев с бубном и сторонних приложений, плагинов, не в API. А тут готовое, совершенно релевантное решение в один клик.
Это прямо вау.
Статья консистентная, когерентная. Без грамматических ошибок, с адекватным, читаемым слогом. Абсолютно на уровне статей в рецензируемых журналах. При этом, на русском языке.
Ни ChatGPT, ни Gemini, ни Claude не способны сейчас создать настолько длинную статью без танцев с бубном и сторонних приложений, плагинов, не в API. А тут готовое, совершенно релевантное решение в один клик.
Это прямо вау.
🔥4😁4🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
В Genie 3 можно создать буквально любую видеоигру. BUT WHY?
🔥5
Рой агентов от Антропик завтра
Скорее всего, уже завтра релизнется Claude Sonnet 5 (кодовое название "Fennec"). Согласно утечкам, релиз может состояться 3 февраля 2026 года. Основанием этого слуха является ошибка в логах Vertex AI, где упоминается идентификатор "claude-sonnet-5@20260203", что интерпретируется как дата релиза.
Модель должна будет превосходить текущую флагманскую Claude Opus 4.5 в задачах кодирования и агентных сценариях. Поддержка контекстного окна в 1 млн токенов (что в 5 раз больше стандартного 200k для предыдущих моделей Sonnet), оптимизация на TPU Google для повышенной скорости и сниженной задержки. Новые функции включают создание суб-агентов (например, для backend, QA, research), параллельную работу и режим "Dev Team" для автономной разработки фич.
Ожидается, что Sonnet 5 будет на 50% дешевле Opus 4.5, что сделает её более доступной для разработчиков и предприятий, потенциально "переманив" пользователей от конкурентов.
Скорее всего, уже завтра релизнется Claude Sonnet 5 (кодовое название "Fennec"). Согласно утечкам, релиз может состояться 3 февраля 2026 года. Основанием этого слуха является ошибка в логах Vertex AI, где упоминается идентификатор "claude-sonnet-5@20260203", что интерпретируется как дата релиза.
Модель должна будет превосходить текущую флагманскую Claude Opus 4.5 в задачах кодирования и агентных сценариях. Поддержка контекстного окна в 1 млн токенов (что в 5 раз больше стандартного 200k для предыдущих моделей Sonnet), оптимизация на TPU Google для повышенной скорости и сниженной задержки. Новые функции включают создание суб-агентов (например, для backend, QA, research), параллельную работу и режим "Dev Team" для автономной разработки фич.
Ожидается, что Sonnet 5 будет на 50% дешевле Opus 4.5, что сделает её более доступной для разработчиков и предприятий, потенциально "переманив" пользователей от конкурентов.
Вообще, релизный план на февраль:
• Claude Sonnet 5; субагенты, мощнее и дешевле Опус 4.5
• GPT-5.3; агент с 400к+ токенов памяти; будет оч. дорогим
• DeepSeek V4; Engram-революция в памяти, подвинет Антропик по коду; опенсорс
• Gemini 3.0 Pro (GA); общий доступ (сейчас она в превью, лол); поднимется выше по бенчам
• Nano Banana 2.0; качество Pro на скорости Flash
• Claude Sonnet 5; субагенты, мощнее и дешевле Опус 4.5
• GPT-5.3; агент с 400к+ токенов памяти; будет оч. дорогим
• DeepSeek V4; Engram-революция в памяти, подвинет Антропик по коду; опенсорс
• Gemini 3.0 Pro (GA); общий доступ (сейчас она в превью, лол); поднимется выше по бенчам
• Nano Banana 2.0; качество Pro на скорости Flash
❤1
Forwarded from Борис опять
Мужское желание запустить с братанами стартап по ллм агентам прямо перед тем как пузырь лопнет
👏4
Американские банки начали сокращать кредитование GPU-кластеров. Имхо, именно это и выглядит как начало коллапса пузыря ИИ. Сейчас будет разбор этого дерьма.
😁2👍1🔥1