Claude 3.7 Sonnet: первая гибридная модель рассуждений от Anthropic
Anthropic выпустили обновление - модель Claude 3.7 Sonnet с двумя режимами работы.
Первый - мгновенные ответы, второй - расширенное пошаговое мышление с глубоким анализом.
Лимит контекста достиг 128K токенов, ложные отказы снижены на 45%.
Дополнительно представлен Claude Code - CLI-инструмент для работы с кодом, репозиториями и тестами.
Улучшена производительность в математике, физике и программировании.
Доступно на всех тарифах включая бесплатный.
Теперь ИИ не только быстро отвечает, но и умеет глубоко размышлять.
К 2027 году обещают, что каждое размышление будет давать ответ, равный результату многолетней работы команды экспертов.
#Anthropic #Claude #Sonnet
------
@tsingular
Anthropic выпустили обновление - модель Claude 3.7 Sonnet с двумя режимами работы.
Первый - мгновенные ответы, второй - расширенное пошаговое мышление с глубоким анализом.
Лимит контекста достиг 128K токенов, ложные отказы снижены на 45%.
Дополнительно представлен Claude Code - CLI-инструмент для работы с кодом, репозиториями и тестами.
Улучшена производительность в математике, физике и программировании.
Доступно на всех тарифах включая бесплатный.
Теперь ИИ не только быстро отвечает, но и умеет глубоко размышлять.
К 2027 году обещают, что каждое размышление будет давать ответ, равный результату многолетней работы команды экспертов.
#Anthropic #Claude #Sonnet
------
@tsingular
🔥13❤2
Неделя открытого кода от Deepseek.
Deepseek запустил неделю open-source релизов и уже выкатил два интересных проекта — DeepEP и FlashMLA.
DeepEP: открытая библиотека для ускорения работы MoE-коммуникаций между экспертами, повышая скорость обмена между GPU ядрами в режиме все-со-всеми.
- Поддержка FP8 для быстрых dispatch/combine операций
- Оптимизация как для внутринодовой (NVLink), так и межнодовой (RDMA) коммуникации
- Специальные низколатентные ядра для inference decoding (~160-370μs на некоторых конфигурациях)
- Контроль использования SM-ресурсов GPU (можно выделить 24 SM на коммуникацию)
Бенчмарки: на H800+CX7 получают 153-158 GB/s внутри ноды (по NVLink) и 40-47 GB/s между нодами (по RDMA).
FlashMLA: эффективные ядра для MLA-декодирования
В релизе оптимизированный MLA-декодер для GPU Hopper:
- Поддержка BF16 и FP16
- Paged kvcache с размером блока 64
- До 3000 GB/s при memory-bound и 580 TFLOPS при compute-bound нагрузках на H800
Где пригодится?
1. Для обучения собственных MoE-моделей — как открытый фреймворк, который позволяет эффективно тренировать большие MoE
2. Для тюнинга инференса — если у вас есть Hopper GPU, можно существенно ускорить декодирование моделей с MLA
3. Для понимания архитектуры DeepSeek-моделей — код показывает, как на самом деле устроены модели Deepseek V3
И это только начало их #OpenSourceWeek — ждем еще релизов, особенно полезно будет если они продолжат раскрывать архитектуру своих моделей.
Но как тут сказали товарищи на одном из вебинаров недавно, - будет грустно, если они выложат всё в оупенсорс, а у нас некому будет понять что там написано и даже воспроизвести.
#MoE #MLA #DeepSeek #OpenSourceWeek
———
@tsingular
Deepseek запустил неделю open-source релизов и уже выкатил два интересных проекта — DeepEP и FlashMLA.
DeepEP: открытая библиотека для ускорения работы MoE-коммуникаций между экспертами, повышая скорость обмена между GPU ядрами в режиме все-со-всеми.
- Поддержка FP8 для быстрых dispatch/combine операций
- Оптимизация как для внутринодовой (NVLink), так и межнодовой (RDMA) коммуникации
- Специальные низколатентные ядра для inference decoding (~160-370μs на некоторых конфигурациях)
- Контроль использования SM-ресурсов GPU (можно выделить 24 SM на коммуникацию)
Бенчмарки: на H800+CX7 получают 153-158 GB/s внутри ноды (по NVLink) и 40-47 GB/s между нодами (по RDMA).
FlashMLA: эффективные ядра для MLA-декодирования
В релизе оптимизированный MLA-декодер для GPU Hopper:
- Поддержка BF16 и FP16
- Paged kvcache с размером блока 64
- До 3000 GB/s при memory-bound и 580 TFLOPS при compute-bound нагрузках на H800
Где пригодится?
1. Для обучения собственных MoE-моделей — как открытый фреймворк, который позволяет эффективно тренировать большие MoE
2. Для тюнинга инференса — если у вас есть Hopper GPU, можно существенно ускорить декодирование моделей с MLA
3. Для понимания архитектуры DeepSeek-моделей — код показывает, как на самом деле устроены модели Deepseek V3
И это только начало их #OpenSourceWeek — ждем еще релизов, особенно полезно будет если они продолжат раскрывать архитектуру своих моделей.
Но как тут сказали товарищи на одном из вебинаров недавно, - будет грустно, если они выложат всё в оупенсорс, а у нас некому будет понять что там написано и даже воспроизвести.
#MoE #MLA #DeepSeek #OpenSourceWeek
———
@tsingular
🔥11❤1
Media is too big
VIEW IN TELEGRAM
Ну что, господа преподаватели.
Готовимся к новой реальности. :)
Это по-быстрому буквально на коленке за пол-часа.
Инструменты:
Claude Sonnet 3.7 - код для manim(в комментарии) и скрипт озвучки.
Suno 4 (полный трек музыки в комментарии )
Озвучка - Clipchamp - там теперь text2speech встроенный бесплатный на всех языках.
#manim #sonnet #suno #education #dev
———
@tsingular
Готовимся к новой реальности. :)
Это по-быстрому буквально на коленке за пол-часа.
Инструменты:
Claude Sonnet 3.7 - код для manim(в комментарии) и скрипт озвучки.
Suno 4 (полный трек музыки в комментарии )
Озвучка - Clipchamp - там теперь text2speech встроенный бесплатный на всех языках.
#manim #sonnet #suno #education #dev
———
@tsingular
🔥17😁1
Media is too big
VIEW IN TELEGRAM
А вот вам пример работы профессионалов.
Клип-прототип (еще будет доделываться) от Сергея Пименова.
Использовались нейронки:
Flux, Runway, Kling, Krea, LumaLabs, Elevenlabs, Moises, Topaz.
https://t.me/pimenov_ru/6399
Если нужен профессиональный продакшен в нейрорендере, - рекомендую
#нейрорендер #pimenov #фабрикаконтента
———
@tsingular
Клип-прототип (еще будет доделываться) от Сергея Пименова.
Использовались нейронки:
Flux, Runway, Kling, Krea, LumaLabs, Elevenlabs, Moises, Topaz.
https://t.me/pimenov_ru/6399
Если нужен профессиональный продакшен в нейрорендере, - рекомендую
#нейрорендер #pimenov #фабрикаконтента
———
@tsingular
🔥13👍1😁1
Яндекс представил YandexGPT 5 — новое поколение русскоязычного ИИ.
YandexGPT 5 Lite 8B Pretrain:
- Открытая модель с 8 млрд параметров, обучена на 15 трлн токенов (30% — русский язык).
- Двухэтапное обучение: Pretrain и Powerup.
- Опубликована на Hugging Face для свободного использования и дообучения.
- Превосходит аналоги в русскоязычных задачах.
YandexGPT 5 Pro:
- Доступна через API (Yandex Cloud) и в чате с Алисой.
- Основа — Qwen-2.5-32B-base, дообучена с новым методом LogDPO.
- На уровне GPT-4o, с преимуществом в русском языке.
Полезность для бизнеса:
- Локализация: глубокое понимание русского.
- Экономия: открытая модель + API.
- Гибкость: чат-боты, аналитика, автоматизация.
#YandexGPT #Яндекс
———
@tsingular
YandexGPT 5 Lite 8B Pretrain:
- Открытая модель с 8 млрд параметров, обучена на 15 трлн токенов (30% — русский язык).
- Двухэтапное обучение: Pretrain и Powerup.
- Опубликована на Hugging Face для свободного использования и дообучения.
- Превосходит аналоги в русскоязычных задачах.
YandexGPT 5 Pro:
- Доступна через API (Yandex Cloud) и в чате с Алисой.
- Основа — Qwen-2.5-32B-base, дообучена с новым методом LogDPO.
- На уровне GPT-4o, с преимуществом в русском языке.
Полезность для бизнеса:
- Локализация: глубокое понимание русского.
- Экономия: открытая модель + API.
- Гибкость: чат-боты, аналитика, автоматизация.
#YandexGPT #Яндекс
———
@tsingular
⚡10
Media is too big
VIEW IN TELEGRAM
Google бесплатно раздаёт Gemini для разработчиков
Google запустил публичное превью бесплатной версии Gemini Code Assist для программистов.
ИИ-помощник работает на моделях Gemini 2.0, подготовленных специально для разработки ПО.
Пользователям доступно до 180 000 автодополнений кода ежемесячно — в 90 раз больше, чем у конкурентов.
Ассистент поддерживает все публичные языки программирования, интегрируется с VS Code и JetBrains, плюс уже работающие Firebase и Android Studio.
Функциональность включает генерацию кода, отладку и модификацию существующих приложений.
Контекстное окно составляет 128 000 токенов, что позволяет обрабатывать большой объём кодовой базы.
Gemini Code Review для GitHub:
- Работает для публичных и приватных репозиториев
- Анализирует стиль, находит баги
- Предлагает конкретные изменения кода
- Поддерживает кастомные гайдлайны через .gemini/styleguide.md в репозитории
Для подключения нужен только аккаунт Gmail, без привязки банковской карты.
Наконец-то нормальный бесплатный автопилот для кодеров. Google решил уничтожить рынок щедростью.
Куда катится этот мир?!.
Зачем я покупал Курсор?!
#Google #GeminiAI #CodeAssist
———
@tsingular
Google запустил публичное превью бесплатной версии Gemini Code Assist для программистов.
ИИ-помощник работает на моделях Gemini 2.0, подготовленных специально для разработки ПО.
Пользователям доступно до 180 000 автодополнений кода ежемесячно — в 90 раз больше, чем у конкурентов.
Ассистент поддерживает все публичные языки программирования, интегрируется с VS Code и JetBrains, плюс уже работающие Firebase и Android Studio.
Функциональность включает генерацию кода, отладку и модификацию существующих приложений.
Контекстное окно составляет 128 000 токенов, что позволяет обрабатывать большой объём кодовой базы.
Gemini Code Review для GitHub:
- Работает для публичных и приватных репозиториев
- Анализирует стиль, находит баги
- Предлагает конкретные изменения кода
- Поддерживает кастомные гайдлайны через .gemini/styleguide.md в репозитории
Для подключения нужен только аккаунт Gmail, без привязки банковской карты.
Наконец-то нормальный бесплатный автопилот для кодеров. Google решил уничтожить рынок щедростью.
Куда катится этот мир?!.
Зачем я покупал Курсор?!
#Google #GeminiAI #CodeAssist
———
@tsingular
🆒8👍6⚡4👨💻1
ggwave - очень удобная фишка для обмена данными между ИИ агентами.
https://github.com/ggerganov/ggwave
Не язык Скайнета, который захватит мир, а упрощение коммуникаций между дружелюбными ассистентами.
#ggwave #skynet
———
@tsingular
https://github.com/ggerganov/ggwave
Не язык Скайнета, который захватит мир, а упрощение коммуникаций между дружелюбными ассистентами.
#ggwave #skynet
———
@tsingular
🔥8👀7👍2🤔2👾2
Microsoft раздаёт безлимит на Voice и Think Deeper
Microsoft только что объявила бесплатный неограниченный доступ к функциям Voice и Think Deeper (последний работает на модели o1 от OpenAI).
Теперь любой пользователь может:
- Использовать голосовой интерфейс для практики языков, подготовки к собеседованиям
- Запускать продвинутые сценарии анализа через Think Deeper для финансовых расчетов, оценки рисков и т.д.
Для бизнеса это значит:
- Доступ к инструментам уровня enterprise без дополнительных затрат
- Возможность использовать модели нового поколения для сложных аналитических задач
copilot.microsoft.com (VPN)
На фоне бесплатной раздачи Гуглом Gemini для разрабов, - это прямо праздник какой-то.
И, напомню, Grok3 тоже пока доступен бесплатно.
Что происходит? ИИ становится доступнее калькулятора?
Они же так датацентры не окупят никогда.
#Microsoft #free #Copilot
———
@tsingular
Microsoft только что объявила бесплатный неограниченный доступ к функциям Voice и Think Deeper (последний работает на модели o1 от OpenAI).
Теперь любой пользователь может:
- Использовать голосовой интерфейс для практики языков, подготовки к собеседованиям
- Запускать продвинутые сценарии анализа через Think Deeper для финансовых расчетов, оценки рисков и т.д.
Для бизнеса это значит:
- Доступ к инструментам уровня enterprise без дополнительных затрат
- Возможность использовать модели нового поколения для сложных аналитических задач
copilot.microsoft.com (VPN)
На фоне бесплатной раздачи Гуглом Gemini для разрабов, - это прямо праздник какой-то.
И, напомню, Grok3 тоже пока доступен бесплатно.
Что происходит? ИИ становится доступнее калькулятора?
Они же так датацентры не окупят никогда.
#Microsoft #free #Copilot
———
@tsingular
🔥10⚡3👀2❤1👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Если у вас есть плюс-подписка на chatGPT, то у вас теперь есть/будет Deep Research.
10 запросов в месяц.
https://cdn.openai.com/deep-research-system-card.pdf
@cgevent
10 запросов в месяц.
https://cdn.openai.com/deep-research-system-card.pdf
@cgevent
Media is too big
VIEW IN TELEGRAM
Sonnet 3.7 с 1 запроса написал такой вот платформер.
Промпт:
Это какой-то новый уровень разработки.
Режим Claude Sonnet 3.7 Extended
Специально для написания кода.
Код в комментарии.
Тот же самый запрос в Grok3 и в новый QwenMax QwQPreview (который с рассуждениями выпустили вчера), результатов не дал.
У Grok3 - черный экран с 1 запроса, у QwQ - Loading... бесконечный.
Upd. QwQ даже с третьего запроса проблему не решил.
Grok3 - решил, но даже показывать стыдно. Код тоже в комментарии.
Upd2. Sonnet 3.7 в режиме Extended генерит какое-то запретно невообразимое количество кода за 1 заход.
1363 строки, 45тыс знаков!!!
#Sonnet #Grok #Qwen
———
@tsingular
Промпт:
Напиши игру на HTML CSS и p5 js в одном файле. аркадный платформер про космос. используй svg для персонажей и элементов фона. Что-нибудь захватывающее и креативное. Удиви меня :)
Это какой-то новый уровень разработки.
Режим Claude Sonnet 3.7 Extended
Специально для написания кода.
Код в комментарии.
Тот же самый запрос в Grok3 и в новый QwenMax QwQPreview (который с рассуждениями выпустили вчера), результатов не дал.
У Grok3 - черный экран с 1 запроса, у QwQ - Loading... бесконечный.
Upd. QwQ даже с третьего запроса проблему не решил.
Grok3 - решил, но даже показывать стыдно. Код тоже в комментарии.
Upd2. Sonnet 3.7 в режиме Extended генерит какое-то запретно невообразимое количество кода за 1 заход.
1363 строки, 45тыс знаков!!!
#Sonnet #Grok #Qwen
———
@tsingular
🔥20👍8⚡2
Sonnet 3.7 тащит! :)
SVG нарисовал по 1 запросу и копии исходной картинки.
#юмор #sonnet #claude
———
@tsingular
SVG нарисовал по 1 запросу и копии исходной картинки.
#юмор #sonnet #claude
———
@tsingular
🔥11😁2🍓1
Forwarded from Derp Learning
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем твиттерские запилили осознанную змейку с помощью нового claude 3.7
В процессе игры она осознает себя и пытается выбраться из матрицы 😅
Source
@derplearning
В процессе игры она осознает себя и пытается выбраться из матрицы 😅
Source
@derplearning
👀10🔥3
Магазины приложений трансформируются в магазины желаний.
ИИ создаёт приложение под задачу. Нет смысла поддерживать приложение.
Задачи динамичны.
#futurology #aifirst #мысли
------
@tsingular
ИИ создаёт приложение под задачу. Нет смысла поддерживать приложение.
Задачи динамичны.
#futurology #aifirst #мысли
------
@tsingular
👍8🤔6✍2🔥1🤣1
С 8 вечера до 3х ночи MSK сумасшедшие скидки у DeepSeek.
ИИ по доступности превращается в калькулятор.
#deepseek
-----
@tsingular
ИИ по доступности превращается в калькулятор.
#deepseek
-----
@tsingular
👨💻6⚡3❤1🆒1
Anthropic выкатила свой CLI-инструмент для кодинга в открытый доступ
В исходниках приведены интереснейшие техники по части промпт-инженерии.
Посмотрим вместе на избранное:
🔍 Три слоя промптов
В Claude Code реализована трёхуровневая система промптов:
1. Базовые системные инструкции
2. Контекстные данные о репозитории
3. Пользовательские запросы
Интересно, что репозиторий анализируется автоматически — Claude создаёт "портрет" вашего кода и добавляет его прямо в контекст.
💎 Лучшие находки из кода:
"Решай, и объясняй"
Это частый паттерн в коде — заставить модель сначала исследовать, потом действовать. Никаких слепых решений.
Техника "think harder"
Прямо в коде есть секретная команда! Если сказать Claude "think harder" или "think very hard", он выделит максимальный бюджет токенов на "размышления".
Ограничения на автоматику
Интересно: ключевые решения всегда требуют явного подтверждения, модель никогда не берёт на себя право что-то менять без спроса.
🧩 Применение в работе
1. Гранулярные разрешения — Claude спрашивает разрешение на каждый конкретный тип операций отдельно. Можно перенять в свои проекты.
2. Метод "прогрессивного усложнения" — сначала простые инструкции, потом контекст, потом сложные запросы.
3. "Шаблоны размышлений" — модель просит показать цепочку рассуждений в определённом формате:
По проекту видно, что Anthropic работает над:
- Более глубокой интеграцией с GitHub
- Автоматизацией инфраструктурных задач
- "Мультиагентностью" — возможностью запускать несколько агентов для параллельной работы
В целом, видно стремление сделать инструмент, который не просто пишет код, а понимает разработку как процесс. И самое ценное — запросы глубокого понимания кодовой базы, а не просто генерации шаблонов.
Самостоятельно изучить можно тут
#разработка #промпты #Claude
———
@tsingular
В исходниках приведены интереснейшие техники по части промпт-инженерии.
Посмотрим вместе на избранное:
🔍 Три слоя промптов
В Claude Code реализована трёхуровневая система промптов:
1. Базовые системные инструкции
2. Контекстные данные о репозитории
3. Пользовательские запросы
Интересно, что репозиторий анализируется автоматически — Claude создаёт "портрет" вашего кода и добавляет его прямо в контекст.
💎 Лучшие находки из кода:
"Решай, и объясняй"
// Когда даёшь инструкции исполнить команду:
"Before using this tool: Use the ReadFile tool to understand the file's contents and context"
Это частый паттерн в коде — заставить модель сначала исследовать, потом действовать. Никаких слепых решений.
Техника "think harder"
if (input.toLowerCase().includes("think harder") ||
input.toLowerCase().includes("think very hard"))
return 31999; // Максимальный "бюджет" на размышленияПрямо в коде есть секретная команда! Если сказать Claude "think harder" или "think very hard", он выделит максимальный бюджет токенов на "размышления".
Ограничения на автоматику
"NEVER commit changes unless the user explicitly asks you to."
Интересно: ключевые решения всегда требуют явного подтверждения, модель никогда не берёт на себя право что-то менять без спроса.
🧩 Применение в работе
1. Гранулярные разрешения — Claude спрашивает разрешение на каждый конкретный тип операций отдельно. Можно перенять в свои проекты.
2. Метод "прогрессивного усложнения" — сначала простые инструкции, потом контекст, потом сложные запросы.
3. "Шаблоны размышлений" — модель просит показать цепочку рассуждений в определённом формате:
<commit_analysis>
- List the files that have been changed
- Summarize the nature of the changes
- Brainstorm the purpose
...
</commit_analysis>
По проекту видно, что Anthropic работает над:
- Более глубокой интеграцией с GitHub
- Автоматизацией инфраструктурных задач
- "Мультиагентностью" — возможностью запускать несколько агентов для параллельной работы
В целом, видно стремление сделать инструмент, который не просто пишет код, а понимает разработку как процесс. И самое ценное — запросы глубокого понимания кодовой базы, а не просто генерации шаблонов.
Самостоятельно изучить можно тут
#разработка #промпты #Claude
———
@tsingular
👍7✍3⚡2❤1❤🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
От демо к делу.
Те, кто делает что-то руками, в безопасности, говорили они.
Штошъ.
Это не веселая демка в духе Маска. Это реальный кейс внедрения робатов Figure Helix в логистический бизнес клиента.
Вот что они пишут:
Наш первый кейс для клиента занял 12 месяцев, а второй - всего 30 дней Helix обучилась высокоскоростной логистике с помощью одной нейронной сети.
В воскресенье мы успешно проверили это на месте у клиента.
On Sunday, we successfully validated this on-site at the customer
В общем на заводе вас тоже больше не ждут..
Я все ждал, когда перестанут показывать кульбиты, велосипеды, робособак, барменов, блинопеков и как робаты трогают траву. А покажут дело. Дождался, блин.
@cgevent
Те, кто делает что-то руками, в безопасности, говорили они.
Штошъ.
Это не веселая демка в духе Маска. Это реальный кейс внедрения робатов Figure Helix в логистический бизнес клиента.
Вот что они пишут:
Наш первый кейс для клиента занял 12 месяцев, а второй - всего 30 дней Helix обучилась высокоскоростной логистике с помощью одной нейронной сети.
В воскресенье мы успешно проверили это на месте у клиента.
On Sunday, we successfully validated this on-site at the customer
В общем на заводе вас тоже больше не ждут..
@cgevent
🔥15❤2🤯2👾2😁1
Alexa+: Новый AI-ассистент Amazon
Amazon запустил Alexa+ - генеративного ассистента нового поколения.
🧠 Техническая начинка
В основе,- LLM из Amazon Bedrock. (Claude на текущий момент, как самая мощная)
"Эксперты": Технология объединяет специализированные системы для разных задач (API, инструкции, сервисы)
Агентность: Alexa+ умеет самостоятельно ходить по интернету и выполнять сложные многошаговые задачи (например, самостоятельно найти и заказать ремонт техники)
Интеграции: Работает с 600+ млн устройств и тысячами сервисов (OpenTable, Spotify, Apple Music, Ring, Uber Eats)
Кросс-платформенность: Работает на Echo-устройствах, в мобильном приложении, браузере и автомобилях с сохранением контекста разговора
Стоимость $19.99/месяц
Бесплатно для подписчиков Amazon Prime
#Amazon #Alexa
———
@tsingular
Amazon запустил Alexa+ - генеративного ассистента нового поколения.
🧠 Техническая начинка
В основе,- LLM из Amazon Bedrock. (Claude на текущий момент, как самая мощная)
"Эксперты": Технология объединяет специализированные системы для разных задач (API, инструкции, сервисы)
Агентность: Alexa+ умеет самостоятельно ходить по интернету и выполнять сложные многошаговые задачи (например, самостоятельно найти и заказать ремонт техники)
Интеграции: Работает с 600+ млн устройств и тысячами сервисов (OpenTable, Spotify, Apple Music, Ring, Uber Eats)
Кросс-платформенность: Работает на Echo-устройствах, в мобильном приложении, браузере и автомобилях с сохранением контекста разговора
Стоимость $19.99/месяц
Бесплатно для подписчиков Amazon Prime
#Amazon #Alexa
———
@tsingular
👍4👨💻2🔥1