Технозаметки Малышева

Claude 3.7 Sonnet: первая гибридная модель рассуждений от Anthropic

Anthropic выпустили обновление - модель Claude 3.7 Sonnet с двумя режимами работы.

Первый - мгновенные ответы, второй - расширенное пошаговое мышление с глубоким анализом.

Лимит контекста достиг 128K токенов, ложные отказы снижены на 45%.

Дополнительно представлен Claude Code - CLI-инструмент для работы с кодом, репозиториями и тестами.

Улучшена производительность в математике, физике и программировании.

Доступно на всех тарифах включая бесплатный.

Теперь ИИ не только быстро отвечает, но и умеет глубоко размышлять.
К 2027 году обещают, что каждое размышление будет давать ответ, равный результату многолетней работы команды экспертов.

#Anthropic #Claude #Sonnet
------
@tsingular

🔥13❤2

1.1K views18:36

Технозаметки Малышева

Неделя открытого кода от Deepseek.

Deepseek запустил неделю open-source релизов и уже выкатил два интересных проекта — DeepEP и FlashMLA.

DeepEP: открытая библиотека для ускорения работы MoE-коммуникаций между экспертами, повышая скорость обмена между GPU ядрами в режиме все-со-всеми.

- Поддержка FP8 для быстрых dispatch/combine операций
- Оптимизация как для внутринодовой (NVLink), так и межнодовой (RDMA) коммуникации
- Специальные низколатентные ядра для inference decoding (~160-370μs на некоторых конфигурациях)
- Контроль использования SM-ресурсов GPU (можно выделить 24 SM на коммуникацию)

Бенчмарки: на H800+CX7 получают 153-158 GB/s внутри ноды (по NVLink) и 40-47 GB/s между нодами (по RDMA).

FlashMLA: эффективные ядра для MLA-декодирования

В релизе оптимизированный MLA-декодер для GPU Hopper:
- Поддержка BF16 и FP16
- Paged kvcache с размером блока 64
- До 3000 GB/s при memory-bound и 580 TFLOPS при compute-bound нагрузках на H800

Где пригодится?
1. Для обучения собственных MoE-моделей — как открытый фреймворк, который позволяет эффективно тренировать большие MoE

2. Для тюнинга инференса — если у вас есть Hopper GPU, можно существенно ускорить декодирование моделей с MLA

3. Для понимания архитектуры DeepSeek-моделей — код показывает, как на самом деле устроены модели Deepseek V3

И это только начало их #OpenSourceWeek — ждем еще релизов, особенно полезно будет если они продолжат раскрывать архитектуру своих моделей.

Но как тут сказали товарищи на одном из вебинаров недавно, - будет грустно, если они выложат всё в оупенсорс, а у нас некому будет понять что там написано и даже воспроизвести.

#MoE #MLA #DeepSeek #OpenSourceWeek
———
@tsingular

🔥11❤1

1.01K views05:19

Технозаметки Малышева

1:16

Media is too big

VIEW IN TELEGRAM

Ну что, господа преподаватели.
Готовимся к новой реальности. :)

Это по-быстрому буквально на коленке за пол-часа.

Инструменты:
Claude Sonnet 3.7 - код для manim(в комментарии) и скрипт озвучки.
Suno 4 (полный трек музыки в комментарии )
Озвучка - Clipchamp - там теперь text2speech встроенный бесплатный на всех языках.

#manim #sonnet #suno #education #dev
———
@tsingular

🔥17😁1

1.15K viewsedited 08:05

Технозаметки Малышева

2:48

Media is too big

VIEW IN TELEGRAM

А вот вам пример работы профессионалов.

Клип-прототип (еще будет доделываться) от Сергея Пименова.

Использовались нейронки:
Flux, Runway, Kling, Krea, LumaLabs, Elevenlabs, Moises, Topaz.

https://t.me/pimenov_ru/6399

Если нужен профессиональный продакшен в нейрорендере, - рекомендую

#нейрорендер #pimenov #фабрикаконтента
———
@tsingular

🔥13👍1😁1

1.05K views08:21

Технозаметки Малышева

Яндекс представил YandexGPT 5 — новое поколение русскоязычного ИИ.

YandexGPT 5 Lite 8B Pretrain:
- Открытая модель с 8 млрд параметров, обучена на 15 трлн токенов (30% — русский язык).
- Двухэтапное обучение: Pretrain и Powerup.
- Опубликована на Hugging Face для свободного использования и дообучения.
- Превосходит аналоги в русскоязычных задачах.

YandexGPT 5 Pro:
- Доступна через API (Yandex Cloud) и в чате с Алисой.
- Основа — Qwen-2.5-32B-base, дообучена с новым методом LogDPO.
- На уровне GPT-4o, с преимуществом в русском языке.

Полезность для бизнеса:
- Локализация: глубокое понимание русского.
- Экономия: открытая модель + API.
- Гибкость: чат-боты, аналитика, автоматизация.

#YandexGPT #Яндекс
———
@tsingular

⚡10

1.12K views09:30

Технозаметки Малышева

наглядная иллюстрация зачем нужны ИИ агенты. :)

До и после на базе n8n

#n8n #агенты
———
@tsingular

👍9❤‍🔥1

993 viewsedited 10:43

Технозаметки Малышева

0:31

Media is too big

VIEW IN TELEGRAM

Google бесплатно раздаёт Gemini для разработчиков

Google запустил публичное превью бесплатной версии Gemini Code Assist для программистов.

ИИ-помощник работает на моделях Gemini 2.0, подготовленных специально для разработки ПО.

Пользователям доступно до 180 000 автодополнений кода ежемесячно — в 90 раз больше, чем у конкурентов.

Ассистент поддерживает все публичные языки программирования, интегрируется с VS Code и JetBrains, плюс уже работающие Firebase и Android Studio.

Функциональность включает генерацию кода, отладку и модификацию существующих приложений.

Контекстное окно составляет 128 000 токенов, что позволяет обрабатывать большой объём кодовой базы.

Gemini Code Review для GitHub:
- Работает для публичных и приватных репозиториев
- Анализирует стиль, находит баги
- Предлагает конкретные изменения кода
- Поддерживает кастомные гайдлайны через .gemini/styleguide.md в репозитории

Для подключения нужен только аккаунт Gmail, без привязки банковской карты.

Наконец-то нормальный бесплатный автопилот для кодеров. Google решил уничтожить рынок щедростью.

Куда катится этот мир?!.
Зачем я покупал Курсор?!

#Google #GeminiAI #CodeAssist
———
@tsingular

🆒8👍6⚡4👨‍💻1

1.09K views12:26

Технозаметки Малышева

1:09

This media is not supported in your browser

ggwave - очень удобная фишка для обмена данными между ИИ агентами.

https://github.com/ggerganov/ggwave

Не язык Скайнета, который захватит мир, а упрощение коммуникаций между дружелюбными ассистентами.

#ggwave #skynet
———
@tsingular

🔥8👀7👍2🤔2👾2

951 views12:44

Технозаметки Малышева

Microsoft раздаёт безлимит на Voice и Think Deeper

Microsoft только что объявила бесплатный неограниченный доступ к функциям Voice и Think Deeper (последний работает на модели o1 от OpenAI).

Теперь любой пользователь может:
- Использовать голосовой интерфейс для практики языков, подготовки к собеседованиям
- Запускать продвинутые сценарии анализа через Think Deeper для финансовых расчетов, оценки рисков и т.д.

Для бизнеса это значит:
- Доступ к инструментам уровня enterprise без дополнительных затрат
- Возможность использовать модели нового поколения для сложных аналитических задач

copilot.microsoft.com (VPN)

На фоне бесплатной раздачи Гуглом Gemini для разрабов, - это прямо праздник какой-то.
И, напомню, Grok3 тоже пока доступен бесплатно.

Что происходит? ИИ становится доступнее калькулятора?
Они же так датацентры не окупят никогда.

#Microsoft #free #Copilot
———
@tsingular

🔥10⚡3👀2❤1👍1

1.05K viewsedited 18:54

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

Если у вас есть плюс-подписка на chatGPT, то у вас теперь есть/будет Deep Research.

10 запросов в месяц.

https://cdn.openai.com/deep-research-system-card.pdf

@cgevent

992 views19:03

Технозаметки Малышева

0:36

Media is too big

VIEW IN TELEGRAM

Sonnet 3.7 с 1 запроса написал такой вот платформер.

Промпт:

Напиши игру на HTML CSS и p5 js в одном файле. аркадный платформер про космос. используй svg для персонажей и элементов фона. Что-нибудь захватывающее и креативное. Удиви меня :)

Это какой-то новый уровень разработки.
Режим Claude Sonnet 3.7 Extended
Специально для написания кода.

Код в комментарии.

Тот же самый запрос в Grok3 и в новый QwenMax QwQPreview (который с рассуждениями выпустили вчера), результатов не дал.
У Grok3 - черный экран с 1 запроса, у QwQ - Loading... бесконечный.

Upd. QwQ даже с третьего запроса проблему не решил.
Grok3 - решил, но даже показывать стыдно. Код тоже в комментарии.

Upd2. Sonnet 3.7 в режиме Extended генерит какое-то запретно невообразимое количество кода за 1 заход.
1363 строки, 45тыс знаков!!!

#Sonnet #Grok #Qwen
———
@tsingular

🔥20👍8⚡2

1.37K viewsedited 22:04

Технозаметки Малышева

Sonnet 3.7 тащит! :)

SVG нарисовал по 1 запросу и копии исходной картинки.

#юмор #sonnet #claude
———
@tsingular

🔥11😁2🍓1

1.05K viewsedited 23:05

Технозаметки Малышева

Forwarded from Derp Learning

1:58

This media is not supported in your browser

VIEW IN TELEGRAM

Тем временем твиттерские запилили осознанную змейку с помощью нового claude 3.7

В процессе игры она осознает себя и пытается выбраться из матрицы 😅

Source

@derplearning

👀10🔥3

1.25K views23:11

Технозаметки Малышева

Магазины приложений трансформируются в магазины желаний.

ИИ создаёт приложение под задачу. Нет смысла поддерживать приложение.
Задачи динамичны.

#futurology #aifirst #мысли
------
@tsingular

👍8🤔6✍2🔥1🤣1

1.11K viewsedited 11:53

Технозаметки Малышева

С 8 вечера до 3х ночи MSK сумасшедшие скидки у DeepSeek.

ИИ по доступности превращается в калькулятор.

#deepseek
-----
@tsingular

👨‍💻6⚡3❤1🆒1

1.25K views13:05

Технозаметки Малышева

Anthropic выкатила свой CLI-инструмент для кодинга в открытый доступ

В исходниках приведены интереснейшие техники по части промпт-инженерии.

Посмотрим вместе на избранное:

🔍 Три слоя промптов

В Claude Code реализована трёхуровневая система промптов:
1. Базовые системные инструкции
2. Контекстные данные о репозитории
3. Пользовательские запросы

Интересно, что репозиторий анализируется автоматически — Claude создаёт "портрет" вашего кода и добавляет его прямо в контекст.

💎 Лучшие находки из кода:

"Решай, и объясняй"

// Когда даёшь инструкции исполнить команду:
"Before using this tool: Use the ReadFile tool to understand the file's contents and context"

Это частый паттерн в коде — заставить модель сначала исследовать, потом действовать. Никаких слепых решений.

Техника "think harder"

if (input.toLowerCase().includes("think harder") || 
    input.toLowerCase().includes("think very hard")) 
    return 31999; // Максимальный "бюджет" на размышления

Прямо в коде есть секретная команда! Если сказать Claude "think harder" или "think very hard", он выделит максимальный бюджет токенов на "размышления".

Ограничения на автоматику

"NEVER commit changes unless the user explicitly asks you to."

Интересно: ключевые решения всегда требуют явного подтверждения, модель никогда не берёт на себя право что-то менять без спроса.

🧩 Применение в работе
1. Гранулярные разрешения — Claude спрашивает разрешение на каждый конкретный тип операций отдельно. Можно перенять в свои проекты.

2. Метод "прогрессивного усложнения" — сначала простые инструкции, потом контекст, потом сложные запросы.

3. "Шаблоны размышлений" — модель просит показать цепочку рассуждений в определённом формате:

<commit_analysis>
- List the files that have been changed
- Summarize the nature of the changes
- Brainstorm the purpose
...
</commit_analysis>

По проекту видно, что Anthropic работает над:
- Более глубокой интеграцией с GitHub
- Автоматизацией инфраструктурных задач
- "Мультиагентностью" — возможностью запускать несколько агентов для параллельной работы

В целом, видно стремление сделать инструмент, который не просто пишет код, а понимает разработку как процесс. И самое ценное — запросы глубокого понимания кодовой базы, а не просто генерации шаблонов.

Самостоятельно изучить можно тут

#разработка #промпты #Claude
———
@tsingular

👍7✍3⚡2❤1❤‍🔥1

1.28K views18:36

Технозаметки Малышева

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

1:32

This media is not supported in your browser

VIEW IN TELEGRAM

От демо к делу.

Те, кто делает что-то руками, в безопасности, говорили они.

Штошъ.

Это не веселая демка в духе Маска. Это реальный кейс внедрения робатов Figure Helix в логистический бизнес клиента.

Вот что они пишут:

Наш первый кейс для клиента занял 12 месяцев, а второй - всего 30 дней Helix обучилась высокоскоростной логистике с помощью одной нейронной сети.

В воскресенье мы успешно проверили это на месте у клиента.
On Sunday, we successfully validated this on-site at the customer

В общем на заводе вас тоже больше не ждут..

Я все ждал, когда перестанут показывать кульбиты, велосипеды, робособак, барменов, блинопеков и как робаты трогают траву. А покажут дело. Дождался, блин.

@cgevent

🔥15❤2🤯2👾2😁1

1.03K views18:42

Технозаметки Малышева

Alexa+: Новый AI-ассистент Amazon

Amazon запустил Alexa+ - генеративного ассистента нового поколения.

🧠 Техническая начинка
В основе,- LLM из Amazon Bedrock. (Claude на текущий момент, как самая мощная)

"Эксперты": Технология объединяет специализированные системы для разных задач (API, инструкции, сервисы)

Агентность: Alexa+ умеет самостоятельно ходить по интернету и выполнять сложные многошаговые задачи (например, самостоятельно найти и заказать ремонт техники)

Интеграции: Работает с 600+ млн устройств и тысячами сервисов (OpenTable, Spotify, Apple Music, Ring, Uber Eats)

Кросс-платформенность: Работает на Echo-устройствах, в мобильном приложении, браузере и автомобилях с сохранением контекста разговора

Стоимость $19.99/месяц
Бесплатно для подписчиков Amazon Prime

#Amazon #Alexa
———
@tsingular

👍4👨‍💻2🔥1

1.14K viewsedited 06:36

About

Blog

Apps

Platform