Технозаметки Малышева
8.25K subscribers
3.72K photos
1.39K videos
40 files
3.91K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Claude 3.7 Sonnet: первая гибридная модель рассуждений от Anthropic

Anthropic выпустили обновление - модель Claude 3.7 Sonnet с двумя режимами работы.

Первый - мгновенные ответы, второй - расширенное пошаговое мышление с глубоким анализом.

Лимит контекста достиг 128K токенов, ложные отказы снижены на 45%.

Дополнительно представлен Claude Code - CLI-инструмент для работы с кодом, репозиториями и тестами.

Улучшена производительность в математике, физике и программировании.

Доступно на всех тарифах включая бесплатный.

Теперь ИИ не только быстро отвечает, но и умеет глубоко размышлять.
К 2027 году обещают, что каждое размышление будет давать ответ, равный результату многолетней работы команды экспертов.

#Anthropic #Claude #Sonnet
------
@tsingular
🔥132
Неделя открытого кода от Deepseek.

Deepseek запустил неделю open-source релизов и уже выкатил два интересных проекта — DeepEP и FlashMLA.

DeepEP: открытая библиотека для ускорения работы MoE-коммуникаций между экспертами, повышая скорость обмена между GPU ядрами в режиме все-со-всеми.

- Поддержка FP8 для быстрых dispatch/combine операций
- Оптимизация как для внутринодовой (NVLink), так и межнодовой (RDMA) коммуникации
- Специальные низколатентные ядра для inference decoding (~160-370μs на некоторых конфигурациях)
- Контроль использования SM-ресурсов GPU (можно выделить 24 SM на коммуникацию)

Бенчмарки: на H800+CX7 получают 153-158 GB/s внутри ноды (по NVLink) и 40-47 GB/s между нодами (по RDMA).

FlashMLA: эффективные ядра для MLA-декодирования

В релизе оптимизированный MLA-декодер для GPU Hopper:
- Поддержка BF16 и FP16
- Paged kvcache с размером блока 64
- До 3000 GB/s при memory-bound и 580 TFLOPS при compute-bound нагрузках на H800

Где пригодится?
1. Для обучения собственных MoE-моделей — как открытый фреймворк, который позволяет эффективно тренировать большие MoE

2. Для тюнинга инференса — если у вас есть Hopper GPU, можно существенно ускорить декодирование моделей с MLA

3. Для понимания архитектуры DeepSeek-моделей — код показывает, как на самом деле устроены модели Deepseek V3

И это только начало их #OpenSourceWeek — ждем еще релизов, особенно полезно будет если они продолжат раскрывать архитектуру своих моделей.

Но как тут сказали товарищи на одном из вебинаров недавно, - будет грустно, если они выложат всё в оупенсорс, а у нас некому будет понять что там написано и даже воспроизвести.

#MoE #MLA #DeepSeek #OpenSourceWeek
———
@tsingular
🔥111
Media is too big
VIEW IN TELEGRAM
Ну что, господа преподаватели.
Готовимся к новой реальности. :)

Это по-быстрому буквально на коленке за пол-часа.

Инструменты:
Claude Sonnet 3.7 - код для manim(в комментарии) и скрипт озвучки.
Suno 4 (полный трек музыки в комментарии )
Озвучка - Clipchamp - там теперь text2speech встроенный бесплатный на всех языках.

#manim #sonnet #suno #education #dev
———
@tsingular
🔥17😁1
Media is too big
VIEW IN TELEGRAM
А вот вам пример работы профессионалов.

Клип-прототип (еще будет доделываться) от Сергея Пименова.

Использовались нейронки:
Flux, Runway, Kling, Krea, LumaLabs, Elevenlabs, Moises, Topaz.

https://t.me/pimenov_ru/6399

Если нужен профессиональный продакшен в нейрорендере, - рекомендую

#нейрорендер #pimenov #фабрикаконтента
———
@tsingular
🔥13👍1😁1
Яндекс представил YandexGPT 5 — новое поколение русскоязычного ИИ.

YandexGPT 5 Lite 8B Pretrain:
- Открытая модель с 8 млрд параметров, обучена на 15 трлн токенов (30% — русский язык).
- Двухэтапное обучение: Pretrain и Powerup.
- Опубликована на Hugging Face для свободного использования и дообучения.
- Превосходит аналоги в русскоязычных задачах.

YandexGPT 5 Pro:
- Доступна через API (Yandex Cloud) и в чате с Алисой.
- Основа — Qwen-2.5-32B-base, дообучена с новым методом LogDPO.
- На уровне GPT-4o, с преимуществом в русском языке.

Полезность для бизнеса:
- Локализация: глубокое понимание русского.
- Экономия: открытая модель + API.
- Гибкость: чат-боты, аналитика, автоматизация.

#YandexGPT #Яндекс
———
@tsingular
10
наглядная иллюстрация зачем нужны ИИ агенты. :)

До и после на базе n8n

#n8n #агенты
———
@tsingular
👍9❤‍🔥1
Media is too big
VIEW IN TELEGRAM
Google бесплатно раздаёт Gemini для разработчиков

Google запустил публичное превью бесплатной версии Gemini Code Assist для программистов.

ИИ-помощник работает на моделях Gemini 2.0, подготовленных специально для разработки ПО.

Пользователям доступно до 180 000 автодополнений кода ежемесячно — в 90 раз больше, чем у конкурентов.

Ассистент поддерживает все публичные языки программирования, интегрируется с VS Code и JetBrains, плюс уже работающие Firebase и Android Studio.

Функциональность включает генерацию кода, отладку и модификацию существующих приложений.

Контекстное окно составляет 128 000 токенов, что позволяет обрабатывать большой объём кодовой базы.

Gemini Code Review для GitHub:
- Работает для публичных и приватных репозиториев
- Анализирует стиль, находит баги
- Предлагает конкретные изменения кода
- Поддерживает кастомные гайдлайны через .gemini/styleguide.md в репозитории

Для подключения нужен только аккаунт Gmail, без привязки банковской карты.

Наконец-то нормальный бесплатный автопилот для кодеров. Google решил уничтожить рынок щедростью.

Куда катится этот мир?!.
Зачем я покупал Курсор?!

#Google #GeminiAI #CodeAssist
———
@tsingular
🆒8👍64👨‍💻1
ggwave - очень удобная фишка для обмена данными между ИИ агентами.

https://github.com/ggerganov/ggwave

Не язык Скайнета, который захватит мир, а упрощение коммуникаций между дружелюбными ассистентами.

#ggwave #skynet
———
@tsingular
🔥8👀7👍2🤔2👾2
Microsoft раздаёт безлимит на Voice и Think Deeper

Microsoft только что объявила бесплатный неограниченный доступ к функциям Voice и Think Deeper (последний работает на модели o1 от OpenAI).

Теперь любой пользователь может:
- Использовать голосовой интерфейс для практики языков, подготовки к собеседованиям
- Запускать продвинутые сценарии анализа через Think Deeper для финансовых расчетов, оценки рисков и т.д.

Для бизнеса это значит:
- Доступ к инструментам уровня enterprise без дополнительных затрат
- Возможность использовать модели нового поколения для сложных аналитических задач

copilot.microsoft.com (VPN)

На фоне бесплатной раздачи Гуглом Gemini для разрабов, - это прямо праздник какой-то.
И, напомню, Grok3 тоже пока доступен бесплатно.

Что происходит? ИИ становится доступнее калькулятора?
Они же так датацентры не окупят никогда.

#Microsoft #free #Copilot
———
@tsingular
🔥103👀21👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Если у вас есть плюс-подписка на chatGPT, то у вас теперь есть/будет Deep Research.

10 запросов в месяц.

https://cdn.openai.com/deep-research-system-card.pdf

@cgevent
Media is too big
VIEW IN TELEGRAM
Sonnet 3.7 с 1 запроса написал такой вот платформер.

Промпт:
Напиши игру на HTML CSS и p5 js в одном файле. аркадный платформер про космос. используй svg для персонажей и элементов фона. Что-нибудь захватывающее и креативное. Удиви меня :)


Это какой-то новый уровень разработки.
Режим Claude Sonnet 3.7 Extended
Специально для написания кода.

Код в комментарии.

Тот же самый запрос в Grok3 и в новый QwenMax QwQPreview (который с рассуждениями выпустили вчера), результатов не дал.
У Grok3 - черный экран с 1 запроса, у QwQ - Loading... бесконечный.

Upd. QwQ даже с третьего запроса проблему не решил.
Grok3 - решил, но даже показывать стыдно. Код тоже в комментарии.

Upd2. Sonnet 3.7 в режиме Extended генерит какое-то запретно невообразимое количество кода за 1 заход.
1363 строки, 45тыс знаков!!!

#Sonnet #Grok #Qwen
———
@tsingular
🔥20👍82
Sonnet 3.7 тащит! :)

SVG нарисовал по 1 запросу и копии исходной картинки.

#юмор #sonnet #claude
———
@tsingular
🔥11😁2🍓1
Forwarded from Derp Learning
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем твиттерские запилили осознанную змейку с помощью нового claude 3.7

В процессе игры она осознает себя и пытается выбраться из матрицы 😅

Source

@derplearning
👀10🔥3
Магазины приложений трансформируются в магазины желаний.

ИИ создаёт приложение под задачу. Нет смысла поддерживать приложение.
Задачи динамичны.

#futurology #aifirst #мысли
------
@tsingular
👍8🤔62🔥1🤣1
С 8 вечера до 3х ночи MSK сумасшедшие скидки у DeepSeek.

ИИ по доступности превращается в калькулятор.

#deepseek
-----
@tsingular
👨‍💻631🆒1
Anthropic выкатила свой CLI-инструмент для кодинга в открытый доступ

В исходниках приведены интереснейшие техники по части промпт-инженерии.

Посмотрим вместе на избранное:

🔍 Три слоя промптов

В Claude Code реализована трёхуровневая система промптов:
1. Базовые системные инструкции
2. Контекстные данные о репозитории
3. Пользовательские запросы

Интересно, что репозиторий анализируется автоматически — Claude создаёт "портрет" вашего кода и добавляет его прямо в контекст.

💎 Лучшие находки из кода:

"Решай, и объясняй"
// Когда даёшь инструкции исполнить команду:
"Before using this tool: Use the ReadFile tool to understand the file's contents and context"

Это частый паттерн в коде — заставить модель сначала исследовать, потом действовать. Никаких слепых решений.

Техника "think harder"
if (input.toLowerCase().includes("think harder") || 
input.toLowerCase().includes("think very hard"))
return 31999; // Максимальный "бюджет" на размышления

Прямо в коде есть секретная команда! Если сказать Claude "think harder" или "think very hard", он выделит максимальный бюджет токенов на "размышления".

Ограничения на автоматику
"NEVER commit changes unless the user explicitly asks you to."

Интересно: ключевые решения всегда требуют явного подтверждения, модель никогда не берёт на себя право что-то менять без спроса.

🧩 Применение в работе
1. Гранулярные разрешения — Claude спрашивает разрешение на каждый конкретный тип операций отдельно. Можно перенять в свои проекты.

2. Метод "прогрессивного усложнения" — сначала простые инструкции, потом контекст, потом сложные запросы.

3. "Шаблоны размышлений" — модель просит показать цепочку рассуждений в определённом формате:
<commit_analysis>
- List the files that have been changed
- Summarize the nature of the changes
- Brainstorm the purpose
...
</commit_analysis>


По проекту видно, что Anthropic работает над:
- Более глубокой интеграцией с GitHub
- Автоматизацией инфраструктурных задач
- "Мультиагентностью" — возможностью запускать несколько агентов для параллельной работы

В целом, видно стремление сделать инструмент, который не просто пишет код, а понимает разработку как процесс. И самое ценное — запросы глубокого понимания кодовой базы, а не просто генерации шаблонов.

Самостоятельно изучить можно тут

#разработка #промпты #Claude
———
@tsingular
👍7321❤‍🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
От демо к делу.

Те, кто делает что-то руками, в безопасности, говорили они.

Штошъ.

Это не веселая демка в духе Маска. Это реальный кейс внедрения робатов Figure Helix в логистический бизнес клиента.

Вот что они пишут:

Наш первый кейс для клиента занял 12 месяцев, а второй - всего 30 дней Helix обучилась высокоскоростной логистике с помощью одной нейронной сети.

В воскресенье мы успешно проверили это на месте у клиента.
On Sunday, we successfully validated this on-site at the customer


В общем на заводе вас тоже больше не ждут..

Я все ждал, когда перестанут показывать кульбиты, велосипеды, робособак, барменов, блинопеков и как робаты трогают траву. А покажут дело. Дождался, блин.

@cgevent
🔥152🤯2👾2😁1
Alexa+: Новый AI-ассистент Amazon

Amazon запустил Alexa+ - генеративного ассистента нового поколения.

🧠 Техническая начинка
В основе,- LLM из Amazon Bedrock. (Claude на текущий момент, как самая мощная)

"Эксперты": Технология объединяет специализированные системы для разных задач (API, инструкции, сервисы)

Агентность: Alexa+ умеет самостоятельно ходить по интернету и выполнять сложные многошаговые задачи (например, самостоятельно найти и заказать ремонт техники)

Интеграции: Работает с 600+ млн устройств и тысячами сервисов (OpenTable, Spotify, Apple Music, Ring, Uber Eats)

Кросс-платформенность: Работает на Echo-устройствах, в мобильном приложении, браузере и автомобилях с сохранением контекста разговора

Стоимость $19.99/месяц
Бесплатно для подписчиков Amazon Prime

#Amazon #Alexa
———
@tsingular
👍4👨‍💻2🔥1