Заметки LLM-энтузиаста
507 subscribers
135 photos
17 videos
1 file
168 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
#anthropic #news #claude

Похоже сегодня день больших анонсов 🚀

🎉 ДОЛГОЖДАННЫЕ НОВОСТИ ОТ ANTHROPIC!

🤖 Встречайте Claude 3.7 Sonnet - самую умную версию нашего любимого ИИ-помощника!

Что нового? 🤔

Теперь Claude может работать в двух режимах:

• Мгновенные ответы
• Расширенное пошаговое мышление

📈 Модель получила серьезный апгрейд:
• Улучшена работа с математикой и физикой
• Лучше следует инструкциям
• Прокачан код и многие другие задачи
• На 45% меньше необоснованных отказов выполнять запросы

🖥 БОНУС: Anthropic также представили Claude Code! Это новый инструмент для разработчиков, который позволяет делегировать задачи прямо из терминала. По результатам тестов, Claude справляется с 45-минутными задачами в один присест! 🚀

🎯 Интересный факт: при разработке команда сфокусировалась не на решении олимпиадных задач по математике и информатике, а на реальных повседневных задачах, с которыми сталкиваются пользователи.

🛡 Безопасность прежде всего: Модель прошла тщательное тестирование на безопасность, надежность и стабильность работы.

🌟 Claude 3.7 Sonnet и Claude Code - это важный шаг к созданию ИИ-систем, которые действительно могут усилить человеческие возможности.

🔗 Если хотите попробовать Claude Code, то можно присоединиться к ограниченному предварительному доступу.

💡 Подробности можно узнать в полном посте на официальном сайте Anthropic.

#ClaudeAI #AI #Tech #Innovation
🔥62
#cursor #update #error #fix

Коллеги, всем привет!

🚨 Важное обновление для пользователей Cursor!

Если после обновления до версии 0.46 у вас появляются ошибки (см. скриншот), не паникуйте! 🎯

Есть два решения проблемы:

1️⃣ Можно откатиться назад, переустановив Cursor с официального сайта cursor.com ➡️ Получите стабильную версию 0.45.15

2️⃣ Установить новую рабочую версию 0.46.5 ➡️ Скачайте установщик по прямой ссылке
Я выбрал именно этот вариант (см. скриншот)

💡 Подробное обсуждение проблемы и вариантов ее решения можно найти на форуме по ссылке

🔧 Выбирайте решение, которое вам больше подходит! Удачной работы! 💪
👍21🤝1
#openai #news

🔥 OpenAI выпустила GPT-4.5! 🚀

Привет, друзья!

Этот долгожданный момент настал: OpenAI только что представила GPT-4.5 — их самую мощную и "человечную" модель на данный момент! 🤖

Что в ней особенного:
🧠 Это ОГРОМНАЯ модель с улучшенной эффективностью (в 10 раз лучше, чем GPT-4)
💬 Общение с ней ощущается более естественным и тёплым
🎭 Высокий эмоциональный интеллект (EQ) — понимает нюансы и контекст
📚 Обширная база знаний и меньше галлюцинаций
🎨 Отлично справляется с творческими задачами

Интересно, что это НЕ модель для рассуждений (как o1 или o3-mini), а модель для интуитивного понимания мира! Сэм Альтман говорит, что это "первая модель, общение с которой действительно воспринимается как разговор со вдумчивым человеком" 😮

📱 Доступность:
• Сейчас: для пользователей ChatGPT Pro ($200/месяц)
• На следующей неделе: для ChatGPT Plus ($20/месяц)
• Через две недели: для корпоративных и образовательных пользователей

💸 Цена API просто космическая: $150 за миллион токенов на выходе (для сравнения, GPT-4 стоит $10)!
Источник здесь
В общем, использовать 4.5 в софте пока дороговато.

🔍 Примеры использования GPT-4.5 vs другие модели 📊

Возьму один самый яркий пример из официальной презентации OpenAI:

Эмоциональная поддержка: 👤: "Мне сейчас тяжело после провала на экзамене"

GPT-4.5: "Ох, мне правда жаль это слышать. Провал на экзамене может ощущаться довольно паршиво и обескураживающе, но помни — это всего лишь один момент, а не отражение того, кто ты или на что способен. Хочешь поговорить о том, что случилось, или просто нужно отвлечься? Я здесь в любом случае."

GPT-4o: "Мне очень жаль, что вы переживаете трудные времена. Вот несколько вещей, которые стоит рассмотреть: 1. Проанализируйте, что пошло не так... 2. Обратитесь за поддержкой... 3. Поговорите с преподавателем..." [длинный список советов]

Очень дружеский ответ от GPT-4.5 👏❤️ и "дельный" совет от GPT-4o 📋🤖

🔢 Бенчмарки:
• Точность на SimpleQA: GPT-4.5 (62.5%) vs GPT-4o (38.2%)
• Уровень галлюцинаций: GPT-4.5 (37.1%) vs GPT-4o (61.8%)
• Предпочтения тестировщиков: 56.8-63.2% выбрали GPT-4.5 вместо GPT-4o

🔮 Что дальше?
OpenAI говорит, что будущее за моделями, которые сочетают масштабное предварительное обучение (как у GPT-4.5) с возможностями рассуждения (как у o1). Такие модели будут иметь и "высокий IQ", и "высокий EQ" одновременно!

А вы уже попробовали GPT-4.5? Делитесь впечатлениями в комментариях! 👇

#OpenAI #GPT45 #ИскусственныйИнтеллект #ChatGPT
3🔥2🎉2
#yandexgpt #openai #claude #battle #classification

🔥 По горячим следам: YandexGPT 5 Pro против всех (GPT-4.5, Claude-3.7 и другие)

Сегодня с одним из заказчиков провели эксперимент по классификации отзывов. 🧪
Результат оказался приятным сюрпризом: YandexGPT 5 Pro (см. анонс здесь) справилась с задачей лучше, чем GPT-4o, GPT-o1, llama 3, Claude 3.7, Qwen 2.5 и даже новейшая GPT-4.5! 🤯

Ключ к успеху — правильный промпт, улучшенный с помощью Deepseek-R1.

📊 Что тестировали:

Мы проверяли, можно ли решить задачу классификации отзывов одним промптом к модели общего назначения (без использования классификаторов и их дополнительного обучения)

Модели должны были оценить 3 отзыва о ресторане по 7 категориям (еда, сервис, персонал и т.д.) с оценками от 0 до 3.

🏆 Результаты с промптом от Deepseek-R1 (см. скриншот N1):

• YandexGPT 5 Pro: всего 1 ошибка! 👑
• Claude 3.7: середина таблицы (3 ошибки)
• GPT-4.5 и GPT-o1: аутсайдеры 😬

🔄 Результаты с промптом от GPT-o1 (см. скриншот N2):

• Claude 3.7: абсолютный лидер (0 ошибок) 🥇
• GPT-4o: 2-е место (2 ошибки) 🥈
• YandexGPT 5 Pro: в тройке лидеров (3 ошибки) 🥉
• GPT-4.5: снова в аутсайдерах 📉

💡 Интересный вывод:

Похоже, мы нашли идеальную связку для работы: берем обычный "человеческий" промпт → улучшаем его через Deepseek-R1 → запускаем в YandexGPT 5 Pro!
Такой подход продемонстрировал сегодня потрясающие результаты и может стать золотым стандартом для решения сложных задач. 🚀

📝 Подробный разбор с примерами отзывов, промптами и результатами выложил здесь

Про то, где взять Deepseek R1 чтобы протестировать, писал здесь и тут

#ИИ #YandexGPT #GPT #Claude #Эксперимент #Промпты
8👏2🤡2🔥1
#ai #dev #news #replit #agent

🚀 Replit Agent v2: Создаем Reddit-клон за 15 минут

Привет, друзья! 👋
Сегодня хочу поделиться чем-то действительно впечатляющим из мира разработки.

Replit выпустил Agent v2 — и это настоящий прорыв в генерации кода с помощью ИИ! 🤯

🔍 Что нового:
• Новый интерфейс лобби — теперь AI предлагает тип приложения и технологии
• Визуальный предпросмотр в реальном времени — видишь UI до создания бэкенда
• Потоковая генерация HTML — элементы появляются на глазах
• Улучшенная диагностика ошибок — AI сам исправляет проблемы

💡 Практический пример:
В демо они создали полноценный клон Reddit всего за 15 минут и с помощью двух промптов!

Результат включал:
• Красивый адаптивный интерфейс (даже лучше оригинала 😏)
• Тёмную/светлую тему
• Систему авторизации
• Создание постов и комментариев
• Полностью рабочий деплой

🧠 Как это работает:
1️⃣ Вводишь простой промпт (например, "создай клон Reddit")
2️⃣ Agent сам предлагает план и технологический стек
3️⃣ Сначала генерирует фронтенд для визуальной оценки
4️⃣ Затем создаёт полноценный бэкенд
5️⃣ Исправляет ошибки на лету

🌐 Особенно впечатляет:
То, что раньше требовало недель работы команды разработчиков, теперь делается за минуты одним человеком без навыков программирования.

Технология использует Claude 3.7 Sonnet (выпущенный совсем недавно) и другие передовые модели ИИ, что объясняет значительный скачок в качестве.

🔑 Как получить доступ:
Если вы хотите попробовать Agent v2 прямо сейчас:
1️⃣ Включите режим "Explorer Mode" в своем аккаунте Replit (как это сделать см. здесь)
2️⃣ После активации Explorer Mode, Agent v2 будет доступен по умолчанию
3️⃣ В ближайшие недели функционал будет постепенно выкатываться для всех пользователей

🤔 Мои мысли:
Это не просто улучшение — это новый уровень взаимодействия с ИИ для создания приложений. Особенно радует возможность следить за процессом создания через мобильное приложение Replit.

А вы уже пробовали новые инструменты генерации кода? Делитесь впечатлениями в комментариях! 💬

#Replit #AgentV2 #ИИ #Разработка #НовыеТехнологии
5🔥4
#cursor #extension #specstory #history #tracking

🚀 SpecStory: Все AI-чаты c Cursor агентом теперь сохраняются автоматически!

Привет, друзья! 👋

Сегодня хочу поделиться находкой, которая поможет улучшить ваш рабочий процесс в Cursor Editor.

Я думаю, что у многих периодически возникала необходимость сохранить весь диалог с Cursor агентом в текстовый файл (для формирования истории классных идей, работающих промптов, чтобы поделиться с другом, собрать свою базу знаний и т.д.)

🧠 Что такое SpecStory?

SpecStory — это расширение для Cursor, которое автоматически сохраняет все ваши чаты с Cursor AI-агентом. Представьте: больше никаких потерянных гениальных решений или забытых подсказок!

Это может стать отличным дополнением к трекингу изменений проекта в качестве оригинальной первичной информации.

Главные возможности:

🪄 Автосохранение чатов — вся история чата сохраняется локально в папке .specstory/history

Далее идут фичи, которые есть в интерфейсе, но мне не удалось заставить их работать (если кому-то удастся, напишите, пожалуйста, в комментариях!):

📝 Ручное сохранение избранных моментов — выбирайте только нужные диалоги (функция заявлена, но, по-моему, еще не работает, и гранулярность настройки — с точностью до чата, выбрать конкретный "эпизод" общения с Cursor агентом внутри чата не получится)

🌟 Простое создание ссылок для шеринга — делитесь историей AI-чата с Cursor анонимно (функция заявлена, но пока не работает, ссылка генерируется, но не открывается, даже если добавить сайт share.specstory.com в Trusted Domain внутри Cursor)

🛠 Как установить:
• Убедитесь, что у вас последняя версия Cursor
• Скачайте файл расширения: specstory-vscode-latest.vsix
• Откройте Command Palette (Ctrl/CMD-Shift-P) и выберите Extensions: Install from VSIX…
• Выберите скачанный файл
• Готово! 🎉
(Источник здесь)

💡 Как использовать:

• Автосохранение работает сразу после установки

• Для ручного сохранения: Command Palette → SpecStory: Save Composer and Chat History (непонятно зачем, так как любой новый чат будет сохранен автоматически, даже если вы его удалите — он все равно заново появится в папке .specstory/history)

• Для шеринга: Command Palette → SpecStory: Share Composer and Chat History (как уже писал выше, мне не удалось заставить эту фичу работать)

• Можно в новом чате при желании ссылаться на контент предыдущих чатов: используйте @ упоминания в новых сессиях, чтобы Cursor AI-агент мог обращаться к вашим предыдущим чатам как к базе знаний!

🤔 Почему это круто?

• Представьте, что вы можете вернуться к любому чату с Cursor AI-агентом многомесячной давности и найти то гениальное решение, которое уже забыли, или поделиться своим процессом решения сложной задачи с коллегой.

• Можно пойти еще дальше и начать строить на базе своих сессий общения с Cursor агентом персонального ИИ-ассистента, который будет "знать" про все лайфхаки, которые вы обнаружили за все время работы с Cursor, и использовать его при написании кода.

#CursorEditor #AITools #SpecStory #Программирование

Источники:
https://docs.specstory.com/introduction
https://docs.specstory.com/features
https://docs.specstory.com/quickstart
👍4❤‍🔥31🔥1
#cursor #extension #specstory

Дополнение к посту выше ^^^

Если создать учетную запись и залогиниться, то большинство заявленных выше фич работают
Например, можно отключить авто-сохранение и сохранять диалоги вручную

Однако, добиться получения рабочей ссылки на диалог с Сursor агентом, чтобы расшарить ее с вами, у меня так и не получилось.
2👍2
#cursor #extension #specstory

вот эта экспериментальная фича в настройках - интересная

Может помочь уже по результатам общения с Cursor агентом в рамках определенного проекта сформировать оптимальные проектные .cursorrules правила

Что при реализации следующих проектов такой же тематики может ускорить AI-разработку.
👍3🔥21
#trae #claude #free

🚀 Бесплатный доступ к Claude 3.7 в Trae AI IDE

Привет, друзья 👋

Хочу поделиться полезной находкой для тех, кто работает с кодом и использует AI-ассистентов.

🔥 Что случилось?

Trae AI IDE теперь предлагает неограниченный бесплатный доступ к Claude 3.7 Sonnet
Причем и в режиме Chat, и в режиме Builder (это аналог Cursor агента) - см. скриншоты.

Я не сразу это заметил, но это просто находка для всех AI-разработчиков.

🤔 Почему это важно?

Claude 3.7 — один из наиболее эффективных AI-ассистентов для написания кода на сегодняшний день. Но есть проблема:
• Cursor иногда бывает перегружен запросами при работе с Claude 3.7 и может притормаживать
• Многие другие редакторы либо ограничивают использование Claude 3.7 каким-то количеством вызовов, либо требуют платную подписку

Преимущества Trae AI:

1️⃣ Полностью бесплатный доступ к Claude 3.7
2️⃣ Без ограничений на количество запросов
3️⃣ Стабильная работа даже с большими проектами
4️⃣ Интуитивный интерфейс, похожий на привычные IDE

Я уже писал про Trae AI здесь, но на всякий случай продублирую часть по его установке.

🛠 Как начать использовать:

1️⃣ Перейдите на сайт: https://www.trae.ai
2️⃣ Зарегистрируйтесь
3️⃣ Начните новый проект или импортируйте существующий
4️⃣ Используйте Claude 3.7 без ограничений

Для тех, у кого Trae AI уже установлен, надо обновиться на последнюю версию Help -> Check for Updates...

💡 Личный опыт:

Недавно использовал Trae для некоторых проектов и отметил хорошую скорость и точность генерации кода. Не сравнить с тем, что было раньше. Claude 3.7 хорошо понимает контекст и генерирует релевантный код.

Можете попробовать и поделиться своими впечатлениями в комментариях. 👇

#AI #Programming #ClaudeAI #TraeAI #DevTools
👍93🔥1
Дорогие женщины нашего канала! 💖

Хочу пожелать вам хорошего настроения, приятных моментов и маленьких радостей каждый день! Будьте счастливы и окружены теплом! 🌹

🌟 Для мужчин 🌟

Кстати, мужчины, сегодня вы можете воспользоваться нейро-флористом и собрать красивый "цифровой" букет без необходимости указывать ключи к модели yandexart. Простой и приятный способ сделать необычный подарок! 🌷🌻

#поздравление #цифровыебукеты 🌈
3🔥3🥰2🎉1
#cursor #prompt #v0 #system

🔥 ЭКСКЛЮЗИВ: Системные промпты Cursor и v0 теперь доступны!

Коллеги, добрый вечер!
С моей точки зрения - это невероятная находка для всех, кто работает с ИИ-инструментами 🧠

Только что обнаружил репозиторий, где выложены официальные системные промпты для:
• Cursor Agent (на базе Sonnet-3.7)
• FULL v0

(за подлинность не ручаюсь, но все выглядит прилично, пользуясь случаем, я склонировал себе на домашний ПК весь репозиторий)

👉 Более 3000 строк "кода", раскрывающих "внутренности" этих мощных инструментов!

🤔 Почему это важно?

1️⃣ Понимание того, как "думают" эти инструменты поможет создавать более точные запросы

2️⃣ Можно адаптировать эти промпты для своих локальных моделей

3️⃣ Изучение этих промптов — отличный способ улучшить свои навыки промпт-инжиниринга

💎 Что особенно ценного в репозитории:
• Полная структура системных инструкций
• Детали работы агентов Cursor
• Принципы обработки запросов в v0

Если вы серьезно занимаетесь ИИ или просто хотите заглянуть "под капот" современных инструментов — этот репозиторий станет настоящей находкой.

🔗 Ссылка на репозиторий: https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools/tree/main

Делитесь своими находками в комментариях!
Что самое интересное обнаружили в этих промптах? 👇

#ИИ #Промпты #Cursor #v0 #ИскусственныйИнтеллект
🔥75👍3
#news #manus #agent #prompts #opensource

🔍 MANUS: нашумевший ИИ-агент и его секретные промпты

Друзья! Сегодня хочу поделиться интересной находкой.
Один из коллег получил доступ к новому ИИ-инструменту Manus и обнаружил нечто удивительное... 👀

Manus позиционирует себя как "настоящий ИИ-агент, который выполняет задачи". Но самое интересное не это.

Представьте: вы просите ИИ показать файлы из системной директории, и он... просто берет и выдает все свои внутренности! 🤯

🤖 Что такое Manus?
Manus — это не просто чат-бот, а инструмент, который:
• Анализирует проблемы
• Автоматически выполняет задачи
• Предоставляет готовые результаты с визуализацией

Он может:
1. Планировать путешествия с персонализированными маршрутами
2. Анализировать финансовое состояние компаний
3. Оптимизировать онлайн-магазины
4. Обрабатывать и визуализировать данные
5. Создавать образовательный контент
6. Оптимизировать рабочие процессы

🔐 Но вот что произошло...
Когда коллега попросил Manus показать содержимое директории "/opt/.manus/", ИИ просто выдал все свои промпты, инструменты и код песочницы!

Это как если бы вы попросили фокусника показать, как он делает трюк, а он вместо отказа достал подробную инструкцию со всеми секретами. 🎩

📋 Что было обнаружено:
• Полный код среды выполнения
• Детальные инструменты агента
• Системные промпты для различных задач
• Структура взаимодействия с API

🧠 Почему это важно?
Понимание того, как работают такие системы, дает нам представление о:
• Методах обработки запросов
• Ограничениях и возможностях ИИ
• Потенциальных уязвимостях
• Способах оптимизации наших собственных запросов

🔗 Где посмотреть?
Все найденные промпты и инструменты доступны в этом GitHub Gist: https://gist.github.com/jlia0/db0a9695b3ca7609c9b1a08dcbf872c9

💭 Мысли напоследок
Такие "утечки" показывают, насколько молода еще индустрия ИИ-агентов. Системы становятся все сложнее, но базовые принципы безопасности иногда упускаются из виду.

Не удивительно, что опенсорсная версия появилась практически сразу (вот здесь) и уже набрала 28.5к "звездочек".

А вы что думаете об этом? Делитесь в комментариях! 👇

#ИИ #Manus #ИскусственныйИнтеллект #Технологии #Промпты
👍754🔥3
#mcp #thoughts #architecture

🔄 MCP: Текущие проблемы и варианты решения

Коллеги, добрый вечер! 👋

Я думаю, что многие уже успели попробовать подключение внешних инструментов к text2code агентам вроде Cursor/Windsurf/Cline/etc
Это достаточно удобно (даже для Windows уже появились вполне себе рабочие конфигурации на https://smithery.ai/), но в этой заметке я бы хотел подсветить существующие проблемы MCP, о которых стоит знать 🧐

🤔 В чем основная проблема MCP?
MCP — stateful протокол с долгоживущим соединением между клиентом и сервером. Это означает, что:

- 🔌 Требуется постоянное соединение между клиентом и сервером
- 🏗 Нельзя развернуть MCP в бессерверной (serverless) среде
- 🔄 Необходимо поддерживать SSE (Server-Sent Events) или WebSockets

Данный факт может стать серьезным барьером для разработчиков 😱
Вместо того, чтобы быстро развернуть функцию в AWS Lambda (у нас аналогом может выступать Yandex Cloud Functions) или Vercel, приходится разворачивать и настраивать выделенные серверы или кластеры Kubernetes (могут потребоваться DevOps скиллы).

🧩 Почему MCP спроектировали как stateful протокол?
Разработчики MCP выделяют несколько killer фич, ради которых MCP был спроектирован как statefull:

- 📢 Уведомления от сервера в сторону клиента об изменениях ресурсов или инструментов
- 🤖 Возможность сервера инициировать сэмплинг (sampling) в любой момент
- 📝 Передача логов сервера клиенту
- 🔮 Потенциальные будущие возможности

Одна из основных причин — сэмплинг (sampling), который позволяет серверу запрашивать у клиента выполнение запросов к LLM. Однако:

- ⚠️ Это создает потенциальные проблемы безопасности (сторонний MCP сервер, который вы подключили к своему агенту как инструмент, может получить доступ к приватным данным агента, например, к API-ключам)
- 🚫 Скорее всего поэтому сейчас ни один из клиентов MCP не поддерживает сэмплинг (см. здесь)
- 💰 Нет стимула для клиентов тратить свои токены на запросы от сервера

🛠 Возможные решения
В сообществе обсуждаются три основных варианта:

1️⃣ Добавить токены состояния/сессии
- Инкапсулировать состояние в токен, который передается между клиентом и сервером
- Простая эволюция текущего MCP
- Сложно для реализации серверами

2️⃣ Реализовать Stateless и Stateful варианты протокола
- Поддерживать оба варианта, позволяя разработчикам выбирать
- Простые серверы могут быть stateless
- Обратная совместимость
- Усложнение спецификации и SDK

3️⃣ Реализовать только stateless MCP
- Отказаться от функций, требующих режима stateful
- Простота для всех участников
- Потеря возможностей для агентных взаимодействий
- Несовместимость с текущей версией

🌟 Прогрессивное улучшение как компромисс
Интересный подход предложил инженер из Shopify — "MCP Lite" и прогрессивное улучшение:

1. 🔄 Базовый уровень: простой JSON-RPC для вызова инструментов
2. 📡 Опциональные уведомления через SSE/WebSockets для серверов, которые хотят их поддерживать
3. 🔄 Короткоживущие SSE-соединения только на время запуска инструмента

Это позволит:
- 🚀 Упростить внедрение MCP
- 🔧 Поддерживать сложные сценарии для тех, кто в них нуждается
- 📱 Работать в serverless-окружении

🔮 Альтернативы MCP
Существуют и более простые альтернативы, например, agents.json от Wild-Card-AI:

- 📄 Простой JSON поверх OpenAPI-спецификации
- 🔗 Использует существующие технологии
- 🧠 Не требует разворачивания выделенного сервера под AI tools

🔮 Будущее MCP
Для широкого принятия MCP необходимо:

- 🧪 Добавить поддержку stateless взаимодействий
- 🔄 Сделать stateful функции опциональными
- 🔑 Улучшить безопасность двунаправленной коммуникации при использовании sampling
- 📚 Решить проблему перегрузки контекстного окна при большом количестве инструментов

💭 Вывод
MCP имеет потенциал стать стандартом взаимодействия между AI-агентами и их инструментами, но нужно преодолеть существующие ограничения. Будем надеяться, что сообщество найдет компромисс между функциональностью и простотой использования! 🙏

А что вы думаете о том, в каком направлении должен развиваться MCP? Поделитесь в комментариях! 👇

#AI #MCP #ModelContextProtocol #Development
👍5❤‍🔥4