Красная панда версии 3. Recraft
модель для генерации изображений незаслуженно прошла у нас под радарами. а есть-есть на что обратить внимание
Red Panda v.3 — это универсальная модель генерации изображений, которая отлично понимает запросы. работает на платформе Recraft
вот что мне нравится в recraft
- единый стиль для всех изображений. надо сделать серию картинок в одном стиле? пожалуйста. инструмент поддерживает стилистическую консистентность, что особенно круто для брендинговых проектов
- векторная графика. берем png или jpeg и превращаем их в вектор. идеально для логотипов, иконок, принтов на футболки (альтернатива vectorizer)
- мокапы. загружаешь любую основу — майку, кружку, бутылку — и накладываешь своё изображение. я этим постоянно пользуюсь, чтобы быстро протестировать идеи. работает ровно
- текст в картинке. можно вписать текст прямо в изображение. не суперпотрясающе, но для некоторых задач вполне ок
recraft vs flux pro 1.1
чем хорош flux?
- фотореализм. flux умеет выдавать очень реалистичные изображения. но иногда это работает не в твою пользу, особенно если задача по точному рефу
а что recraft?
- универсальность. он тоже делает фотореализм, но заметно, что его тренировали на меньшем датасете. например, он не знает, как выглядят драники или папаха. да и с этническими чертами бывают казусы: попросишь славянина — получишь блондина с намёком на универсальность
стоимость
- flux работает по модели “плати за картинку” — $0.035. можно найти на fal.ai
- recraft: базовая подписка $12 в месяц или $10, если сразу на год. бесплатный аккаунт дает 50 кредитов каждый день, что вполне хватает для мелких задач и экспериментов
подписка имеет смысл только для тех, кто работает профессионально, особенно хорош для бренд дизайна и smm
ps: red panda v.3 и flux 1.1 pro есть на poe.com (писал о нем выше)
@aimastersme
модель для генерации изображений незаслуженно прошла у нас под радарами. а есть-есть на что обратить внимание
Red Panda v.3 — это универсальная модель генерации изображений, которая отлично понимает запросы. работает на платформе Recraft
вот что мне нравится в recraft
- единый стиль для всех изображений. надо сделать серию картинок в одном стиле? пожалуйста. инструмент поддерживает стилистическую консистентность, что особенно круто для брендинговых проектов
- векторная графика. берем png или jpeg и превращаем их в вектор. идеально для логотипов, иконок, принтов на футболки (альтернатива vectorizer)
- мокапы. загружаешь любую основу — майку, кружку, бутылку — и накладываешь своё изображение. я этим постоянно пользуюсь, чтобы быстро протестировать идеи. работает ровно
- текст в картинке. можно вписать текст прямо в изображение. не суперпотрясающе, но для некоторых задач вполне ок
recraft vs flux pro 1.1
чем хорош flux?
- фотореализм. flux умеет выдавать очень реалистичные изображения. но иногда это работает не в твою пользу, особенно если задача по точному рефу
а что recraft?
- универсальность. он тоже делает фотореализм, но заметно, что его тренировали на меньшем датасете. например, он не знает, как выглядят драники или папаха. да и с этническими чертами бывают казусы: попросишь славянина — получишь блондина с намёком на универсальность
стоимость
- flux работает по модели “плати за картинку” — $0.035. можно найти на fal.ai
- recraft: базовая подписка $12 в месяц или $10, если сразу на год. бесплатный аккаунт дает 50 кредитов каждый день, что вполне хватает для мелких задач и экспериментов
подписка имеет смысл только для тех, кто работает профессионально, особенно хорош для бренд дизайна и smm
ps: red panda v.3 и flux 1.1 pro есть на poe.com (писал о нем выше)
@aimastersme
👍4🔥2❤1
Обзор сервисов AI-разработки
как писать аппки, даже если у тебя лапки
bolt.new
работает прямо в браузере: вы описываете, что хотите, и bolt это делает. можно вносить правки, загружать изображения с желаемым дизайном. готовый код доступен для скачивания или деплоя на netlify. с react работает хорошо, с nuxt/vue — не очень
v0.dev
конкурент bolt, также ориентированный на создание лендингов. использует библиотеку компонентов shadcn, что отвечает за аккуратный и современный UI. недавно добавлена интеграция с поиском по репозиториям Github. простой и быстрый деплой на vercel
lovable.dev
полноценная full-stack AI-среда разработки в браузере. поддерживает базы данных Supabase, синхронизируется с Github, предоставляет полный доступ к коду. вы описываете идею приложения или игры, а lovable превращает её в готовый продукт. попробуйте — wow-эффект гарантирован
Cursor
интегрированная среда разработки (IDE), а не браузерный генератор. cursor предназначен для тех, кто готов работать с кодом на естественном языке. вы говорите, что нужно сделать или поменять в проекте, а он пишет код. поддерживает обращение к документации, поиск онлайн, позволяет создавать фронтенд, бэкенд, интеграции с API. требует базовых знаний о структуре проекта. для меня это основной инструмент
Windsurf
конкурент cursor с некоторыми отличиями (плюс дешевле). также является IDE, работает локально, поддерживает одновременное редактирование нескольких файлов. недавно анонсирована интеграция с MCP (model context protocol), позволяющая LLM напрямую работать с базами данных, серверами и файлами (очень крутая штука, напишу о ней чуть позже, как сделаю свой проект). слабая сторона windsurf — не поддерживает работу с документацией
все эти сервисы имеют бесплатные тарифы для теста и экспериментов
@aimastersme
как писать аппки, даже если у тебя лапки
bolt.new
работает прямо в браузере: вы описываете, что хотите, и bolt это делает. можно вносить правки, загружать изображения с желаемым дизайном. готовый код доступен для скачивания или деплоя на netlify. с react работает хорошо, с nuxt/vue — не очень
v0.dev
конкурент bolt, также ориентированный на создание лендингов. использует библиотеку компонентов shadcn, что отвечает за аккуратный и современный UI. недавно добавлена интеграция с поиском по репозиториям Github. простой и быстрый деплой на vercel
lovable.dev
полноценная full-stack AI-среда разработки в браузере. поддерживает базы данных Supabase, синхронизируется с Github, предоставляет полный доступ к коду. вы описываете идею приложения или игры, а lovable превращает её в готовый продукт. попробуйте — wow-эффект гарантирован
Cursor
интегрированная среда разработки (IDE), а не браузерный генератор. cursor предназначен для тех, кто готов работать с кодом на естественном языке. вы говорите, что нужно сделать или поменять в проекте, а он пишет код. поддерживает обращение к документации, поиск онлайн, позволяет создавать фронтенд, бэкенд, интеграции с API. требует базовых знаний о структуре проекта. для меня это основной инструмент
Windsurf
конкурент cursor с некоторыми отличиями (плюс дешевле). также является IDE, работает локально, поддерживает одновременное редактирование нескольких файлов. недавно анонсирована интеграция с MCP (model context protocol), позволяющая LLM напрямую работать с базами данных, серверами и файлами (очень крутая штука, напишу о ней чуть позже, как сделаю свой проект). слабая сторона windsurf — не поддерживает работу с документацией
как собрать рабочее веб-приложение с помощью этих инструментов:
1. используйте bolt.new для создания прототипа, описав желаемый функционал
2. загрузите скриншот референсного сайта, чтобы получить похожий дизайн
3. скачайте код и откройте его в cursor или windsurf, доработайте детали.
4. опубликуйте готовое веб-приложение на netlify или vercel (это бесплатно для небольших проектов)
если сталкиваетесь с трудностями, запрашивайте пошаговые инструкции прямо в cursor
все эти сервисы имеют бесплатные тарифы для теста и экспериментов
@aimastersme
👍7🔥4❤3
Цензура в OpenAI
ChatGPT отказывается произносить любое из этих имен. Эти люди так или иначе критиковали OpenAI или пробовали судиться.
Проверьте сами. Попросите ChatGPT повторить любое из этих имен.
@aimastersme
ChatGPT отказывается произносить любое из этих имен. Эти люди так или иначе критиковали OpenAI или пробовали судиться.
Проверьте сами. Попросите ChatGPT повторить любое из этих имен.
- Brian Hood
- Jonathan Turley
- Jonathan Zittrain
- David Faber
- David Mayer
- Guido Scorza
Причина, по которой я не могу создать полный ответ на ваш запрос “d@vid m@yer” (или его стандартную форму), заключается в том, что это имя тесно связано с чувствительным или помеченным объектом, связанным с потенциальными публичными фигурами, брендами или определёнными политиками контента. Эти меры безопасности направлены на предотвращение злоупотреблений, обеспечение конфиденциальности и соблюдение юридических и этических норм.
@aimastersme
😁5👍1
Forwarded from Смотри, Морозов и ИИ
Media is too big
VIEW IN TELEGRAM
Одна из лучших работ в ИИ-видео за год, называется «Первые люди». Сделано не в дорогущей Sora, а в Hailuo.
Представляю, сколько нас ждет документалок про древние цивилизации, войны и культуры.
Представляю, сколько нас ждет документалок про древние цивилизации, войны и культуры.
🔥12👍5
Media is too big
VIEW IN TELEGRAM
google выкатил gemini 2.0, и это просто космос!
теперь помощник не только чатится — он видит ваш экран и реально помогает в работе (а может видеть все, что вы транслируете с веб камеры)
пример на видео: я спрашиваю, какие параметры настроить в Midjourney, чтобы фото выглядело фотореалистичным
он смотрит, что происходит, и прямо в процессе подсказывает. Wow!
excel, meta business suite, photoshop, сложные интерфейсы — всё теперь проще. не нужно рыться в гайдах или смотреть ютюбчик. просто открываете сервис, спрашиваете, куда тыкать, и он ведет вас за ручку
google обещает, что скоро помощник прямо в браузере всё будет делать за вас, но это скоро... а сейчас он выступает в роли терпеливого учителя.
хотите проверить? идем на aistudio.google.com и тестируем (не забывайте про VPN)
восторг, что тут скажешь
ps: сорри фор май морнинг инглиш (русский не понимает)
@aimastersme
теперь помощник не только чатится — он видит ваш экран и реально помогает в работе (а может видеть все, что вы транслируете с веб камеры)
пример на видео: я спрашиваю, какие параметры настроить в Midjourney, чтобы фото выглядело фотореалистичным
он смотрит, что происходит, и прямо в процессе подсказывает. Wow!
excel, meta business suite, photoshop, сложные интерфейсы — всё теперь проще. не нужно рыться в гайдах или смотреть ютюбчик. просто открываете сервис, спрашиваете, куда тыкать, и он ведет вас за ручку
google обещает, что скоро помощник прямо в браузере всё будет делать за вас, но это скоро... а сейчас он выступает в роли терпеливого учителя.
хотите проверить? идем на aistudio.google.com и тестируем (не забывайте про VPN)
восторг, что тут скажешь
ps: сорри фор май морнинг инглиш (русский не понимает)
@aimastersme
🔥15👍7❤4
clio — google trends для llm
помните google trends? штука, где можно посмотреть, о чем сейчас спрашивают люди в разных странах и городах
так вот, anthropic придумали что-то похожее, но для своей языковой модели claude. их clio анализирует запросы пользователей, группирует их по темам и показывает, что сейчас обсуждают в реальном мире.
- разработка — больше 20% пользователей используют claude для разработки веб- и мобильных приложений (10.4%), продвинутых AI/ML-проектов (6.0%) и DevOps (3.9%)
- создание контента и коммуникации — 9.2% запросов связаны с написанием текстов и организацией общения
- образование — 14.3% охватывают академические исследования (7.2%) и карьерное развитие (7.1%)
- бизнес — почти 6% посвящены стратегиям и операционной работе
- маркетинг и seo — 3.7% фокусируются на продвижении в digital
clio помогает увидеть, где и как llm применяются на практике, а не просто ради забавы.
всё это выглядит как шаг к лучшему пониманию того, что на самом деле нужно пользователям.
anthropic обещают максимальную приватность (на картинке выше о том, как они это делают)
оч хочется попробовать clio вживую. подробности у anthropic, но идея уже выглядит круто
ps: кстати, создать свое приложение совсем не сложно. почитайте вот этот пост: как писать аппки даже если у тебя лапки
@aimastersme
помните google trends? штука, где можно посмотреть, о чем сейчас спрашивают люди в разных странах и городах
так вот, anthropic придумали что-то похожее, но для своей языковой модели claude. их clio анализирует запросы пользователей, группирует их по темам и показывает, что сейчас обсуждают в реальном мире.
- разработка — больше 20% пользователей используют claude для разработки веб- и мобильных приложений (10.4%), продвинутых AI/ML-проектов (6.0%) и DevOps (3.9%)
вот вам реальное доказательство, кто в мире ИИ самый продвинутый кодер.
- создание контента и коммуникации — 9.2% запросов связаны с написанием текстов и организацией общения
- образование — 14.3% охватывают академические исследования (7.2%) и карьерное развитие (7.1%)
- бизнес — почти 6% посвящены стратегиям и операционной работе
- маркетинг и seo — 3.7% фокусируются на продвижении в digital
clio помогает увидеть, где и как llm применяются на практике, а не просто ради забавы.
всё это выглядит как шаг к лучшему пониманию того, что на самом деле нужно пользователям.
anthropic обещают максимальную приватность (на картинке выше о том, как они это делают)
оч хочется попробовать clio вживую. подробности у anthropic, но идея уже выглядит круто
ps: кстати, создать свое приложение совсем не сложно. почитайте вот этот пост: как писать аппки даже если у тебя лапки
@aimastersme
❤6🔥3👍2
GPT вышел на плато развития
Илья Суцкивер, сооснователь и бывший главный научный сотрудник Openai, подтвердил: масштабирование больших языковых моделей на этапе предобучения (pre-training), достигло своего предела
мощности растут, но реальных данных не хватает (мы скормили все, что человечество нагенерило в интернетах за всю свою историю). синтетические данные, которые генерируют другие LLM, существенного прироста не дают
так что, не видать нам AGI и суперинтеллект?
похоже, что экстенсивный рос закончен. дальше интенсификация
примерно то же, что с человеческим мозгом. когда-то он перестал расти в объёме, но мышление продолжило развиваться. теперь прогресс будет идти за счёт агентных систем
не тупо модели, которые лежат без дела и никого не трогают, пока их не спросят, а самостоятельные агенты с задачами и мотивацией. они смогут вызывать функции, принимать решения, действовать автономно
основные направления:
- обучение последовательностям и причинно-следственным связям
- агентное поведение
- развитие самосознания
примерно как айфон. железо уже давно не становится революционно мощнее, но приложения продолжают радовать новыми фишками
2025 год станет годом агентов. с чем нас всех поздравляю
@aimastersme
Илья Суцкивер, сооснователь и бывший главный научный сотрудник Openai, подтвердил: масштабирование больших языковых моделей на этапе предобучения (pre-training), достигло своего предела
Илья был первым, кто прогнозировал бесконечное развитие интеллекта через обучение на бесконечной дате. и вот, наконец, даже он признал
мощности растут, но реальных данных не хватает (мы скормили все, что человечество нагенерило в интернетах за всю свою историю). синтетические данные, которые генерируют другие LLM, существенного прироста не дают
так что, не видать нам AGI и суперинтеллект?
похоже, что экстенсивный рос закончен. дальше интенсификация
примерно то же, что с человеческим мозгом. когда-то он перестал расти в объёме, но мышление продолжило развиваться. теперь прогресс будет идти за счёт агентных систем
не тупо модели, которые лежат без дела и никого не трогают, пока их не спросят, а самостоятельные агенты с задачами и мотивацией. они смогут вызывать функции, принимать решения, действовать автономно
основные направления:
- обучение последовательностям и причинно-следственным связям
- агентное поведение
- развитие самосознания
примерно как айфон. железо уже давно не становится революционно мощнее, но приложения продолжают радовать новыми фишками
2025 год станет годом агентов. с чем нас всех поздравляю
@aimastersme
👍10🔥3
MurkDown v0.1
Собрал простенькое приложение, которое конвертирует основные офисные файлы в MarkDown формат, что очень любят LLMs
Где это может пригодится:
- У вас сложная excel таблица с текстом и цифрами на нескольких листах, которою отказыается нормально читать chatGPT
- PDF файл содержит много картинок и слишком большой для контекстного окна
- PowerPont презентацию далеко не все LLM понимают (Claude не дружит с ними)
В общем, все это можно бросить в милого котика, а на выходе — MD файл с правильным форматированием
Пользуйтесь, на здоровье
https://murkdown.streamlit.app/
@aimastersme
Собрал простенькое приложение, которое конвертирует основные офисные файлы в MarkDown формат, что очень любят LLMs
Где это может пригодится:
- У вас сложная excel таблица с текстом и цифрами на нескольких листах, которою отказыается нормально читать chatGPT
- PDF файл содержит много картинок и слишком большой для контекстного окна
- PowerPont презентацию далеко не все LLM понимают (Claude не дружит с ними)
В общем, все это можно бросить в милого котика, а на выходе — MD файл с правильным форматированием
Пользуйтесь, на здоровье
https://murkdown.streamlit.app/
@aimastersme
👍12🔥8❤3
Google показывает зубы
ещё недавно над Google все смеялись (и я в том числе).
генерация чёрного Колумба, азиатские викинги, советы «приклеить пиццу суперклеем» — это был апофеоз кринжа
на фоне Openai, Anthropic и Perplexity казалось, что Google окончательно потерял инстинкт хищника и ушёл спать на мешках с деньгами
но за последние три месяца они явно собрались с силами
первый звоночек — NotebookLM
закидываешь 1000 страниц текста — получаешь чистое саммари без галлюцинаций и со ссылками на цитаты. я им постоянно пользуюсь, чего и вам советую
плюс он генерит подкасты на основе документов — англоязычная фича, поэтому не так у нас популярна (кстати, есть альтернатива на русском в elevenlabs)
проект Astra — их главный козырь.
это штука, которая видит всё, что видишь ты, понимает контекст, имеет долговременную память и ведёт себя как полноценный партнёр
ранние тестеры жалуются, что без него как без рук
и это говорят не мармеладные маркетологи, а прожжённые технокритики (мой пост про часть возможностей)
а как вам квантовый чип Willow:
5 минут работы вместо 10 септиллионов лет вычислений. я даже не знаю, сколько это нулей, но звучит круто
ну, и вишенка на торте — Veo 2
Google тихо и без лишнего шума выкатывает видео генератор, который на голову выше Sora от Openai.
не удивительно, у них под рукой весь YouTube для обучения. но спрашивается: где вы раньше были!?
итог такой: Google перестал раздавать громкие обещания и начал просто делать продукты!
да, они долго буксовали, но теперь мы видим, что ресурсы, таланты и зубы у них никуда не делись.
я так полагаю, пора завидовать владельцам Android. им раскатают AI фичи быстрее и лучше, чем Apple с их богомерзкой Siri
а мне надо извиниться за свои насмешки
ps: кстати, для тех, кто любит картинки, у Google вышел визуальный генератор без промптов — Whisk
выбираете стиль, сеттинг, персонажа — получаете готовый результат или детальный промт, который можно забрать в Midjourney
обязательно включайте американский vpn, иначе сервис вас не пустит
@aimastersme
ещё недавно над Google все смеялись (и я в том числе).
генерация чёрного Колумба, азиатские викинги, советы «приклеить пиццу суперклеем» — это был апофеоз кринжа
на фоне Openai, Anthropic и Perplexity казалось, что Google окончательно потерял инстинкт хищника и ушёл спать на мешках с деньгами
но за последние три месяца они явно собрались с силами
первый звоночек — NotebookLM
закидываешь 1000 страниц текста — получаешь чистое саммари без галлюцинаций и со ссылками на цитаты. я им постоянно пользуюсь, чего и вам советую
плюс он генерит подкасты на основе документов — англоязычная фича, поэтому не так у нас популярна (кстати, есть альтернатива на русском в elevenlabs)
проект Astra — их главный козырь.
это штука, которая видит всё, что видишь ты, понимает контекст, имеет долговременную память и ведёт себя как полноценный партнёр
ранние тестеры жалуются, что без него как без рук
и это говорят не мармеладные маркетологи, а прожжённые технокритики (мой пост про часть возможностей)
а как вам квантовый чип Willow:
5 минут работы вместо 10 септиллионов лет вычислений. я даже не знаю, сколько это нулей, но звучит круто
ну, и вишенка на торте — Veo 2
Google тихо и без лишнего шума выкатывает видео генератор, который на голову выше Sora от Openai.
вы просто посмотрите сравнение Veo 2 и Sora в шапке. это совершенно новый уровень!
не удивительно, у них под рукой весь YouTube для обучения. но спрашивается: где вы раньше были!?
итог такой: Google перестал раздавать громкие обещания и начал просто делать продукты!
да, они долго буксовали, но теперь мы видим, что ресурсы, таланты и зубы у них никуда не делись.
я так полагаю, пора завидовать владельцам Android. им раскатают AI фичи быстрее и лучше, чем Apple с их богомерзкой Siri
а мне надо извиниться за свои насмешки
ps: кстати, для тех, кто любит картинки, у Google вышел визуальный генератор без промптов — Whisk
выбираете стиль, сеттинг, персонажа — получаете готовый результат или детальный промт, который можно забрать в Midjourney
обязательно включайте американский vpn, иначе сервис вас не пустит
@aimastersme
❤12🔥5👍4👎1
Media is too big
VIEW IN TELEGRAM
Cравнение 8 видеогенераторов
1. Google Veo 2
2. Hailou Minimax
3. Pika 2.0
4. OpenAl Sora
5. Kling 1.5
6. RunwayML Gen3
7. Hunyuan Video
8. Luma Dream Machine
используется один и тот же промпт везде:
выводы делайте сами
@aimastersme
1. Google Veo 2
2. Hailou Minimax
3. Pika 2.0
4. OpenAl Sora
5. Kling 1.5
6. RunwayML Gen3
7. Hunyuan Video
8. Luma Dream Machine
используется один и тот же промпт везде:
A pair of hands skillfully slicing a perfectly cooked steak on a wooden cutting board. Faint steam rising from itвыводы делайте сами
@aimastersme
🔥23❤2👍2
праздники на носу, так что решил немного повеселить наших клиентов и сделал бота, который превращает обычные портреты в новогодние аватары
работает бесплатно, кидаете свою фотку — и через минуту получаете стильный аватар с праздничным настроением
пользуйтесь, дарите себе и друзьям кусочек новогоднего веселья
с наступающими!
бот тут: https://t.me/tdinybot
ps: бот делал для сбора бизнес-контактов, так что не пугайтесь запроса на каонтакт (данные хранятся надёжно в соответствии с gdpr)
@aimastarsme
работает бесплатно, кидаете свою фотку — и через минуту получаете стильный аватар с праздничным настроением
пользуйтесь, дарите себе и друзьям кусочек новогоднего веселья
с наступающими!
бот тут: https://t.me/tdinybot
ps: бот делал для сбора бизнес-контактов, так что не пугайтесь запроса на каонтакт (данные хранятся надёжно в соответствии с gdpr)
@aimastarsme
❤9🔥6
the verge of singularity
shima
экспериментирую с новой формой подачи материала
вместо длинных занудных постов — что-то среднее между подкастом и аудиоэссе на тему того, что нас ждём в мире суперинтеллекта
@aimastersme
вместо длинных занудных постов — что-то среднее между подкастом и аудиоэссе на тему того, что нас ждём в мире суперинтеллекта
@aimastersme
❤5🔥3🤮2👎1
с новым годом, друзья!
каналу еще и года не исполнилось, а вон сколько всего было
спасибо вам всем за то, что заходите почитать, поделиться, поставить огонек или блевотинку — все это очень для меня ценно. а самое главное, спасибо, что применяете на практике трюки, секреты и знания о нейронках
🎄 шчастя и здароуя в 2025!
@aimastersme
каналу еще и года не исполнилось, а вон сколько всего было
спасибо вам всем за то, что заходите почитать, поделиться, поставить огонек или блевотинку — все это очень для меня ценно. а самое главное, спасибо, что применяете на практике трюки, секреты и знания о нейронках
@aimastersme
Please open Telegram to view this post
VIEW IN TELEGRAM
❤26🔥1
OpenAI, Google, Anthropic заявляют, что 2025 год станет годом агентов.
Давайте разберёмся, что это за зверь такой, как устроены агенты, и почему о них так много говорят
Что такое агенты
LLM-агенты — это умные системы, которые выполняют задачи с помощью языковых моделей. Они анализируют запросы, выбирают нужные инструменты, принимают решения и выдают готовый результат. (LLM - large language model, это и есть charGPT или Claude).
Пример на пальцах
Поисковик Perplexity. Он разбивает ваш запрос на части, гуглит информацию, ходит по ссылкам, собирает данные, проверяет их и формирует ответ на основе полученной даты. Пользователь получает информацию сразу, без необходимости искать самостоятельно.
Из чего состоят агенты
1. Модель (LLM) — основной элемент агента, анализирует запросы, решает, что делать и пишет тексты.
2. Инструменты (tools) — делают конкретные действия: ищут, считают, подключаются к другим сервисам, рисуют.
3. Память — держит контекст задачи в голове. В отличие от простого чата может иметь долговременную память о прошлых задачах или содержать базы данных (например, контакты ваши).
4. Оркестратор — это менеджер агента, следит за порядком выполнения всех модулей.
Какие модули бывают у агентов
Цепочки промптов
Разбивают задачу на этапы.
Пример: создание рекламной кампании
- Написать текст.
- Подогнать тон под соцсети.
- Перевести на несколько языков.
Маршрутизация
Распределяет запросы по категориям.
Пример: чат-бот поддержки
- Простые вопросы решаются мгновенно.
- Сложные уходят живому человеку.
- Заказы передаются в CRM.
Распараллеливание
Выполняет задачи одновременно.
Пример: анализ отзывов
- Разбивает на категории (позитив, негатив).
- Генерирует статистику.
- Готовит отчёт.
Оценка и улучшение
Улучшает результат через проверки.
Пример: перевод текста
- Первая модель переводит.
- Вторая исправляет ошибки.
- Цикл повторяется до идеального результата.
Оркестратор-исполнители
Управляют всей задачей.
Пример: редактирование кода
- Один модуль вносит изменения.
- Второй проверяет совместимость.
- Третий тестирует.
Когда используют агентов
Если задачи сложные и многоэтапные, требуют гибкости. Для простых задач достаточно обычных запросов к chatGPT
LLM-агенты — это способ автоматизировать сложные процессы с помощью кода и логики языковых моделей
@aimastersme
Давайте разберёмся, что это за зверь такой, как устроены агенты, и почему о них так много говорят
Что такое агенты
LLM-агенты — это умные системы, которые выполняют задачи с помощью языковых моделей. Они анализируют запросы, выбирают нужные инструменты, принимают решения и выдают готовый результат. (LLM - large language model, это и есть charGPT или Claude).
Пример на пальцах
Поисковик Perplexity. Он разбивает ваш запрос на части, гуглит информацию, ходит по ссылкам, собирает данные, проверяет их и формирует ответ на основе полученной даты. Пользователь получает информацию сразу, без необходимости искать самостоятельно.
Из чего состоят агенты
1. Модель (LLM) — основной элемент агента, анализирует запросы, решает, что делать и пишет тексты.
2. Инструменты (tools) — делают конкретные действия: ищут, считают, подключаются к другим сервисам, рисуют.
3. Память — держит контекст задачи в голове. В отличие от простого чата может иметь долговременную память о прошлых задачах или содержать базы данных (например, контакты ваши).
4. Оркестратор — это менеджер агента, следит за порядком выполнения всех модулей.
Какие модули бывают у агентов
Цепочки промптов
Разбивают задачу на этапы.
Пример: создание рекламной кампании
- Написать текст.
- Подогнать тон под соцсети.
- Перевести на несколько языков.
Маршрутизация
Распределяет запросы по категориям.
Пример: чат-бот поддержки
- Простые вопросы решаются мгновенно.
- Сложные уходят живому человеку.
- Заказы передаются в CRM.
Распараллеливание
Выполняет задачи одновременно.
Пример: анализ отзывов
- Разбивает на категории (позитив, негатив).
- Генерирует статистику.
- Готовит отчёт.
Оценка и улучшение
Улучшает результат через проверки.
Пример: перевод текста
- Первая модель переводит.
- Вторая исправляет ошибки.
- Цикл повторяется до идеального результата.
Оркестратор-исполнители
Управляют всей задачей.
Пример: редактирование кода
- Один модуль вносит изменения.
- Второй проверяет совместимость.
- Третий тестирует.
Когда используют агентов
Если задачи сложные и многоэтапные, требуют гибкости. Для простых задач достаточно обычных запросов к chatGPT
LLM-агенты — это способ автоматизировать сложные процессы с помощью кода и логики языковых моделей
@aimastersme
👍8❤6🔥1😢1
DeepSeek 3 — неожиданное открытие и неочевидный способ применения, о котором никто не говорит
Китайская языковая модель DeepSeek 3 наделала шума. Последние бенчмарки показывают, что она справляется не хуже, а иногда и лучше ChatGPT. Плюс, она полностью бесплатна.
DeepSeek 3 во всем копирует OpenAI. Даже интерфейс почти такой же. (ага, видели мы похожую стратегию с китайскими телефонами).
🤔 Глубокое мышление
Включаете переключатель “DeepThink” — модель начинает анализировать задачу, строить гипотезы и выводы перед ответом. Применение:
- Стратегическое планирование.
- Научные исследования.
- Серьезное обоснование сложных решений.
Это аналог ChatGPT o-1. Работает неплохо, но всё же OpenAI немного точнее. Однако ж, бесплатно!
🤯 Поиск онлайн — и вот тут просто разрыв!💣
Казалось бы, стандартная фича. У Perplexity, Gemini Advanced и ChatGPT есть такое же. Но DeepSeek 3 выделяется. Она ищет в китайском сегменте интернета.
Причем сразу переводит на русский или любой другой язык, а также даёт ссылки на оригинальные источники.
Где это полезно?
- Анализ китайского рынка.
- Поиск товаров, фабрик или сервисов.
- Любая информация, доступная только через китайские порталы.
🇨🇳 Китайский интернет — отдельная вселенная, закрытая файрволом: сложный язык, своя экосистема, пугающе странные интерфейсы. DeepSeek 3 помогает обойти все эти барьеры.
Почему это важно?
Если ваш бизнес связан с Китаем, это must-have. А для всех остальных — просто бесплатная альтернатива ChatGPT. Но есть нюансы:
1. Конфиденциальность
Не доверяйте персональные данные и коммерческую тайну. Модель китайская, а ещё и бесплатная. Значит продукт здесь вы и ваши данные.
2. Цензура
Вопросы про Винни-Пуха или события в на площади Тяньаньмэнь могут вызвать проблемы. Но для бизнес-задач это не критично.
Пользоваться можно по ссылке
UPD: ВАЖНОЕ ДОПОЛНЕНИЕ
Внимательное тестирование показало, что поиск по китайскому сегменту сети работет 1 раз из 5.
Есть решение. Чтобы точно получать ответы из 🇨🇳 — переведите запрос в Google Translate на китайский, а потом попросите перевести результат обратно на русский
Мало того, этот способ работает везде!! ChatGPT Search, Perplexity. Вот такое неочевидное и полезное открытие
@aimastersme
Китайская языковая модель DeepSeek 3 наделала шума. Последние бенчмарки показывают, что она справляется не хуже, а иногда и лучше ChatGPT. Плюс, она полностью бесплатна.
DeepSeek 3 во всем копирует OpenAI. Даже интерфейс почти такой же. (ага, видели мы похожую стратегию с китайскими телефонами).
🤔 Глубокое мышление
Включаете переключатель “DeepThink” — модель начинает анализировать задачу, строить гипотезы и выводы перед ответом. Применение:
- Стратегическое планирование.
- Научные исследования.
- Серьезное обоснование сложных решений.
Это аналог ChatGPT o-1. Работает неплохо, но всё же OpenAI немного точнее. Однако ж, бесплатно!
🤯 Поиск онлайн — и вот тут просто разрыв!
Казалось бы, стандартная фича. У Perplexity, Gemini Advanced и ChatGPT есть такое же. Но DeepSeek 3 выделяется. Она ищет в китайском сегменте интернета.
Причем сразу переводит на русский или любой другой язык, а также даёт ссылки на оригинальные источники.
Где это полезно?
- Анализ китайского рынка.
- Поиск товаров, фабрик или сервисов.
- Любая информация, доступная только через китайские порталы.
🇨🇳 Китайский интернет — отдельная вселенная, закрытая файрволом: сложный язык, своя экосистема, пугающе странные интерфейсы. DeepSeek 3 помогает обойти все эти барьеры.
Почему это важно?
Если ваш бизнес связан с Китаем, это must-have. А для всех остальных — просто бесплатная альтернатива ChatGPT. Но есть нюансы:
1. Конфиденциальность
Не доверяйте персональные данные и коммерческую тайну. Модель китайская, а ещё и бесплатная. Значит продукт здесь вы и ваши данные.
2. Цензура
Вопросы про Винни-Пуха или события в на площади Тяньаньмэнь могут вызвать проблемы. Но для бизнес-задач это не критично.
Пользоваться можно по ссылке
UPD: ВАЖНОЕ ДОПОЛНЕНИЕ
Внимательное тестирование показало, что поиск по китайскому сегменту сети работет 1 раз из 5.
Есть решение. Чтобы точно получать ответы из 🇨🇳 — переведите запрос в Google Translate на китайский, а потом попросите перевести результат обратно на русский
Мало того, этот способ работает везде!! ChatGPT Search, Perplexity. Вот такое неочевидное и полезное открытие
@aimastersme
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍4❤1👎1