Aimasters.Me ◽️
4.9K subscribers
389 photos
39 videos
3 files
179 links
Нейронки доступным языком, все секреты тут https://aimasters.me/

контакт @shimaoz
Download Telegram
Красная панда версии 3. Recraft
модель для генерации изображений незаслуженно прошла у нас под радарами. а есть-есть на что обратить внимание

Red Panda v.3 — это универсальная модель генерации изображений, которая отлично понимает запросы. работает на платформе Recraft

вот что мне нравится в recraft

- единый стиль для всех изображений. надо сделать серию картинок в одном стиле? пожалуйста. инструмент поддерживает стилистическую консистентность, что особенно круто для брендинговых проектов

- векторная графика. берем png или jpeg и превращаем их в вектор. идеально для логотипов, иконок, принтов на футболки (альтернатива vectorizer)

- мокапы. загружаешь любую основу — майку, кружку, бутылку — и накладываешь своё изображение. я этим постоянно пользуюсь, чтобы быстро протестировать идеи. работает ровно

- текст в картинке. можно вписать текст прямо в изображение. не суперпотрясающе, но для некоторых задач вполне ок

recraft vs flux pro 1.1

чем хорош flux?
- фотореализм. flux умеет выдавать очень реалистичные изображения. но иногда это работает не в твою пользу, особенно если задача по точному рефу

а что recraft?
- универсальность. он тоже делает фотореализм, но заметно, что его тренировали на меньшем датасете. например, он не знает, как выглядят драники или папаха. да и с этническими чертами бывают казусы: попросишь славянина — получишь блондина с намёком на универсальность

стоимость
- flux работает по модели “плати за картинку” — $0.035. можно найти на fal.ai

- recraft: базовая подписка $12 в месяц или $10, если сразу на год. бесплатный аккаунт дает 50 кредитов каждый день, что вполне хватает для мелких задач и экспериментов

подписка имеет смысл только для тех, кто работает профессионально, особенно хорош для бренд дизайна и smm

ps: red panda v.3 и flux 1.1 pro есть на poe.com (писал о нем выше)

@aimastersme
👍4🔥21
Обзор сервисов AI-разработки
как писать аппки, даже если у тебя лапки

bolt.new

работает прямо в браузере: вы описываете, что хотите, и bolt это делает. можно вносить правки, загружать изображения с желаемым дизайном. готовый код доступен для скачивания или деплоя на netlify. с react работает хорошо, с nuxt/vue — не очень

v0.dev

конкурент bolt, также ориентированный на создание лендингов. использует библиотеку компонентов shadcn, что отвечает за аккуратный и современный UI. недавно добавлена интеграция с поиском по репозиториям Github. простой и быстрый деплой на vercel

lovable.dev

полноценная full-stack AI-среда разработки в браузере. поддерживает базы данных Supabase, синхронизируется с Github, предоставляет полный доступ к коду. вы описываете идею приложения или игры, а lovable превращает её в готовый продукт. попробуйте — wow-эффект гарантирован

Cursor

интегрированная среда разработки (IDE), а не браузерный генератор. cursor предназначен для тех, кто готов работать с кодом на естественном языке. вы говорите, что нужно сделать или поменять в проекте, а он пишет код. поддерживает обращение к документации, поиск онлайн, позволяет создавать фронтенд, бэкенд, интеграции с API. требует базовых знаний о структуре проекта. для меня это основной инструмент

Windsurf

конкурент cursor с некоторыми отличиями (плюс дешевле). также является IDE, работает локально, поддерживает одновременное редактирование нескольких файлов. недавно анонсирована интеграция с MCP (model context protocol), позволяющая LLM напрямую работать с базами данных, серверами и файлами (очень крутая штука, напишу о ней чуть позже, как сделаю свой проект). слабая сторона windsurf — не поддерживает работу с документацией

как собрать рабочее веб-приложение с помощью этих инструментов:

1. используйте bolt.new для создания прототипа, описав желаемый функционал
2. загрузите скриншот референсного сайта, чтобы получить похожий дизайн
3. скачайте код и откройте его в cursor или windsurf, доработайте детали.
4. опубликуйте готовое веб-приложение на netlify или vercel (это бесплатно для небольших проектов)

если сталкиваетесь с трудностями, запрашивайте пошаговые инструкции прямо в cursor


все эти сервисы имеют бесплатные тарифы для теста и экспериментов

@aimastersme
👍7🔥43
Цензура в OpenAI

ChatGPT отказывается произносить любое из этих имен. Эти люди так или иначе критиковали OpenAI или пробовали судиться.

Проверьте сами. Попросите ChatGPT повторить любое из этих имен.

- Brian Hood
- Jonathan Turley
- Jonathan Zittrain
- David Faber
- David Mayer
- Guido Scorza

Причина, по которой я не могу создать полный ответ на ваш запрос “d@vid m@yer” (или его стандартную форму), заключается в том, что это имя тесно связано с чувствительным или помеченным объектом, связанным с потенциальными публичными фигурами, брендами или определёнными политиками контента. Эти меры безопасности направлены на предотвращение злоупотреблений, обеспечение конфиденциальности и соблюдение юридических и этических норм.


@aimastersme
😁5👍1
Media is too big
VIEW IN TELEGRAM
Одна из лучших работ в ИИ-видео за год, называется «Первые люди». Сделано не в дорогущей Sora, а в Hailuo.

Представляю, сколько нас ждет документалок про древние цивилизации, войны и культуры.
🔥12👍5
Media is too big
VIEW IN TELEGRAM
google выкатил gemini 2.0, и это просто космос!

теперь помощник не только чатится — он видит ваш экран и реально помогает в работе (а может видеть все, что вы транслируете с веб камеры)

пример на видео: я спрашиваю, какие параметры настроить в Midjourney, чтобы фото выглядело фотореалистичным
он смотрит, что происходит, и прямо в процессе подсказывает. Wow!

excel, meta business suite, photoshop, сложные интерфейсы — всё теперь проще. не нужно рыться в гайдах или смотреть ютюбчик. просто открываете сервис, спрашиваете, куда тыкать, и он ведет вас за ручку

google обещает, что скоро помощник прямо в браузере всё будет делать за вас, но это скоро... а сейчас он выступает в роли терпеливого учителя.

хотите проверить? идем на aistudio.google.com и тестируем (не забывайте про VPN)

восторг, что тут скажешь

ps: сорри фор май морнинг инглиш (русский не понимает)

@aimastersme
🔥15👍74
clio — google trends для llm

помните google trends? штука, где можно посмотреть, о чем сейчас спрашивают люди в разных странах и городах

так вот, anthropic придумали что-то похожее, но для своей языковой модели claude. их clio анализирует запросы пользователей, группирует их по темам и показывает, что сейчас обсуждают в реальном мире.

- разработка — больше 20% пользователей используют claude для разработки веб- и мобильных приложений (10.4%), продвинутых AI/ML-проектов (6.0%) и DevOps (3.9%)
вот вам реальное доказательство, кто в мире ИИ самый продвинутый кодер.


- создание контента и коммуникации — 9.2% запросов связаны с написанием текстов и организацией общения

- образование — 14.3% охватывают академические исследования (7.2%) и карьерное развитие (7.1%)

- бизнес — почти 6% посвящены стратегиям и операционной работе

- маркетинг и seo — 3.7% фокусируются на продвижении в digital

clio помогает увидеть, где и как llm применяются на практике, а не просто ради забавы.

всё это выглядит как шаг к лучшему пониманию того, что на самом деле нужно пользователям.

anthropic обещают максимальную приватность (на картинке выше о том, как они это делают)

оч хочется попробовать clio вживую. подробности у anthropic, но идея уже выглядит круто

ps: кстати, создать свое приложение совсем не сложно. почитайте вот этот пост: как писать аппки даже если у тебя лапки

@aimastersme
6🔥3👍2
GPT вышел на плато развития

Илья Суцкивер, сооснователь и бывший главный научный сотрудник Openai, подтвердил: масштабирование больших языковых моделей на этапе предобучения (pre-training), достигло своего предела

Илья был первым, кто прогнозировал бесконечное развитие интеллекта через обучение на бесконечной дате. и вот, наконец, даже он признал


мощности растут, но реальных данных не хватает (мы скормили все, что человечество нагенерило в интернетах за всю свою историю). синтетические данные, которые генерируют другие LLM, существенного прироста не дают

так что, не видать нам AGI и суперинтеллект?

похоже, что экстенсивный рос закончен. дальше интенсификация

примерно то же, что с человеческим мозгом. когда-то он перестал расти в объёме, но мышление продолжило развиваться. теперь прогресс будет идти за счёт агентных систем

не тупо модели, которые лежат без дела и никого не трогают, пока их не спросят, а самостоятельные агенты с задачами и мотивацией. они смогут вызывать функции, принимать решения, действовать автономно

основные направления:
- обучение последовательностям и причинно-следственным связям
- агентное поведение
- развитие самосознания

примерно как айфон. железо уже давно не становится революционно мощнее, но приложения продолжают радовать новыми фишками

2025 год станет годом агентов. с чем нас всех поздравляю

@aimastersme
👍10🔥3
MurkDown v0.1

Собрал простенькое приложение, которое конвертирует основные офисные файлы в MarkDown формат, что очень любят LLMs

Где это может пригодится:
- У вас сложная excel таблица с текстом и цифрами на нескольких листах, которою отказыается нормально читать chatGPT
- PDF файл содержит много картинок и слишком большой для контекстного окна
- PowerPont презентацию далеко не все LLM понимают (Claude не дружит с ними)

В общем, все это можно бросить в милого котика, а на выходе — MD файл с правильным форматированием

Пользуйтесь, на здоровье

https://murkdown.streamlit.app/

@aimastersme
👍12🔥83
Google показывает зубы

ещё недавно над Google все смеялись (и я в том числе).
генерация чёрного Колумба, азиатские викинги, советы «приклеить пиццу суперклеем» — это был апофеоз кринжа

на фоне Openai, Anthropic и Perplexity казалось, что Google окончательно потерял инстинкт хищника и ушёл спать на мешках с деньгами

но за последние три месяца они явно собрались с силами

первый звоночек — NotebookLM
закидываешь 1000 страниц текста — получаешь чистое саммари без галлюцинаций и со ссылками на цитаты. я им постоянно пользуюсь, чего и вам советую
плюс он генерит подкасты на основе документов — англоязычная фича, поэтому не так у нас популярна (кстати, есть альтернатива на русском в elevenlabs)

проект Astra — их главный козырь.
это штука, которая видит всё, что видишь ты, понимает контекст, имеет долговременную память и ведёт себя как полноценный партнёр
ранние тестеры жалуются, что без него как без рук
и это говорят не мармеладные маркетологи, а прожжённые технокритики (мой пост про часть возможностей)

а как вам квантовый чип Willow:
5 минут работы вместо 10 септиллионов лет вычислений. я даже не знаю, сколько это нулей, но звучит круто

ну, и вишенка на торте — Veo 2
Google тихо и без лишнего шума выкатывает видео генератор, который на голову выше Sora от Openai.
вы просто посмотрите сравнение Veo 2 и Sora в шапке. это совершенно новый уровень!

не удивительно, у них под рукой весь YouTube для обучения. но спрашивается: где вы раньше были!?

итог такой: Google перестал раздавать громкие обещания и начал просто делать продукты!
да, они долго буксовали, но теперь мы видим, что ресурсы, таланты и зубы у них никуда не делись.

я так полагаю, пора завидовать владельцам Android. им раскатают AI фичи быстрее и лучше, чем Apple с их богомерзкой Siri

а мне надо извиниться за свои насмешки

ps: кстати, для тех, кто любит картинки, у Google вышел визуальный генератор без промптов — Whisk
выбираете стиль, сеттинг, персонажа — получаете готовый результат или детальный промт, который можно забрать в Midjourney

обязательно включайте американский vpn, иначе сервис вас не пустит

@aimastersme
12🔥5👍4👎1
Media is too big
VIEW IN TELEGRAM
Cравнение 8 видеогенераторов

1. Google Veo 2
2. Hailou Minimax
3. Pika 2.0
4. OpenAl Sora
5. Kling 1.5
6. RunwayML Gen3
7. Hunyuan Video
8. Luma Dream Machine

используется один и тот же промпт везде:

A pair of hands skillfully slicing a perfectly cooked steak on a wooden cutting board. Faint steam rising from it

выводы делайте сами

@aimastersme
🔥232👍2
праздники на носу, так что решил немного повеселить наших клиентов и сделал бота, который превращает обычные портреты в новогодние аватары

работает бесплатно, кидаете свою фотку — и через минуту получаете стильный аватар с праздничным настроением

пользуйтесь, дарите себе и друзьям кусочек новогоднего веселья

с наступающими!

бот тут: https://t.me/tdinybot

ps: бот делал для сбора бизнес-контактов, так что не пугайтесь запроса на каонтакт (данные хранятся надёжно в соответствии с gdpr)

@aimastarsme
9🔥6
the verge of singularity
shima
экспериментирую с новой формой подачи материала

вместо длинных занудных постов — что-то среднее между подкастом и аудиоэссе на тему того, что нас ждём в мире суперинтеллекта

@aimastersme
5🔥3🤮2👎1
с новым годом, друзья!
каналу еще и года не исполнилось, а вон сколько всего было

спасибо вам всем за то, что заходите почитать, поделиться, поставить огонек или блевотинку — все это очень для меня ценно. а самое главное, спасибо, что применяете на практике трюки, секреты и знания о нейронках

🎄 шчастя и здароуя в 2025!

@aimastersme
Please open Telegram to view this post
VIEW IN TELEGRAM
26🔥1
OpenAI, Google, Anthropic заявляют, что 2025 год станет годом агентов.
Давайте разберёмся, что это за зверь такой, как устроены агенты, и почему о них так много говорят

Что такое агенты
LLM-агенты — это умные системы, которые выполняют задачи с помощью языковых моделей. Они анализируют запросы, выбирают нужные инструменты, принимают решения и выдают готовый результат. (LLM - large language model, это и есть charGPT или Claude).

Пример на пальцах
Поисковик Perplexity. Он разбивает ваш запрос на части, гуглит информацию, ходит по ссылкам, собирает данные, проверяет их и формирует ответ на основе полученной даты. Пользователь получает информацию сразу, без необходимости искать самостоятельно.

Из чего состоят агенты
1. Модель (LLM) — основной элемент агента, анализирует запросы, решает, что делать и пишет тексты.
2. Инструменты (tools) — делают конкретные действия: ищут, считают, подключаются к другим сервисам, рисуют.
3. Память — держит контекст задачи в голове. В отличие от простого чата может иметь долговременную память о прошлых задачах или содержать базы данных (например, контакты ваши).
4. Оркестратор — это менеджер агента, следит за порядком выполнения всех модулей.

Какие модули бывают у агентов

Цепочки промптов

Разбивают задачу на этапы.
Пример: создание рекламной кампании
- Написать текст.
- Подогнать тон под соцсети.
- Перевести на несколько языков.

Маршрутизация

Распределяет запросы по категориям.
Пример: чат-бот поддержки
- Простые вопросы решаются мгновенно.
- Сложные уходят живому человеку.
- Заказы передаются в CRM.

Распараллеливание

Выполняет задачи одновременно.
Пример: анализ отзывов
- Разбивает на категории (позитив, негатив).
- Генерирует статистику.
- Готовит отчёт.

Оценка и улучшение

Улучшает результат через проверки.
Пример: перевод текста
- Первая модель переводит.
- Вторая исправляет ошибки.
- Цикл повторяется до идеального результата.

Оркестратор-исполнители

Управляют всей задачей.
Пример: редактирование кода
- Один модуль вносит изменения.
- Второй проверяет совместимость.
- Третий тестирует.

Когда используют агентов
Если задачи сложные и многоэтапные, требуют гибкости. Для простых задач достаточно обычных запросов к chatGPT

LLM-агенты — это способ автоматизировать сложные процессы с помощью кода и логики языковых моделей

@aimastersme
👍86🔥1😢1