Aimasters.Me ◽️
4.94K subscribers
389 photos
39 videos
3 files
179 links
Нейронки доступным языком, все секреты тут https://aimasters.me/

контакт @shimaoz
Download Telegram
Сравниваем лучшие генераторы изображений: Midjourney 6.1, Flux Pro, Ideogram 2.0, Mystic

Когда вышел Flux, я писал, что корона Midjourney в генерации реалистичных изображений заметно пошатнулась.

Спустя неделю выходит Ideogram v.2 — еще одна заявка на лидерство

И вот вчера открывают для всех Mystic — продукт от команды Freepick и MagnificAI. (кстати, собираюсь делать обзор лучших сервисов по апскейлу/улучшению качества изображений - ставьте🔥, если тема интересна).

Говорят, что Mystic — это дотренированный Flux с апскейлом через алгоритмы Magnific. Я склонен согласиться. Уж очень быстро выпустили продукт после релиза Flux, да и общая эстетика сильно напоминает магнификовскую постобработку.

Источник изображений

Пришло время выбрать, кто по вашему сейчас король.

@aimastersme
🔥182👍1
Лучший генератор изображений:
Anonymous Poll
57%
🔵Midjourney
17%
🟡Ideogram
21%
🟢Flux Pro
5%
🟠Mystic
Словарь ИИ сленга 1

Бывает читаешь статью или пост от реальныого эксперта, и ничерта не понимаешь в этих нейронках. Давайте разбираться, что же значат все эти странные слова, чтобы не потеряться в этом ИИ безумии. Погнали!

▪️LLM (Large Language Model) — Большая языковая модель. Это мощный ИИ, обученный на огромных массивах текста, который умеет генерировать осмысленные ответы, писать статьи, решать логические задачи или мимикрировать под заданную роль. Очень важно здесь, что это всего лишь модель (!), которая не имеет воли, мотивов и целей. Это модель представления о том, как все устроено, почерпнутая из огромного количества текстов. Когда мы к ней обращаемся через промпт, то модель начинает генерировать ответ. ChatGPT, Gemini, Claude, LLama, Mistral и прочие – это LLM. Важно не путать LLM (текствые модели) с другими генеративными моделями, типа Midjourney (картинки), Suno (музыка) или Kling (видео).

▪️Промпт (Prompt) — запрос или инструкция, который вы даёте генеративному ИИ, чтобы он сгенерировал ответ. Это может быть вопрос, фраза или чётко структурированный текст, по типу программного скрипта, написанного естественным языком. Промпт задает контекст и направление, по которому модель начинает "думать". Чем точнее и понятнее сформулирован промпт, тем лучше и релевантнее будет ответ.

▪️Системный промпт (System Prompt) — это скрытая от пользователя инструкция, задающая роль, определенный стиль поведения и рамки ответа перед началом основной генерации. В отличие от обычного промпта, который видит пользователь, системный промпт скрыт и используется для настройки базового контекста модели: как ей отвечать (формально, дружелюбно, кратко), какую роль играть (например, эксперт, учитель, консультант) и на что делать акцент. Системный промпт применяется для создания агентов и ботов на основе LLM.

▪️GenAI (Generative AI) — сокращение от "Генеративный ИИ", это общее название для технологий, которые используют модели ИИ для создания нового контента: текста, изображений, музыки, видео или кода. GenAI обучаются на огромных наборах данных и генерирует уникальные результаты на основе своего представления (модели мира) о том, что было в промпте.

▪️Генерация (Generation) — это процесс создания картинки, видео или текста моделью ИИ на основе заданного промпта. В момент генерации модель старается передать своё представление о том, что было задано в промпте. Генерация может происходить в режиме реального времени, где каждое следующее слово «подбирается» в зависимости от контекста и настроек модели, таких как температура и окна контекста. Чем лучше настроена генерация, тем осмысленнее и полезнее будет ответ.

▪️Токен (Token) — это кусочек текста (семантическая единица), из которых LLM собирает ответы. Могут быть отдельными словами, буквами, знаками препинания, пробелами или частями слов. Примерно в 100 токенах содержится от 50 до 70 слов (зависит от языка и алгоритма токенизации, который применяется при обучении модели). Пример: в английском “don’t” представляет 1 токен, а в русском “не делай” - 2 токена.

▪️Температура (Temperature) — настройка, которая определяет креативность ответа. Чем выше температура, тем более креативный и непредсказуемый будет ответ. Дефолтное значение температуры 1. Если температуру понизить до 0, то ответ будет очень сухим и шаблонным, если поднять выше единицы – получится белиберда.

▪️Окно контекста (Context Window) — это объем текста, который LLM видит и хранит в оперативной памяти одновременно, чтобы дать осмысленный ответ. Чем больше окно, тем более сложные запросы может обработать модель, удерживая "в памяти" больше информации. Короткое окно контекста приводит к тому, что в определённый момент вашего диалога с LLM модель “забудет начало” разговора и начнёт выдавать неточные ответы. Поэтому очень важно не засылать в LLM огромные документы с большим количеством текста. Она просто не запомнит все, а только начало и конец текста – остальное будет выдумывать на ходу.

В следующей части разберемся с новой порцией терминов, чтобы стать сыном маминой подруги в мире ИИ

@aimastersme | instagram
Please open Telegram to view this post
VIEW IN TELEGRAM
22👍3
Доброе утро, искусственные интеллектуалы

Мы тут чрезмерно увлеклись прекрасными возможностями ИИ, и подзабыли об обратной стороне юаня.

Приведу несколько мыслей из статьи в The Economist о том, что сейчас происходит в Китае.

Напомню, что Китай отрезан от поставок высокотехнологичных видеокарт Nvidia, из которых строят суперкласстеры для разработки ИИ.

При этом компартия не гнушается внедрять ИИ для тотального контроля за гражданами без каких-либо сантиментов.


Итак, ближе к делу... в Китае две группы — "акселерационисты" и "думеры" — схлестнулись в битве за умы партийного руководства и лично товарища Си.

И нет, не про цензуру Винни-Пуха в выдаче нейронок.

Акселерационисты призывают дать зеленый свет разработкам и не отставать от США.

Но на другом фланге — группа элитных ученых во главе с единственным китайским лауреатом премии Тьюринга Эндрю Чи-Чи Яо. Они предупреждают, что неконтролируемый ИИ может представлять даже большую угрозу человечеству, чем ядерное или биологическое оружие. Некоторые опасаются, что продвинутый ИИ будет смотреть на людей, как люди - на белок. (где-то мы это уже слышали)

Судя по всему, товарищ Си прислушивается к предостережениям "думеров". В методичке для партийных кадров говорится, что Китаю следует отказаться от безудержного роста ИИ в ущерб безопасности. (а может просто потому, что "не шмагла")

В марте эксперты призвали уничтожать ИИ-модели, демонстрирующие жажду власти или признаки самовоспроизведения. (ачо всмысле, такие реально существуют?)

Если Китай решится на жесткие ограничения по разработке фундаментальных ИИ, то это горячий красный звоночек, ибо этим коммунякам не привыкать жить в страхе. Но если даже их пугают возможности ИИ, что уж говорить о нас.

хороших выходных, как говорится 😎

@aimastersme
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥5🤯2
спасибо, вы классные 💜

картинка создана в ideogram
Please open Telegram to view this post
VIEW IN TELEGRAM
19🔥8👍1
При загрузке сайта ChatGPT на мгновение появляется вот такая плашка и сразу исчезает.

Если посмотреть обзоры тех, кому уже удалось получить доступ к этой функции, то создаётся впечатление, что пользоваться Perplexity все же удобнее и эффективнее.

Если кто ещё не пользовался – обязательно попробуйте на Perplexity. Задаём любой вопрос – он собирает информацию онлайн с релевантных источников, а потом выдаёт развернутое резюме по собранной информации и прикладывает ссылки на источники. Для ресёрча - самое оно!

По сути, вам не надо лазить по первым 10 результатам выдачи гугла и собирать инфу по крупицам – за вас это сделает нейронка. Вот и SearchGPT работает по такому же принципу.

Сдаёется мне, что в ближайшие дни SearchGPT раскатают на всех пользователей. Штош, будем ждать. Интересо, на сколько SearchGPT окажется лучше чем Perplexity.

@aimastersme
🔥6👍31
Aimasters.Me ◽️
При загрузке сайта ChatGPT на мгновение появляется вот такая плашка и сразу исчезает. Если посмотреть обзоры тех, кому уже удалось получить доступ к этой функции, то создаётся впечатление, что пользоваться Perplexity все же удобнее и эффективнее. Если кто…
Вдогонку к предыдущему посту

Мало кто знает, что Perplexity можно использовать просто как текстовую нейронку: писать в ней статьи, брейнштормить идеи, закидывать документы и обсуждать их содержимое...

Если нажать кнопку FOCUS, то можно выбирать, какую именно задачу мы хотим выполнить. Для работы с текстами подходит режим Writing
Для решения задачек – Math

Ну, и есть продвинутый поиск: по видео, соцсетям, научным статьям

И все это бесплатно!
(правда, под капотом модель не самая продвинутая, но для базовых задач сойдёт)

@aimastersme
👍91
Топ 4 сервиса, где бесплатно генерить картинки с помощью модели Flux

В недавнем голосовании Flux занял почётное второе место среди лучших генераторов изображения (Midjourney все ещё лидер).
Это очень круто, с учетом того, что моделька вышла всего месяц назад.

Я протестировал десяток ресурсов, куда уже прикрутили Flux и выбрал 4 самых достоиных из бесплатных.

4️⃣ место Lora The Explorer
Бесплатный генератор с набором стилей, которые очень сильно влияют на финальный результат. Для реалистичных изображений рекомендую выбирать flux-Realism. Важно прописывать промпт максимально точно (только английский!), тогда и результат будет класс. Работает медленно, одна картинка в генерации.

3️⃣ место FASTFLUX
Очень быстрая генерация, но качество так себе. Годится для создания первичных идей, например, для фирменного стиля или скетча персонажей. Полностью бесплатный!
пример промпта для набрасывания идей фирменного стиля:
Branding, Logo design, style guide of "THE BDAND" trade company, red and yellow, amazing detailed brand assets, beautiful design, graphic design, brand, brand identity

2️⃣ место GLIFF
Это целый комбайн по созданию контента: можно собирать из блоков-генератов креативные цепочки, например, улучшить текст для промпта, потом отправить в блок генерации изображений и проч. Нас инетересует просто создание картинок во Flux. Для этого идём в раздел Build, нажимаем плюсик и добавялем блок Image Generator, выбираем в моделях Flux Pro (см инструкцию на картинке к посту). Качество очень высокое. Генерирует одну картинку за раз, Ограничение: 20 генераций в сутки.

1️⃣ место KREA
Это бесспорный лидер. Генерирует сразу 4 изображения за раз. Есть сотни стилей, которые можно применить и настроить их влияние на финальный результат. См. приложенное видео к посту. Ограничение: дают 3 минуты генераций в день на бесплатном аккаунте, этого хватает примерно на 7-8 генераций по 4 картинки в каждой. Качество высокое.

@aimastersme | instagram
8👍8🔥1
Как генерить любые изображения с собой в главной роли

На выходных закинул в соцсети две картинки про свои будни / воскресенья и собрал тонну лайков и вопросов: “Как ты это делаешь?” Вот вам простая пошаговая инструкция.


Мы будем использовать модель для генерации изображений Flux и создадим для нее LoRA со своим лицом. (воспринимайте LoRA как специальный плагин для модели, который знает, как выглядит какой-то уникальный объект. В нашем случае - это ваше лицо).

ВАЖНО: мы будем использовать сервис fal.ai - тренировка там стоит порядка $5, дальнейшие генерации около 3 центов. (можно бесплатно, но только если у вас есть карта Nvidia с видеопамятью выше 12Гб - для этого воспользуйтесь FluxGym на pinokio)


Итак, идём вот сюда (предварительно надо создать github аккаунт, тк авторизация только через него) и тыкаем салатовую кнопку Training, выбираем Train Flux LoRA Fast.

Закидываем минимум 10 своих фото с разных ракурсов (желательно без головных уборов, без очков, волосы не закрывают лицо и нет яркой косметики). Закидываем фотки только головы в хорошем качестве. Ещё важно, чтобы на фото были только вы, без посторонних.

Прописываем чуть ниже Trigger Word, например, ваше имя на английском (чем уникальнее имя, тем лучше, чтобы модель точно знала, что это вы).

Больше никаких настроек менять не нужно. Отправляем на тренировку (перед этим попросит пополнить баланс аккаунта на 5 баксов - принимает любые карты visa и MC. Я рекомендую пополнить сразу на 10, чтобы оставить ещё 5 долларов на генерации).

Идем пить чай. Через минут 15 у вас появится файл с LoRa. Переходим по этой ссылке и выбираем справа Run Inference напротив вашего файла.

Можно приступать к генерации любых вымышленных сцен вместе с вами. Очень важно в текстовом описании указывать ваше Trigger Word, например, у меня это shima.

Чтобы получить стилизованное под South Park изображение, я применял вот такой промпт:
full body shot of a bald {Trigger Word} with beard as a SouthPark character wearing yellow hoodie and gray shoes | cartoon South Park simple style | office background

Обычно требуется 5-12 реранов, чтобы получилось что-то адекватное, так что наберитесь терпения. Ещё можно подвигать ползунок CFG, если раскрыть меню More - это параметр, который отвечает за точное следование промпту. Лучше всего работает в области между 2 и 8. Чем выше значение, тем меньше будет LoRa, а больше будет слушаться промпта.

Вот и все - вы великолепны!

@aimastersme
👍115