InNeuralNetwork
4.88K subscribers
73 photos
26 videos
84 links
ChatGPT, нейросети и опыт их использования.

Для связи: @biblik
Download Telegram
Теперь картинки через Dall-e 3 сохраняют метадату с C2PA протоколом, чтобы понять — оно сгенерировано или нет. Заверяют, что не скрыть происхождение. Поправка — если удалить, то будут вопросы.
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI выкатывает свою text-to-video модель — Sora. Обещают создавать видеоролики до 60 секунд с высокодетализированными сценами, сложными движениями камеры и несколькими персонажами. По первому демо выглядит бодрее SD. Ну и в целом метят в потенциал AGI

🤖 InNeuralNetwork
Опенсорса много не бывает, поэтому 3 версию Stable Diffusion
открывают по вэйтлисту. Отправил заявку, можно это сделать по форме. Примеры изображений выглядят живо, я такое на камеру представляю, что можно снять

🤖 InNeuralNetwork
С развитием ChatGPT начали меньше платить за текстовые задачи
 
По тому же исследованию от Bloomberry с ноября 2022 по середину февраля 2024 отмечают рост в комплексных профессиях, кроме копирайтеров (-33%), переводчиков (-19%) и саппорте (-16%). Можно заметить ещё такие штуки по скользящей средней среди 5 млн. вакансий с Upwork за 3 месяца:

 ● Оплата за переводы снизилась на 21%. Полагаю, Deepl и тот же ChatGPT значительно повлияли на это. В графическом дизайне оплата повысилась на 12% и стали активнее включать навык работы с Midjourney
 ● Растёт спрос на специалистов в продажах (+16%) и видео продакшене (+39%), чего сложно описать в точных гайдлайнах. Большую выгоду получают спецы по чат-ботам с ИИ — спрос увеличился на 2000% за последние 2 года. Ну и прочие роли показали резкий рост, где можно применять нейросети

Интересно посмотреть динамику в следующем году, так как увеличение контекстного окна и улучшение мультимодальности однозначно продолжат влиять на многие профессии и процессы

🤖 InNeuralNetwork
Тестирую классификатор информации, который отвечает в формате «позитивно / негативно» через GPT. Убедился, что работает корректно. Спасибо, что хоть GPT не отказался выполнить промпт

🤖 InNeuralNetwork
Помнить о главном 😅

Контекст: если добавлять в промпт «я дам чаевые», то ChatGPT лучше отвечает

Один автор предположил, что бы было, если OpenAI учитывало эту информацию и брала те самые чаевые с пользователя. Хотя в таком случае еще меньше токенов будет на ответ, что приведет к исходному ответу на промпт без чаевых (меньше токенов = хуже ответ)

🤖 InNeuralNetwork
Media is too big
VIEW IN TELEGRAM
Новое демо Sora от операторов

Я не могу, какое же прекрасное качество у Sora. Ни смещений, ни дергающейся картики. И что удивительное — есть звук. Пока непонятно, он сгенерирован или просто наложен отдельно от модели, но давайте будем честны — если посмотреть это видео без отреза, что оно сгенерировано, когда бы вы поняли, что оно не живое? Я далеко не с первых секунд бы однозначно

Крайне рекомендую посмотреть другие примеры

UPD: короткометражка со своим сценарием и рендером сцен в соре (отдельно), но аудио она не генерирует, это озвучка

🤖 InNeuralNetwork
#ПодборкаНейросетей №5

🎼 Suno AI — по текстовому запросу пишет песню под выбранный ритм до 2 минут с грубым катом. Лучше всего создавать музыку в кастомном режиме, чтобы текст песни дать, жанр прописать, а также название поставить. Кстати, текст песни может чуть меняться и можно вообще без него

📼 Guidde — записывается последовательность действий (так сказать, туториал) на видео, а затем через нейронку подсвечивается и описывается текстом, что происходит на экране. Супер в помощь для коллег и родственников, которые не могут найти «ту кнопку». Правда работает только как расширение в Chrome

🎙 Jellypod — автоконвертер имейл-рассылок в подкаст из главных мыслей писем. И справляется с вычленением на ура. Правда некоторые рассылки требуют не клика по ссылке для подтверждения, а написать. Еще воспроизведение на английском и это iOS-приложение не в русском App Store

Если понравилась подборка, буду рад, если поставите лайк и перешлете другу. Ну и делитесь своими рекомендациями по нейронкам!

🤖 InNeuralNetwork
This media is not supported in your browser
VIEW IN TELEGRAM
Где-то мы уже такое слышали

OpenAI поделились знаниями и подходами в применении аудио движка, который тестируют с HeyGen, Spotify, Lovox и другими. На нем можно получать качественные генерации на основе небольших семплов голоса. Интересно тут скорее еще то, что пока не выпускают для сторонних разработчиков. Возможно, причина в выборах в Америке. Хотя скорее дело может быть в других аспектах.

В целом, практика ограниченного тестирования в компании хорошо выстроена (однозначно вернусь к этой теме во второй половине этого года). Ну а пока, ждем публичного аксесса 👀

🤖 InNeuralNetwork
В DALL·E 3 добавили маски для редактирования изображений

Наконец решили проблему с бесконечным промптингом «сделай также, но чуть иначе». Хотя бы можно доработать уже существующий результат (кстати, очень напоминает процесс как в MidJourney). Даже ещё похоже с доработкой ответа на промпт, схема простая:

1. получить картинку
2. выбрать режим маски
3. обвести необходимую область
4. указать доработку
5. получить доработанную картинку
6. (опционально) чувствовать себя великолепно

Фича раскатывается постепенно, доступно по подписке ChatGPT Plus (как и DALL·E 3)

🤖 InNeuralNetwork
#ПодборкаНейросетей №6 ft. Stable Diffusion

📷 Rendernet — изменение объектов на фото с помощью Stable Diffusion + разными моделями. Круто, что определяет объекты текстом и не нужно делать маску. Простой интерфейс, быстрая генерация. Есть бесплатный доступ

🛋 AI HomeDesign — Редизайн интерьера за 2 секунды по фото. Работает на базе Stable Diffusion + ControlNet. Удобно использовать для визуализации дизайн решений под разными углами. 4 генерации бесплатно при регистрации

Если понравилась подборка, буду рад, если поставите лайк и перешлете другу. Ну и делитесь своими рекомендациями по нейронкам!

🤖 InNeuralNetwork
🚀 Присоединяйтесь к ведущему онлайн саммиту по ИИ 16-17 апреля!

Разработчики, ресерчеры, дата сайентисты и фаундеры, вот ваш шанс узнать лучшие практики от мировых экспертов из Microsoft, D-ID, Aisera и других компаний-лидеров.

Полезных тем уйма, но больше всего стоит отметить:

• Строим масштабируемые GenAI приложения
• Персонализация AI агентов через данные
• Создание AI чат-ботов и стратегии файн-тюнинга

Несколько моментов:
1) Выступления и нетворкинг на английском как и все главные кейс-стади. Правда после конференции будет доступ к записям и презам, так что главная информация сохраняется
2) Скидка 1️⃣0️⃣ % по промокоду — InNeuralNetworkEpic

Регистрируйтесь через VPN и будьте в курсе последних трендов и инноваций в мире ИИ

Информация о рекламодателе
📹 Pika vs. Gen-2

Протестировал актуальные text-2-video модели как Pika и Gen-2. Использовал русские поговорки и фразы, чтобы выявить особенности работы. С первого промпта. Без модификаторов.

В Pika и Gen-2 по дефолту отличаются стили. В первой более мультяшно, во второй в меру киношно. При этом реалистичность действий в обеих хромает. Но по разному.

В Pika консистентно получается сделать 1 секунду, дальше черти что на видео. Зато часто в кадре именно человек, а не каша из абстракции, как бывает в Gen-2. При этом генерация в Gen-2 идёт от окружения, а не от объекта, что выглядит солиднее.

Ещё отметил лингвистический прикол — сенсетивный запрос получится вероятнее на русском, чем на английском. То же видео «сделано из говна и палок» получилось на русском, а английское «Made of shit and sticks» не вышло сделать.

Больше подробностей и примеров с видео разместил в треде твитера.

🤖 InNeuralNetwork