InNeuralNetwork
4.82K subscribers
75 photos
26 videos
88 links
ChatGPT, нейросети и опыт их использования.

Для связи: @biblik
Download Telegram
#ПодборкаНейросетей №5

🎼 Suno AI — по текстовому запросу пишет песню под выбранный ритм до 2 минут с грубым катом. Лучше всего создавать музыку в кастомном режиме, чтобы текст песни дать, жанр прописать, а также название поставить. Кстати, текст песни может чуть меняться и можно вообще без него

📼 Guidde — записывается последовательность действий (так сказать, туториал) на видео, а затем через нейронку подсвечивается и описывается текстом, что происходит на экране. Супер в помощь для коллег и родственников, которые не могут найти «ту кнопку». Правда работает только как расширение в Chrome

🎙 Jellypod — автоконвертер имейл-рассылок в подкаст из главных мыслей писем. И справляется с вычленением на ура. Правда некоторые рассылки требуют не клика по ссылке для подтверждения, а написать. Еще воспроизведение на английском и это iOS-приложение не в русском App Store

Если понравилась подборка, буду рад, если поставите лайк и перешлете другу. Ну и делитесь своими рекомендациями по нейронкам!

🤖 InNeuralNetwork
This media is not supported in your browser
VIEW IN TELEGRAM
Где-то мы уже такое слышали

OpenAI поделились знаниями и подходами в применении аудио движка, который тестируют с HeyGen, Spotify, Lovox и другими. На нем можно получать качественные генерации на основе небольших семплов голоса. Интересно тут скорее еще то, что пока не выпускают для сторонних разработчиков. Возможно, причина в выборах в Америке. Хотя скорее дело может быть в других аспектах.

В целом, практика ограниченного тестирования в компании хорошо выстроена (однозначно вернусь к этой теме во второй половине этого года). Ну а пока, ждем публичного аксесса 👀

🤖 InNeuralNetwork
В DALL·E 3 добавили маски для редактирования изображений

Наконец решили проблему с бесконечным промптингом «сделай также, но чуть иначе». Хотя бы можно доработать уже существующий результат (кстати, очень напоминает процесс как в MidJourney). Даже ещё похоже с доработкой ответа на промпт, схема простая:

1. получить картинку
2. выбрать режим маски
3. обвести необходимую область
4. указать доработку
5. получить доработанную картинку
6. (опционально) чувствовать себя великолепно

Фича раскатывается постепенно, доступно по подписке ChatGPT Plus (как и DALL·E 3)

🤖 InNeuralNetwork
#ПодборкаНейросетей №6 ft. Stable Diffusion

📷 Rendernet — изменение объектов на фото с помощью Stable Diffusion + разными моделями. Круто, что определяет объекты текстом и не нужно делать маску. Простой интерфейс, быстрая генерация. Есть бесплатный доступ

🛋 AI HomeDesign — Редизайн интерьера за 2 секунды по фото. Работает на базе Stable Diffusion + ControlNet. Удобно использовать для визуализации дизайн решений под разными углами. 4 генерации бесплатно при регистрации

Если понравилась подборка, буду рад, если поставите лайк и перешлете другу. Ну и делитесь своими рекомендациями по нейронкам!

🤖 InNeuralNetwork
🚀 Присоединяйтесь к ведущему онлайн саммиту по ИИ 16-17 апреля!

Разработчики, ресерчеры, дата сайентисты и фаундеры, вот ваш шанс узнать лучшие практики от мировых экспертов из Microsoft, D-ID, Aisera и других компаний-лидеров.

Полезных тем уйма, но больше всего стоит отметить:

• Строим масштабируемые GenAI приложения
• Персонализация AI агентов через данные
• Создание AI чат-ботов и стратегии файн-тюнинга

Несколько моментов:
1) Выступления и нетворкинг на английском как и все главные кейс-стади. Правда после конференции будет доступ к записям и презам, так что главная информация сохраняется
2) Скидка 1️⃣0️⃣ % по промокоду — InNeuralNetworkEpic

Регистрируйтесь через VPN и будьте в курсе последних трендов и инноваций в мире ИИ

Информация о рекламодателе
📹 Pika vs. Gen-2

Протестировал актуальные text-2-video модели как Pika и Gen-2. Использовал русские поговорки и фразы, чтобы выявить особенности работы. С первого промпта. Без модификаторов.

В Pika и Gen-2 по дефолту отличаются стили. В первой более мультяшно, во второй в меру киношно. При этом реалистичность действий в обеих хромает. Но по разному.

В Pika консистентно получается сделать 1 секунду, дальше черти что на видео. Зато часто в кадре именно человек, а не каша из абстракции, как бывает в Gen-2. При этом генерация в Gen-2 идёт от окружения, а не от объекта, что выглядит солиднее.

Ещё отметил лингвистический прикол — сенсетивный запрос получится вероятнее на русском, чем на английском. То же видео «сделано из говна и палок» получилось на русском, а английское «Made of shit and sticks» не вышло сделать.

Больше подробностей и примеров с видео разместил в треде твитера.

🤖 InNeuralNetwork
Завтра в 19:00 по мск выступлю онлайн, как нейросети меняют обучение и работу. Материал для всех, особенно для детей и подростков.

Все же нейросети не заменили человека. Учиться надо, без работы не обойтись. Даже сосиску все ещё самому придётся заваривать. Однако же, навык использования нейросетей поможет оптмизировать многие процессы. Моё выступление как раз подсветит эти области и подход к использованию нейросетей. Покажу на демо.

Если у вас есть ребёнок или вы сами чувствуете себя таковым (понимаю, уважаю!), то регистрируйтесь сюда и увидимся завтра :)
Цифровая подборка: что почитать и посмотреть на досуге

🖥«Цифровая трансформация», Томас Сибел (Литрес). Мастрид для айтишников: от рядовых до SEO. Книга о том, как выжить и преуспеть в новую эпоху. Пошаговый план и 10 принципов того, как использовать облачные технологии, Big Data и нейросети в работе.

💼 «Компания для людей. Как сохранить душу бизнеса в эпоху тотальной цифровизации», Ришад Тобакковала (Литрес). На стыке психологии и технологий, обязательно к прочтению руководителей. О том, как не впадать в цифровую эйфорию и учитывать потребности живых людей и их эмоции в работе бизнеса.

📹 «Двухсотлетний человек», 1999 г (Okko). Классика кинематографа, которая поднимает проблемы человечности и искусственного интеллекта, рабства и свободы. Уверен, что уже смотрели, но пересматривать сегодня можно и нужно: инсайты гарантированы! Точно стоит пересмотреть иллюстраторам и фотографам.

🤖 «Из машины», 2014 г (Иви). Еще один фильм про взаимодействие человека и ИИ: эксперимент, который показывает обратную сторону умных машин. Небанальный взгляд для тех, кто работает с визуалом.

💌 Канал «ДзеноПульс» Тимура Угулава. Канал для маркетологов и редакторов: по большей части о том, как работать со статейным продвижением, в том числе — с помощью нейросетей.
Обновленный GPT-4 Turbo выглядит снова самой лучшей моделью по тестам. Доступно во всех GPT-подписках и по API

🤖 InNeuralNetwork
Perplexity > Нейро

Потестил контекстный браузер Яндекса, неплохой. Вычленяет полезную инфу, подсвечивает релевантные особенности. Работает бесплатно на УandexGPT-3 в приложении Яндекс с Алисой и Браузере

Но Нейро — это адаптация Perplexity с похожим UX. На первый взгляд сложно отличить, где что

Качество больше нравится в Perplexity с Pro версией (на GPT-4 / Claude 3). Выдаёт корректнее ответы, а еще задаёт 1-2 наводящих вопроса, чтобы лучше ответить. Нейро же сразу отвечает, поэтому хуже попадает в запрос

И ещё заметил, что Нейро учитывает не все контекстные особенности. На «Куда сходить с 2 друзьями в Томске 20 и 21 апреля? Нам 14 лет, общий бюджет — 1500 рублей» базово получаю неплохой ответ. Но в нем же предложение сходить в кальян и за пивом. Друзьям по 14 лет. Хех

Интересно наблюдать за развитием продукта. А еще рекламы, так как суть нейробраузинга — сократить нерелевантную инфу баннеры и получать точечные ответы

Если потестили, что думаете? В комментах ещё несколько примеров

🤖 InNeuralNetwork
InNeuralNetwork
Обновленный GPT-4 Turbo выглядит снова самой лучшей моделью по тестам. Доступно во всех GPT-подписках и по API 🤖 InNeuralNetwork
Новая модель GPT-4 еще и с данными до декабря 2023. Могут быть неточности, но уже здорово
This media is not supported in your browser
VIEW IN TELEGRAM
Звучит клево

Тестирую text-2-music нейросеть Udio, нравится реализация. Быстро генерируется музыка, можно тюнить песни в разных отрезках, указывать жанр, добавлять текст, ставить инструменталку, а также и автоматически «сделать че-нить». Еще доступна лента с другими песнями, клёво для вдохновения

В сравнении с Suno (писал в этом посте) лучше по настройкам, по качеству сопостовимо. Все же с русским есть лингвистические и контекстные косяки, но вполне добротно. На английском сложно понять, что поет не человек, а модель

Сервис находится в бете, распространяется бесплатно до 1200 генераций в месяц. Песню из видео можно послушать тут

🤖 InNeuralNetwork
Вышла LLaMa 3

Доступно бесплатно, есть несколько версий: простая, базовая, 400 миллиарднопараметерная. Помимо текста, ещё можно генерить картинки. По качеству выдвигают как самую лучшую бесплатную модель. Подробнее с релизом можно ознакомиться на официальном блоге.

Также можно потыкать вручную в формате чата. С русским пока не очень, больше на английском работает. Пробуйте тут, но с VPN

🤖 InNeuralNetwork
This media is not supported in your browser
VIEW IN TELEGRAM
📸 Генеративный фотошоп все ещё круто

Сделал фотошопную визуализацию своего котелка, если сбрить его на половину. Загрузил фотку, обвёл маской половину головы, сделал копию для сравнения, а по запросу remove hair генеративно преобразил. 2 подхода по 30 секунд ожиданий, фотка готова. А то в реальности сложно представить, как оно будет на самом деле.

В жизни совпало (фотка в белой футболке после стрижки). Та же форма головы, только не очень ровно отметил линию при генерации — половина головы все же левее начинается. Ещё волос чуть меньше надо было оставить на другой, все же за стрижкой собрался.

Генеративную заливку можно пульнуть через Photoshop Beta по подписке Adobe на PS и LR за $12 в месяц. Похожая фича есть в бесплатном Adobe Firefly, но процесс чуть дольше.

🤖 InNeuralNetwork
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Assistant API убер проапгрейдили

Я чуть подзабил на GPTs, так как режим в меру ограничен по обработке данных — плохо работает с русским, долго выдаёт ответ и быстро прерывается. Можно было загрузить до 20 файлов, по-хорошему, не более 100 страниц, чтобы сносно работало. Однако сегодня OpenAI пульнули супер обновление — можно грузить до 10 000 файлов, работает векторный поиск, нативная работа без танцев с бубном. Простым языком, сделать линейную автоматизацию можно за вечер и не сотни тысяч рублей.

Я нервно потираю руки от происходящего, так как часть вещей «делаем так, тут костылём подправим, тут костылём костыль исправим» больше не потребуется. И с другой стороны — печалюсь, что часть своих текущих работ надо адаптировать под новый пайплайн.

Для примера, гружу «Пиши, сокращай», спрашиваю нетривиальный вопрос про замену штампов, на что получаю точный ответ меньше, чем за 30 секунд. Для русского языка и облачной машины это топ. 2 запроса с поиском и переводом правда обошлись в 22 рубля, так что всему своя (оправданная) цена.

AGI близко!

🤖 InNeuralNetwork