Denis Sexy IT 🤖
79.1K subscribers
3.17K photos
1.61K videos
21 files
4.06K links
Личный блог Дениса Ширяева (🤍🇺🇦), про технологии, интересное или актуальное.

В основном я по нейронкам. Работаю CEO в https://neural.love

⚜️ Реклама в канале возможна для юрлиц и физ-лиз у которых работает SWIFT оплата в Нидерланды

Связь: @thenbot
Download Telegram
Song of the Baldr
Undenis
В этот раз хотел сделать какую-то простенькую песню без слов, но с женским вокалом и добиться от нее гармонического эффекта — так как раз у нас роботы могут петь любые звуки теперь, то нужно попробовать их извлечь — что довольно непросто как оказалось, но кажется я справился.

Сначала сделал в Suno длинный трек, а потом нанял на Fiverr звукорежиссера из Иордана который за $25 убрал шумы и сделал эту магию со звуком, что роботы пока не могут.

В общем, вот что получилось.

Прошлые треки:
Nordic I
Nordic II

P.S. Бальдр — бог весны и света из скандинавской мифологии, его убил его брат и это песнь их матери, Фригги.

P.P.S. Почему я продолжаю делать норвежские песни?
Потому что у меня есть план: когда у меня будет 30 минут песен, я закажу себе аудио-кассету с записями нейронных песен, куплю кассетный Sony Walkman и поеду хайкать в Норвегию слушая нейронную музыку. Потому что планы должны быть такими, чтобы люди думали что я поехавший если спросят что я тут делаю 🚶‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
И к другим новостям киберпанка:
Forwarded from Zavtracast (Ярослав Ивус)
This media is not supported in your browser
VIEW IN TELEGRAM
Робот Thermonator, которого в прошлом году представила компания Throwflame, поступил в продажу.

Этот робопёс умеет пускать огненную струю на расстояние до 9 метров. Throwflame управляется по Wi-Fi/Bluetooth и работает от зарядки всего час.

Thermonator продаётся за $9420 на сайте компании.

@zavtracast
Forwarded from Generative Anton (Anton Repushko)
Эпоха скама конечно великая. Известный в широких кругах rabbit r1 (это оранжевая штука, которую дизайнили Teenage Engineering), который был с очень здравыми идеями про Large Action Model и т.д., оказался на деле всего лишь несколькими скриптами для автоматизации четырех приложений: Spotify, Midjourney, Doordash и UberEats. Может конечно всё ещё изменится в будущем, но пока вот так.

Теперь хейтеры занимаются сливом их сорцов. Началось все в треде на HackerNews. В интересное время живём.
Люди:
Хаха глупая нейронка, галлюцинирует и придумывает детали 😂

Тоже люди:
Смотрите, красная банка!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Техно Фил
Media is too big
VIEW IN TELEGRAM
Принёс вам прекрасное. Стартап из Индии Swaayatt Robots делает беспилотник для местных дорог.

Им приходится работать с коровами на дорогах, машинами на встречке, мотороллерами и тук-туками, которые пытаются попасть под колёса, полным отсутствием разметки и знаков (да и дорог тоже).

Это вам не по идеальным улицам Калифорнии тестировать беспилотник.
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на интересный UX того, как генерация картинок в теории и должна работать в SciFi: вы просто сидите у компьютера, называете случайные фразы, whisper.cpp их переводит в текст, а SD генерирует бесконечно картинки, плавно подмешивая новые концепты в старые (не просто на уровне промпта, а на уровне внутреннего пространства сети), пока вам какая-то генерация не понравится

Ну или просто, сидишь, смотришь и фантазируешь вместе с нейронкой – хороший тул для вдохновления.

Кода пока нет, но автор обещал выложить.

P.S. Лица психонавтов и биохакеров представили 🌈
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Техно Фил
В Абу-Даби прошла первая в мире гонка болидов-беспилотников.

Самое интересное происходило на квалификации, когда машины делали тестовые заезды, чтобы «познакомиться» с трассой. Машины вылетали с трасс, разворачивались, влетали в отбойники. Одним словом делали то, за что мы любим беспилотники.
Когда мне говорят «Денис, держи себя в руках»

(Готовим новый AI тул к анонсу)
Denis Sexy IT 🤖
Эпоха скама конечно великая. Известный в широких кругах rabbit r1 (это оранжевая штука, которую дизайнили Teenage Engineering), который был с очень здравыми идеями про Large Action Model и т.д., оказался на деле всего лишь несколькими скриптами для автоматизации…
This media is not supported in your browser
VIEW IN TELEGRAM
Мне нравится как ревьюверы девайса Rabbit r1 по нему проходятся – правда я его не купил по другой причине: потому что боюсь, что через год-два сервера выключат и у меня останется только красная коробочка без подключения к серверу, а я не настолько хорош в тайпскрипте ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Нас ждут в скором времени безумные игрушки
Небольшое обновление по грядущей GPT 4.5:

— Вчера, на одной арене для теста разных LLM, появилась новая модель которая называется «gpt2chat» (там лимиты чтобы ее потрогать, так что уже быстро не получить доступ)

— Она слишком хороша по сравнению с другими моделями, потому что следует инструкциям как никто другой — на это сразу обратили внимание в сообществе

— Я добрался до модели, и немного помучал ее — модель правда сильно отличалась от всего что я видел

— А потом я решил передать ей своей подготовленный промпт разработчика из этого поста, и я офигел от качества и деатальности ответа: модель с третьего раза написала мне визуализатор моего ДНК, да еще и ускорила так чтобы я мог повертеть это все в 3D без задержки в 3 секунды на поворот (данных ДНК ~15 Мб); при этом, не важно, что это не очень полезный тул – я тестировал именно написание кода и интерфейса – обычно с первых попыток такие проекты не запускаются с текущими LLM.

– Ну и Сэм Альтман троллит немного, намекая что gpt2 «близкая ему штука»

Следующие пару недель будут опять «This is changes everything» и с кучей паники от АИ-фобов, готовьтесь 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Новое обновление про полезные локальные модели:
Вчера вышла версия llama-3-8b с контекстным окном в 1 миллион токенов (!). Это значит, что задачи анализа большого количества текста можно теперь делать локально (точно на английском, с другими языками я это не тестил), до этого я ходил в Claude 3 Opus 200k.

Зачем это нужно?
Расскажу на живом примере: мы готовим новый продукт к анонсу, это что-то вроде AI фото студии но на вход мы берем всего одно фото пользователя, не 10-20; что сильно дешевле чем файнтюн модели дримбудкой, а значит, мы можем снизить цену на продукт для юзеров.

У продукта уже есть конкуренты — это классно, потому что это значит, что в нише есть выручка. Конкуренты уже успели обрасти органическим трафиком – это мы и учитываем при запуске нового продукта:
Я выгрузил из SEO анализатора органический трафик по которому находят наших конкурентов в гугле, скормил все это в контекстное окно как часть промпта и запросил у LLM популярные стили генераций, по которым пользователи ищут наших конкурентов.

В итоге, на запуске, мы получили топ-10 стилей которые точно востребованы в интернете.

Ради теста я сравнил результаты своего анализа между Claude 3 Opus 200k и Llama-3-8B-Instruct-Gradient-1048k, и могу сказать что локальная модель отлично справилась для своего размера и действительно смогла написать важные стили, похожие на то что выдал Opus. Так что теперь вы можете делать анализ больших корпусов текста дома.

Сама модель тут (gguf версия для адептов llama.cpp)

P.S. Для этой задачи важно ставить температуру 0, а то напридумывает деталей моделька. Указывая контекстное окно в 100k+ будьте готовы что памяти компа вам не хватит.

P.P.S. Как водится, делюсь промптом который специально собрал для llama3 формат под эту задачу, там видно куда нужно поместить большой объем текста.

#пропродукт
Вторая модель из недавних которую хотел показать:
Мечта ипохондрика — OpenBioLLM 70B

Это медицинская модель, которая сейчас на первом месте по тестам на медицинских задачах (даже выше gpt4). Модель идеально подходит для практикующих докторов, тех, кто учится на медицинском или для тех, кто, по каким-то причинам стесняется говорить про свои медицинские проблемы с ChatGPT (например я, не хочу чтобы потом учили на этом датасеты — когда данные не покидают компьютер, комфортнее).

Примеры задач которые умеет решать модель:
🚑 Резюмировать клинические записи
🚑 Отвечать на медицинские вопросы
🚑 Распознавать клинические сущности
🚑 Медицинская классификация
🚑 Деидентификация пациента (удаление персональных данных из документов)

Естественно, модель не заменяет врача — это скорее быстрый способ спросить что-то на английском в сфере знания человеческого тела. И классный тул, который можно взять с собой куда-то где нет врачей и интернета (но есть вы и ваш ноут).

Естественно, никаких диагнозов по ней не сделать — как и с любой языковой моделью, по настоящему она раскрывается в руках эксперта который понимает когда она ошибается.

Но если вам все же интересно потестировать, то я сделал промпт медицинского агента в нужном ей формате.

Ссылки:
💊 Походная OpenBioLLM 8B (gguf)

💊 Намного более умная (она же на первом месте) OpenBioLLM 70B (gguf)

🌐 Анонос от автора
Please open Telegram to view this post
VIEW IN TELEGRAM