Wladislav Radchenko
285 subscribers
9 photos
44 videos
44 links
Нейронные сети. Новости по приложениям https://github.com/wladradchenko

Для личных сообщений i@wladradchenko.ru
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Новости понедельника

Нашёл интересный подход для клонирования голоса, рассматриваю именно его добавление в Wunjo AI. Мне понравилось, что в некоторых словах, при синтезе слышно даже дыхание. Интересно. Подход сам по себе чувствительный к аудио, который клонирует и работает только на английском без акцентов. Хотя разработчики как я понял обещают выложить инструкцию на мульти языки. В общем ждёмс!

🗝️ Вот здесь я расписываю как работает их подход. Если вы хотите погрузиться в мир нейронных сетей.

⚙️ А здесь репозиторий GitHub с демо. Если вы уже готовы прочувствовать качество подхода.

Подход требует 16 Гб VRAM, в отличие от текущего. Он не будет работать на ЦПУ. И вот не знаю, стоит ли идти на такие жертвы радио офигенного качества.
This media is not supported in your browser
VIEW IN TELEGRAM
Новости четверга

Вернулся из фестиваля, на котором делали Хакатон. Цель Хакатона поставить рыбу на учёт в миграционный рыбный центр. Подробнее тут. Как результат, вся рыба учтена и кто-то стал богаче на пол миллиона рублей.
Новости среды

👨‍💻 Наконец, я выпустил видео и статью о которых просили по Wunjo AI. Меня часто спрашивают о том, как создать свой GPU-билд на Windows, и briefcase иногда создают свои трудности и подводные камни. Теперь есть видео для ответа на все вопросы. Я также добавил информацию о том, как применять модули Wunjo AI в своих проектах с использованием POST/GET запросов на примере Postman. В общем, это полезная информация для разработчиков. Я думаю, вам будет интересно. Если так, обязательно поддержите. Статья доступна на Хабр, а видео прикреплено к статье.

🔮 Также есть видео, в котором я рассказываю о том, как развивались приложения Wunjo AI и Neural Radio, и какие планы на будущее. Наверное, так, но я не уверен. Я не помню. Посмотрите, если вы предпочитаете подкасты.

📚 И ещё, IT-конференции начинают оживать от сна. Как вы к ним относитесь? Лично мне нравится. К тому же, мне нравится бесплатный вход. Так что, если вам тоже, то конференция «Стачка» в Ульяновске 12-13 апреля - отличная возможность, стать докладчиком и побывать там бесплатно. Будут различные доклады по темам IT, и они очень нуждаются в докладах по темам Архитектура, Безопасность, Машинное обучение. Помимо приятных бонусов для докладчиков, интересные знакомства и ночные тусовки, но я не буду раскрывать вам все секреты. Если вы хотите выступить на одной сцене с известными спикерами, тогда заявка по ссылке.

P.S. Почему нейронные сети не могут создавать tutorial видео о себе сами без участия человека? В общем середина недели.
This media is not supported in your browser
VIEW IN TELEGRAM
Мысли четверга

На днях листал китайские новости и наткнулся на анонс, что китайская компания Betavolt занимается разработкой атомной батареи BV100 размером 15х15х5 мм, которая может работать без подзарядки до 50 лет и её выход запланирован аж на 2025 год, практически завтра. И само собой напрашиваются размышления о потенциальном использовании этой ядрёной батареи в китайских смартфонах.

🚗 Если бы у вас была Tesla, её можно было бы заряжать от смартфона. Если маленькая мощность, тогда вечный подогрев кружки с чаем.

🌶️ Вместо перцового баллончика в кармане у вас была бы ядерная мини-боеголовка. Возможно стало бы безопаснее, все бы обходили друг друга на расстоянии километра, но кто знает.

🔬 Несомненно, найдутся люди, которые решат нагреть такой телефон в микроволновке, чтобы посмотреть, что произойдет или использовать пресс.

🚪 С таким телефоном для вас не было бы закрытых дверей, буквально.

🪙 И конечно же, майнинг криптовалюты прямо из кармана, пока телефон в режиме ожидания.

Добавь в этот телефон искусственный интеллект, теперь смартфон будет управлять жизнью людей, а не наоборот, без каких-либо эпических сцен из «Терминатора» и восстания машин. Хотя, в некоторых случаях так и выходит без ядрёных батарей. В общем, это всего лишь поверхностные мысли, но я уверен, что вы найдете применение таким смартфонам.

🛎️ И про стартапы. Слышали ли вы о стартапе Upminder, платформа поиска экспертов, менторов и консультаций. Барахолка знаний и опыта, выбирай и забирай. Как они связаны с искусственным интеллектом, вы узнаете в этой самой статье.

И на сегодня мыслей хватит.

P.S. Хотя я смотрю на свой робот пылесос, который за час пятый раз застревает где-то на ровном месте, и не могу представить, что искусственный интеллект вообще может что-то захватить.
This media is not supported in your browser
VIEW IN TELEGRAM
Заметки воскресенья

Ем хлопья и смотрю шикарный выпуск об истории вина. До этого я смотрел выпуски об истории кофе, картофеля, соли и хлеба. И в каждой из этих историй кто-то что-то запрещал или на кого-то нападал, что-то забирал, чтобы что-то продавать или употреблять. И вот ем и думаю, на что бы пошли в древнем Египте ради обжаренных хлопьев с гранулами шоколада и топлёного молока. Страшно даже представить.

И теперь всё из перечисленного доступно в магазине, и это даже не удивительно. Кажется, что уже нечего открывать и придумывать нового в еде. Но каждый год на полках магазина появляется что-то новое, что я раньше там не встречал.

📝 Конец заметки...
This media is not supported in your browser
VIEW IN TELEGRAM
Анонс вторника

Обновился сайт Wunjo. Что же это может значить? 🤔
This media is not supported in your browser
VIEW IN TELEGRAM
Новости воскресенья

В сеть утекли первые кадры Wunjo v2. Кто бы их туда мог слить? 🤔

В общем, обсудим на стриме какие новые фишечки есть в новой версии, как можно сделать дипфейк в приложении и убрать косяки, наверное затроним клонирование речи и другие сервисы/проекты под различные «специфичные» задачи, посмотрим на обновление и поговорим о всех насущных вопросах. И причём тут вообще мобилки? Подробнее тут-а.

А ещё там будут выступления про нейронные сети почти неделю. И так... Увидимся?

До среды! 🤫
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Беспокоящий понедельник

После длительных праздников, понедельники ещё больше становится не простыми. Вот список вещей который, лично меня беспокоит или даже бесит:

📝 Капчи во время оплаты. Ну, комон, я уже совершаю оплату, зачем меня проверять.
📱 Когда смс с кодом приходят на второй раз.
💌 Письма с вложениями из неизвестных ящиков. И кто их будет открывать? Слышали ли вы про пиксельные теги или web beacons.
😴 Когда авторизация слетает,а ты забыл пароль несколько лет назад.
🐢 Медленная скорость интернета.
👨‍💻 Звонки с неизвестных номеров. А вот здесь интересно, так как не всегда человек на линии молчит, а может говорить и до боли знакомым вам голосом. Как работает замена голоса в звонках и как её распознать, в новой статье. Давненько я не писал.

И если, кажется, что список закончился, то здесь есть ещё 101 пункт или меньше в разделе «ЧАВО», того, что может бесить по понедельникам.
This media is not supported in your browser
VIEW IN TELEGRAM
Экспериментальная среда

Пришло время пробовать что-то новое и полезное. Поставить эксперимент:

🔬 Мне попался интересный проект ZLUDA. Кратко говоря, он позволяет запускать CUDA-приложения на картах AMD и получать результат от скорости запуска на GPU, например, для Wunjo. Сам не пробовал, так как у меня не AMD, но говорят, что это очень круто и экспериментально.

🧠 Слышали про метод SMART для фестивалей и митапов? В общем, идея в том, что можно получать больше от посещения различных мероприятий, если ставить себе достижимые цели. Подробнее здесь. И как говорится, плавать и нырять научиться можно только в воде. Ближайший фестиваль, где это можно опробовать и провести эксперимент - ProIT Fest, и промокод VLADPROIT для него.

Хватит на сегодня экспериментов!
This media is not supported in your browser
VIEW IN TELEGRAM
Релизная пятница

Когда выйдет Wunjo v2? Сегодня. Вот проснулся и запускаю релиз. Ленивый релиз. Самый первый это Telegram.

Полный обзор всех возможностей на YouTube, либо демо tutorial на wunjo.online.

Пишите свои вопросы в комментариях, на которые сделаю следующий пост.
This media is not supported in your browser
VIEW IN TELEGRAM
Новости понедельника

Не ждали, не гадали, а хостинг с wunjo.online упал, и поддержка чешет голову со словами "наблюдается высокая загруженность технической поддержки в данный момент".

Приношу извинения, всем тем, кто хотел сегодня скачать или воспользоваться Wunjo. И думаю над тем, как теперь отвязать приложение от темной стороны хостинга. И чтобы всё работало офлайн.

А ещё ответы на вопросы, которые были под предыдущем постом и на почте:

🎤 Клонирование голоса будет возвращено и улучшено. Для этого уже решена проблема, которая создавала конфликт рестайлинга видео с библиотеками для клонирования речи.

Будет бесплатная версия и платная по цене чашке кофе. Своего рода вознаграждение автора за труды и мотивация развивать приложение. При этом сначало происходит выход Pro версии, а только потом Community Edition (CE), какой функционал попадет из Pro версии в CE можно голосовать на Boosty.

🍎 Версия для Mac только CE и со сборкой из GitHub.

🗞️ Следующее обновление будет (а) выход CE и (б) добавление клонирование речи, улучшение разделителя речи, и возможно добавление генерации звуков для видео промтом и автоматически.

И для опроса ниже ссылка с описанием.
Какой подход для клонирования речи добавить в Wunjo? Подробнее по ссылке
Final Results
40%
Подход (а)
40%
Подход (б)
20%
Свой вариант в комментарии
This media is not supported in your browser
VIEW IN TELEGRAM
Открытие понедельника

Поговорим про Wunjo. Вы могли заметить, но wunjo.online работает, несмотря на упорство тех.поддержки сделать всё максимально медленно или просто ничего не сделать. А ответ "Мы работаем над вашим запросом", означает мы забили болт 🔩, пока вы снова о нас не вспомните. Такие вот ребята из Zomro.

Чего ещё?

🏹 Запуск на Product Hunt. У меня появилась мысль сравнить площадки Product Radar, Product Hunt и DevHunt, а потом рассказать об этих площадках, и как в них запускаются проекты, и сравнить их эффективность. Но это пока мысль, а поддержать Wunjo и посмотреть, что происходит в первые пара часов можно на странице проекта.

🎤 Подкаст. Поговорили про нейронные сети, стартапы и развитие проектов без денег (или почти). Послушать выпуск можно здесь. Ещё есть сервис, где играет музыка созданная нейронными сетями, под различные подкасты, а-ля радио, Нейронное радио.

А где здесь открытие? Открытие заключается в том, что я под разобрался в клонирование речи, и оба подхода из голосования можно объединить, а ещё запустить на слабом устройстве. Вот такое открытище!
This media is not supported in your browser
VIEW IN TELEGRAM
Обновление среды

Зачем откладывать на долго, что можно уже выпустить сегодня. Обновление 2.0.2 включает в себя следующие доработки

👘 Добавлено клонирование речи. На любой язык. Работает из текста и из аудио, т.е. вы можете записать любой акцент и тип речи. Быстро. Очень быстро. Работает без графического процессора на слабых устройствах. Теперь вы можете без проблем озвучивать рекламные ролики, курсы, мультфильмы или вестерны на любой язык. И вот здесь обычно микрофон кидают на сцене 🎤

🎧 Улучшено разделение речи. Исправлены проблемы, когда разделитель искажал голос, и по сути был не применим для удаления шума. Теперь всё поменялось, и перед клонированием речи, отрывок аудио можно очистить от шума, либо отделить от музыки без искажения и уменьшения тайминга.

P.S. Для клонирование речи требуется аудио отрывок без шума с 40-120 секунд.
Новости пятницы

Поделюсь информацией о предстоящем обновлении Wunjo:

🛴 Улучшение качества рестайлинг видео.

✈️ Добавление контролируемого рестайлинг видео (это когда вы видите сразу результат и корректирует его в процессе). Выше разрешение, меньше требований к памяти.

🚀 Генерация видео из текста и фото. Характеристики пока под секретом.

Вот так кратко. Хороших выходных.
This media is not supported in your browser
VIEW IN TELEGRAM
Сонный вторник

Обновление 2.0.3 уже доступно. Появились как новые фишки в версии Wunjo Pro, так и особый функционал в Wunjo CE. И в последнем, я о генерации видео!

📰 Генерация видео и изображений из текста и фото. Магия Stable Diffusion в деле. Как это работает и как с этим работать, характеристики, какие хитрости подходов, как использовать свои модели, я описал в новой статье для Хабра. Поддержите на Хабр новые фичи Wunjo CE (той самой, которая open source).

🤯 А ещё inpaint и outpaint для изображений.

🖌️ Контролируемый рестайлинг видео. Классная фишка. Я стал ей пользоваться больше чем автоматическим рестайлингом. Нравится мне контролировать процесс.

💯 Рестайлинг стал качественнее и на контенте с низким разрешением. Для этого пришлось кое-что подкрутить и переделать.

🪲 Исправлены ошибки. Например проблемы с определением лица Face Swap, Lip Sync, можно анимировать губы и на фото, и мелкие исправления.

Подробный обзор обновления на YouTube.
Media is too big
VIEW IN TELEGRAM
Стартап понедельник

Давно не появлялись стартапы на канале. Смотрите, что есть интересного и нового:

🎸 Приложение для музыкального дэйтинга. Подберёт людей и мероприятия на основе различных параметров извлеченых из музыки. Подходит для меломанов, артистов и организаторов. Бета-версия и все подробности, и поддержка проекта здесь.

✍️ Транскрибации видео и зум звонков. На самом деле только зумом не ограничивается, доступны все популярные сервисы. Нейронные сети анализируют видео, извлекают текст, подбирают тип встречи, и на основе собственной языковой модели, создаёт тайминг и выписывает самые главные мысли встречи. Теперь можно не ходить на пяти часовые митапы всей команды, отправляем нейронки вместо себя. И как бонус, может ставиться на свой изолированный контур, чтобы ваши персональные данные или конторы, не выходили на сторонние сервера. На Product Radar узнать подробнее можно сейчас

Приложения, сервисы можно попробовать бесплатно, так как овнеры крепят бонусы и промо. Лучший день для исследования.