DenoiseLAB

👋

👋Ребят всем привет!!! Продолжаем серию подборок про нейронки различной степени направленности, сегодня на очереди сетки и готовые к развертыванию репозитории для работы со звуком. Пригодится всем кто озвучивает игры, фильмы, или плотно работает с тексами различной направленности. Продукты платные, бесплатыне всякие, подойдут для любых целей. Можно менять голоса, тип, стиль, темп изложения текста и много других характеристик. Всех прошу подл каст:

🔠

https://github.com/RHVoice/RHVoice

🔠

https://elevenlabs.io/

🔠

https://mycroft-ai.gitbook.io/docs/mycroft-technologies/mimic-tts/mimic-overview

🔠

https://murf.ai/

🔠

https://speechify.com/

🔠

https://github.com/mozilla/TTS

🔠

https://deepgram.com/

🔠

https://marketplace.respeecher.com/

🔠

https://www.wondercraft.ai/

🔠

https://coqui.ai/

🔠

https://www.fluxon.ai/

🔠

https://play.ht/

🔠

https://voicemy.ai/

🔠

https://app.letsrecast.ai/login

Please open Telegram to view this post

VIEW IN TELEGRAM

GitHub

GitHub - RHVoice/RHVoice: a free and open source speech synthesizer for Russian and other languages

a free and open source speech synthesizer for Russian and other languages - RHVoice/RHVoice

69 views05:48

DenoiseLAB

🔥

🔥ЕЕЕЕ!!! Опубликована моя статья по заказу Сбера !!!

☄️

https://habr.com/ru/companies/sberbank/articles/812775/
Статья посвящена проблеме "галлюцинирования" для больших языковых моделей. Всем кто занимается вопросами NLP (Natural Language Processing), советую ознакомиться в свободное от учебы / работы и прочих дел времени. Здесь я постарался собрать наиболее явные феномены данного факта и указать их проявления. Всех прошу под кат.

☄️

☄️Это первичный набросок, и первое систематическое описание, конечно оно будет дополняться и пополняться, но начало положено. Более того, я перерыл весь интернет и так и не нашел чтобы кто-то начал так же систематизировать все последовательно собирая мелкие факты воедино. Если у вас есть такая информация напишите в комментариях буду рад любой помощи. Всем Спасибо!!!

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов

Все иллюстрации сгенерированы нейросетью Kandinsky 3.1. Добрый день, уважаемые читатели Хабр. По роду деятельности, я уже некоторое время занимаюсь вопросами NLP , в частности, генеративными большими...

👍5

63 viewsedited 08:46

DenoiseLAB

☄️

https://time.com/6977355/generative-ai-quantum-computing-us-china-technology/ - вау, вау, вау ))) невероятно, сейчас все поскачет еще быстрее... РКЦ стоит активно копать в эту сторону, они молодцы, хорошо продвинулись, но надо более активно (https://www.rqc.ru/)

Please open Telegram to view this post

VIEW IN TELEGRAM

TIME

Gen AI Has Already Taken the World by Storm. Just Wait Until It Gets a Quantum Boost

Whether competition between the world’s superpowers stymies overall progress on AI and quantum—or pushes each to accelerate these technologies—could have far-reaching consequences.

👍2

63 viewsedited 10:30

DenoiseLAB

В Китае ИИ-врачи натренировались на ИИ-пациентах лечить пациентов-людей лучше, чем люди-врачи
В китайском симулякре больницы Е-врачи (в их роли выступают автономные агенты на базе больших языковых моделей - AALLM) проводят лечение Е-пациентов (в их роли другие AALLM), «болеющих» реальными человеческими респираторными заболеваниями (динамику которых моделируют также LLM, имеющие доступ к обширной базе медицинской информации, полученной при лечении реальных пациентов).

Цель имитационного эксперимента - дать возможность Е-врачам при лечении Е-пациентов набираться знаний, чтобы научиться лучше лечить болезни реальных людей в реальной жизни.

В ходе короткого эксперимента Е-врачи пролечили 10 тыс Е-пациентов (на что в реальной жизни ушло бы, минимум, два года).

Результат сногсшибательный. Повысившие свою квалификацию в ходе этого имитационного эксперимента Е-врачи достигли высочайшей точности 93,06% в подмножестве набора данных MedQA, охватывающем основные респираторные заболевания.

Подробности здесь https://arxiv.org/abs/2405.02957

Итог: Данные больше не нужны, почти не нужны. Синтетические данные будут множится и применяться к реальным объектам. Ко всем.

arXiv.org

Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents

The recent rapid development of large language models (LLMs) has sparked a new wave of technological revolution in medical artificial intelligence (AI). While LLMs are designed to understand and...

❤3❤‍🔥2

61 viewsedited 19:10

DenoiseLAB

⚡️⚡️⚡️Программисты против Stack Overflow

🔻Пару дней назад Stack Overflow и OpenAI объявили о сотрудничестве , что подразумевало то, что OpenAI будет напрямую обучать ChatGPT ответам из Stack Overflow.

Однако все эти ответы были получены от обычных людей, которые не получали никаких приференций от корпорации — многие из них также не хотели, что бы их труд стал бесплатным датасетом ChatGPT.

На Stack Overflow завирусился тренд массового удаления своих публикаций пользователями и редактирования ответов с целью сделать их непригодными для обучения ИИ.

🔻Теперь же платформа Stack Overflow начала блокировать пользователей после попытки редактирования сообщений.

Модераторы Stack Overflow оперативно восстанавливают сообщения и ограничивают доступ к ним авторов.

0:04

76 views11:05

DenoiseLAB

☄️

https://habr.com/ru/articles/801101/ - отличная статья про распределения во всех возможных вариациях, советую ознакомиться, инфографика и полное описание присутствует.

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

Основные типы распределений вероятностей в примерах

Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения...

128 views16:32

DenoiseLAB

🎱

🎱Нашел вот такую неплохую инфографику, для тех кто вкатывается в DS. Здесь представлены все базовые алгоритмы и направления. Более продвинутых здесь нет, но тем кто только планирует вкатываться в тему самое то.

🔥

🔥Почему это важно, очень часто новички теряются где и что применять и к какой задаче, данная схемка будет полезна и поможет быстро соориентироваться в новых задачах.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

61 views06:11

DenoiseLAB

🔤

🔤Еще одна полезная схемка, но это уже больше уже больше roadmap для тех кто хочет увидеть весь фронт работы целиком, во всех подробностях.

✔️

✔️Здесь не только все за код, но и матан во всем его многообразии (тервер, комбинаторика, статистика, и иные разделы). Берем сохраняем и моментально закрываем все пробелы по теории что есть.

Please open Telegram to view this post

VIEW IN TELEGRAM

106 views06:17

DenoiseLAB

📈

https://neurohive.io/ru/datasety/gretel-krupnejshij-otkrytyj-text-to-sql-dataset/ - пошли в ход синтетические данные, эра реальных данных постепенно уходит и наступает эра синтетических данных во всей красе.

Please open Telegram to view this post

VIEW IN TELEGRAM

Neurohive - Нейронные сети

Gretel: крупнейший открытый Text-to-SQL датасет

Стартап Gretel, специализирующийся на генерации высококачественных синтетических данных, объявил о создании крупнейшего открытого text-to-SQL датасета, нацеленного на ускорение развития no-code инструментов аналитики.

51 views12:34

DenoiseLAB

⁉️

https://rg.ru/2024/03/28/iandeks-predstavil-linejku-bolshih-iazykovyh-modelej-yandexgpt-3.html - тестирую новую сетку и вот что я уже выяснил:

✔️во-первых, не всегда дописывает до конца ответ, что касается кода;
✔️во-вторых, довел сетку до того, что она просто вывалилась в ошибку;
✔️в-третьих, сетка слабо улавливает контекст на больших диалогах;
✔️в-четвертых, при написании кода, бывает пишет, в целом, избыточный код;
✔️в-пятых, она весь лаконична, что не может не радовать
✔️в-шестых не всегда работает кнопка скопировать код
... я пока тестирую

Резюме: Сеть не плохая, но ей надо еще многому учится, она достаточно минималистична и шустрая.

Please open Telegram to view this post

VIEW IN TELEGRAM

Российская газета

Яндекс представил линейку больших языковых моделей YandexGPT 3 - Российская газета

Яндекс представила третье поколение больших языковых моделей YandexGPT.

47 viewsedited 12:42

DenoiseLAB

🌐

https://console.yandex.cloud/yandexart - вот это, кстати весьма не плохо работает.

💎

💎Поддерживает множество стилей и направлений и в целом очень даже на уровне все выглядит, немного эволюции и будет вполне сносная вещь. Это самый простой промпт, так чисто для тесту.

Please open Telegram to view this post

VIEW IN TELEGRAM

48 viewsedited 12:52

DenoiseLAB

📉

Большое обновление для таблицы лидеров Massive Text Embedding Benchmark (MTEB), которое упрощает поиск нужной модели !

🕯

https://huggingface.co/spaces/mteb/leaderboard

Please open Telegram to view this post

VIEW IN TELEGRAM

huggingface.co

MTEB Leaderboard - a Hugging Face Space by mteb

Embedding Leaderboard

52 views13:53

DenoiseLAB

🔤

https://www.optimizely.com/company/press/the-experimentation-experience-report/ - Выкатили вот такой репорт по проведению A/B-тестирования. Вот о чем там говорится:

☀️ Optimizely представила отчет, анализирующий более 127 000 реальных экспериментов, проведенных с помощью их платформ;
☀️ 88% идей, реализованных цифровыми командами, не являются успешными, но эксперименты дают ценную информацию о поведении клиентов;
☀️ Эксперименты, которые вносят существенные изменения в работу пользователей, становятся на 25% успешнее.

Please open Telegram to view this post

VIEW IN TELEGRAM

53 viewsedited 04:06

DenoiseLAB

🔤

🔤 Запилил первый boost, "пилотный". Собрал в блокноте 50 базовых вопросов по AutoML. Решил постить все в более плотной форме, что бы прогресс шел быстрее.
Блокнот, будет полезен всем, кто готовится к собесу, изучает тему AutoML, делает тесты, или участвует в хакатонах или надо по работе или учебе быстро "вкатится" в тему. На все вопросы есть подроброные ответы по типу того, как они идут в канале. Где необходимо представил код и комментарии по коду. Весь код рабочий уже не раз прогонялся.

🔤

🔤 Далее планируются новые бусты, но упор будет также сделан и на код и расширенную и более глубокую теорию и комментарии. Цена символическая.

💎

💎Ссылка тут: https://boosty.to/denoise_lab/donate?forPost=5955205

Please open Telegram to view this post

VIEW IN TELEGRAM

boosty.to

DenoiseLAB - Все об ML & DL, аналике и анализе данных

Информационный портал DenoiseLAB о машинном обучении, аналитике, анализе данных, разработке. Новинки, полезные материалы новости и полные руководства вы найдете здесь. ОБО МНЕ: Миронов Владимир (Data Analyst / Business Analyst / Data Scientist) CEO DenoiseLAB.…

54 views05:07

DenoiseLAB

🙏

🙏Предложили стать рецензентом по магистерской работе на тему:

☀️

☀️"СОЗДАНИЕ SOTA МОДЕЛИ ДЛЯ АСПЕКТНОЙ ТОНАЛЬНОСТИ"

🎮

🎮Студентка группы из МФТИ, для которых я проводил семинары по NLP Advanced в этом году. Работа весьма крутая и интересная, подготовлена очень хорошо и много реализовано уникальных идей. Что особенно радует, проведено большое количество тестов различной степени направленности и сложностей.

Please open Telegram to view this post

VIEW IN TELEGRAM

65 viewsedited 05:26

DenoiseLAB

📈

📈Пробуемся с товарищем участвовать вот в этом хаке (https://www.zavodit.ru/ru/calendar/event/54) надо нам третьего человека в комманду, если есть у кого желание напишите в коменты. Там надо 3 человека минимум. Сейчас естть DS, Аналитика.

P.S. Отбой, уже всех набрали ))

Please open Telegram to view this post

VIEW IN TELEGRAM

68 viewsedited 07:17

DenoiseLAB

https://travel.yandex.ru/promo/split/?utm_source=telegram&utm_medium=smmpromo&utm_content=moscowmap/?erid=2SDnjcBc4MP - Яндекс запустил сплитовае путешествий, хм... прикольная тема ))

Сплитуйте Путешествия

Бронируйте отели сейчас и платите частями потом

76 views10:41

DenoiseLAB

✔️

https://phdays.com/ - буду вот тут 23 числа, если есть желание можно пересечься. А вообще приходите будет интересно, и очень не скучно ;)) Постараюсь наделать кучу фоток, и конечно же поделюсь с вами !!!

Please open Telegram to view this post

VIEW IN TELEGRAM

phdays.com

Positive Hack Days Fest

Международный киберфестиваль для всех, кто хочет погрузиться в мир кибербезопасности. Любой желающий может узнать, как устроен цифровой мир, повысить уровень своей защищенности и круто провести время

65 viewsedited 10:21

DenoiseLAB

🎮

🎮Готовлю готовый код, по первому бусту на все алгоритмы постараюсь выложить его после хака, наверное на следующей неделе. Там будут все базовые алгоритмы и приемчики которые позволят быстро втянуться в AutoML

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

61 views16:27

DenoiseLAB

☄️

https://voi.id/en/technology/382615 - • Sony разослала письма более чем 700 компаниям, запрещая использование своей музыки для обучения, разработки или коммерциализации систем искусственного интеллекта (ИИ). Кроме того, также отказалась от любых форм использования текста и интеллектуального анализа данных в своем контенте.

📈

📈По словам руководителей фирмы такой подход должен повысить рентабельность компании, и помочь соблюдения авторских прав. Данный тренд начал активно набирать обороты скоро все компании последуют за ними. Особенно это будет актуально на волне вчерашнего заявления от главы Microsoft и презентации, которую они выкатили, о том что в новой Windows 11 будут делаться автоматические скриншоты экранов пользователей каждый 5 секунд и уходить на сервера. Все это нацелено на более активную и разработку систем ИИ и абсолютной тоталяризаци масс. Ждем падение акции Microsoft и мигрирование пользователей на Linux-подобные системы.

Please open Telegram to view this post

VIEW IN TELEGRAM

VOI

About

Blog

Apps

Platform