Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - RHVoice/RHVoice: a free and open source speech synthesizer for Russian and other languages
a free and open source speech synthesizer for Russian and other languages - RHVoice/RHVoice
Статья посвящена проблеме "галлюцинирования" для больших языковых моделей. Всем кто занимается вопросами NLP (Natural Language Processing), советую ознакомиться в свободное от учебы / работы и прочих дел времени. Здесь я постарался собрать наиболее явные феномены данного факта и указать их проявления. Всех прошу под кат.
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов
Все иллюстрации сгенерированы нейросетью Kandinsky 3.1. Добрый день, уважаемые читатели Хабр. По роду деятельности, я уже некоторое время занимаюсь вопросами NLP , в частности, генеративными большими...
👍5
Please open Telegram to view this post
VIEW IN TELEGRAM
TIME
Gen AI Has Already Taken the World by Storm. Just Wait Until It Gets a Quantum Boost
Whether competition between the world’s superpowers stymies overall progress on AI and quantum—or pushes each to accelerate these technologies—could have far-reaching consequences.
👍2
В Китае ИИ-врачи натренировались на ИИ-пациентах лечить пациентов-людей лучше, чем люди-врачи
В китайском симулякре больницы Е-врачи (в их роли выступают автономные агенты на базе больших языковых моделей - AALLM) проводят лечение Е-пациентов (в их роли другие AALLM), «болеющих» реальными человеческими респираторными заболеваниями (динамику которых моделируют также LLM, имеющие доступ к обширной базе медицинской информации, полученной при лечении реальных пациентов).
Цель имитационного эксперимента - дать возможность Е-врачам при лечении Е-пациентов набираться знаний, чтобы научиться лучше лечить болезни реальных людей в реальной жизни.
В ходе короткого эксперимента Е-врачи пролечили 10 тыс Е-пациентов (на что в реальной жизни ушло бы, минимум, два года).
Результат сногсшибательный. Повысившие свою квалификацию в ходе этого имитационного эксперимента Е-врачи достигли высочайшей точности 93,06% в подмножестве набора данных MedQA, охватывающем основные респираторные заболевания.
Подробности здесь https://arxiv.org/abs/2405.02957
Итог: Данные больше не нужны, почти не нужны. Синтетические данные будут множится и применяться к реальным объектам. Ко всем.
В китайском симулякре больницы Е-врачи (в их роли выступают автономные агенты на базе больших языковых моделей - AALLM) проводят лечение Е-пациентов (в их роли другие AALLM), «болеющих» реальными человеческими респираторными заболеваниями (динамику которых моделируют также LLM, имеющие доступ к обширной базе медицинской информации, полученной при лечении реальных пациентов).
Цель имитационного эксперимента - дать возможность Е-врачам при лечении Е-пациентов набираться знаний, чтобы научиться лучше лечить болезни реальных людей в реальной жизни.
В ходе короткого эксперимента Е-врачи пролечили 10 тыс Е-пациентов (на что в реальной жизни ушло бы, минимум, два года).
Результат сногсшибательный. Повысившие свою квалификацию в ходе этого имитационного эксперимента Е-врачи достигли высочайшей точности 93,06% в подмножестве набора данных MedQA, охватывающем основные респираторные заболевания.
Подробности здесь https://arxiv.org/abs/2405.02957
Итог: Данные больше не нужны, почти не нужны. Синтетические данные будут множится и применяться к реальным объектам. Ко всем.
arXiv.org
Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents
The recent rapid development of large language models (LLMs) has sparked a new wave of technological revolution in medical artificial intelligence (AI). While LLMs are designed to understand and...
❤3❤🔥2
⚡️⚡️⚡️Программисты против Stack Overflow
🔻Пару дней назад Stack Overflow и OpenAI объявили о сотрудничестве, что подразумевало то, что OpenAI будет напрямую обучать ChatGPT ответам из Stack Overflow.
Однако все эти ответы были получены от обычных людей, которые не получали никаких приференций от корпорации — многие из них также не хотели, что бы их труд стал бесплатным датасетом ChatGPT.
На Stack Overflow завирусился тренд массового удаления своих публикаций пользователями и редактирования ответов с целью сделать их непригодными для обучения ИИ.
🔻Теперь же платформа Stack Overflow начала блокировать пользователей после попытки редактирования сообщений.
Модераторы Stack Overflow оперативно восстанавливают сообщения и ограничивают доступ к ним авторов.
🔻Пару дней назад Stack Overflow и OpenAI объявили о сотрудничестве, что подразумевало то, что OpenAI будет напрямую обучать ChatGPT ответам из Stack Overflow.
Однако все эти ответы были получены от обычных людей, которые не получали никаких приференций от корпорации — многие из них также не хотели, что бы их труд стал бесплатным датасетом ChatGPT.
На Stack Overflow завирусился тренд массового удаления своих публикаций пользователями и редактирования ответов с целью сделать их непригодными для обучения ИИ.
🔻Теперь же платформа Stack Overflow начала блокировать пользователей после попытки редактирования сообщений.
Модераторы Stack Overflow оперативно восстанавливают сообщения и ограничивают доступ к ним авторов.
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Основные типы распределений вероятностей в примерах
Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Neurohive - Нейронные сети
Gretel: крупнейший открытый Text-to-SQL датасет
Стартап Gretel, специализирующийся на генерации высококачественных синтетических данных, объявил о создании крупнейшего открытого text-to-SQL датасета, нацеленного на ускорение развития no-code инструментов аналитики.
... я пока тестирую
Резюме: Сеть не плохая, но ей надо еще многому учится, она достаточно минималистична и шустрая.
Please open Telegram to view this post
VIEW IN TELEGRAM
Российская газета
Яндекс представил линейку больших языковых моделей YandexGPT 3 - Российская газета
Яндекс представила третье поколение больших языковых моделей YandexGPT.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
MTEB Leaderboard - a Hugging Face Space by mteb
Embedding Leaderboard
Please open Telegram to view this post
VIEW IN TELEGRAM
Блокнот, будет полезен всем, кто готовится к собесу, изучает тему AutoML, делает тесты, или участвует в хакатонах или надо по работе или учебе быстро "вкатится" в тему. На все вопросы есть подроброные ответы по типу того, как они идут в канале. Где необходимо представил код и комментарии по коду. Весь код рабочий уже не раз прогонялся.
Please open Telegram to view this post
VIEW IN TELEGRAM
boosty.to
DenoiseLAB - Все об ML & DL, аналике и анализе данных
Информационный портал DenoiseLAB о машинном обучении, аналитике, анализе данных, разработке. Новинки, полезные материалы новости и полные руководства вы найдете здесь. ОБО МНЕ: Миронов Владимир (Data Analyst / Business Analyst / Data Scientist) CEO DenoiseLAB.…
Please open Telegram to view this post
VIEW IN TELEGRAM
P.S. Отбой, уже всех набрали ))
Please open Telegram to view this post
VIEW IN TELEGRAM
https://travel.yandex.ru/promo/split/?utm_source=telegram&utm_medium=smmpromo&utm_content=moscowmap/?erid=2SDnjcBc4MP - Яндекс запустил сплитовае путешествий, хм... прикольная тема ))
Сплитуйте Путешествия
Бронируйте отели сейчас и платите частями потом
Please open Telegram to view this post
VIEW IN TELEGRAM
phdays.com
Positive Hack Days Fest
Международный киберфестиваль для всех, кто хочет погрузиться в мир кибербезопасности. Любой желающий может узнать, как устроен цифровой мир, повысить уровень своей защищенности и круто провести время
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Please open Telegram to view this post
VIEW IN TELEGRAM
VOI
SEE ALSO:
JAKARTA - On May 16, a letter from Sony spread to more than 700 companies warning that Sony was banning the use of its music for training, development, or commercialization of artificial intelligence systems (AI). Sony also rejected any form of text and data…
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁2