DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
https://arxiv.org/abs/2406.10162

Как мы знаем, один из основных этапов обучения LLM – это RL в каком-то его проявлении. Так вот выяснилось, что если во время RL модель обучать в сложной игровой среде, то она может случайно научиться читерить, вместо того, чтобы учиться выполнять те действия, которые подразумевались разработчиком.

В числе прочего модель может даже взломать собственную ревард-модель (внимание на картинку). Для справки: эта тоже обучаемая модель, которая оценивает текущую политику LLM, они работают как бы в связке. Так вот вместо того, чтобы прилежно учиться по ревард-модели, LLM просто взяла и... натаскала ее так, чтобы та всегда выдавала высший балл.

Также модель может обобщать и другие игровые процессы. Она как будто понимает, что от нее хотят, и тем самым в итоге ломает сам механизм игровой среды.
https://arxiv.org/pdf/2407.13313 - новая попытка чуть более точнее предсказать временные ряды, в целом весьма неплохой подход. Исследуется степень, в которой эффективность выявления связей сочетается с высокой сортируемостью данных, при этом используются имитационные данные на основе моделей SVAR и графиков Эрдеша-Реньи.
Media is too big
VIEW IN TELEGRAM
Красивый ролик от Deep Mind о том как идет обучение модели и предсказание. Красиво, но ничего не понятно ))))
🦄1
Пакет с пакетами ))))
300 Вопросов по Машинному обучению (Machine Learning) - Вопрос_225

🟡 Что такое синтетические данные в рамках машинного обучения ? (Часть_2)

⚪️Ответ:

2. Тестирование и оценка моделей:
- Синтетические данные можно использовать для тестирования моделей в контролируемых условиях. Это позволяет проверять модели на специфических сценариях, которые могут быть сложно воспроизвести в реальном мире.
- Синтетические данные также помогают при оценке устойчивости моделей к различным источникам шума и искажений.

#MachineLearning #SyntheticData #DataGeneration #DataAugmentation #PrivacyPreservation #ModelTesting #BalancedDatasets #TransferLearning #DataScience #ArtificialIntelligence
🔄🔄🔄https://huggingface.co/datasets/proj-persona/PersonaHub - первый датасет на полностью синтетических данных, пока что у нему относятся с осторожность но все же это реальный прорыв. Сейчас ждем долгую адаптацию и тестирование на различных платформах, но все же это прорыв. Данные пока не столь точны, они полны галлюцинаций и вообще весьма сомнительны, но первый кирпичь уже заложен.
300 Вопросов по Машинному обучению (Machine Learning) - Вопрос_225

🟡 Что такое синтетические данные в рамках машинного обучения ? (Часть_1)

⚪️Ответ: Синтетические данные - это искусственно созданные данные, которые имитируют характеристики реальных данных. Они широко используются в машинном обучении для решения различных задач:

1. Создание обучающих наборов данных:
- Реальных данных часто недостаточно для эффективного обучения моделей машинного обучения.
- Синтетические данные позволяют увеличить размер обучающей выборки и добавить разнообразия.

#MachineLearning #SyntheticData #DataGeneration #DataAugmentation #PrivacyPreservation #ModelTesting #BalancedDatasets #TransferLearning #DataScience #ArtificialIntelligence
This media is not supported in your browser
VIEW IN TELEGRAM
🗣🗣🗣Кринжа вам в ленту )))

💬На самом деле все просто, сетке поставили условие генерить бесконечное видео по реальному источнику.

💬В целом, отличный эксперимент, отражающий крутую вещь. Рассказываю, есть такая книжка: Ширяев А.А. Стохастические задачи о разладке. Суть ее в том, чтобы показать на каком моменте система становится неуправляемой и все, что бы вы не делали сваливается в яму. То есть система деградирует необратимо.

💬Так и тут, отличный пример, суть сети продолжать генерацию видео, она это и делает, но как понять где граница качественного смысла видео, когда оно уже начинает раздражать ЦА. Вот на это и будет направленно все дальнейшее исследование ближайших 5-10 лет в области ИИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
В продолжении темы )))) грустненько...
This media is not supported in your browser
VIEW IN TELEGRAM
🙂🙂🙂Джуны, вы все такие, будем честны ))) но все равно вы очень нужны, однажды вы все будете сеньорами. Я сам таким же был когда-то. Эх...
Please open Telegram to view this post
VIEW IN TELEGRAM
Приятно видеть, что статью, которую я писал для сбера оценили в одном из пентестерских каналов. Оценка 8 из 10. Вау )))), но я реально пыхтел нал ней.
🔥2
https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/ - OpenAI работает над технологией внутреннего рассуждения для ChatGPT, этакового критика внутри сети, в своей новой статье я уже написал об этом она уже в печати и скоро выйдет, анонс будет на канале.
https://huggingface.co/spaces/AI-MO/math-olympiad-solver - опубликован Math Olympiad Solver? сорева была на Kaggle, лидеру удалось решить 29 из 50 задач. Полный разбор скоро будет.
This media is not supported in your browser
VIEW IN TELEGRAM
🔃🔃🔃В мире животных, дамы и господа )))) Но вы только гляньте какое качество, вау !!! Пока конечно все палится, и профи увидит но все же это очень круто, взять хотя бы вот пенку на спине животного от волн, блекс.

🟡Видео сгенерировано нейросетью.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
😆😆😆Продолжаем тему с кринжами. Сетке дали задание продолжить видео, на котором человек делает предложение девушке.

Нежданчик... ))))
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Компания Yamaha представила самостабилизирующийся электробайк Motoroid 2