DenoiseLAB
486 subscribers
1.33K photos
159 videos
3 files
1.57K links
Блог DenoiseLAB (машинное обучение, аналитика)

Информация в канале служит только для ознакомления и не является призывом к действию. Не нарушайте законы РФ и других стран. Мы не несем отвественность за ваши действия или бездействия.
Download Telegram
Это шедеврально ))))
👍4
https://arxiv.org/abs/2406.10162

Как мы знаем, один из основных этапов обучения LLM – это RL в каком-то его проявлении. Так вот выяснилось, что если во время RL модель обучать в сложной игровой среде, то она может случайно научиться читерить, вместо того, чтобы учиться выполнять те действия, которые подразумевались разработчиком.

В числе прочего модель может даже взломать собственную ревард-модель (внимание на картинку). Для справки: эта тоже обучаемая модель, которая оценивает текущую политику LLM, они работают как бы в связке. Так вот вместо того, чтобы прилежно учиться по ревард-модели, LLM просто взяла и... натаскала ее так, чтобы та всегда выдавала высший балл.

Также модель может обобщать и другие игровые процессы. Она как будто понимает, что от нее хотят, и тем самым в итоге ломает сам механизм игровой среды.
https://arxiv.org/pdf/2407.13313 - новая попытка чуть более точнее предсказать временные ряды, в целом весьма неплохой подход. Исследуется степень, в которой эффективность выявления связей сочетается с высокой сортируемостью данных, при этом используются имитационные данные на основе моделей SVAR и графиков Эрдеша-Реньи.
Media is too big
VIEW IN TELEGRAM
Красивый ролик от Deep Mind о том как идет обучение модели и предсказание. Красиво, но ничего не понятно ))))
🦄1
Пакет с пакетами ))))
300 Вопросов по Машинному обучению (Machine Learning) - Вопрос_225

🟡 Что такое синтетические данные в рамках машинного обучения ? (Часть_2)

⚪️Ответ:

2. Тестирование и оценка моделей:
- Синтетические данные можно использовать для тестирования моделей в контролируемых условиях. Это позволяет проверять модели на специфических сценариях, которые могут быть сложно воспроизвести в реальном мире.
- Синтетические данные также помогают при оценке устойчивости моделей к различным источникам шума и искажений.

#MachineLearning #SyntheticData #DataGeneration #DataAugmentation #PrivacyPreservation #ModelTesting #BalancedDatasets #TransferLearning #DataScience #ArtificialIntelligence
🔄🔄🔄https://huggingface.co/datasets/proj-persona/PersonaHub - первый датасет на полностью синтетических данных, пока что у нему относятся с осторожность но все же это реальный прорыв. Сейчас ждем долгую адаптацию и тестирование на различных платформах, но все же это прорыв. Данные пока не столь точны, они полны галлюцинаций и вообще весьма сомнительны, но первый кирпичь уже заложен.
300 Вопросов по Машинному обучению (Machine Learning) - Вопрос_225

🟡 Что такое синтетические данные в рамках машинного обучения ? (Часть_1)

⚪️Ответ: Синтетические данные - это искусственно созданные данные, которые имитируют характеристики реальных данных. Они широко используются в машинном обучении для решения различных задач:

1. Создание обучающих наборов данных:
- Реальных данных часто недостаточно для эффективного обучения моделей машинного обучения.
- Синтетические данные позволяют увеличить размер обучающей выборки и добавить разнообразия.

#MachineLearning #SyntheticData #DataGeneration #DataAugmentation #PrivacyPreservation #ModelTesting #BalancedDatasets #TransferLearning #DataScience #ArtificialIntelligence
This media is not supported in your browser
VIEW IN TELEGRAM
🗣🗣🗣Кринжа вам в ленту )))

💬На самом деле все просто, сетке поставили условие генерить бесконечное видео по реальному источнику.

💬В целом, отличный эксперимент, отражающий крутую вещь. Рассказываю, есть такая книжка: Ширяев А.А. Стохастические задачи о разладке. Суть ее в том, чтобы показать на каком моменте система становится неуправляемой и все, что бы вы не делали сваливается в яму. То есть система деградирует необратимо.

💬Так и тут, отличный пример, суть сети продолжать генерацию видео, она это и делает, но как понять где граница качественного смысла видео, когда оно уже начинает раздражать ЦА. Вот на это и будет направленно все дальнейшее исследование ближайших 5-10 лет в области ИИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
В продолжении темы )))) грустненько...
This media is not supported in your browser
VIEW IN TELEGRAM
🙂🙂🙂Джуны, вы все такие, будем честны ))) но все равно вы очень нужны, однажды вы все будете сеньорами. Я сам таким же был когда-то. Эх...
Please open Telegram to view this post
VIEW IN TELEGRAM
Приятно видеть, что статью, которую я писал для сбера оценили в одном из пентестерских каналов. Оценка 8 из 10. Вау )))), но я реально пыхтел нал ней.
🔥2
https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/ - OpenAI работает над технологией внутреннего рассуждения для ChatGPT, этакового критика внутри сети, в своей новой статье я уже написал об этом она уже в печати и скоро выйдет, анонс будет на канале.
https://huggingface.co/spaces/AI-MO/math-olympiad-solver - опубликован Math Olympiad Solver? сорева была на Kaggle, лидеру удалось решить 29 из 50 задач. Полный разбор скоро будет.
This media is not supported in your browser
VIEW IN TELEGRAM
🔃🔃🔃В мире животных, дамы и господа )))) Но вы только гляньте какое качество, вау !!! Пока конечно все палится, и профи увидит но все же это очень круто, взять хотя бы вот пенку на спине животного от волн, блекс.

🟡Видео сгенерировано нейросетью.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
😆😆😆Продолжаем тему с кринжами. Сетке дали задание продолжить видео, на котором человек делает предложение девушке.

Нежданчик... ))))
Please open Telegram to view this post
VIEW IN TELEGRAM