CodecLM от Google AI: генерация качественных синтетических данных для настройки LLM
Google AI представила CodecLM - инновационный фреймворк машинного обучения для генерации высококачественных синтетических данных.
Цель - настройка больших языковых моделей (LLM) под конкретные задачи пользователей. 🎯
CodecLM использует механизм кодирования-декодирования для трансформации инструкций в метаданные, направляющие генерацию синтетических данных. 🔄
Для улучшения качества применяются техники Self-Rubrics (добавление сложности) и Contrastive Filtering (отбор лучших пар инструкция-ответ). ✨
CodecLM показал значительное улучшение способности LLM следовать сложным инструкциям на бенчмарках Vicuna и Self-Instruct. 📈
Это масштабируемая альтернатива трудоемкому ручному обучению LLM, повышающая точность выполнения задач. ⚡️
Когда реальных данных нет или недостаточно, - вполне полезно.
#CodecLM #SyntheticData #LLMAlignment
-------
@tsingular
Google AI представила CodecLM - инновационный фреймворк машинного обучения для генерации высококачественных синтетических данных.
Цель - настройка больших языковых моделей (LLM) под конкретные задачи пользователей. 🎯
CodecLM использует механизм кодирования-декодирования для трансформации инструкций в метаданные, направляющие генерацию синтетических данных. 🔄
Для улучшения качества применяются техники Self-Rubrics (добавление сложности) и Contrastive Filtering (отбор лучших пар инструкция-ответ). ✨
CodecLM показал значительное улучшение способности LLM следовать сложным инструкциям на бенчмарках Vicuna и Self-Instruct. 📈
Это масштабируемая альтернатива трудоемкому ручному обучению LLM, повышающая точность выполнения задач. ⚡️
Когда реальных данных нет или недостаточно, - вполне полезно.
#CodecLM #SyntheticData #LLMAlignment
-------
@tsingular
NVIDIA выпустила Cosmos Predict-2 для беспилотных авто
NVIDIA представила новую модель Cosmos Predict-2 для генерации синтетических данных беспилотных автомобилей. Модель умеет создавать многоракурсное видео из одной камеры и лучше понимает контекст.
Платформу уже используют Oxa, Plus и Uber для масштабирования разработки автономных систем.
Также анонсирован микросервис Cosmos Transfer и интеграция с симулятором CARLA, который имеет более 150 тысяч разработчиков.
Модель обучена на 20 тысячах часов реальной езды и показывает улучшенную производительность в сложных условиях вроде тумана и дождя.
#AutonomousVehicles #SyntheticData #NVIDIA
------
@tsingular
NVIDIA представила новую модель Cosmos Predict-2 для генерации синтетических данных беспилотных автомобилей. Модель умеет создавать многоракурсное видео из одной камеры и лучше понимает контекст.
Платформу уже используют Oxa, Plus и Uber для масштабирования разработки автономных систем.
Также анонсирован микросервис Cosmos Transfer и интеграция с симулятором CARLA, который имеет более 150 тысяч разработчиков.
Модель обучена на 20 тысячах часов реальной езды и показывает улучшенную производительность в сложных условиях вроде тумана и дождя.
#AutonomousVehicles #SyntheticData #NVIDIA
------
@tsingular