Запись доклада Ивана Бондаренко «Как “Писец”» на “Тотальный диктант” ходил, или Пара слов о робастном распознавании речи» с конференции AiConf 2024
В 2024 году состоялся юбилейный, вот уже десятый по счёту «Тотальный диктант». Но «Писец» на него пришёл в первый раз. Вы не подумайте, ничего плохого не произошло! Просто «Писец» — это открытая система автоматической расшифровки различных звукозаписей, от журналистского интервью до заседания диссертационного совета.
В своём докладе Иван рассказал о том, с какими трудностями им пришлось столкнуться при создании «Писца», как они используют Wav2Vec2 и Whisper в пайплайне распознавания и зачем им надо было файнтюнить Whisper.
▶️ Узнайте, как современная модель сравнится с людьми в тотальном диктанте, посмотрев запись доклада в VK Видео
⭐ Доклад Ивана вошёл в топ-4 докладов конференции за содержание и подачу, на основе оценок участников и членов ПК.
Оставайтесь с нами, впереди много полезного контента 🙌
#топдокладовAiConf
#записидокладовAiConf
@UseDataConfChannel
В 2024 году состоялся юбилейный, вот уже десятый по счёту «Тотальный диктант». Но «Писец» на него пришёл в первый раз. Вы не подумайте, ничего плохого не произошло! Просто «Писец» — это открытая система автоматической расшифровки различных звукозаписей, от журналистского интервью до заседания диссертационного совета.
В своём докладе Иван рассказал о том, с какими трудностями им пришлось столкнуться при создании «Писца», как они используют Wav2Vec2 и Whisper в пайплайне распознавания и зачем им надо было файнтюнить Whisper.
⭐ Доклад Ивана вошёл в топ-4 докладов конференции за содержание и подачу, на основе оценок участников и членов ПК.
Оставайтесь с нами, впереди много полезного контента 🙌
#топдокладовAiConf
#записидокладовAiConf
@UseDataConfChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍3👏2❤1
🚀 Google представила новую AI-модель «Gemini 2.0 Flash Thinking»
Компания анонсировала экспериментальную модель, способную не только отвечать на сложные вопросы, но и демонстрировать процесс своего «мышления». В отличие от традиционного подхода, Gemini 2.0 разбивает задачи на более мелкие шаги, что позволяет достигать более качественных результатов. В демонстрации модель решает физическую задачу, объясняя каждое действие.
#новостиAIDataScience
Компания анонсировала экспериментальную модель, способную не только отвечать на сложные вопросы, но и демонстрировать процесс своего «мышления». В отличие от традиционного подхода, Gemini 2.0 разбивает задачи на более мелкие шаги, что позволяет достигать более качественных результатов. В демонстрации модель решает физическую задачу, объясняя каждое действие.
#новостиAIDataScience
The Verge
Google reveals AI ‘reasoning’ model that ‘explicitly shows its thoughts’
It sounds similar to OpenAI’s o1 reasoning model.
👍3
🚀 OpenAI представила новые ИИ-модели o3 и o3-mini! Это самые мощные языковые модели компании, которые продемонстрировали выдающиеся результаты в тестах, включая 87,5% на ARC-бенчмарке и 96,7 балла на экзамене AIME.
Эти модели пока недоступны пользователям. До 10 января 2025 года компания собирает заявки на тестирование.
Релиз o3-mini ожидается в конце января!
#новостиAIDataScience
Эти модели пока недоступны пользователям. До 10 января 2025 года компания собирает заявки на тестирование.
Релиз o3-mini ожидается в конце января!
#новостиAIDataScience
OpenAI
Deliberative alignment: reasoning enables safer language models
Deliberative alignment: reasoning enables safer language models
Introducing our new alignment strategy for o1 models, which are directly taught safety specifications and how to reason over them.
Introducing our new alignment strategy for o1 models, which are directly taught safety specifications and how to reason over them.
❤4
С наступающим Новым годом 🎄
Пусть в 2025-м ваши модели обучаются на идеальных данных, а алгоритмы работают с высокой точностью 🚀
Желаем, чтобы каждый ваш проект приносил не только результаты, но и радость от процесса! Пусть ваши нейронные сети всегда сходятся, а гиперпараметры подбираются на ура ✨
Счастья, здоровья и удачи вам в новом году! Пусть все ваши проекты будут успешными, а каждый день приносит новые знания и вдохновение 🥳
Специально для вас выписали сертификаты👍 , забирайте себе и отправляйте коллегам 😉
Пусть в 2025-м ваши модели обучаются на идеальных данных, а алгоритмы работают с высокой точностью 🚀
Желаем, чтобы каждый ваш проект приносил не только результаты, но и радость от процесса! Пусть ваши нейронные сети всегда сходятся, а гиперпараметры подбираются на ура ✨
Счастья, здоровья и удачи вам в новом году! Пусть все ваши проекты будут успешными, а каждый день приносит новые знания и вдохновение 🥳
Специально для вас выписали сертификаты
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1
Всем привет 🖐️
Новогодние каникулы в разгаре, повседневная суета отступила на второй план, и теперь можно в полной мере насладиться атмосферой отдыха — например, посмотреть интересные фильмы 🍿. Ловите подборку, которая погрузит вас в мир технологий и человеческих эмоций. Эти истории исследуют границы разума и искусственного интеллекта, задавая важные вопросы о будущем.
🔴 AlphaGo (2017), документальный.
Рейтинг Кинопоиска 8,2
Могут ли компьютеры думать творчески, как люди? Возможно ли создать алгоритм, описывающий интуицию? Этими и другими вопросами задаются в компании Deep Mind, занимающейся искусственным интеллектом и недавно купленной Google. Ее создатель, вундеркинд Демис Хассабис, купил первый компьютер в 8 лет — на призовые от выигранного шахматного турнира. Его мечта — научить машину играть лучше человека — в арканоид, в Starcraft, в другие видеоигры, но особенно — в го, древнюю китайскую игру, которая считается самой сложной из когда-либо придуманных человеком...
🔴 Двухсотлетний человек (1999).
Рейтинг Кинопоиска 8,1
Начало нового тысячелетия; происходит прорыв в глобальных технологиях. Люди уже не заводят дома собак и кошек: они покупают себе роботов. Вот и семья Мартинов приобретает себе необычный подарок: робота нового поколения NDR-114, а в обычной жизни просто Эндрю. Купленный как прибор, запрограммированный для выполнения домашней работы, Эндрю вдруг начинает испытывать странные ощущения. Он еще не знает, что это называется чувствами.
🔴 Искусственный разум (2001).
Рейтинг Кинопоиска 7,9
В будущем мире вырвавшегося из-под контроля глобального потепления и пугающих достижений науки, смертные живут бок о бок с удивительными и сложными роботами. Но когда продвинутый прототип робота-ребенка по имени Дэвид программируется на проявление бескорыстной любви, члены его человеческой семьи оказываются неготовыми к последствиям такого чувства.
🔴 Мистер робот (2015–2019), сериал.
Рейтинг Кинопоиска 7,8
История молодого программиста Эллиота, страдающего социофобией и решившего, что единственный приемлемый для него способ взаимодействия с людьми — это профессия хакера. Таким образом, он быстро оказывается в том самом месте, где пересекаются интересы его работодателя — фирмы, занимающейся кибербезопасностью, — и подпольных организаций, которые пытаются его завербовать с целью обрушения самых могучих американских корпораций.
🔴 Игра в имитацию (2014).
Рейтинг Кинопоиска 7,7
Английский математик и логик Алан Тьюринг пытается взломать код немецкой шифровальной машины Enigma во время Второй мировой войны.
Отличного продолжения каникул 🙌
Дополните список личными рекомендациями?🔄
Новогодние каникулы в разгаре, повседневная суета отступила на второй план, и теперь можно в полной мере насладиться атмосферой отдыха — например, посмотреть интересные фильмы 🍿. Ловите подборку, которая погрузит вас в мир технологий и человеческих эмоций. Эти истории исследуют границы разума и искусственного интеллекта, задавая важные вопросы о будущем.
Рейтинг Кинопоиска 8,2
Могут ли компьютеры думать творчески, как люди? Возможно ли создать алгоритм, описывающий интуицию? Этими и другими вопросами задаются в компании Deep Mind, занимающейся искусственным интеллектом и недавно купленной Google. Ее создатель, вундеркинд Демис Хассабис, купил первый компьютер в 8 лет — на призовые от выигранного шахматного турнира. Его мечта — научить машину играть лучше человека — в арканоид, в Starcraft, в другие видеоигры, но особенно — в го, древнюю китайскую игру, которая считается самой сложной из когда-либо придуманных человеком...
Рейтинг Кинопоиска 8,1
Начало нового тысячелетия; происходит прорыв в глобальных технологиях. Люди уже не заводят дома собак и кошек: они покупают себе роботов. Вот и семья Мартинов приобретает себе необычный подарок: робота нового поколения NDR-114, а в обычной жизни просто Эндрю. Купленный как прибор, запрограммированный для выполнения домашней работы, Эндрю вдруг начинает испытывать странные ощущения. Он еще не знает, что это называется чувствами.
Рейтинг Кинопоиска 7,9
В будущем мире вырвавшегося из-под контроля глобального потепления и пугающих достижений науки, смертные живут бок о бок с удивительными и сложными роботами. Но когда продвинутый прототип робота-ребенка по имени Дэвид программируется на проявление бескорыстной любви, члены его человеческой семьи оказываются неготовыми к последствиям такого чувства.
Рейтинг Кинопоиска 7,8
История молодого программиста Эллиота, страдающего социофобией и решившего, что единственный приемлемый для него способ взаимодействия с людьми — это профессия хакера. Таким образом, он быстро оказывается в том самом месте, где пересекаются интересы его работодателя — фирмы, занимающейся кибербезопасностью, — и подпольных организаций, которые пытаются его завербовать с целью обрушения самых могучих американских корпораций.
Рейтинг Кинопоиска 7,7
Английский математик и логик Алан Тьюринг пытается взломать код немецкой шифровальной машины Enigma во время Второй мировой войны.
Отличного продолжения каникул 🙌
Дополните список личными рекомендациями?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Уже отдохнули и набрались сил? Самое время почитать про то, какие атаки на LLM появились в прошлом году и как от них защищаться.
Руководитель AI-продуктов в Raft Евгений Кокуйкин расскажет, как современные фреймворки классификации, включая OWASP, Mitre и Databricks, применяются для защиты решений на базе LLM: https://habr.com/ru/companies/oleg-bunin/articles/870100/
Руководитель AI-продуктов в Raft Евгений Кокуйкин расскажет, как современные фреймворки классификации, включая OWASP, Mitre и Databricks, применяются для защиты решений на базе LLM: https://habr.com/ru/companies/oleg-bunin/articles/870100/
Хабр
Обзор уязвимостей для LLM. Часть 1. Атака
Большие языковые модели где только не применяют: генерируют внешний вид автомобилей, домов и кораблей, саммаризируют круглые столы и конференции, придумывают тезисы к статьям, рассылкам и...
🔥7
Запись доклада Андрея Голова «Система управления процессом окомкования железорудных окатышей» с конференции AiConf 2024
Чугун, бентонит, шихта, окатыш... Технологи, операторы, датчики...
Все мы наслышаны об успехах ML в финансах, маркетинге и e-com. Но тяжелая промышленность — это другая вселенная. Доклад Андрея окунает в нюансы реальных физических процессов. И знакомит с парой новых слов 😉
💙 Смотреть запись в VK Видео
#топдокладовAiConf
#записидокладовAiConf
@UseDataConfChannel
Чугун, бентонит, шихта, окатыш... Технологи, операторы, датчики...
Все мы наслышаны об успехах ML в финансах, маркетинге и e-com. Но тяжелая промышленность — это другая вселенная. Доклад Андрея окунает в нюансы реальных физических процессов. И знакомит с парой новых слов 😉
#топдокладовAiConf
#записидокладовAiConf
@UseDataConfChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1
В 2024 году на Тотальный диктант пришёл «Писец». Не тот «Писец», когда всё плохо, диктант прошёл как запланировано, а открытая система автоматической расшифровки звукозаписей.
Как получилось такое боевое крещение системы в экстремальных условиях, поделится сооснователь стартапа «Сибирские нейросети» Иван Бондаренко. Он расскажет о трудностях, которые возникли при создании Писца, об использовании Wav2vec2 и Whisper в пайплайне распознавания, о том, как и зачем файнтюнить Whisper. И немного о парадигме минимизации инвариантного риска и понятии среды (environment) в распознавании речи.
Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/867722/
Как получилось такое боевое крещение системы в экстремальных условиях, поделится сооснователь стартапа «Сибирские нейросети» Иван Бондаренко. Он расскажет о трудностях, которые возникли при создании Писца, об использовании Wav2vec2 и Whisper в пайплайне распознавания, о том, как и зачем файнтюнить Whisper. И немного о парадигме минимизации инвариантного риска и понятии среды (environment) в распознавании речи.
Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/867722/
Хабр
Как «Писец» на Тотальный диктант ходил
В 2024 году состоялся юбилейный, десятый Тотальный диктант. Тогда на него пришёл «Писец». Вы не подумайте, не произошло ничего плохого. «Писец» — это открытая система автоматической расшифровки речи,...
👍2
Запись доклада Артёма Карасюка «Как мы развернули трансформер на событиях интерфейса операторов поддержки» с конференции AiConf 2024
Инструменты для операторов службы поддержки при взаимодействии с пользователем — всегда актуальный трек для прикладного применения ML-моделей. Артём рассказал, как переход на более совершенные трансформерные модели для ранжирования интентов пользователя дает осязаемый бизнес-профит.
💙 Смотреть запись в VK Видео
#топдокладовAiConf
#записидокладовAiConf
@UseDataConfChannel
Инструменты для операторов службы поддержки при взаимодействии с пользователем — всегда актуальный трек для прикладного применения ML-моделей. Артём рассказал, как переход на более совершенные трансформерные модели для ранжирования интентов пользователя дает осязаемый бизнес-профит.
#топдокладовAiConf
#записидокладовAiConf
@UseDataConfChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Первый автозавод, работающий на ИИ 🚘
В октябре 2024 года Changan Automobile представила свою Цифровую Интеллектуальную Фабрику на 4-й конференции Changan Tech Ecosystem. Завод, оснащенный 5G и ИИ, перешел в массовое производство, демонстрируя передовые технологии в автомобильной отрасли.
Расположенная в Чунцине, фабрика включает более 800 интеллектуальных устройств и 1400 роботов, обеспечивая 100% автоматизацию ключевых процессов. Инновационная модель C2M позволяет гибко реагировать на запросы рынка, предлагая пользователям возможность выбирать конфигурацию своих автомобилей онлайн. С полным покрытием 5G и интеграцией IoT, завод представляет собой образец будущего производства в Китае.
#новостиAIDataScience
В октябре 2024 года Changan Automobile представила свою Цифровую Интеллектуальную Фабрику на 4-й конференции Changan Tech Ecosystem. Завод, оснащенный 5G и ИИ, перешел в массовое производство, демонстрируя передовые технологии в автомобильной отрасли.
Расположенная в Чунцине, фабрика включает более 800 интеллектуальных устройств и 1400 роботов, обеспечивая 100% автоматизацию ключевых процессов. Инновационная модель C2M позволяет гибко реагировать на запросы рынка, предлагая пользователям возможность выбирать конфигурацию своих автомобилей онлайн. С полным покрытием 5G и интеграцией IoT, завод представляет собой образец будущего производства в Китае.
#новостиAIDataScience
Вы бы воспользовались услугой выбора конфигурации автомобиля онлайн?
Anonymous Poll
38%
Да, это удобно
35%
Возможно, если будет много опций
8%
Нет, предпочитаю традиционный подход
19%
Не знаю, не пробовал
👍1
Запись доклада Aлександра Тимофеева-Каракозова «3D pose estimation объектов фиксированной геометрии для складских роботов» с конференции AiConf 2024
В докладе Александр рассказал про end-2-end-пайплайн обучения и работы складских роботов Яндекса от 3D-локализации коробок с товарами для складской робототехники через keypoints estimation и instance segmentation к финальному решению, базирующемуся на active learning в среде активно меняющихся доменов.
💙 Смотреть запись в VK Видео
#топдокладовAiConf
#записидокладовAiConf
@UseDataConfChannel
В докладе Александр рассказал про end-2-end-пайплайн обучения и работы складских роботов Яндекса от 3D-локализации коробок с товарами для складской робототехники через keypoints estimation и instance segmentation к финальному решению, базирующемуся на active learning в среде активно меняющихся доменов.
#топдокладовAiConf
#записидокладовAiConf
@UseDataConfChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1👍1🔥1
Microsoft Research представила два инструмента на основе ИИ — MatterGen и MatterSim, которые революционизируют разработку новых материалов.
MatterGen создает трехмерные молекулярные структуры, а MatterSim затем тестирует эти материалы, моделируя, как они будут вести себя в реальных условиях.
Работая с Институтом передовых технологий Шэньчжэня, исследователи успешно создали новый материал под названием TaCr2O6, предложенный MatterGen. Фактические свойства синтезированного материала совпадали с прогнозами ИИ примерно в 80 процентах случаев. Microsoft открыла исходный код MatterGen под лицензией MIT и интегрировала оба инструмента в Azure Quantum Elements.
#новостиAIDataScience
MatterGen создает трехмерные молекулярные структуры, а MatterSim затем тестирует эти материалы, моделируя, как они будут вести себя в реальных условиях.
Работая с Институтом передовых технологий Шэньчжэня, исследователи успешно создали новый материал под названием TaCr2O6, предложенный MatterGen. Фактические свойства синтезированного материала совпадали с прогнозами ИИ примерно в 80 процентах случаев. Microsoft открыла исходный код MatterGen под лицензией MIT и интегрировала оба инструмента в Azure Quantum Elements.
#новостиAIDataScience
THE DECODER
MatterGen: Microsoft presents AI tools for generating and simulating new materials
Microsoft Research has unveiled two AI tools, MatterGen and MatterSim, that take a fresh approach to developing new materials. Instead of searching through existing options, these tools can create and validate entirely new materials from scratch.