Mini-Omni - open-source MMLM, которая умеет ввод-вывод речи в режиме реального времени. Она построена по предложенному в исследовании методу "Any Model Can Talk", который позволяет добавлять речевые возможности к существующим LLM с минимальными изменениями в их архитектуре.
Функциональные возможности модели:
🟢 speech-to-speech в реальном времени. Не требуются дополнительные модели ASR или TTS;
🟢 генерация текста и аудио одновременно;
🟢 потоковое воспроизведение аудио;
🟢 пакетное преобразование "speech-to-text" и "speech-to-speech".
Mini-Omni основана на LLM Qwen2-0.5B с трансформерной архитектурой, состоящей из 24 блоков и internal dimension 896.
Для кодирования речи используется Whisper-small encoder, а для распознавания и синтеза речи добавлены адаптеры ASR, связанные с двухслойной MLP, и ТТS, который добавляет 6 дополнительных трасформерных блоков к существующим у Qwen2.
Mini-Omni обучалась на датасетах Libritts, VCTK, Multilingual LibriSpeech, Open-Orca, Moss’s SFT, Alpaca-GPT4 и другие. Общий объем данных составил около 8000 часов речевых данных и 2 миллиона текстовых записей.
В бенчмарках Mini-Omn продемонстрировала отличные результаты в задачах распознавания речи, немного уступая Whisper-small и VITA.
Функциональные возможности модели:
Mini-Omni основана на LLM Qwen2-0.5B с трансформерной архитектурой, состоящей из 24 блоков и internal dimension 896.
Для кодирования речи используется Whisper-small encoder, а для распознавания и синтеза речи добавлены адаптеры ASR, связанные с двухслойной MLP, и ТТS, который добавляет 6 дополнительных трасформерных блоков к существующим у Qwen2.
Mini-Omni обучалась на датасетах Libritts, VCTK, Multilingual LibriSpeech, Open-Orca, Moss’s SFT, Alpaca-GPT4 и другие. Общий объем данных составил около 8000 часов речевых данных и 2 миллиона текстовых записей.
В бенчмарках Mini-Omn продемонстрировала отличные результаты в задачах распознавания речи, немного уступая Whisper-small и VITA.
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
gpt-omni/mini-omni at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
🔥2
Nemotron-Mini-4B-Instruct - небольшая модель, полученная в результате файнтюна, обрезки (pruning), дистилляции и квантования модели Minitron-4B-Base.
Эта модель оптимизирована для roleplay-сценариев, RAG QA и вызова функций на английском языке.
Практическое применение модели ориентировано на интеграции в гейм-разработке, преимущественно - в экосистеме NVIDIA.
Модель обучалась в период февраль-август 2024 года.
При создании Nemotron-Mini-4B-Instruct использованы техники Grouped-Query Attention (GQA) и Rotary Position Embeddings (RoPE).
▶️ Технические характеристики:
🟢 total params - 4B;
🟢 embedding size - 3072;
🟢 attention heads - 32;
🟢 MLP intermediate dimension - 9216;
🟢 input context - 4096.
Пример инференса в Transformers, шаблоны простого промпта и instruct- шаблон в карточке модели на Huggingface.
Есть неофициальные квантованные (imatrix) GGUF - версии модели в 8 разрядностях, от 3-bit (2.18 Gb) до 16-bit (8.39 Gb) для запуска в llama.cpp и LM Studio.
📌 Лицензирование : NVIDIA Community Model License.
🟡 Страница модели на NGC Catalog
🟡 Модель
🟡 GGUF
🟡 Arxiv
🟡 Demo
Эта модель оптимизирована для roleplay-сценариев, RAG QA и вызова функций на английском языке.
Практическое применение модели ориентировано на интеграции в гейм-разработке, преимущественно - в экосистеме NVIDIA.
Модель обучалась в период февраль-август 2024 года.
При создании Nemotron-Mini-4B-Instruct использованы техники Grouped-Query Attention (GQA) и Rotary Position Embeddings (RoPE).
Пример инференса в Transformers, шаблоны простого промпта и instruct- шаблон в карточке модели на Huggingface.
Есть неофициальные квантованные (imatrix) GGUF - версии модели в 8 разрядностях, от 3-bit (2.18 Gb) до 16-bit (8.39 Gb) для запуска в llama.cpp и LM Studio.
Please open Telegram to view this post
VIEW IN TELEGRAM
Крутое событие для мобильных разработчиков — Я.Субботник 16 ноября!
Встречаемся на масштабном митапе в московском офисе Яндекса на «Парке культуры».
В программе — доклады об iOS и Android, экскурсия по «Красной Розе» и командный квиз с участием автора блога Mobile Developer Алексея Гладкова и руководителя мобильной разработки Супераппа Яндекса Артура Василова. А ещё нетворкинг и афтерпати с угощениями и напитками.
Регистрируйтесь и присоединяйтесь офлайн или онлайн.
Встречаемся на масштабном митапе в московском офисе Яндекса на «Парке культуры».
В программе — доклады об iOS и Android, экскурсия по «Красной Розе» и командный квиз с участием автора блога Mobile Developer Алексея Гладкова и руководителя мобильной разработки Супераппа Яндекса Артура Василова. А ещё нетворкинг и афтерпати с угощениями и напитками.
Регистрируйтесь и присоединяйтесь офлайн или онлайн.
Я.Субботник по мобильной разработке
Я.Субботник — большой митап в офисе Яндекса для мобильных разработчиков всех направлений. На Я.Субботниках технические специалисты Яндекса рассказывают об устройстве сервисов, над которыми они работают. В программе 5 докладов от разработчиков из и afterparty…
👍1
⚡️ Прими участие в хакатоне Т1 2024 в Москве и поборись за призовой фонд в 1 200 000 рублей!
Когда: 26-29 ноября 2024
Формат: гибридный
Призовой фонд: 1 200 000 рублей
🔥 Хакатон Т1 2024 создан для тебя, если ты:
– Выпускник вуза или молодой специалист;
– Студент старших курсов технических вузов;
– Специалист по frontend или backend-разработке, системный аналитик, AI-специалист.
❗️На хакатоне тебе будут предложены 2 кейса:
1. Хаб: объединение данных пользователя в золотую запись
Создайте методику, которая поможет найти "золотую запись" в большом наборе данных, используя признаки актуальности, частоты и полноты.
2. Окно знаний: цифровой ассистент базы знаний Создайте платформу, которая позволит пользователям разрабатывать окна взаимодействия с ассистентом, интегрируя собственные базы знаний.
▶️ Регистрация открыта! Успей зарегистрироваться до 25 ноября, 23:59 МСК по ссылке.
Когда: 26-29 ноября 2024
Формат: гибридный
Призовой фонд: 1 200 000 рублей
🔥 Хакатон Т1 2024 создан для тебя, если ты:
– Выпускник вуза или молодой специалист;
– Студент старших курсов технических вузов;
– Специалист по frontend или backend-разработке, системный аналитик, AI-специалист.
❗️На хакатоне тебе будут предложены 2 кейса:
1. Хаб: объединение данных пользователя в золотую запись
Создайте методику, которая поможет найти "золотую запись" в большом наборе данных, используя признаки актуальности, частоты и полноты.
2. Окно знаний: цифровой ассистент базы знаний Создайте платформу, которая позволит пользователям разрабатывать окна взаимодействия с ассистентом, интегрируя собственные базы знаний.
▶️ Регистрация открыта! Успей зарегистрироваться до 25 ноября, 23:59 МСК по ссылке.
impulse.t1.ru
T1 | Импульс | Хакатон | Москва
Хакатон в Москве
⚡️ Прими участие в хакатоне Т1 2024 в Санкт-Петербурге и поборись за призовой фонд в 800 000 рублей!
Когда: 15-18 ноября 2024
Формат: гибридный
Призовой фонд: 800 000 рублей
🔥 Хакатон Т1 2024 создан для тебя, если ты:
– выпускник вуза или молодой специалист;
– студент старших курсов технических вузов;
– специалист по frontend- или backend-разработке, системный аналитик, AI-специалист.
❗️На хакатоне тебе будут предложены 2 кейса:
1. Открытый WAF, закрытый доступ: Создание непробиваемой политики против инъекций. Примите участие в создании непреодолимого барьера для злоумышленников.
2. SprintHealth: Инновационный Анализ для Agile-команд. Создайте инструмент для оценки «здоровья» спринтов на основе детального анализа данных задач.
▶️ Регистрация открыта! Успей зарегистрироваться до 13 ноября, 23:59 МСК по ссылке.
Когда: 15-18 ноября 2024
Формат: гибридный
Призовой фонд: 800 000 рублей
🔥 Хакатон Т1 2024 создан для тебя, если ты:
– выпускник вуза или молодой специалист;
– студент старших курсов технических вузов;
– специалист по frontend- или backend-разработке, системный аналитик, AI-специалист.
❗️На хакатоне тебе будут предложены 2 кейса:
1. Открытый WAF, закрытый доступ: Создание непробиваемой политики против инъекций. Примите участие в создании непреодолимого барьера для злоумышленников.
2. SprintHealth: Инновационный Анализ для Agile-команд. Создайте инструмент для оценки «здоровья» спринтов на основе детального анализа данных задач.
▶️ Регистрация открыта! Успей зарегистрироваться до 13 ноября, 23:59 МСК по ссылке.
impulse.t1.ru
T1 | Импульс | Хакатон | Санкт-Петербург
Хакатон в Санкт-Петербурге
🚀Analytics meetup - Системный анализ, метрики и дата-приложения: инструменты для успеха
1. Системный анализ с нуля. Внедрение в команду разработки — Михаил Сластной, РТК ИТ
Как конфигурации команд влияют на производительность и бюджеты? Какие роли нужны для эффективной разработки? Михаил расскажет о переходе команды от работы с бизнес-аналитиками (БА) к добавлению системных аналитиков (СА), покажет оригинальный метод градации специалистов и поделится опытом создания гибких и результативных процессов.
2. Как настроить аналитику при выходе продукта на новые рынки — Алёна Трескова, Яндекс
Разбор реальных кейсов выхода на международные рынки. Как правильно выбрать метрики, учесть культурные и языковые особенности разных стран и обеспечить бесперебойный мониторинг KPI. Полезно для аналитиков, продактов и тех, кто планирует расширение на зарубежные рынки.
3. Создание дата приложений при помощи Taipy — Бояджи Владислав, МТС
Узнайте, как сэкономить время на разработке дата-приложений с помощью фреймворка Taipy. Это идеальное решение для аналитиков и дата-сайентистов, позволяющее быстро создать веб-интерфейс для модели или визуализации данных, не тратя усилия на ручную разработку.
Модератор Антон Комаров
Evrone
Эксперт Михаил Сластной
РТК ИТ, Начальник отдела
➖➖➖
🗓 6 ноября, начало в 19:00 мск, Среда
🌐 ОНЛАЙН
✅ Регистрация на мероприятие
1. Системный анализ с нуля. Внедрение в команду разработки — Михаил Сластной, РТК ИТ
Как конфигурации команд влияют на производительность и бюджеты? Какие роли нужны для эффективной разработки? Михаил расскажет о переходе команды от работы с бизнес-аналитиками (БА) к добавлению системных аналитиков (СА), покажет оригинальный метод градации специалистов и поделится опытом создания гибких и результативных процессов.
2. Как настроить аналитику при выходе продукта на новые рынки — Алёна Трескова, Яндекс
Разбор реальных кейсов выхода на международные рынки. Как правильно выбрать метрики, учесть культурные и языковые особенности разных стран и обеспечить бесперебойный мониторинг KPI. Полезно для аналитиков, продактов и тех, кто планирует расширение на зарубежные рынки.
3. Создание дата приложений при помощи Taipy — Бояджи Владислав, МТС
Узнайте, как сэкономить время на разработке дата-приложений с помощью фреймворка Taipy. Это идеальное решение для аналитиков и дата-сайентистов, позволяющее быстро создать веб-интерфейс для модели или визуализации данных, не тратя усилия на ручную разработку.
Модератор Антон Комаров
Evrone
Эксперт Михаил Сластной
РТК ИТ, Начальник отдела
➖➖➖
🗓 6 ноября, начало в 19:00 мск, Среда
🌐 ОНЛАЙН
✅ Регистрация на мероприятие
evrone.ru
Блог компании Evrone
В блоге компании Evrone вы найдёте обзоры новых технологий и фреймворков, интересные и полезные статьи, информацию о последних событиях, интервью в сфере IT.
👍1
Кодишь лучше, чем пишешь курсовую? Тогда тебе на Alfa Hack — хакатон по направлениям Data Science, Data Analysis и ML от Альфа-Банка! ❤️
Ты сможешь:
➡️ побороться за денежный приз из фонда 500к и получить фаст-трек в команду Альфы;
➡️ потусить на финале в Москве;
➡️ понетворкаться с экспертами;
➡️ прокачать Python и погрузиться в актуальные задачи бизнеса.
Не упусти возможность стать частью команды Альфы — регистрируйся до 31 октября и участвуй из любой точки России: https://u.to/2173IA
Ты сможешь:
Не упусти возможность стать частью команды Альфы — регистрируйся до 31 октября и участвуй из любой точки России: https://u.to/2173IA
Please open Telegram to view this post
VIEW IN TELEGRAM
Alfa Students
Всероссийский хакатон от Альфа‑Банка
Участвуй в направлениях Data Science, Data Analysis и ML Engineering и дойди до финала в Москве!
Можно ли уронить большую систему, внедряя паттерны для повышения надёжности?
Можно уронить всё, что угодно 😅
А вот как этого не сделать — расскажем на бесплатном вебинаре Слёрма
«Паттерны построения отказоустойчивых приложений на Golang»
Рассмотрим:
😄 базу: таймауты и ретраи (linear, exponential backoff)
😄 продвинутые паттерны: graceful degradation, bulkhead isolation, feature flags
⚡️Спикер вебинара — Виталий Лихачёв, SRE в booking.сom
➡️ 31 октября в 19:00 мск
➡️ Занять место на вебинаре — по ссылке
#реклама
О рекламодателе
erid: LjN8KQ8AJ
Можно уронить всё, что угодно 😅
А вот как этого не сделать — расскажем на бесплатном вебинаре Слёрма
«Паттерны построения отказоустойчивых приложений на Golang»
Рассмотрим:
😄 базу: таймауты и ретраи (linear, exponential backoff)
😄 продвинутые паттерны: graceful degradation, bulkhead isolation, feature flags
⚡️Спикер вебинара — Виталий Лихачёв, SRE в booking.сom
➡️ 31 октября в 19:00 мск
➡️ Занять место на вебинаре — по ссылке
#реклама
О рекламодателе
erid: LjN8KQ8AJ
Telegram
Golang-разработчик / Бот
Привет, это бот курса Golang-разработчик 🖖
Я помогаю с информацией по курсу.
Я помогаю с информацией по курсу.
🏆 Business camp Х5 - оплачиваемая программа для студентов и выпускников, которые хотят развиваться в мире бизнеса и IT
Компания X5 Group открывает свои двери для начинающих профессионалов, готовых к карьерному росту и новым вызовам.
Почему стоит подать заявку?
- Получишь полезный опыт: 6 месяцев ты будешь работать над реальными проектами
- Забудешь про скучные задания: на Business camp Х5 у тебя будет возможность генерить идеи и воплощать их в дружном коллективе
- Гибкий график работы: сможешь работать от 20 до 40 часов в неделю
Для кого?
- Ты - студент 3−4 курса бакалавриата или 1−2 курса магистратуры (выпускаешься в 2025 / 2026)
- Готов(а) работать в Москве
- Средний балл 4.7 и выше (по пятибалльной шкале)
Направления: Data Science, Data Engineering, IT, Бизнес-аналитик
❗️Заявки принимаются до 10 ноября 2024 года
💫 Регистрируйся и открывай новые карьерные горизонты вместе с X5 Group - https://vk.cc/cD3qLb?erid=LjN8KbvDt
Компания X5 Group открывает свои двери для начинающих профессионалов, готовых к карьерному росту и новым вызовам.
Почему стоит подать заявку?
- Получишь полезный опыт: 6 месяцев ты будешь работать над реальными проектами
- Забудешь про скучные задания: на Business camp Х5 у тебя будет возможность генерить идеи и воплощать их в дружном коллективе
- Гибкий график работы: сможешь работать от 20 до 40 часов в неделю
Для кого?
- Ты - студент 3−4 курса бакалавриата или 1−2 курса магистратуры (выпускаешься в 2025 / 2026)
- Готов(а) работать в Москве
- Средний балл 4.7 и выше (по пятибалльной шкале)
Направления: Data Science, Data Engineering, IT, Бизнес-аналитик
❗️Заявки принимаются до 10 ноября 2024 года
💫 Регистрируйся и открывай новые карьерные горизонты вместе с X5 Group - https://vk.cc/cD3qLb?erid=LjN8KbvDt
💬 КРОК проводит серию митапов про people-менеджмент
Во втором выпуске поговорят про работу с зумерами – разницу поколений, майндсет руководителя и форматы развития молодых специалистов.
Среди гостей — те, кому есть чем поделиться о работе с людьми:
– Денис Медведев, руководитель группы менеджеров по продажам, КРОК
– Кристина Чебыкина, руководитель группы консультантов и разработчиков 1С, КРОК
– Максим Чижин, руководитель группы инженеров дата-центра, Selectel
Когда: 29 октября (вт)
Во сколько: 19:00 по мск
Где: встречаемся онлайн
Зарегистрироваться и узнать про следующие выпуски можно по ссылке: http://croc.global/2gf
Реклама. ЗАО «КРОК инкорпорейтед», ИНН 7701004101, erid 2VtzqwJsyQ8
Во втором выпуске поговорят про работу с зумерами – разницу поколений, майндсет руководителя и форматы развития молодых специалистов.
Среди гостей — те, кому есть чем поделиться о работе с людьми:
– Денис Медведев, руководитель группы менеджеров по продажам, КРОК
– Кристина Чебыкина, руководитель группы консультантов и разработчиков 1С, КРОК
– Максим Чижин, руководитель группы инженеров дата-центра, Selectel
Когда: 29 октября (вт)
Во сколько: 19:00 по мск
Где: встречаемся онлайн
Зарегистрироваться и узнать про следующие выпуски можно по ссылке: http://croc.global/2gf
Реклама. ЗАО «КРОК инкорпорейтед», ИНН 7701004101, erid 2VtzqwJsyQ8
www.people.croc.ru
Дело в людях КРОК
Вдохновляемся коллаборацией КРОК х HUMANIST. Говорим про людей и для людей на онлайн-стримах. Узнаем язык благодарности мира ИТ и обменяемся «спасибо»
Шведские ученые напророчили, что через 40 лет Facebook* превратится в цифровой некрополь. Количество профилей покойников превысит число живых пользователей.
Ребята, вы серьезно? 40 лет? Давайте будем реалистами! История интернета - это кладбище забытых сервисов. ICQ, Blackberry, Yahoo, AltaVista... Все они когда-то были на пике, а теперь пылятся на свалке истории.
Facebook*, конечно, гигант, но даже гиганты не вечны. Технологии развиваются с бешеной скоростью. Кто знает, что будет через 5, 10, 20 лет? Может, появится новая социальная сеть, которая затмит Facebook*. Или вообще все перейдут в виртуальную реальность, и Facebook* станет таким же архаизмом, как пейджеры.
Так что не будем загадывать на 40 лет вперед. Живем здесь и сейчас, общаемся с друзьями, делимся фотками и мемами. А что будет с Facebook* через 40 лет - посмотрим. Может, он действительно станет кладбищем, а может, и нет. Время покажет.
* экстремистка контора, запрещена в РФ
Ребята, вы серьезно? 40 лет? Давайте будем реалистами! История интернета - это кладбище забытых сервисов. ICQ, Blackberry, Yahoo, AltaVista... Все они когда-то были на пике, а теперь пылятся на свалке истории.
Facebook*, конечно, гигант, но даже гиганты не вечны. Технологии развиваются с бешеной скоростью. Кто знает, что будет через 5, 10, 20 лет? Может, появится новая социальная сеть, которая затмит Facebook*. Или вообще все перейдут в виртуальную реальность, и Facebook* станет таким же архаизмом, как пейджеры.
Так что не будем загадывать на 40 лет вперед. Живем здесь и сейчас, общаемся с друзьями, делимся фотками и мемами. А что будет с Facebook* через 40 лет - посмотрим. Может, он действительно станет кладбищем, а может, и нет. Время покажет.
* экстремистка контора, запрещена в РФ
❤3❤🔥2🔥2
Media is too big
VIEW IN TELEGRAM
☝🏻Калифорнийская компания Altera запустила проект Project Sid, в рамках которого 1000 ИИ-ботов получили свободу действий в Minecraft.
Без вмешательства человека агенты ИИ создали экономику, культуру, правительство и религию.
🔻Боты освоили торговлю, используя драгоценные камни в качестве валюты.
🔻Сформировали религиозные структуры и попытки распространения веры.
🔻Отмечены случаи взаимопомощи и принятия решений с учетом общественных интересов.
🔻Боты провели голосование по двум различным "конституциям", выбирая направление развития.
Altera уже запустила тестовый режим, позволяющий пользователям взаимодействовать с ботами.
Компания рассматривает Project Sid как шаг на пути к созданию "цифровых людей" - ИИ, способных жить и развиваться вместе с человечеством.🤖
Без вмешательства человека агенты ИИ создали экономику, культуру, правительство и религию.
🔻Боты освоили торговлю, используя драгоценные камни в качестве валюты.
🔻Сформировали религиозные структуры и попытки распространения веры.
Включая подкуп других ботов.
🔻Отмечены случаи взаимопомощи и принятия решений с учетом общественных интересов.
Например один бот-фермер, вдохновлённый рассказом путешественника, хотел отправиться в путешествие, но вернулся на ферму, потому что деревня нуждалась в еде.
🔻Боты провели голосование по двум различным "конституциям", выбирая направление развития.
Голосовали за конституцию "Харрис" или "Байдена".🤣
Altera уже запустила тестовый режим, позволяющий пользователям взаимодействовать с ботами.
Компания рассматривает Project Sid как шаг на пути к созданию "цифровых людей" - ИИ, способных жить и развиваться вместе с человечеством.🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Всем большим победам в кодинге посвящается ))))
🔥3👍2
🚀 Intel предствавили полностью интегрированные многослойные персептроны на графических процессорах Intel для центров обработки данных
Intel Max 1550 превосходит графический процессор H100 в 2,84 раза при выводе и в 1,75 раза при обучении
https://arxiv.org/abs/2403.17607
Intel Max 1550 превосходит графический процессор H100 в 2,84 раза при выводе и в 1,75 раза при обучении
https://arxiv.org/abs/2403.17607