Как мы делаем Яндекс
3.07K subscribers
396 photos
5 videos
490 links
Сотрудники Яндекса каждый день решают технологические задачки.

В нашем блоге они делятся с сообществом опытом и знаниями.
Download Telegram
Софтмакс Гумбеля: как устроен и для каких нейронных сетей полезен

Gumbel-Softmax — это метод, который используется для обучения нейронных сетей, способных выбирать из конечного списка вариантов. Он особенно полезен, когда в процессе вычислений возникает дискретное место, через которое не проходит градиент.

С помощью Gumbel-Softmax можно осуществлять сэмплирование из категориального распределения таким образом, чтобы это не влияло на вычисление градиентов. А как именно — рассказал Николай Лысенко, разработчик рекомендательных системам в Яндекс Маркете.

#статья
Свой плеер для DASH: вошли и вышли, приключение на 20 минут

Для доставки контента пользователю многие сервисы Яндекса используют технологию стриминга по стандарту MPEG‑DASH. Чтобы всё хорошо работало, нужна подходящая библиотека. Команда выбрала готовое опенсорс-решение Shaka Player, но с ним возникло несколько проблем.

В своём докладе Ольга Попова, разработчик в Yandex Infrastructure, поделилась опытом разработки своего DASH-плеера, а также рассказала об архитектуре решения, его тестировании и метриках.

#доклад
Как мы в Яндекс Путешествиях на Compose стёкла морозили

Антон Урывский, Android‑разработчик в Яндекс Вертикалях, поделился опытом создания эффекта морозного стекла, который блюрит не содержимое View, а всё, что находится под ним. На iOS он достигается достаточно легко, а вот на Android всё не так просто: BlurRenderEffect доступен только с API 31, а для нас очень важно, чтобы приложение выглядело одинаково на всех смартфонах — даже на старых.

#статья
Математика надёжности. Доклад Яндекса

Есть много способов повысить надёжность — делать ретраи, срезать избыточную нагрузку, отключать необязательные функции, реплицировать сервисы или делать фолбэки на критичную логику. Но из чего складывается надёжность и как её посчитать?

Вадим Мартынов, руководитель команды платформы надёжности в Яндекс Go, в своём докладе рассказал, как влияют те или иные решения на надёжность системы и как это учитывать при разработке.

#доклад
Как Яндекс создал технологию эмоционального синтеза в Алисе

Теперь Алиса умеет выражать голосом целый спектр эмоций. Например, она может подбодрить, посочувствовать или порадоваться за пользователя. При этом Алиса способна менять оттенки эмоций в рамках одной реплики, как люди.

Рассказали, что под капотом: как работала эмоциональность раньше, в чём была проблема, как мы создали новый синтез эмоциональной речи и добавили туда оттенков.

#статья
Встречаем OmniCast — технологию, которая повысит точность прогноза температуры с помощью пользовательских метеостанций

Яндекс Погода внедрила технологию OmniCast, которая учитывает данные как профессиональных, так и и любительских метеостанций. Подключить по API такую станцию к сервису теперь может любой желающий. Благодаря этому сервис стал в 36 раз чаще получать данные о температуре и давать более точный прогноз для каждого городского квартала.

Рассказали на Хабре о том, как при помощи фильтра Калмана и комбинации двунаправленной и однонаправленной LSTM-нейросетей нам удалось улучшить качество прогноза температуры.

#статья
ICML 2024: как это было и куда движется индустрия

Владислав Офицеров, ответственный за развитие нейросетевых технологий в международном Поиске в Яндексе, впервые побывал на одной из крупнейших международных конференций по машинному обучению — ICML (The International Conference on Machine Learning), и поделился в статье своими впечатлениями.

Рассказывает, из чего конференция состоит, как смотреть доклады, когда участники представляют 2600 статей на своих стендах, и показывает в своем обзоре самые интересные из них.

А другими обзорами свежих научных статей мы с коллегами делимся в канале Душный NLP →

#статья
От десятков до сотен тысяч RPS: как мы создали API, который развивается 10 лет без дропа обратной совместимости

В 2014 году Яндекс Почта и Диск существовали как отдельные сервисы. Тогда же разработчики Диска начали проектировать API Gateway — паттерн в микросервисной архитектуре, который даёт единую точку доступа к API.

Время шло, сервисы росли, появлялись новые и в 2021 году они объединились в Яндекс 360. API Gateway менялся вместе с ними и за 10 лет не утратил своей актуальности. В сегодняшней статье на Хабре — подробный рассказ о тех подходах к разработке API, которые обеспечили его долговечность.

#статья
Как базовой инфраструктуре удобно жить на железе в 2к24

Что делать, когда нужно автоматизировать сеть в масштабах 10+ точек присутствия и сотен серверов? При этом базовая инфраструктура не может сильно зависеть от других сервисов. Но хочется и не остаться в стороне от лучших практик разработки, контейнеров, k8s и CI/CD-пайплайнов.

Борис Литвиненко, ведущий разработчик группы разработки сетевой инфраструктуры и мониторинга в Yandex Infrastructure, в своём докладе рассказывает, как в команде пришли к необходимости в стандартизации, почему победил облачный подход и как преодолеть проблемы монолитной инфраструктуры при автоматизации сети.

#доклад
YRGB 2024 — конкурс по созданию игр для ZX Spectrum

Компьютер конца 80–х ZX Spectrum знают и любят миллионы жителей как России, так и других стран, где он был популярен. Именно поэтому вот уже который год Яндекс Музей проводит YRGB — конкурс, посвящённый разработке игр для этого компьютера. Правила предельно простые: нужно сделать игру для любой фирменной модели ZX Spectrum, а потом подать заявку и ждать итогов летом 2025 года.

Если у вас есть желание сделать игру для ZX Spectrum, но нет соответствующих умений, то не переживайте — это не очень сложно. А в посте на Хабре мы собрали полезные ссылки на эмуляторы, движки, графические и музыкальные редакторы, а также на архивы с играми для этой платформы.

#статья #новость
Как Яндекс создавал новую end2end-модель генерации видео

В Шедевруме заработала новая end2end-модель YandexART (Vi). Она позволяет создавать видео по текстовому запросу и учитывает взаимосвязь между кадрами. Результат получается более связным и плавным, чем при использовании предыдущей модели.

В статье — история о том, почему разработчики изначально выбрали работу в пиксельном пространстве, а в итоге решили отказаться от него в пользу латентного, а также подробный разбор методов инженерных оптимизаций, которые помогли в обучении моделей.

#статья
Следим за производительностью SDK. Доклад Яндекса

Владислав Бардин, iOS‑разработчик в команде Яндекс Маркета, выступил с докладом конференции Яндекс Go Dev Day&Night. Он рассказал, зачем следить за производительностью, когда вы разрабатываете такой фундаментальный SDK, какие метрики стоит собирать и как взаимодействовать с потребителями, а именно с продуктовыми командами, которые используют ваш SDK в своих приложениях.

#доклад
Основы Jetpack Compose: как обеспечить стабильность вашего кода

Стабильность в Jetpack Compose важна для производительности и удобства использования пользовательского интерфейса. Компилятор Kotlin автоматически определяет стабильность типов, но есть неочевидные моменты, которые могут привести к рекомпозиции.

В сегодняшней статье на Хабре — подборка советов, как правильно организовать стабильность типов и параметров, чтобы уменьшить количество рекомпозиций, которые значительно влияют на производительность и плавность работы приложения.

#статья
Как в Яндексе 16 человек управляют 1800 переговорками по всему миру

В Яндексе есть внутренний сервис — Паспорт переговорных. Его основная задача — легко и эффективно управлять видеосвязью огромного парка переговорных: от больших залов до кабин, рассчитанных на пару человек. А это около 1800 помещений в 125 офисах в 12 странах.

Данила Елагин, технический менеджер проектов и продуктов во внутреннем подразделении ИТ Яндекса, рассказал, как за полгода команде удалось довести до ума лоскутное одеяло из плохо интегрированных функций прежнего Паспорта переговорных и сделать так, чтобы сервисом было удобно и уютно пользоваться.

#статья
Как мы учили Yandex Code Assistant помогать с написанием кода и делать разработчиков счастливыми

Появление модных LLM и кодовых ассистентов на их основе обещает разработчикам ускорение и упрощение процесса написания кода. Но как научить такого помощника не просто дописывать код, но и предлагать такие подсказки, чтобы разработчик был доволен и счастлив?

Этим вопросом задалась команда ML-лаборатории Yandex Infrastructure, которая осенью выпустила собственного помощника для разработчиков Yandex Code Assistant. Виктор Плошихин и Константин Моксин в новой статье рассказали, что такое метрика "счастья разработчика", и как создатели кодового ассистента вывели её формулу в результате 40+ экспериментов внутри Яндекса.

#статья
Яндекс Погода открыла бесплатный API для умного дома

Команда Яндекс Погоды открыла бесплатный API для интеграции погодных данных в системы умного дома. С помощью API пользователи смогут создавать сценарии, которые учитывают погоду на улице — например, чтобы в холодные вечера включался тёплый пол, а в дождливое утро — яркий свет. В ближайшее время данные о погоде начнут применяться в умном доме Яндекса.

Сервис совместим с любыми системами, которые поддерживают сторонние API. А для пользователей Home Assistant мы опубликовали плагин, упрощающий процедуру подключения.

#новость
Как мы генерируем GPT-нейросетями миллиарды объявлений на малом количестве GPU. Доклад Яндекса

Ольга Зайкова, руководитель группы автоматической генерации рекламы, выступила с докладом на Saint HighLoad++ с рассказом о том, как её команде удалось масштабировать ML-решение, генерирующее заголовки рекламных объявлений. Они разработали алгоритм умного обхода объектов и научили сервис инференса GPT-нейросетей адаптироваться к изменяющейся нагрузке со стороны процессинга объявлений.

#доклад
Enterprise 128: компьютер, который опоздал на рынок

Изрядная часть коллекции Яндекс Музея состоит из популярных экспонатов, которые знакомы многим посетителям, но в нашей коллекции встречаются и довольно редкие устройства. Одно из них — Enterprise 128. Это британский компьютер с очень интересной, пусть и не слишком весёлой судьбой.

В новой хабростатье — история о том, как попытки создать идеальный компьютер привели к тому, что он не смог завоевать мировой рынок. Однако он стал культовым среди молодёжи Венгрии и России в начале 90-х годов.

#статья
Как эволюционировало машинное зрение автономного транспорта. Доклад Яндекса

Всеволод Орлов, руководитель службы восприятия в автономном транспорте, выступил на конференции «Я Железо 2024». Он рассказал, благодаря чему автономный транспорт видит окружающий мир, как его органы зрения менялись и эволюционировали и какой софт позволяет роботам и машинам успешно ездить без человека в кабине.

#доклад
Встречаем нейроредактор в Браузере, или Как мы учили LLM-модели помогать пользователям с текстами

Сегодня мы представляем нейроредактор — инструмент в Браузере, который облегчает монотонную и трудоёмкую работу с текстом. Он появился в результате работы над скоростью и качеством LLM-моделей из предыдущего решения. Теперь пользователи Браузера могут не просто быстро поправить опечатки, но и создать текст с нуля по любому промту.

В статье на Хабре рассказали историю о том, как разработчики пришли к идее отдельного инструмента, как работает кастомный промт и почему переписывание и генерация — это разные задачи с точки зрения моделей.

#статья