Всё про Алгоритмы и Структуры данных
7.76K subscribers
345 photos
37 videos
5 files
3.16K links
Мы не претендуем на оригинальность контента, мы лишь собираем материал из открытых источников.

Ссылка: @Portal_v_IT

Сотрудничество, авторские права: @oleginc, @tatiana_inc

Канал на бирже: https://telega.in/c/structuredata
Download Telegram
CLIP или SigLIP. База по Computer vision собеседованиям. Middle/Senior

Вопросы о CLIP-моделях встречаются почти на каждом техническом собеседовании.
Неважно, занимаетесь ли вы видеоаналитикой, создаёте генеративные модели или работаете над поиском по изображениям — CLIP и его потомки (BLIP , SigLIP ) стали стандартом де-факто в задачах связи визуальных и текстовых данных. Почему? Потому что они позволяют решать задачи, которые ранее требовали значительных усилий: от автоматической разметки данных до генерации изображений по текстовым запросам. А значит, на собеседовании вас спросят, как устроены эти модели, зачем они нужны и в чём их преимущества перед классическими подходами.

https://habr.com/ru/articles/908168/

Алгоритмы и Структуры данных
Путь самурая к заветной 1К на LeetCode [личный опыт]

Возможно вы сейчас на этапе подготовки к алгоритмическому собеседованию в Big Tech или просто энтузиаст, который хочет укрепить свои знания алгоритмов. Тогда эта статья для вас!

https://habr.com/ru/articles/907944/

Алгоритмы и Структуры данных
I-CON: Периодическая таблица машинного обучения

В последние годы в исследованиях машинного обучения наблюдается распространение методов обучения представлений, каждый из которых имеет уникальную архитектуру, функции потерь и стратегии обучения. Эта фрагментация затрудняет для исследователей понимание взаимосвязей между различными методами и определение того, какой подход лучше всего подходит для данной задачи.

В статье "I-CON: Унифицированная платформа для обучения представлений" предлагается всеобъемлющая информационно-теоретическая платформа, которая вносит ясность в этот сложный ландшафт, объединяя более 23 различных методов обучения представлений под единой математической формулировкой.

Фреймворк I-CON, показывающий взаимосвязь между входными данными, контрольными сигналами, изученными представлениями и распределениями вероятностей.

https://habr.com/ru/articles/908306/

Алгоритмы и Структуры данных
Дискретные тригонометрические функции, машинный эпсилон и автоматическое дифференцирование

Попалась мне недавно статья Синус, косинус, квадратный корень FixedPoint. Автор размышляет как можно не затратно рассчитывать координаты и углы в микроконтроллере. Попробовал я подсказать автору пару аппроксимаций, но он оказался общителен только на тему "упадка автоматизации в РФ", а по делу как то не сложился диалог. Посмотрел, такие статьи с такой тематикой не редкость. Например, очень хорошая статья Как посчитать синус быстрее всех на Xабре. В общем разгрузил себе голову на майских праздниках от главного хобби - геометрической алгебры.

В процессе изучения всего этого, возник у меня вопрос - а зачем вообще нужно аппроксимировать sin,cos, arctan и еще и в привязке к числу в двоичной системе, если есть декартовы координаты?

Из ответа на этот вопрос родилась идея этой статьи. Будет длинно, но если на примере подробно разбираться с работой машинного эпсилон и автоматическим дифференцированием, короче не получится. Следите за мыслью по ходу изложения. Начну с главного тезиса, и разверну по шагам как это работает на примере операций с единичной окружностью. На математический трактат не замахиваюсь, поэтому пишу только основное и не строго.

https://habr.com/ru/articles/907936/

Алгоритмы и Структуры данных
Атака зомби: математическая модель заражения

В одном из американских издательств вышел любопытный сборник научных работ по моделированию инфекционных болезней. Одна из статей в сборнике (18-страничный PDF) посвящена весьма «актуальной» сегодня теме — моделированию атаки зомби [When Zombies Attack!: Mathematical Modelling Of An Outbreak Of Zombie Infection – P. Munz, I. Hudea, J. Imad and R.J. Smith?].

Учёные составили базовую математическую модель скорости распространения атаки зомби, в зависимости от количества жителей.

https://habr.com/ru/articles/67275/

Алгоритмы и Структуры данных
Быстрый алгоритм fulltext-поиска без токенизации

Меня зовут Дмитрий Ольшанский, я ведущий инженер Т-Банка. Расскажу о новом (насколько мне известно) алгоритме поиска текста по шаблону. Такая задача возникла в рамках проекта Sage — observability-платформы от Т-Банка, для которой мы строим новый бэкэнд для структурированных логов, SageDB.

https://habr.com/ru/companies/tbank/articles/906990/

Алгоритмы и Структуры данных
Как c помощью Аналитики набрать миллионы подписчиков на Youtube

«Никто ничего не знает» - знаменитая цитата Уильяма Голдмана, сказанная в 80х. Имелась ввиду неспособность Голивудских продюсеров предугадывать успех или провал фильма в прокате. Сам Голдман - дважды обладатель Оскара и один из самых великих сценаристов в истории кинематографа. Короче, ему можно верить.

С тех пор прошло 40 лет. Появился интернет. В Интернете появилось видео. Однако, в отличие от фильма в кинотеатрах, успех ролика в интернете можно предугадать с большой вероятностью.

Особенно, успех ролика на Ютуб.

https://habr.com/ru/articles/672260/

Алгоритмы и Структуры данных
Ядро, которое понимает: как я построил обучаемый механизм атак с нейросетью, эволюцией и квантовой логикой

Я больше не мог смотреть на то, как сканеры уязвимостей просто генерируют атаки из словарей и кидают в стену тысячи запросов. Это напоминало мне детский рисунок, где ребёнок мечется кистью по холсту, надеясь случайно изобразить Ван Гога.

Я хотел сканер, который понимает. Сканер, который учится. Сканер, который адаптируется.

Так начался проект AI-Scanner — не как плагин к существующему решению, а как попытка вырастить нечто живое: обучаемую систему, способную эволюционировать, предсказывать, ошибаться и исправляться.

https://habr.com/ru/articles/908796/

Алгоритмы и Структуры данных
👍21🔥1
Интерактивный учебник для подготовки к алгоритмической секции собеседования

Собеседования в крупные IT-компании почти всегда содержат алгоритмическую секцию — даже если вы собеседуетесь на позицию, в работе на которой алгоритмы возникать вряд ли будут. Ниже мы приводим пример задачи, с которой вы можете столкнуться на вашем следующем интервью. Мы расскажем, как эта задача решается, но мы настоятельно рекомендуем вам читать решение только после того, как вы попробуете решить задачу самостоятельно: во-первых, это отличная тренировка; во-вторых, вы лучше запомните решение, если придумаете его сами (не отказывайте себе в этом удовольствии!); в-третьих, даже если вы подумаете над задачей, но не решите её, время не будет потеряно: прочитав потом решение, вы лучше его поймёте и оцените его красоту.

https://habr.com/ru/articles/671466/

Алгоритмы и Структуры данных
Почему идентификация лиц невозможна — так, как этого хочет заказчик?

Ну
, давайте честно, много вы знаете случаев успешного внедрения? Естественно, мы не говорим про верификацию, когда нужно просто подтвердить, что чел похож на того, кому дана карточка СКУД. Хотя… об этом тоже поговорим, потому что и она извращена на практике.

https://habr.com/ru/articles/671940/

Алгоритмы и Структуры данных
Генетический алгоритм в помощь Adam — супер, но есть нюанс

Это моя первая статья и я хотел бы начать ее с такого интересного эксперимента как "сбор гибрида для обучения нейронных сетей с помощью генетического алгоритма" и дополнительно рассказать про библиотеку Deap. Для данной статьи я подразумеваю, что вы уже знаете как устроены нейронные сети и как они обучаются.

Сейчас практически у всех на слуху "нейросети" и подобные производные от данного слова, то всякого рода другие подходы отходят на второй план. Во вторую категорию (сугубо личное мнение, можете не согласиться) относятся генетические алгоритмы и др. родственные алгоритмы. Поэтому попробую дать основы, из чего состоит генетический алгоритм, стараясь не нагружать статью математикой. Если вы уже знакомы с данным алгоритмом, можно пропустить материал в "скрытом тексте" :)

https://habr.com/ru/articles/909124/

Алгоритмы и Структуры данных
👍1
Как работать с моделью числа II

Содержание текста статьи у некоторых читателей Хабра вызвало определенный интерес (судя по комментариям). Что в общем-то не удивительно, так как тема статьи весьма актуальная для современного общества – информационная безопасность. Специалисты проявляют интерес и активно разрабатывают тему с момента открытия двухключевой криптографии и односторонних функций (около 50 лет).

https://habr.com/ru/articles/908714/

Алгоритмы и Структуры данных
Российские нейросети доступны для всех – показываем, на что они способны

Разбираем и тестируем лучшие отечественные ИИ-инструменты от Яндекса, Сбера и других разработчиков вместе с СЕО университета Зерокодер ⚡️

Кому будет полезно?

– Тем, кто хочет пользоваться доступными в РФ нейросетями без ограничений и языковых барьеров;
– Специалистам, работающим с текстами и визуальным контентом;
– IT-специалистам для оптимизации рабочих процессов.

В программе вебинара:

– Обзор возможностей российских нейросетей и их сравнение с западными аналогами;
– Практические примеры использования ИИ для различных задач в работе и повседневной жизни;
– Рассмотрение рынка вакансий и возможностей заработка с навыками работы с нейросетями.

Один из самых интересных и бесплатных эфиров в 2025 году ждет вас по ссылке.

erid: 2W5zFJNNSwA
ООО Зерокодер, ИНН 9715401631
Об одном красивом неизвестном решении одной известной задачи

Как известно, на машине Тьюринга (далее МТ) запрограммировать можно всё, что мы вообще считаем программируемым, но в реальности программы на МТ настолько громоздкие, что МТ редко используется даже в академических примерах. И тем не менее в некоторых отдельных случаях с помощью МТ получается написать небольшую программу, на КДПВ изображена программа из 5 состояний на алфавите из 3 символом. Если вы изучали программирование, то задачу, которую решает эта программа, вы скорее всего встречали. Если я сумел вас заинтересовать, то приглашаю в небольшое приключение по реверс инженирингу МТ.

https://habr.com/ru/articles/909162/

Алгоритмы и Структуры данных
👍1
Как мы научили AI писать тексты для бизнеса не хуже, чем копирайтеры

Привет, Хабр! Я Алексей, data scientist в Сбере, отвечаю за AI создание персонализированного маркетингового контента для разных каналов коммуникаций.

Как и другие подразделения Сбера, мы в трайбе «Массовая персонализация» создаём много текстового контента. Это тексты для СМС, пуш-уведомлений, e-mail, рекламные баннеры и прочее для СберБанка. (Да-да, это мы шлём вам эсэмэски!)

Мы хотели сделать этот процесс эффективнее — как по продажам, так и по затратам на производство контента. После того как SberDevices выкатили ruGPT-3, мы решили обобщить накопленные за несколько лет данные и доверить AI написание текстов для наших клиентов.

Получилось ли это? Спойлер: да, ещё как. Но обо всём по порядку.

https://habr.com/ru/companies/sberbank/articles/671792/

Алгоритмы и Структуры данных
Алгоритм преобразования НКА в эквивалентный ДКА

Цель данной статьи: познакомить Вас с алгоритмом построения детерминированного конечного автомата из недетерминированного конечного автомата. И сразу куча вопросов: зачем понадобилось данное преобразование, что такое конечный автомат, что такое ДКА и НКА и зачем мне это знать? Начнём с мотивации.

https://habr.com/ru/articles/671742/

Алгоритмы и Структуры данных
Оптимизация производительности кода — это тяжёлый труд

Я не говорю о навыках или о знаниях, равно как и не пытаюсь внушить миру идею о необходимости оптимизации производительности. Наш мир и без этого поставил во главу угла ускорение всего и вся. Оптимизация производительности кода — это тяжёлый труд из-за того, что речь идёт о задаче, природа которой диктует использование при её решении метода грубой силы — полного перебора вариантов — и ничего с этим не поделаешь.

Статья, которую вы читаете — это, отчасти, рассуждения о том, сколько огорчений мне приносит оптимизация кода. Но я, кроме того, попытаюсь дать здесь практические советы, которые, надеюсь скрасят путь тем, кто идёт дорогами оптимизации.

https://habr.com/ru/companies/wunderfund/articles/908402/

Алгоритмы и Структуры данных
Java-разработчик о том, зачем ходить на собеседования ради удовольствия и как их проводить для обоюдной пользы

Константин Шибков (на Хабре sendelust) — эксперт Skillbox и Java-разработчик, который искренне любит собеседования. Не только проходить их сам, но и обсуждать чужие. Он расспрашивает знакомых, какие им попались задачи, а потом разбирает их вместе с участниками своего алгоритмического клуба JavaKeyFrame. Ведёт телеграм-канал «Три монитора», где делится личным опытом. Мы поговорили с Константином о том, почему техническое интервью — это не пытка, а интеллектуальное удовольствие, как проводить собесы по-человечески, зачем нужны задачки «на подумать» и почему иногда лучше не отвечать сходу, а сначала задать встречный вопрос.

https://habr.com/ru/articles/909780/

Алгоритмы и Структуры данных
Робот для пинг-понга: умнее, быстрее, точнее

Многие виды спорта являются либо командными, либо парными занятиями. Но не всегда у человека может быть кто-то, кто готов составить ему компанию в дружеском матче по пинг-понгу. В такой ситуации на помощь придет робот, разработанный учеными из Массачусетского технологического института (США). Из чего сделан пинг-понг робот, в чем его особенности, и насколько хорошим соперником он может быть? Ответы на эти вопросы мы найдем в докладе ученых.

https://habr.com/ru/companies/ua-hosting/articles/909616/

Алгоритмы и Структуры данных
Программный генератор случайных числовых последовательностей на RISC-V с использованием PUF в DRAM

Мы продолжаем рассказывать о проектах Зимней школы RISC-V, организованной YADRO. Возможно ли создать программный генератор на базе открытой архитектуры, используя физически неклонируемые функции (PUF) динамической памяти? Команда из БГУИР — Никита Малявко, Ксения Трубач, Михаил Кулик, Павел Шлык — в своем проекте проверила гипотезу о наличии PUF в динамической памяти и создала модель одноканального источника шума. Затем реализовала постобработку и тестирование, измерила производительность генератора и оптимизировала код.

Как устроена динамическая память? Каждая ячейка DRAM складывается из транзистора и конденсатора. Конденсаторы разряжаются, поэтому без периодической подзарядки данные памяти будут потеряны. Так же, как и в результате чтения данных из памяти.

https://habr.com/ru/companies/yadro/articles/909902/

Алгоритмы и Структуры данных