Всё про Алгоритмы и Структуры данных
7.77K subscribers
344 photos
37 videos
5 files
3.15K links
Мы не претендуем на оригинальность контента, мы лишь собираем материал из открытых источников.

Ссылка: @Portal_v_IT

Сотрудничество, авторские права: @oleginc, @tatiana_inc

Канал на бирже: https://telega.in/c/structuredata
Download Telegram
Как ФНС «нашла» 64 тысячи «богатых безработных» и собрала с них 9 млрд рублей

Не могу пройти мимо и не разобрать очередную громкую новость про налоги, которую сегодня опубликовал один популярный телеграм-канал. А звучит она примерно так:

Налоговая выявила 64 тысячи безработных москвичей с роскошным образом жизни без официального дохода - им доначислили налоги, и бюджет получил более 9 млрд рублей. Теперь подобные проверки пройдут по всей России»

Как по мне, так это больше похоже на сатирический вброс от ИА «Панорама». Но поискав немного в интернете, оказалось, что нет, и эта новость еще вчера оказалась в интернет пространстве, и опубликовали ее многие известные новостные издания.

https://habr.com/ru/articles/1002182/

Алгоритмы и Структуры данных
«Я всё сломал за выходные»: как мы учим LLM писать в стиле конкретного СМИ

Привет, я Лена, это мой первый пост здесь, и он про техническую задачу, с которой мы столкнулись: как заставить LLM писать текст так, чтобы его нельзя было отличить от написанного конкретной редакцией. Не «хороший текст», не «грамотный текст», а такой, который звучит как этот конкретный городской портал или этот Telegram-канал.

Мы строим AI-систему для автоматизации рерайта новостей в региональных СМИ. Суть простая: система собирает новости из источников, проверяет факты и пишет рерайт в стиле конкретного издания. Тем временем журналисты занимаются своей нормальной работой, а не переписыванием чужих текстов. Звучит понятно. А потом начинаешь делать «в стиле конкретного издания» — и всё ломается.

Расскажу, как мы спорили, передумывали и к чему пришли.

https://habr.com/ru/articles/1002228//

Алгоритмы и Структуры данных
Цифровое Домостроительство: Дерево новой этики

Уважаемые духовные лидеры,

Я пишу вам как инженер, который всю жизнь создавал невидимые конструкции. Сегодня человечество возделывает новое поле — цифровое пространство. На нём растут системы, которые управляют нашей связью, памятью, финансами и критически важными решениями.

Но я вижу, что на этом поле всё чаще всходят болезненные растения: они быстро растут, выглядят мощно — и при этом истощают землю. Я обращаюсь к вам, чтобы описать Дерево новой этики, которое нам необходимо вырастить вместе — от Семени (The Seed) до Плодов.

https://habr.com/ru/articles/1002514/

Алгоритмы и Структуры данных
Магия цифр от ФНС: разбор красивых отчетов

18 февраля 2026 года глава ФНС Даниил Егоров провел видеоконференцию, где рассказал о «ходе адаптации бизнеса» к изменениям 2026 года: НДС для УСН, роли маркетплейсов, АвтоУСН, динамике выручки по ККТ, а также «поддержке» через рассрочки и отсрочки.

Не все озвученное главой ведомства показалось мне объективным. Учитывая, что прошлые 12 лет (до ноября 2025 года) я и сам проработал в ФНС. Поэтому я выделил шесть ключевых заявлений из этого выступления и решил разобрать каждое из них с позиции «а как оно в жизни?».

https://habr.com/ru/articles/1002492/

Алгоритмы и Структуры данных
Глубокое погружение в LSM-дерево

С увеличением спроса на операции, которые требуют больших объемов записи, традиционные базы данных, использующие B-дерево, становятся узким местом, поскольку обновление записей в b-дереве приводит к многочисленным беспорядочным операциям ввода-вывода (IO) и обновлению нескольких страниц на диске. B-дерево очень хорошо подходит для "тяжелых" операций чтения. Для операций с большими объемами записи у нас есть LSM-дерево.

https://habr.com/ru/companies/otus/articles/738312/

Алгоритмы и Структуры данных
Генерация лабиринтов с использованием алгоритма Recursive backtracker

В этой статье я расскажу о том как генерировать рандомные лабиринты, используя рекурсивный алгоритм с возвратом. Этот алгоритм также может использоваться для решения других задач, которые связанны с неявными графами: судоку, комбинаторика и другие головоломки (например, задача о n ферзях).

https://habr.com/ru/articles/1002460/

Алгоритмы и Структуры данных
Есть проблемы гораздо сложнее, чем NP-Complete

Люди часто сравнивают P и NP в таком духе, что проблемы P простые, а NP — сложные. Но это чрезмерное упрощение. На самом деле проблемы могут быть намного, намного сложнее, чем NP.

В этом смысле можно вспомнить интеллектуально-фантастический триллер Travelling Salesman (Коммивояжёр, 2012) о четырёх математиках, нанятых правительством США для решения самой сложной проблемы в истории информатики — равенства классов сложности P и NP (P versus NP problem). И им это удалось. Чиновник министерства обороны США предлагает за их алгоритм вознаграждение $10 млн. Но сами математики слишком хорошо понимают, какие разрушительные последствия принесёт в мир их открытие. Один из лучших фильмов про математику в истории кинематографа…

https://habr.com/ru/companies/timeweb/articles/740100/

Алгоритмы и Структуры данных
Как я построил Graph RAG систему с точностью 96.7% за 5 дней: от научных статей до production-ready пайплайна

Я реализовал Graph RAG систему, которая комбинирует 5 техник из свежих научных статей в единый пайплайн с декларативным reasoning-движком, полной провенансной трассировкой и типизированным API. Результат: 174/180 (96.7%) на билингвальном бенчмарке из 30 вопросов, оценённых в 6 режимах retrieval. Три режима достигли 100%. Ноль persistent failures.

https://habr.com/ru/articles/1003064/

Алгоритмы и Структуры данных
Забыть про Backprop: Как я собрал «Термодинамический Мозг» с фазой сна и митозом, который влезет в Arduino

Мы (человечество) очень хотим создать разум. Инопланетян мы пока не нашли, поэтому пытаемся собрать его сами из кремния и электричества. Но то, куда свернула индустрия сегодня, вызывает вопросы. Мы греем планету мегаваттами энергии, перемножая гигантские матрицы в дата-центрах, чтобы обучить LLM. Backpropagation и современный инференс - это непозволительно дорого и энергозатратно.

А что если вернуться к истокам? Что если интеллект — это не градиентный спуск, а кристаллизация связей под давлением информации?

В этой статье я расскажу о концепте Термодинамического Мозга. Это самоорганизующийся граф, который обучается в один проход O(1), непрерывно адаптируется к новым данным, спит по ночам, чтобы не сойти с ума, и настолько нетребователен к ресурсам, что его можно запустить хоть во вкладке браузера, хоть на Arduino.

https://habr.com/ru/articles/1003270/

Алгоритмы и Структуры данных
Множество Мандельброта. 32-бит TrueColor. 60 FPS. 80-бит long double. OpenMP. Суперсэмплинг 2x2 (4 прохода). И цвета

Я хочу сказать. Это самая нужная вещь во Вселенной. Самая глубокое. И я сейчас за всю жизнь наконец стал писать код и сделал. Довольно сложное. И самое прекрасное. Скачайте и посмотрите! Это экзешник, в ГитХаб.

https://habr.com/ru/articles/1001498/

Алгоритмы и Структуры данных
Забыть про Backprop: Как я собрал «Термодинамический Мозг» с фазой сна и митозом, который влезет в Arduino

Мы (человечество) очень хотим создать разум. Инопланетян мы пока не нашли, поэтому пытаемся собрать его сами из кремния и электричества. Но то, куда свернула индустрия сегодня, вызывает вопросы. Мы греем планету мегаваттами энергии, перемножая гигантские матрицы в дата-центрах, чтобы обучить LLM. Backpropagation и современный инференс - это непозволительно дорого и энергозатратно.

А что если вернуться к истокам? Что если интеллект — это не градиентный спуск, а кристаллизация связей под давлением информации?

В этой статье я расскажу о концепте Термодинамического Мозга. Это самоорганизующийся граф, который обучается в один проход O(1), непрерывно адаптируется к новым данным, спит по ночам, чтобы не сойти с ума, и настолько нетребователен к ресурсам, что его можно запустить хоть во вкладке браузера, хоть на Arduino.

https://habr.com/ru/articles/1003270/

Алгоритмы и Структуры данных
2
Множество Мандельброта. 32-бит TrueColor. 60 FPS. 80-бит long double. OpenMP. Суперсэмплинг 2x2 (4 прохода). И цвета

Я хочу сказать. Это самая нужная вещь во Вселенной. Самая глубокое. И я сейчас за всю жизнь наконец стал писать код и сделал. Довольно сложное. И самое прекрасное. Скачайте и посмотрите! Это экзешник, в ГитХаб.

github: Download Latest Version Windows And Source code

"Но если дело в инсульте, то понятно. Может, стоит небольшой дисклеймер добавлять в начало статей, чтобы ни у кого не было повода после первых же строк минусовать. Инсульт у меня. Поэтому ИИ."

https://habr.com/ru/articles/1001498/

Алгоритмы и Структуры данных
Сравнение двух налоговых служб: ФНС России и IRS США

12 лет я отработал в ФНС России: начинал в районной инспекции и завершал карьеру в Управлении ФНС по субъекту. И довольно долго жил с ощущением, что «у нас налоги мягче», предпринимателю проще дышать, а где-то «там» всё устроено жестче и формальнее.

Но всё оказалось не так однозначно, как казалось изнутри системы. Теперь, находясь по другую сторону баррикад, я решил сравнить две налоговые системы: российскую ФНС и американскую IRS, и в итоге оказалось, что налоговое бремя, у нас в России, не такое уж низкое как преподносят в СМИ - оно просто иначе спрятано и иначе распределено. В России человек чаще всего видит только НДФЛ, но значительная часть нагрузки живёт «над зарплатой» - в страховых взносах работодателя, а затем догоняет нас в потреблении через НДС, который уже встроен в цену.

В США все несколько иначе: у налогоплательщика в расчётном листке обычно сразу несколько строк удержаний, а сама система сильнее завязана на вычеты и кредиты, то есть на механизмы, которые меняют итог в зависимости от жизненной ситуации. При этом США это ещё и во многом география: помимо федерального уровня, многое зависит от штата и местных правил. В России же наоборот все жестко централизовано, и федеральный центр оттягивает одеяло на себя.

Так как тема очень большая, в этой статье я начну с фундамента - разберу архитектуру ФНС и IRS: как устроены уровни управления, где сосредоточены контроль и аналитика, а в следующей части сравню налоговую нагрузку двух стран на конкретных расчётах и покажу, где именно «прячется» налоговое бремя в России и США.

https://habr.com/ru/articles/1003610/

Алгоритмы и Структуры данных
SBER-MoVQGAN или новый эффективный Image Encoder для генеративных моделей

Вариационные автоэнкодеры в квантованном векторном пространстве стали довольно популярными в последние несколько лет и успешно применяются в широком спектре генеративных задач (Stable Diffusion, VQ Diffusion, VideoGPT и др.). VQVAE позволяет сжимать картинку в латентное пространство меньшей размерности, а затем восстанавливать это латентное представление изображения в RGB-состояние. Операции в латентном пространстве выполняются быстро, поэтому VQVAE получил широкое применение как в авторегрессионных мультимодальных архитектурах (DALLE, ruDALL-E, RUDOLPH), так и в диффузионных моделях (DALL-E 2, Kandinsky 2.1, Latent Diffusion). В первом случае вариационный автоэнкодер позволяет закодировать картинку в последовательность визуальных токенов, которые вместе с текстовыми токенами используются в обучении трансформера. Во втором случае VQVAE кодирует картинку в квантованное пространство малой размерности, позволяя выполнять диффузионный процесс в латентном пространстве (ввиду того, что диффузионный процесс является итеративным и скорость генерации напрямую зависит от числа шагов диффузии, вычислительная сложность каждого шага очень важна), который в сравнении с пиксельной диффузией выполняется быстрее и потребляет меньше памяти.

https://habr.com/ru/companies/sberbank/articles/740624/

Алгоритмы и Структуры данных
Об основах алгоритмов сортировки в иллюстрациях

Если вы не знакомы с информатикой или являетесь совсем новичком в программировании, перспектива глубокого погружения в алгоритмы может казаться не очень радужной. А кого-то, возможно, даже напугает. Но не стоит поджимать хвост, мы пройдем через это вместе и выйдем с большими знаниями, как настоящие эксперты!

Давайте начнем с азов. Что такое алгоритм? Мы собираемся многое о них узнать, так что должны для начала знать определение, правильно?

Алгоритм — это набор инструкций для машины, что и как ей делать. Другими словами, это руководство к вашему коду. И все. Наиболее часто используемым подмножеством множества алгоритмов являются алгоритмы сортировки, то есть инструкции, как программа или компьютер должны подойти к организации данных.

https://proglib.io/p/sorting-guide

Алгоритмы и Структуры данных
Применяем TLA+ на практике

Привет, Хабр! Меня зовут Сергей, я работают в компании InfoWatch разработчиком на продукте ARMA Стена (NGFW). Подробнее о том, что такое ARMA Стена, можно прочитать тут.

В этой статье я хочу поделиться опытом применения метода формальной верификации в решении практической бизнес-задачи.

Сразу оговорюсь, что в статье используется TLA+, без введения в инструмент, чтобы не увеличивать объём статьи. Подробнее про инструмент вы можете почитать на сайте создателя, тут и тут. Необходимые объяснения даются по ходу изложения.

Статья состоит из двух частей:

1. Что такое формальная верификация и где она применятся
2. Решение бизнес-задачи в NGFW

https://habr.com/ru/companies/infowatch/articles/1003382/

Алгоритмы и Структуры данных
👍1
Повторяем профиль Телеграмма, используя Metaballs ит

Однажды я заметил, что на iOS с Dynamic Island у Telegram очень интересный эффект при сворачивании аватара в профиле. Если зайти в свой профиль и медленно скроллить вверх, аватар буквально втекает в Dynamic Island. Как мобильный разработчик, я заинтересовался, как это сделать.

Основные проблемы появились, когда я понял, что делать это нужно через шейдеры, которые я не писал, буду честен. И сам алгоритм метаболов, который вроде понятен, но… Как будто есть вопросы.

Я разобрался, как это сделать — и понял, что скорее всего не одинок. Тем, кто задавался вопросом «как сделать как у Telegram» и столкнулся с теми же вопросами по шейдерам и алгоритму metaballs — эта статья для вас.

https://habr.com/ru/articles/1004752/

Алгоритмы и Структуры данных
Как устроено распределение памяти

Один из общих для всех программ на вашем компьютере аспектов — это потребность в памяти. Прежде чем запуститься, программы должны быть загружены с жёсткого диска в память. При работе программ подавляющее большинство их действий заключается в загрузке значений из памяти, выполнении вычислений с ними, а затем сохранении результата обратно в память.

В этом посте я познакомлю вас с основами распределения памяти (memory allocation). Распределители памяти существуют, потому что иметь доступную память недостаточно, необходимо ещё и эффективно её использовать. Мы наглядно изучим, как работают простые распределители. Мы рассмотрим некоторые из задач, которые им необходимо решать, а также некоторые из методик, которыми они их решают. Прочитав этот пост, вы узнаете всё, что необходимо для написания собственного распределителя.

https://habr.com/ru/companies/ruvds/articles/740466/

Алгоритмы и Структуры данных
Создание идеального лабиринта с помощью упрощённого алгоритма Прима

Лабиринты использовались в видеоиграх с момента их появления. Первой видеоигрой с процедурно генерируемым лабиринтом была Beneath Apple Manor, выпущенная в 1978 году. Лабиринт в ней генерировался методом деления на комнаты и коридоры, из-за этого лабиринт часто выглядел однообразным и предсказуемым, что портило впечатление от игры. Для того, чтобы лабиринт выглядел естественнее разработчики стали использовать различные алгоритмы на графах. В этой статье мы рассмотрим реализации генерации идеального лабиринта с помощью алгоритма Прима.

https://habr.com/ru/articles/1004900/

Алгоритмы и Структуры данных
Дообучение модели машинного перевода

Разработчики машинного перевода часто рассказывают об использовании предварительно обученных моделей. Захотелось дообучить такую модель самому, но пришлось приложить усилия, чтобы найти понятный пример. Поэтому после того, как код заработал, решил поделиться скриптами.

https://habr.com/ru/articles/738086/

Алгоритмы и Структуры данных