Всё про Алгоритмы и Структуры данных
7.77K subscribers
344 photos
37 videos
5 files
3.15K links
Мы не претендуем на оригинальность контента, мы лишь собираем материал из открытых источников.

Ссылка: @Portal_v_IT

Сотрудничество, авторские права: @oleginc, @tatiana_inc

Канал на бирже: https://telega.in/c/structuredata
Download Telegram
Методология: Поиск значений Cheat Engine

Эта статья ориентирована на начинающих пользователей Cheat Engine. Здесь собраны базовые рекомендации, методологические подходы и разборы типичных сценариев, с которыми можно столкнуться при попытке найти нужный адрес.

https://habr.com/ru/articles/1000892/

Алгоритмы и Структуры данных
Цена риска: как ML-модели решают, какой процент по кредиту вы получите

Почему два человека, у которых один и тот же заработок и кредитная история, могут оказаться обязаны платить совершенно разные проценты по одному и тому же займу? В этой статье мы посмотрим, как устроены банковские системы определения ставок, рассмотрим настоящие примеры дискриминации от Ally Bank и Test-Achats, и продемонстрируем, как деревья решений и градиентный бустинг используются для оценки того, сможете ли вы расплатиться – и как эти методы могут быть неверными.

https://habr.com/ru/articles/1001192/

Алгоритмы и Структуры данных
Wikontic: строим графы из текстов, используя онтологию и LLM

Привет, Хабр! Это Алла, я работаю исследователем в команде «Модели с памятью» Лаборатории когнитивных систем искусственного интеллекта Института AIRI и занимаюсь исследованиями на стыке графов знаний и языковых моделей. Ранее я уже писала на Хабре статью про построение графов знаний из текстов по мотивам одной из наших публикаций.

Мы активно продолжаем работать дальше и создали Wikontic — полноценный пайплайн для этой задачи. Недавно мы представляли его на интерактивной демо‑сессии на AAAI 2026 в Сингапуре — про это несколько дней назад вышел хабр от моего коллеги Айдара. Здесь я расскажу подробнее о том, как устроен новый пайплайн, и какие идеи пришли к нам в голову при его создании.

https://habr.com/ru/companies/airi/articles/1000720/

Алгоритмы и Структуры данных
Концепт «Больцмановский Мозг» на квантово— волновой логике (QWL). Нейросеть. Численное моделирование

Больцмановский Мозг (БМ) — это довольно философская идея, с корнями в теории вероятности, которая говорит о том, что в случайном, хаотичной вселенной вполне возможно, что в какой — то момент могут возникнуть целые осознающие структуры (например, мозг), хотя бы для краткого момента времени, просто из-за случайных колебаний атомов и молекул.
БМ — это гипотетический процесс, предполагающий высокую степень самоорганизации, где создается не просто случайный «мозг», а самосознание, возникшее из хаоса.

Квантовый интеллект (QAI) репродуцирует БМ на QWL через моделирование осциляторов — волновых взаимодействий.

https://habr.com/ru/articles/1001666/

Алгоритмы и Структуры данных
Лимит доверия: как ИИ решает, сколько денег вам можно дать (и почему это часто несправедливо)

Что влияет на размер вашего кредитного лимита? И почему банк может вдруг его уменьшить, даже если вы всегда вовремя вносите платежи? В предыдущей статье мы выяснили, как банки применяют модели машинного обучения для определения вашей кредитоспособности; в этой статье мы рассмотрим, как банки задействуют поведенческую экономику и обучение с подкреплением для контроля над вашими долгом, объясним тактику “low-and-grow”, и попутно разберем скандалы вокруг Synchrony Bank и Apple Card.

https://habr.com/ru/articles/1001676/

Алгоритмы и Структуры данных
Книга «Game++. Устройство и оптимизация игрового движка»

С радостью и чувством выполненного долга издательство «БХВ» представляет вам одну из флагманских новинок наступившего года. Мы получили из типографии книгу «Game++. Устройство и оптимизация игрового движка».

Как известно, высококлассные AAA-игры — это та территория, на которой сходятся проверенные и экспериментальные алгоритмы, высокая производительность, графика на уровне произведений искусства и проектирование распределённых систем. Главный язык программирования для аса в разработке игр — это C++.

Поскольку сложно объять необъятное, да и участие в разработке The Sims и Age of Empires смотрелось бы в резюме как опыт участия в гонках «Формулы-1», автор, самоотверженно поработав, создал фундаментальную книгу о наилучших практиках высокопроизводительного программирования как в элитном продакшне, так и на очень ограниченных ресурсах. Для автора игры — это полигон, на котором он набрал свой уникальный профессиональный опыт, а C++ — это инструмент, при помощи которого решается любая задача. Отдельно отметим, что в книге уделено внимание не только различным структурам данных и их реализациям, но и стандартной библиотеке шаблонов (STL); этот материал серьёзно повысит профессиональный уровень любого C++-разработчика.

https://habr.com/ru/companies/bhv_publishing/articles/1001720/

Алгоритмы и Структуры данных
Как в Netflix масштабируют постобучение LLM

Благодаря предобучению, большие языковые модели (LLM) приобретают широкие лингвистические способности и общий «кругозор» о мире. Но постобучение — не менее важный этап, на котором они как раз усваивают конкретные намерения человека, ограничения, присущие предметной области, а также требования к надёжности, предъявляемые в продакшне. В Netflix исследовали, как именно LLM могут открыть новые грани рекомендаций, персонализации и поиска. Для этого в Netflix попробовали адаптировать универсальные обобщённые модели к имеющимся условиям так, чтобы они лучше отражали содержание каталога фильмов и нюансы истории взаимодействия пользователей с сайтом. В масштабе такой компании как Netflix постобучение быстро превращается как в инженерную проблему, так и в проблему моделирования: приходится выстраивать сложные конвейеры данных и оперировать ими, координировать распределённое состояние в масштабах многоузловых кластеров GPU и оркестровать потоки задач, в рамках которых перемежаются обучение и логический вывод. В этой статье описаны архитектура и инженерная философия применяемого в Netflix фреймворка постобучения, который был разработан командой по платформе ИИ с целью скрыть сложность инфраструктуры — так, чтобы исследователи и разработчики моделей могли сосредоточиться на внедрении инноваций, а не на латании распределённых систем.

https://habr.com/ru/companies/piter/articles/1001790/

Алгоритмы и Структуры данных
Цена ошибки: почему антифрод-системы блокируют ваши покупки, но пропускают мошенников на миллиарды

Почему ваша банковская карта может быть заблокирована, когда вы покупаете кофе в другом городе, хотя мошенники умудряются отмывать миллиарды? В этой статье мы подробно рассмотрим, как работают системы защиты от мошенничества, объясним, что такое компромисс между прецизионностью (точностью) и полнотой на понятном примере, проанализируем потерю $1.8 миллиарда у TD Bank и поговорим о том, как банки и киберзлоумышленники соревнуются, используя Adversarial AI (враждебный искусственный интеллект).

https://habr.com/ru/articles/1002092/

Алгоритмы и Структуры данных
Как ФНС «нашла» 64 тысячи «богатых безработных» и собрала с них 9 млрд рублей

Не могу пройти мимо и не разобрать очередную громкую новость про налоги, которую сегодня опубликовал один популярный телеграм-канал. А звучит она примерно так:

Налоговая выявила 64 тысячи безработных москвичей с роскошным образом жизни без официального дохода - им доначислили налоги, и бюджет получил более 9 млрд рублей. Теперь подобные проверки пройдут по всей России»

Как по мне, так это больше похоже на сатирический вброс от ИА «Панорама». Но поискав немного в интернете, оказалось, что нет, и эта новость еще вчера оказалась в интернет пространстве, и опубликовали ее многие известные новостные издания.

https://habr.com/ru/articles/1002182/

Алгоритмы и Структуры данных
«Я всё сломал за выходные»: как мы учим LLM писать в стиле конкретного СМИ

Привет, я Лена, это мой первый пост здесь, и он про техническую задачу, с которой мы столкнулись: как заставить LLM писать текст так, чтобы его нельзя было отличить от написанного конкретной редакцией. Не «хороший текст», не «грамотный текст», а такой, который звучит как этот конкретный городской портал или этот Telegram-канал.

Мы строим AI-систему для автоматизации рерайта новостей в региональных СМИ. Суть простая: система собирает новости из источников, проверяет факты и пишет рерайт в стиле конкретного издания. Тем временем журналисты занимаются своей нормальной работой, а не переписыванием чужих текстов. Звучит понятно. А потом начинаешь делать «в стиле конкретного издания» — и всё ломается.

Расскажу, как мы спорили, передумывали и к чему пришли.

https://habr.com/ru/articles/1002228//

Алгоритмы и Структуры данных
Цифровое Домостроительство: Дерево новой этики

Уважаемые духовные лидеры,

Я пишу вам как инженер, который всю жизнь создавал невидимые конструкции. Сегодня человечество возделывает новое поле — цифровое пространство. На нём растут системы, которые управляют нашей связью, памятью, финансами и критически важными решениями.

Но я вижу, что на этом поле всё чаще всходят болезненные растения: они быстро растут, выглядят мощно — и при этом истощают землю. Я обращаюсь к вам, чтобы описать Дерево новой этики, которое нам необходимо вырастить вместе — от Семени (The Seed) до Плодов.

https://habr.com/ru/articles/1002514/

Алгоритмы и Структуры данных
Магия цифр от ФНС: разбор красивых отчетов

18 февраля 2026 года глава ФНС Даниил Егоров провел видеоконференцию, где рассказал о «ходе адаптации бизнеса» к изменениям 2026 года: НДС для УСН, роли маркетплейсов, АвтоУСН, динамике выручки по ККТ, а также «поддержке» через рассрочки и отсрочки.

Не все озвученное главой ведомства показалось мне объективным. Учитывая, что прошлые 12 лет (до ноября 2025 года) я и сам проработал в ФНС. Поэтому я выделил шесть ключевых заявлений из этого выступления и решил разобрать каждое из них с позиции «а как оно в жизни?».

https://habr.com/ru/articles/1002492/

Алгоритмы и Структуры данных
Глубокое погружение в LSM-дерево

С увеличением спроса на операции, которые требуют больших объемов записи, традиционные базы данных, использующие B-дерево, становятся узким местом, поскольку обновление записей в b-дереве приводит к многочисленным беспорядочным операциям ввода-вывода (IO) и обновлению нескольких страниц на диске. B-дерево очень хорошо подходит для "тяжелых" операций чтения. Для операций с большими объемами записи у нас есть LSM-дерево.

https://habr.com/ru/companies/otus/articles/738312/

Алгоритмы и Структуры данных
Генерация лабиринтов с использованием алгоритма Recursive backtracker

В этой статье я расскажу о том как генерировать рандомные лабиринты, используя рекурсивный алгоритм с возвратом. Этот алгоритм также может использоваться для решения других задач, которые связанны с неявными графами: судоку, комбинаторика и другие головоломки (например, задача о n ферзях).

https://habr.com/ru/articles/1002460/

Алгоритмы и Структуры данных
Есть проблемы гораздо сложнее, чем NP-Complete

Люди часто сравнивают P и NP в таком духе, что проблемы P простые, а NP — сложные. Но это чрезмерное упрощение. На самом деле проблемы могут быть намного, намного сложнее, чем NP.

В этом смысле можно вспомнить интеллектуально-фантастический триллер Travelling Salesman (Коммивояжёр, 2012) о четырёх математиках, нанятых правительством США для решения самой сложной проблемы в истории информатики — равенства классов сложности P и NP (P versus NP problem). И им это удалось. Чиновник министерства обороны США предлагает за их алгоритм вознаграждение $10 млн. Но сами математики слишком хорошо понимают, какие разрушительные последствия принесёт в мир их открытие. Один из лучших фильмов про математику в истории кинематографа…

https://habr.com/ru/companies/timeweb/articles/740100/

Алгоритмы и Структуры данных
Как я построил Graph RAG систему с точностью 96.7% за 5 дней: от научных статей до production-ready пайплайна

Я реализовал Graph RAG систему, которая комбинирует 5 техник из свежих научных статей в единый пайплайн с декларативным reasoning-движком, полной провенансной трассировкой и типизированным API. Результат: 174/180 (96.7%) на билингвальном бенчмарке из 30 вопросов, оценённых в 6 режимах retrieval. Три режима достигли 100%. Ноль persistent failures.

https://habr.com/ru/articles/1003064/

Алгоритмы и Структуры данных
Забыть про Backprop: Как я собрал «Термодинамический Мозг» с фазой сна и митозом, который влезет в Arduino

Мы (человечество) очень хотим создать разум. Инопланетян мы пока не нашли, поэтому пытаемся собрать его сами из кремния и электричества. Но то, куда свернула индустрия сегодня, вызывает вопросы. Мы греем планету мегаваттами энергии, перемножая гигантские матрицы в дата-центрах, чтобы обучить LLM. Backpropagation и современный инференс - это непозволительно дорого и энергозатратно.

А что если вернуться к истокам? Что если интеллект — это не градиентный спуск, а кристаллизация связей под давлением информации?

В этой статье я расскажу о концепте Термодинамического Мозга. Это самоорганизующийся граф, который обучается в один проход O(1), непрерывно адаптируется к новым данным, спит по ночам, чтобы не сойти с ума, и настолько нетребователен к ресурсам, что его можно запустить хоть во вкладке браузера, хоть на Arduino.

https://habr.com/ru/articles/1003270/

Алгоритмы и Структуры данных
Множество Мандельброта. 32-бит TrueColor. 60 FPS. 80-бит long double. OpenMP. Суперсэмплинг 2x2 (4 прохода). И цвета

Я хочу сказать. Это самая нужная вещь во Вселенной. Самая глубокое. И я сейчас за всю жизнь наконец стал писать код и сделал. Довольно сложное. И самое прекрасное. Скачайте и посмотрите! Это экзешник, в ГитХаб.

https://habr.com/ru/articles/1001498/

Алгоритмы и Структуры данных
Забыть про Backprop: Как я собрал «Термодинамический Мозг» с фазой сна и митозом, который влезет в Arduino

Мы (человечество) очень хотим создать разум. Инопланетян мы пока не нашли, поэтому пытаемся собрать его сами из кремния и электричества. Но то, куда свернула индустрия сегодня, вызывает вопросы. Мы греем планету мегаваттами энергии, перемножая гигантские матрицы в дата-центрах, чтобы обучить LLM. Backpropagation и современный инференс - это непозволительно дорого и энергозатратно.

А что если вернуться к истокам? Что если интеллект — это не градиентный спуск, а кристаллизация связей под давлением информации?

В этой статье я расскажу о концепте Термодинамического Мозга. Это самоорганизующийся граф, который обучается в один проход O(1), непрерывно адаптируется к новым данным, спит по ночам, чтобы не сойти с ума, и настолько нетребователен к ресурсам, что его можно запустить хоть во вкладке браузера, хоть на Arduino.

https://habr.com/ru/articles/1003270/

Алгоритмы и Структуры данных
2
Множество Мандельброта. 32-бит TrueColor. 60 FPS. 80-бит long double. OpenMP. Суперсэмплинг 2x2 (4 прохода). И цвета

Я хочу сказать. Это самая нужная вещь во Вселенной. Самая глубокое. И я сейчас за всю жизнь наконец стал писать код и сделал. Довольно сложное. И самое прекрасное. Скачайте и посмотрите! Это экзешник, в ГитХаб.

github: Download Latest Version Windows And Source code

"Но если дело в инсульте, то понятно. Может, стоит небольшой дисклеймер добавлять в начало статей, чтобы ни у кого не было повода после первых же строк минусовать. Инсульт у меня. Поэтому ИИ."

https://habr.com/ru/articles/1001498/

Алгоритмы и Структуры данных
Сравнение двух налоговых служб: ФНС России и IRS США

12 лет я отработал в ФНС России: начинал в районной инспекции и завершал карьеру в Управлении ФНС по субъекту. И довольно долго жил с ощущением, что «у нас налоги мягче», предпринимателю проще дышать, а где-то «там» всё устроено жестче и формальнее.

Но всё оказалось не так однозначно, как казалось изнутри системы. Теперь, находясь по другую сторону баррикад, я решил сравнить две налоговые системы: российскую ФНС и американскую IRS, и в итоге оказалось, что налоговое бремя, у нас в России, не такое уж низкое как преподносят в СМИ - оно просто иначе спрятано и иначе распределено. В России человек чаще всего видит только НДФЛ, но значительная часть нагрузки живёт «над зарплатой» - в страховых взносах работодателя, а затем догоняет нас в потреблении через НДС, который уже встроен в цену.

В США все несколько иначе: у налогоплательщика в расчётном листке обычно сразу несколько строк удержаний, а сама система сильнее завязана на вычеты и кредиты, то есть на механизмы, которые меняют итог в зависимости от жизненной ситуации. При этом США это ещё и во многом география: помимо федерального уровня, многое зависит от штата и местных правил. В России же наоборот все жестко централизовано, и федеральный центр оттягивает одеяло на себя.

Так как тема очень большая, в этой статье я начну с фундамента - разберу архитектуру ФНС и IRS: как устроены уровни управления, где сосредоточены контроль и аналитика, а в следующей части сравню налоговую нагрузку двух стран на конкретных расчётах и покажу, где именно «прячется» налоговое бремя в России и США.

https://habr.com/ru/articles/1003610/

Алгоритмы и Структуры данных