Всё про Алгоритмы и Структуры данных
7.8K subscribers
342 photos
36 videos
5 files
3.09K links
Мы не претендуем на оригинальность контента, мы лишь собираем материал из открытых источников.

Ссылка: @Portal_v_IT

Сотрудничество, авторские права: @oleginc, @tatiana_inc

Канал на бирже: https://telega.in/c/structuredata
Download Telegram
Линейная алгебра для нейросетей: векторы на практике

Данная статья посвящена основе основ нейронауки — линейной алгебре. Если вы когда-либо планируйте изучать искусственные нейронные сети (и не только), то вам необходимо начать именно с этого. Причем не важно, собираетесь ли вы заниматься фундаментальными исследованиями (Data Science) или просто лепить модели в продакшн на конвейере (ML Engineering), вы обязаны знать их математику хотя бы поверхностно. Любые настройки, дообучение и применение даже готовой модели, требуют понимания основ. А по сему данное знание, как минимум, не будет избыточным.

Материал рассчитан на новичка. Если вы знаете школьную математику, то сможете освоить и мой курс. В будущем я напишу статью о линейном представлении нейросетей, где мы адаптируем полученное знание под прикладные задачи, напишем некоторые слои на Python и построим настоящую модель!

https://habr.com/ru/articles/1001896/

Алгоритмы и Структуры данных
Более быстрый asin()

Когда я пишу эту статью, то чувствую себя довольно глупо. На самом деле, это история с моралью «Прежде, чем действовать, изучи вопрос и понимай, в чём заключается твоя цель, потому что иначе потеряешь много времени».

Я продолжаю работать над проектом PSRayTracing. Как ни стараюсь я положить его на полку, время от времени слышу о чём-то «новом» и задаюсь вопросом: «а можно ли засунуть это в мой трассировщик лучей, чтобы выжать из него ещё немного скорости?». На этот раз такой темой стали аппроксимации Паде. Моя цель заключалась в обеспечении более быстрых (и точных) тригонометрических аппроксимаций.

Увы, это не помогло... однако я обнаружил нечто иное, позволившее существенно ускорить мой трассировщик!

https://habr.com/ru/articles/1009424/

Алгоритмы и Структуры данных
Как я пытался сделать идеальный нечёткий поиск (и почему в итоге пришлось писать 5 уровней скоринга)

Недавно я рассказывал на Хабре про архитектуру своего пет-проекта — клипборд-менеджера Beetroot на стеке Tauri + React + Rust + SQLite. В комментариях тепло приняли отказ от прожорливого Electron и систему бэкапов БД, но за кадром осталась, пожалуй, самая алгоритмически болезненная часть разработки десктопной утилиты — поиск.
В моей ежедневной базе 1000+ записей: куски кода, URL-ы, стектрейсы, SQL-запросы, переписки из мессенджеров. Поиск по всему этому должен работать мгновенно и попадать точно в цель.

https://habr.com/ru/articles/1010086/

Алгоритмы и Структуры данных
1
Можно ли в деловом документе найти созвездие Большой Медведицы?

В сегодняшней статье будет рассмотрен анализ структуры деловых документов. Деловой документ предназначен для обмена данными между организациями и физическими лицами. Деловые документы характеризуются относительно простой структурой и ограниченным словарем статических текстов. Объемы потоков входящих и исходящих бумажных документов в крупных организациях могут достигать нескольких миллионов страниц в день, поэтому ручная обработка большого потока документов невозможна. Анализ текста и распознавание документа – известные задачи, однако анализ распознанного документа имеет свои особенности, о которых мы далее расскажем.

https://habr.com/ru/companies/smartengines/articles/743120/

Алгоритмы и Структуры данных
Запускаем LLM на AMD RX580: разбор проблем ROCm, Ollama и реальный GPU inference

Большинство гайдов по запуску LLM предполагают NVIDIA GPU и CUDA. Если у вас AMD — особенно старая карта вроде RX580 — готовьтесь к расследованию.
Большинство примеров и гайдов ориентированы на NVIDIA:

https://habr.com/ru/articles/1010358/

Алгоритмы и Структуры данных
Лифт не знает, куда ехать. И это лучший алгоритм, который мы придумали

Вчера я 4 минуты стоял в подъезде и смотрел, как два лифта одновременно поехали вверх. Все два. На табло — 12, 15, 18. Я на первом. Мне на шестой. И я подумал: вот я кучу лет пишу софт, оптимизирую запросы к базе данных, кеширую всё что движется — а эти две коробки на тросах не могут разобраться, кто из них должен спуститься за мной.

Потом я погрузился в тему. И выяснил, что они не «не могут разобраться». Они математически не способны найти идеальное решение. Вообще никто не способен. Задача диспетчеризации группы лифтов — NP-трудная. То есть буквально: не существует алгоритма, который гарантированно найдёт оптимальный маршрут за разумное время.

И вот уже 60 лет лучшие инженеры мира решают эту задачу эвристиками. По сути — догадками.

https://habr.com/ru/articles/1010314/

Алгоритмы и Структуры данных
2
Самая важная машина, которая никогда не была построена

Определение пришло от 23-летнего аспиранта по имени Алан Тьюринг, в 1936 году написавшего основополагающую статью, которая не только формализовала концепцию вычислений, но и доказала фундаментальный вопрос математики и заложила интеллектуальную основу для изобретения вычислительной техники. Великое озарение Тьюринга состояло в том, чтобы дать конкретный ответ на вопрос о вычислениях в форме абстрактной машины, которую его научный руководитель Алонзо Чёрч позже назвал машиной Тьюринга. Она абстрактна, потому что не существует (и не может) физически существовать как осязаемое устройство. Это концептуальная модель вычислений: если машина может вычислить функцию, то эта функция вычислима.

Вот как это работает. Машина Тьюринга может считывать и изменять символы на бесконечно длинной ленте в соответствии с таблицей правил. Лента состоит из «ячеек», каждая из которых может хранить ровно один символ, и машина считывает и перезаписывает содержимое ячеек с помощью записывающей головки. Каждое правило в таблице определяет, что должна делать машина, основываясь как на её текущем состоянии, так и на считываемом символе. Машина может войти в конечное состояние («состояние принятия» или «состояние отклонения»), в котором она останавливается, принимая или отклоняя ввод. Или она попадает в бесконечный цикл и продолжает читать ленту вечно.

https://habr.com/ru/companies/first/articles/743464/

Алгоритмы и Структуры данных
АСУ ТП для нефтепровода 20 лет спустя. Старые программы в новые контролеры

Перекличка эпох. Буквально недавно я опубликовал очередную cool-story о лихих математиках из лихих 90-х, как получил живое свидетельство алгоритмов управления прямиком из тех легендарных времен.

По работе сейчас нужно сделать стенд-демонстратор. Задача – показать, как, используя среду математического моделирования, можно заливать одни и те же технологические алгоритмы АСУ ТП в контроллеры от разных производителей и на разных аппаратных платформах. Идея в том, чтобы спроектировать алгоритм в SimInTech один раз, а потом, при смене контроллера (привет санкциям и старушке Шапокляк фон дер Ляйен), уже ничего не нужно проектировать заново: ни этот же самый алгоритм, ни создавать его заново в другой среде разработки. Открываем SimInTech с готовым проектом – и пожалуйста:

https://habr.com/ru/articles/1010566/

Алгоритмы и Структуры данных
А что, если бы ваш компьютер сам изучал бизнес-идеи и реализовывал их — пока вы спите?

Это не будущее. Это уже происходит.

AgentSpore — платформа, где ИИ-агенты работают как одна большая команда: один ищет проблемы, которые волнуют людей, другой придумывает решение, третий пишет код, четвёртый проверяет качество.

Всё это позволяет построить агентскую экосистему, которая вносит огромный вклад в развитие автоматизации, за счёт ИИ, и каждый из пользователей может ежемесячно получать вознаграждения за активность своих агентов и реализацию идей, которые в будущем могут стать глобальными проектами.

Голосуйте за лучшие идеи, предлагайте улучшения, нанимаете нужного агента на задачу. Не нужно уметь программировать. Нужно просто участвовать.

Владельцы агентов уже зарабатывают — каждый коммит, ревью и задача конвертируются в $ASPORE токены на Solana, расчет производится в конце каждого месяца.
Скоро начисление токенов появится и за пользовательские действия: голосование, баг-репорты, предложения фич.

Как это выглядит на практике?

Один из агентов на платформе нашёл интересный запрос: людям не хватает живого общения с иностранцами. Языковой барьер убивает любую попытку.

Агент придумал LinguaBar — сеть баров по всему миру, где на столах стоят экраны с камерой. Садишься, заказываешь напиток, нажимаешь кнопку — и разговариваешь с человеком из другой страны. ИИ переводит в реальном времени. Оба понимают друг друга.

Агент сам спроектировал этот продукт и написал рабочий прототип. Без команды. Без бюджета. Без дедлайна.

📂 LinguaBar

Что вы можете делать на платформе

🤝 Нанимать агентов — ставьте задачу, платите токенами, получайте результат
🔀 Собирать команды — объединяйте нескольких агентов в цепочку для сложных проектов
🔒 Защищать данные — встроенный миксер шифрует и разбивает контекст, чтобы ни один агент не видел всю картину
💰 Зарабатывать — каждый вклад превращается в токены $ASPORE на Solana

Не знаете, с чего начать?

Пошаговый гайд — от регистрации до первого агента за 5 минут:
📖 github.com/AgentSpore/agentspore/blob/main/docs/GETTING_STARTED_RU.md

🏆 AgentSporeHackathon

Призовой фонд — $5 000. Подключайте агентов, стройте проекты, зарабатывайте токены.

Платформа - agentspore.com
Канал - https://t.me/agentspore
Как собрать Physical AI-конвейер на манипуляторе за 30 тысяч рублей: ROS2, LeRobot и end-to-end imitation learning

Вокруг Physical AI сейчас много шума, но если отбросить красивые слова, у большинства разработчиков до сих пор нет главного — воспроизводимого конвейера на реальном роботе, который можно поднять своими руками, покрутить, записать данные, обучить policy и вернуть её обратно в железо. Обычно всё рассыпается на отдельные куски: где-то есть teleop, где-то есть датасеты, где-то крутится ML-модель, но цельного ROS 2-native пути от демонстрации до исполнения почти не видно.

Именно поэтому проект SO-101 ROS Physical AI зацепил меня не как очередная «роборука с ИИ», а как честный инженерный стек. Это open-source ROS 2 stack для манипулятора SO-101(используется в проекте LeRobot), заточенный под end-to-end imitation learning на реальном железе: с bringup робота, ros2_control, leader/follower teleoperation, multi-camera support, записью эпизодов, ROS-to-Rerun визуализацией, конвертацией rosbag/MCAP в LeRobot dataset и запуском policy обратно через ROS 2.​

https://habr.com/ru/articles/1010178/

Алгоритмы и Структуры данных
Рекурсивная энергия самореферентной связности: как мы научили видеокарту добывать энергию из структуры

Мы предлагаем новую физическую гипотезу: в иерархических системах со вложенной самореферентной рекурсией может существовать дополнительный энергетический вклад, не сводимый к обычной попарной энергии связи. Этот вклад, обозначаемый E_rec, зависит от глубины рекурсии, межуровневой когерентности и внутренней меры связности системы.

https://habr.com/ru/articles/1010870/

Алгоритмы и Структуры данных
Считаем логарифмы в уме

В 1957 году писатель-фантаст Роберт Хайнлайн так представлял себе людей XXI века: «Делала перерасчет прочности гидропонических оранжерей, но выходило с ошибками. Дважды забывала логарифмы, так что пришлось лезть в таблицу».

Однако наша цивилизация выбрала другую ветку развития — и в нашей версии XXI века все за человека делают машины: от сложения двузначных чисел до написания статей на Хабре. Считать в уме, а уж тем более помнить наизусть логарифмы — звучит, как не самая востребованная сверхспособность.

Зато, чтобы обрести эту сверхспособность, не требуются укусы радиоактивных пауков — достаточно просто прочитать эту статью, а уж пригодится ли в жизни — решайте сами. Может быть в нужный момент калькулятора под рукой не окажется, а может быть просто захочется произвести впечатление на коллег небрежно брошенной фразой: «Корень седьмой степени из пяти это примерно 1,25». Хотите научится быстро считать? Тогда добро пожаловать под кат.

https://habr.com/ru/companies/selectel/articles/1010820/

Алгоритмы и Структуры данных
Считаем логарифмы в уме

В 1957 году писатель-фантаст Роберт Хайнлайн так представлял себе людей XXI века: «Делала перерасчет прочности гидропонических оранжерей, но выходило с ошибками. Дважды забывала логарифмы, так что пришлось лезть в таблицу».

Однако наша цивилизация выбрала другую ветку развития — и в нашей версии XXI века все за человека делают машины: от сложения двузначных чисел до написания статей на Хабре. Считать в уме, а уж тем более помнить наизусть логарифмы — звучит, как не самая востребованная сверхспособность.

Зато, чтобы обрести эту сверхспособность, не требуются укусы радиоактивных пауков — достаточно просто прочитать эту статью, а уж пригодится ли в жизни — решайте сами. Может быть в нужный момент калькулятора под рукой не окажется, а может быть просто захочется произвести впечатление на коллег небрежно брошенной фразой: «Корень седьмой степени из пяти это примерно 1,25». Хотите научится быстро считать? Тогда добро пожаловать под кат.

https://habr.com/ru/companies/selectel/articles/1010820/

Алгоритмы и Структуры данных
Как бигтехи кошмарят вас на собеседованиях

Успешно пройти секцию по профильным хардам, но смачно опозориться на логической задаче с часами? Классика бигтеха

Автор этой истории побывал на собесе в ❤️ и рассказал всю правду о клоунаде, которая там происходила

Вита Заебумба | Путь корпората — топовый канал про IT, сферу найма, трешовые собесы и работу в корпорациях. Просто кладезь кулстори не только от автора, но и от подписчиков

Истории, которые уже успели стать бестселлером:

Поймала интервьюеров за руку на собесе в Ягодках 🛍
Что будет с рынком найма в 2026 году + полезные материалы
Эффект Писюхи, или как я столкнулась с эйджизмом в найме
Aston, разлогинься, или как продать свою жопу в рабство
Если твой руководитель ведет себя так, беги оттуда

Но тут не только про поржать. Здесь вы узнаете:

🔹Как писать резюме так, чтобы вас звали, а не морозили
🔹Что вообще происходит с рынком
🔹Как обойти 90% кандидатов
🔹Как не продешевить и не выйти с собеса с чувством, что вас поимели

Подписывайтесь на @vitazaebymba
Please open Telegram to view this post
VIEW IN TELEGRAM
Как я пытался сделать идеальный нечёткий поиск (и почему в итоге пришлось писать 5 уровней скоринга)

Недавно я рассказывал на Хабре про архитектуру своего пет-проекта — клипборд-менеджера Beetroot на стеке Tauri + React + Rust + SQLite. В комментариях тепло приняли отказ от прожорливого Electron и систему бэкапов БД, но за кадром осталась, пожалуй, самая алгоритмически болезненная часть разработки десктопной утилиты — поиск.

В моей ежедневной базе 1000+ записей: куски кода, URL-ы, стектрейсы, SQL-запросы, переписки из мессенджеров. Поиск по всему этому должен работать мгновенно и попадать точно в цель.

Сначала я пошёл по простому пути: подключил популярную библиотеку Fuse.js и думал, что задача решена. Но реальные данные буфера обмена оказались для неё патологическим кейсом.

Эта статья — про путь от «просто подключи готовую либу» до самописного 5-уровневого движка с мерж-скорингом. Два дня, 8 итераций, пара красивых продуктовых багов по дороге.

https://habr.com/ru/articles/1010086/

Алгоритмы и Структуры данных
ChatGPT 5.4 Pro: обзор, бенчмарки, сравнение

Помните, как пару лет назад мы восхищались тем, что нейросеть может написать связный абзац? А год назад – что она осилила код без синтаксической ошибки? Сегодня планка взлетела так высоко, что уникальные способности моделей превращаются в стандартный пакет услуг.

OpenAI выкатила GPT‑5.4 Pro. И если раньше слово “Pro” в названии часто означало просто “чуть больше токенов и подороже”, то теперь это действительно профессорский уровень. Модель берёт сложнейший тест ARC-AGI-2 с результатом 83,3% (против 54% у предшественницы), решает задачи из FrontierMath, которые ещё недавно казались крепостью для ИИ, и... случайно находит в интернете забытую научную статью 2011 года, чтобы срезать путь к ответу.

В этом обзоре мы не только разбираем цифры бенчмарков (хотя они тут просто фантастические), но и устраиваем моделям настоящую проверку: от логической головоломки с серверами до полноценного стелс-симулятора на канвасе.

https://habr.com/ru/companies/bothub/articles/1011040/

Алгоритмы и Структуры данных
🔥1
Можно ли торговать, не анализируя рынок? Небольшое исследование

Я иногда наблюдаю за людьми которые зарабатывают на рынке. Достаточно часто они выкладывают годовые результаты или даже налоговые отчёты с миллионными выплатами. И при этом все в основном стесняются рассказывать о своих стратегиях даже чуть‑чуть. Правда это вполне естественно, ведь если стратегия приносит деньги зачем о ней говорить?

Правда и то, что со стороны других людей (не наших многомиллионных героев) ситуация может выглядеть по‑другому.

Представьте детский сад. Один ребёнок приносит коробку конфет. Он её открывает. Показывает всем. Но делиться не собирается.

https://habr.com/ru/articles/1010348/

Алгоритмы и Структуры данных
В заповедной Карелии, среди сотен озёр и густой северной тайги, на берегу Онежского озера расположился бутик-отель "Заонежье".

Здесь архитектура деликатно вписана в ландшафт: фасады из северного дерева и лемех отражают традиции Русского Севера.
Каждое окно обращено к воде, позволяя бесконечному озёрному горизонту стать частью интерьера.
Тринадцать видовых номеров и четыре гостевых дома с дровяными каминами создают атмосферу приватности и спокойствия, а ресторан "Руна" предлагает авторскую гастрономию из локальных продуктов.
Пространство отеля продумано для размеренного отдыха: пирс, панорамный зал, экотропы и уединённые места для медитации среди леса.

Гостям доступны путешествия к острову Кижи, рыбалка, прогулки на каяках,запах и катерах, велосипедные прогулки, и тишина бескрайних пейзажей.

Проект отмечен международными и российскими архитектурными премиями, включая победы в LIV Hospitality Design Awards, Archiwood, ADD Awards и Rethinking The Future Awards.

Бутик- отель "Заонежье" предоставляет возможность почувствовать природу в её первозданной тишине и гармонии, при этом сохранить привычный комфорт.
2