Чанкинг — это один из методов, который позволяет представить текст в виде смысловых отрезков, с которыми далее будет работать LLM.
Правильное деление на эти отрезки на входе и определяет в большей мере скорость, качество и цену работы всей системы поиска.
Андрей Носов, AI-архитектор в компании Raft, рассказал в статье о вызовах, которые он с командой преодолевает каждый день, создавая такие системы. Подробнее всего остановился на чанкинге.
Правильное деление на эти отрезки на входе и определяет в большей мере скорость, качество и цену работы всей системы поиска.
Андрей Носов, AI-архитектор в компании Raft, рассказал в статье о вызовах, которые он с командой преодолевает каждый день, создавая такие системы. Подробнее всего остановился на чанкинге.
Хабр
Архитектура высоконагруженных RAG-систем: 10 стратегий оптимизации чанкинга и интеграция с Weaviate, Qwen / Llama /Gemma
Привет, Хабр! Это Андрей Носов, AI-архитектор в компании Raft, проектирую и внедряю высоконагруженные RAG-системы на предприятиях. Сегодня я расскажу о вызовах, которые мы преодолеваем каждый день,...
🔥4❤3👍2
⭐️ Топ-10 докладов HighLoad++ 2025
6 и 7 ноября в Москве собрались более 2700 участников со всей страны и 150+ спикеров, которые представили свои доклады по 14 тематическим трекам.
Два дня мы обсуждали базы данных и системы хранения, GenAI, LLM и ML в продакшене, архитектуру и масштабируемость, безопасность и надежность, FinOps, SRE, Platform Engineering и другие направления, связанные с большими и высоконагруженными IT-системами.
Все для того, чтобы получить концентрат самых актуальных решений 🔥
Пришло время подвести итоги прошедшей конференции и объявить доклады, которые получили самые высокие оценки от участников за содержание и подачу!
Начнем в обратном порядке:
1️⃣0️⃣ Как масштабировать не только IT-системы, но и IT-команды. Александр Апазиди (независимый эксперт, ментор CTO (Apazidi IT)).
Доклад исследует вызовы масштабирования IT-команд через призму системного подхода. Сравнительный анализ организационных моделей, кейсы успехов и провалов. Фреймворк для эволюции структуры команд с использованием Team Topologies и data-driven-подходов.
9️⃣ CокрAIти.It. Марина Кубанина (Технологии Доверия (ex PWC)).
Многие IT-компании на Западе, да и у нас, объявили об оптимизациях. Чего нам ждать от этого? Какими реальными метриками руководствуются IT-боссы и причем тут AI? Узнайте из доклада Марины.
8️⃣ SLA на максималках. Дмитрий Химион (X5 Digital).
Доклад содержит не только ценнейший опыт подходов к SLA, но и пример того, как можно собрать инструменты в работающий процесс.
7️⃣ Как устроена система восприятия робота-доставщика Яндекса. Сергей Голованов (Яндекс).
Как робот Яндекса «видит» город и избегает препятствий? Доклад раскроет систему восприятия: от hardware (лидар, камеры, парктроники) и подсистем (локализация, планировщик) до ML-моделей (3D-детекция, трекинг, светофоры). Узнайте production-истории, об оптимизации latency и тестировании релизов.
6️⃣ Двигательные установки космических аппаратов. Александр Токарев (Voxys).
Как спутники по пять тонн держатся на орбите, зачем им паровые и ионные двигатели, и можно ли собрать движок для спутника в гараже. Разговор о технологиях, инженерии и мечте покорять космос — просто, с юмором и фактами.
🖐️ Продолжение ждет вас в следующем посте. Если вы не смогли присутствовать офлайн или смотреть онлайн — вы можете приобрести записи всех докладов уже сейчас.
✅ Полная программа прошедшей конференции и кнопка для покупки записей на сайте
6 и 7 ноября в Москве собрались более 2700 участников со всей страны и 150+ спикеров, которые представили свои доклады по 14 тематическим трекам.
Два дня мы обсуждали базы данных и системы хранения, GenAI, LLM и ML в продакшене, архитектуру и масштабируемость, безопасность и надежность, FinOps, SRE, Platform Engineering и другие направления, связанные с большими и высоконагруженными IT-системами.
Все для того, чтобы получить концентрат самых актуальных решений 🔥
Пришло время подвести итоги прошедшей конференции и объявить доклады, которые получили самые высокие оценки от участников за содержание и подачу!
Начнем в обратном порядке:
1️⃣0️⃣ Как масштабировать не только IT-системы, но и IT-команды. Александр Апазиди (независимый эксперт, ментор CTO (Apazidi IT)).
Доклад исследует вызовы масштабирования IT-команд через призму системного подхода. Сравнительный анализ организационных моделей, кейсы успехов и провалов. Фреймворк для эволюции структуры команд с использованием Team Topologies и data-driven-подходов.
9️⃣ CокрAIти.It. Марина Кубанина (Технологии Доверия (ex PWC)).
Многие IT-компании на Западе, да и у нас, объявили об оптимизациях. Чего нам ждать от этого? Какими реальными метриками руководствуются IT-боссы и причем тут AI? Узнайте из доклада Марины.
8️⃣ SLA на максималках. Дмитрий Химион (X5 Digital).
Доклад содержит не только ценнейший опыт подходов к SLA, но и пример того, как можно собрать инструменты в работающий процесс.
7️⃣ Как устроена система восприятия робота-доставщика Яндекса. Сергей Голованов (Яндекс).
Как робот Яндекса «видит» город и избегает препятствий? Доклад раскроет систему восприятия: от hardware (лидар, камеры, парктроники) и подсистем (локализация, планировщик) до ML-моделей (3D-детекция, трекинг, светофоры). Узнайте production-истории, об оптимизации latency и тестировании релизов.
6️⃣ Двигательные установки космических аппаратов. Александр Токарев (Voxys).
Как спутники по пять тонн держатся на орбите, зачем им паровые и ионные двигатели, и можно ли собрать движок для спутника в гараже. Разговор о технологиях, инженерии и мечте покорять космос — просто, с юмором и фактами.
🖐️ Продолжение ждет вас в следующем посте. Если вы не смогли присутствовать офлайн или смотреть онлайн — вы можете приобрести записи всех докладов уже сейчас.
✅ Полная программа прошедшей конференции и кнопка для покупки записей на сайте
🔥6❤4
В сегодняшней статье вы узнаете, как из хаоса родился порядок: как вместо десятков разрозненных девайсов появилась стойка, где каждый винт, кабель и IP на своем месте. И как одна инженерная идея может превратиться в систему, которая экономит часы, нервы и делает работу с тестами наконец-то предсказуемой.
Инженер по тестированию АО «ИнфоТеКС» Евгений Деркач — с историей о том, как обуздать привычный рутинный хаос, всего лишь изменив к нему подход. Рекомендуется к прочтению всем, кто скучает по порядку на рабочем месте.
Инженер по тестированию АО «ИнфоТеКС» Евгений Деркач — с историей о том, как обуздать привычный рутинный хаос, всего лишь изменив к нему подход. Рекомендуется к прочтению всем, кто скучает по порядку на рабочем месте.
Хабр
Лего-стенд. История сборки универсальной тестовой лаборатории из 30+ устройств
Когда твой тестовый стенд разбросан по этажам, IP-адреса живут своей жизнью, а нужное устройство стабильно «гуляет» между кабинетами — это не инфраструктура, это квест. Три года назад я подключался к...
👍3❤2
⭐ Топ-10 докладов HighLoad++ 2025
Сегодня делимся с вами пятеркой лидеров. Если вы пропустили первую часть, то она здесь ✔️
5️⃣ Сетевые нереплицируемые диски в облаке: почему, как, а главное — зачем? Александр Руденко (K2 Cloud).
На что только не придется пойти, желая отмасштабироваться! В крупной инфраструктуре все чаще приходится решать задачу эффективной утилизации. В докладе вы увидите историю выноса дисков на отдельные ноды и как при этом не потерять лишние микросекунды задержек на доступе к данным.
4️⃣ ИИ расшифровывает код мозга: от реального синапса до цифрового двойника нейрона (и при чем тут мыши с микроскопами на голове?). Екатерина Пчицкая (СПб политехнический университет Петра Великого).
В докладе – путешествие в мир, где биты и байты помогают расшифровывать биологический код, а данные и метаданные учат нас не только науке, но и порядку!
3️⃣ Восстание машин, или Как хранилища Sage на новое железо заезжали. Руслан Боярский (T-Банк).
Принято считать железо надежным и готовым к использованию из коробки, но это не так. В докладе интересный путь команды Sage, которая умудрилась наступить на массу граблей и столкнуться с «черными лебедями». Полезно будет сравнить их чек-лист проверки железа с вашим списком, если он у вас есть.
2️⃣ Как понимание работы RAM ускорило на 30% пакетный шлюз 4G/5G-сетей и позволило обрабатывать 4M пакетов в секунду на одном ядре и 100 Gbps на NUMA node. Максим Шахметов (Протей-Лаб).
С одной стороны, работа с памятью кажется очевидной задачей со стандартными решениями, однако всегда найдутся хитрости. В докладе вы посмотрите на эффективную работу с ОЗУ в применении к телекому, а также оцените современные возможности программной обработки сетевых пакетов.
1️⃣ Perforator: всеядный распределенный профилировщик. Сергей Скворцов (Яндекс)
Из первых уст узнаете о том, что из себя представляет open-source-инструмент для профилирования, какие подводные камни вас ждут, если решите самостоятельно сделать похожий инструмент.
Программа HighLoad++ 2025 — концентрат решений, технологий и новинок в одном месте 🙌
✅ Посмотреть полную программу прошедшей конференции и приобрести записи всех докладов вы можете на сайте
Сегодня делимся с вами пятеркой лидеров. Если вы пропустили первую часть, то она здесь ✔️
5️⃣ Сетевые нереплицируемые диски в облаке: почему, как, а главное — зачем? Александр Руденко (K2 Cloud).
На что только не придется пойти, желая отмасштабироваться! В крупной инфраструктуре все чаще приходится решать задачу эффективной утилизации. В докладе вы увидите историю выноса дисков на отдельные ноды и как при этом не потерять лишние микросекунды задержек на доступе к данным.
4️⃣ ИИ расшифровывает код мозга: от реального синапса до цифрового двойника нейрона (и при чем тут мыши с микроскопами на голове?). Екатерина Пчицкая (СПб политехнический университет Петра Великого).
В докладе – путешествие в мир, где биты и байты помогают расшифровывать биологический код, а данные и метаданные учат нас не только науке, но и порядку!
3️⃣ Восстание машин, или Как хранилища Sage на новое железо заезжали. Руслан Боярский (T-Банк).
Принято считать железо надежным и готовым к использованию из коробки, но это не так. В докладе интересный путь команды Sage, которая умудрилась наступить на массу граблей и столкнуться с «черными лебедями». Полезно будет сравнить их чек-лист проверки железа с вашим списком, если он у вас есть.
2️⃣ Как понимание работы RAM ускорило на 30% пакетный шлюз 4G/5G-сетей и позволило обрабатывать 4M пакетов в секунду на одном ядре и 100 Gbps на NUMA node. Максим Шахметов (Протей-Лаб).
С одной стороны, работа с памятью кажется очевидной задачей со стандартными решениями, однако всегда найдутся хитрости. В докладе вы посмотрите на эффективную работу с ОЗУ в применении к телекому, а также оцените современные возможности программной обработки сетевых пакетов.
1️⃣ Perforator: всеядный распределенный профилировщик. Сергей Скворцов (Яндекс)
Из первых уст узнаете о том, что из себя представляет open-source-инструмент для профилирования, какие подводные камни вас ждут, если решите самостоятельно сделать похожий инструмент.
Программа HighLoad++ 2025 — концентрат решений, технологий и новинок в одном месте 🙌
✅ Посмотреть полную программу прошедшей конференции и приобрести записи всех докладов вы можете на сайте
🔥6✍2🤔2
ИИ-агенты успешно пишут код, но проваливают безопасность.
Ученые из Carnegie Mellon University, Columbia и Johns Hopkins провели исследование, в котором оценили, насколько безопасен код, создаваемый ИИ-агентами. В ходе тестирования трех популярных ИИ-агентов на 200 реальных задачах с GitHub выяснилось, что 61% предложенных решений работоспособны, однако лишь 10,5% из них можно назвать защищенными. Таким образом, почти 90% функционально правильного кода содержат серьезные уязвимости.
Среди распространенных ошибок в сгенерированном коде — уязвимости, позволяющие проводить атаки на время отклика для подбора паролей, внедрение вредоносных скриптов через неотфильтрованные ссылки и некорректная обработка данных сессий. ИИ корректно реализует основную логику, но систематически упускает важные проверки.
Это ставит под сомнение готовность технологии к использованию в продакшене, особенно в чувствительных к безопасности областях. Простые напоминания о безопасности в запросе не помогают. Необходимы или принципиально новые подходы к обучению моделей, или признание того, что итоговый код всегда будет требовать экспертной проверки.
Ученые из Carnegie Mellon University, Columbia и Johns Hopkins провели исследование, в котором оценили, насколько безопасен код, создаваемый ИИ-агентами. В ходе тестирования трех популярных ИИ-агентов на 200 реальных задачах с GitHub выяснилось, что 61% предложенных решений работоспособны, однако лишь 10,5% из них можно назвать защищенными. Таким образом, почти 90% функционально правильного кода содержат серьезные уязвимости.
Среди распространенных ошибок в сгенерированном коде — уязвимости, позволяющие проводить атаки на время отклика для подбора паролей, внедрение вредоносных скриптов через неотфильтрованные ссылки и некорректная обработка данных сессий. ИИ корректно реализует основную логику, но систематически упускает важные проверки.
Это ставит под сомнение готовность технологии к использованию в продакшене, особенно в чувствительных к безопасности областях. Простые напоминания о безопасности в запросе не помогают. Необходимы или принципиально новые подходы к обучению моделей, или признание того, что итоговый код всегда будет требовать экспертной проверки.
👍6😱1
Istio Sidecars: как сэкономить гигабайты памяти?
Максим Чудновский, владелец продукта Platform V Synapse Service Mesh, СберТех, рассказал в статье о том, как в проде команды СберТеха с 20K+ подов «урезали аппетит» сайдкаров на гигабайты.
Вы узнаете:
🟣 где работает жесткое ограничение видимости,
🟣 когда спасает Ambient Mesh,
🟣 зачем нужен ленивый XDS и почему «волшебной кнопки» нет — но есть комбинации, дающие двузначную экономию.
Максим Чудновский, владелец продукта Platform V Synapse Service Mesh, СберТех, рассказал в статье о том, как в проде команды СберТеха с 20K+ подов «урезали аппетит» сайдкаров на гигабайты.
Вы узнаете:
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Как сэкономить гигабайты памяти в Istio Sidecars
В Istio всё начинается с маленькой «удобной» идеи — прокси рядом с каждым подом. А заканчивается тем, что XDS разносит по кластеру тонны Listener’ов, Route’ов и Cluster’ов, дублируя конфиги для...
👍3❤1
«Я устал слушать доклады, где всё идеально»
«Я уже ничего не внедряю после конференций»
«Я не могу услышать опыт компаний, похожих на мою»
«Бигтехи говорят на своём языке, а мне это бесполезно»
«У меня нет инсайтов — только слайды»
Знакомые мысли?
Мы это изменим, для этого наша команда придумала новый формат конференций — конференции развития.
Конференция развития — инструмент решения задач, а не потребления контента. Конференция становится больше практикумом, чем лекциями, а ты — действительно участником, а не просто слушателем (послушать можно и YouTube). Больше интерактивных форматов и нетворкинга:
Доклады, конечно, останутся. Но среди них будет больше докладов с нестандартными ходами и нестандартными решениями. Ведь именно на таких лекциях и рождаются инсайты о себе и своей деятельности.
Все подробности о том, как мы планируем пересобрать конференции можно узнать по ссылке. Мы открыты к новому: новая механика, идея, формат — давайте обсуждать!
⚡️ Подать заявку на выступление Saint HighLoad++ 2026
⚡️ Регистрация на встречу с Программным комитетом, где можно будет предложить свою тему, провалидировать свою идею, задать любой вопрос членам ПК и организаторам:
✔️офлайн
✔️онлайн
Встреча с Программным комитетом пройдет:
✅ 14.01.2026 года
⏰ начало в 19.00
📍Адрес: Санкт-Петербург, 2-я Советская улица, дом 18, Failover (помещение бара Tara Brooch)
«Я уже ничего не внедряю после конференций»
«Я не могу услышать опыт компаний, похожих на мою»
«Бигтехи говорят на своём языке, а мне это бесполезно»
«У меня нет инсайтов — только слайды»
Знакомые мысли?
Мы это изменим, для этого наша команда придумала новый формат конференций — конференции развития.
Конференция развития — инструмент решения задач, а не потребления контента. Конференция становится больше практикумом, чем лекциями, а ты — действительно участником, а не просто слушателем (послушать можно и YouTube). Больше интерактивных форматов и нетворкинга:
🔴 ты получишь решение своих задач в брейнштормах;🔴 прокачаешь нужные тебе навыки на мастер-классах;🔴 получишь ответы на свои вопросы в экспертных зонах;🔴 прожаришь свой кейс на прожарке;🔴 обсудишь важную для тебя тему в world cafe;🔴 найдешь решение для своего кейса в case clinic;🔴 вступишь в интересное тебе сообщество в community lab;🔴 зафиксируешь опыт, полученный на конференции и спланируешь дальнейшие шаги на ретро-сессии.
Доклады, конечно, останутся. Но среди них будет больше докладов с нестандартными ходами и нестандартными решениями. Ведь именно на таких лекциях и рождаются инсайты о себе и своей деятельности.
Все подробности о том, как мы планируем пересобрать конференции можно узнать по ссылке. Мы открыты к новому: новая механика, идея, формат — давайте обсуждать!
⚡️ Подать заявку на выступление Saint HighLoad++ 2026
⚡️ Регистрация на встречу с Программным комитетом, где можно будет предложить свою тему, провалидировать свою идею, задать любой вопрос членам ПК и организаторам:
✔️офлайн
✔️онлайн
Встреча с Программным комитетом пройдет:
✅ 14.01.2026 года
⏰ начало в 19.00
📍Адрес: Санкт-Петербург, 2-я Советская улица, дом 18, Failover (помещение бара Tara Brooch)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍3❤2🤩1
Новый выпуск Podcast++, где мы погружаемся в важнейшую тему жизнестойкости — метанавыка, который помогает преодолевать сложности и неопределенность как в жизни, так и в работе!
🎤 Ведущая: Ольга Ортега —директор по данным и аналитике в Ви.Tech.
🖐 В гостях: Иван Лукьянов — программист, директор и панк-коуч.
Ольга и Иван обсуждают ключевые аспекты этого навыка и делятся личными историями, которые вдохновляют на развитие устойчивости.
Узнайте, как позитивное мышление, реалистичный взгляд на вещи и дисциплина помогают справляться с трудностями, а также какие техники могут помочь вам укрепить жизнестойкость.
Если вы хотите улучшить свою способность преодолевать препятствия и находить смысл в сложных жизненных ситуациях, этот выпуск для вас 🙌
Слушайте подкаст:
ВКонтакте
Яндекс Музыка
mave
🎤 Ведущая: Ольга Ортега —директор по данным и аналитике в Ви.Tech.
🖐 В гостях: Иван Лукьянов — программист, директор и панк-коуч.
Ольга и Иван обсуждают ключевые аспекты этого навыка и делятся личными историями, которые вдохновляют на развитие устойчивости.
Узнайте, как позитивное мышление, реалистичный взгляд на вещи и дисциплина помогают справляться с трудностями, а также какие техники могут помочь вам укрепить жизнестойкость.
Если вы хотите улучшить свою способность преодолевать препятствия и находить смысл в сложных жизненных ситуациях, этот выпуск для вас 🙌
Слушайте подкаст:
ВКонтакте
Яндекс Музыка
mave
🔥3👍2😁1
В X5 Digital работают в режиме highload с RPS в 7500 и отвечают за всю онлайн-доставку в 73 региона. Этот канал постоянно растет. В компании создают собственную in-house WMS для дарксторов, приложения для сборщиков и курьеров, CRM, каталоги товаров и другие онлайн-продукты.
Задачей было сопоставить одинаковые или похожие товары, которые есть и в X5, и у конкурента — то есть метчи. В свою очередь, основная цель метчинга — обеспечить конкурентоспособность, позволяя быстро реагировать на изменения цен и предложений конкурентов.
Однако при работе с подрядчиками могут возникать проблемы. Например, длительное исправление ошибок тормозит процессы ценообразования и обновления информации о товарах. А это может привести к упущенным возможностям на рынке. Кроме того, необходимость ручных привязок для взаимодействия с собственными торговыми марками и готовой едой, создает дополнительные сложности и увеличивает вероятность ошибок. Исходя из этого в компании решили заменить решение подрядчика на собственную разработку.
🖐️ Узнайте подробности от Данилы Федюкина, тимлида в X5 Digital, в новой статье
Задачей было сопоставить одинаковые или похожие товары, которые есть и в X5, и у конкурента — то есть метчи. В свою очередь, основная цель метчинга — обеспечить конкурентоспособность, позволяя быстро реагировать на изменения цен и предложений конкурентов.
Однако при работе с подрядчиками могут возникать проблемы. Например, длительное исправление ошибок тормозит процессы ценообразования и обновления информации о товарах. А это может привести к упущенным возможностям на рынке. Кроме того, необходимость ручных привязок для взаимодействия с собственными торговыми марками и готовой едой, создает дополнительные сложности и увеличивает вероятность ошибок. Исходя из этого в компании решили заменить решение подрядчика на собственную разработку.
🖐️ Узнайте подробности от Данилы Федюкина, тимлида в X5 Digital, в новой статье
Хабр
Как мы сделали альтернативную систему метчинга товаров в X5 Digital: опыт, грабли и результат
Привет, Хабр! Меня всё ещё зовут Данила Федюкин, и я продолжаю быть тимлидом в X5 Digital. Руковожу командой, которая занимается метчингом. В прошлый раз я рассказывал , как мы перешли на собственную...
👍1
В CDEK за 25 лет работы накопился богатый арсенал архитектурных решений — удачных, спорных и по-своему эффективных.
✅ На связи Наталья Макарова, техлид внутригородской логистики и глава Гильдии Java.
Как выяснилось, идеальных архитектурных паттернов не бывает. Один и тот же подход в разных условиях может стать и спасением, и катастрофой. Все решает контекст.
Чтобы показать это на практике, Наталья собрала три инженерных кейса. Каждый оформлен в формате детективного квиза: роль, фабула, вопросы на размышление, разбор и выводы. Попробуйте разобраться в проблеме, пройти тест и определить: где костыль, где инженерный компромисс, а где — настоящая best practice.
✅ На связи Наталья Макарова, техлид внутригородской логистики и глава Гильдии Java.
Как выяснилось, идеальных архитектурных паттернов не бывает. Один и тот же подход в разных условиях может стать и спасением, и катастрофой. Все решает контекст.
Чтобы показать это на практике, Наталья собрала три инженерных кейса. Каждый оформлен в формате детективного квиза: роль, фабула, вопросы на размышление, разбор и выводы. Попробуйте разобраться в проблеме, пройти тест и определить: где костыль, где инженерный компромисс, а где — настоящая best practice.
Хабр
Архитектурный квиз: костыль или элегантное решение?
Отказоустойчивый и масштабируемый энтерпрайз невозможно спроектировать по книжкам. Одно и то же решение может фигурировать и в best, и в bad practice — и, что забавно, иногда переходит из одного...
😁8❤1👍1 1
Создан суперкомпьютер, который помещается в кармане.
Компания Tiiny AI Inc., занимающаяся разработкой передовых технологий в области искусственного интеллекта, представила самый маленький в мире персональный суперкомпьютер с искусственным интеллектом — Tiiny AI Pocket Lab. Разработка официально занесена в Книгу рекордов Гиннесса в категории «Самый маленький мини-ПК (100B LLM в локальной сети)»
Это карманное устройство способно полностью локально, без облака и серверов, запускать LLM-модели до 120 миллиардов параметров (уровень GPT-4o), потребляя всего 65Вт. Прорыв стал возможен благодаря технологиям TurboSparse и PowerInfer, которые обеспечивают профессиональную производительность на компактном устройстве.
Ключевой сдвиг: полный отказ от облачной зависимости в пользу приватного, безопасного и энергоэффективного интеллекта прямо на устройстве. Поддерживает мгновенное развертывание десятков open-source моделей и фреймворков.
ИИ будущего теперь работает без интернета, с PhD-уровнем рассуждений и банковским уровнем шифрования ваших данных.
Компания Tiiny AI Inc., занимающаяся разработкой передовых технологий в области искусственного интеллекта, представила самый маленький в мире персональный суперкомпьютер с искусственным интеллектом — Tiiny AI Pocket Lab. Разработка официально занесена в Книгу рекордов Гиннесса в категории «Самый маленький мини-ПК (100B LLM в локальной сети)»
Это карманное устройство способно полностью локально, без облака и серверов, запускать LLM-модели до 120 миллиардов параметров (уровень GPT-4o), потребляя всего 65Вт. Прорыв стал возможен благодаря технологиям TurboSparse и PowerInfer, которые обеспечивают профессиональную производительность на компактном устройстве.
Ключевой сдвиг: полный отказ от облачной зависимости в пользу приватного, безопасного и энергоэффективного интеллекта прямо на устройстве. Поддерживает мгновенное развертывание десятков open-source моделей и фреймворков.
ИИ будущего теперь работает без интернета, с PhD-уровнем рассуждений и банковским уровнем шифрования ваших данных.
👍6🔥4❤2
Не прячьте свой опыт в коде — поделитесь им с сообществом!
Друзья, у нас открыт прием заявок на доклады на Saint HighLoad++ 2026, которая пройдет в июне в Санкт-Петербурге. Приглашаем вас стать спикером!
Ознакомиться с темами, форматами выступлений и подать заявку можно на сайте
А также приглашаем вас на офлайн-встречу с Программным комитетом конференции:
✅ 14 января, начало в 19:00.
📍Санкт-Петербург, ул. 2-я Советская, д. 18, Failover
Если вы не сможете быть офлайн — подключайтесь и задавайте вопросы онлайн, мы обязательно ответим! Хотите стать спикером или у вас есть идеи и предложения для создания программы? Приходите/подключайтесь на встречу — все обсудим!
Регистрация на встречу обязательна:
🟣 офлайн
🟣 онлайн
И, конечно, обсудим нововведения, ведь наши конференции становятся конференциями развития! Подробнее об изменениях можно прочитать в манифесте.
Для спикеров это значит, что:
🔴 мы готовы работать с заявками на уровне идеи и помогать с переупаковкой или созданием новых форматов. Мы привлечем методологов, фасилитаторов, специалистов по проведению групповых активностей и создадим ваше выступление вместе: с вас — экспертиза, с нас — всесторонняя поддержка во время подготовки;
🔴 мы снимаем обязательное требование к докладам быть представленными в продакшн. Если ранее отношение Программного комитета к докладу можно было выразить как «ПК верифицировал», то сейчас возможно также отношение «ПК предлагает обсудить» / «ПК считает, что это интересная точка зрения».
Мы открыты новому: новая механика, идея, формат — давайте обсуждать!
Ждем ваши заявки и вас на встрече с Программным комитетом 🙌
Друзья, у нас открыт прием заявок на доклады на Saint HighLoad++ 2026, которая пройдет в июне в Санкт-Петербурге. Приглашаем вас стать спикером!
Ознакомиться с темами, форматами выступлений и подать заявку можно на сайте
А также приглашаем вас на офлайн-встречу с Программным комитетом конференции:
✅ 14 января, начало в 19:00.
📍Санкт-Петербург, ул. 2-я Советская, д. 18, Failover
Если вы не сможете быть офлайн — подключайтесь и задавайте вопросы онлайн, мы обязательно ответим! Хотите стать спикером или у вас есть идеи и предложения для создания программы? Приходите/подключайтесь на встречу — все обсудим!
Регистрация на встречу обязательна:
И, конечно, обсудим нововведения, ведь наши конференции становятся конференциями развития! Подробнее об изменениях можно прочитать в манифесте.
Для спикеров это значит, что:
Мы открыты новому: новая механика, идея, формат — давайте обсуждать!
Ждем ваши заявки и вас на встрече с Программным комитетом 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍1
// файл: cmd/new_year_greetings.go
package main
import (
"успех"
"стабильность"
"отпуск"
)
func main() {
wish := Wish{
Производительность: "высокая",
Нагрузка: "сбалансированная",
Инциденты: nil,
Настроение: "праздничное",
}
for _, engineer := range heroesOfHighLoad { // всем причастным!
engineer.Отправить(wish)
engineer.Уведомить("Годовой деплой завершён. Можно делать git checkout holiday_mode.")
}
}
// Пусть в 2026 году ваши логи будут чисты, а графики — зелены!
package main
import (
"успех"
"стабильность"
"отпуск"
)
func main() {
wish := Wish{
Производительность: "высокая",
Нагрузка: "сбалансированная",
Инциденты: nil,
Настроение: "праздничное",
}
for _, engineer := range heroesOfHighLoad { // всем причастным!
engineer.Отправить(wish)
engineer.Уведомить("Годовой деплой завершён. Можно делать git checkout holiday_mode.")
}
}
// Пусть в 2026 году ваши логи будут чисты, а графики — зелены!
🎉7🔥4👍1