Machine learning Interview

🌟

Mixture-of-Recursions: концепция селективного ризонинга.

Архитектура Mixture-of-Recursions (MoR), предложенная Google в соавторстве с KAIST AI объединяет в едином фреймворке традиционные подходы разделения параметров и адаптивные вычисления, заставляя модель думать над каждым токеном с разной глубиной.

Под капотом MoR - рекурсивный трансформер, который прогоняет входные данные через один и тот же блок слоев несколько раз. Но главная фишка в том, что количество этих прогонов, или глубина рекурсии, не фиксированное, а динамическое и определяется для каждого токена индивидуально.

Легковесный обучаемый роутер анализирует токен и решает, сколько вычислительных усилий на него потратить. Простые слова могут пройти всего один цикл рекурсии, в то время как семантически нагруженные термины отправятся на более глубокую обработку из нескольких циклов.

Это дает два главных преимущества:

🟢Во-первых, модель тратит вычислительные ресурсы только на те токены, которые все еще активны на данной глубине рекурсии. Токены, которые вышли раньше, в дальнейших вычислениях не участвуют. Это уже само по себе сокращает объем вычислений.

🟢Во-вторых, что самое интересное для инженеров, MoR позволяет реализовать очень эффективное KV caching. Вместо того чтобы хранить в памяти огромный кеш для каждого виртуального слоя, модель кеширует KV-пары только для активных в данном цикле рекурсии токенов. Это кардинально снижает требования к памяти и ускоряет инференс, решая одну из главных головных болей при развертывании LLM.

При одинаковом бюджете на обучение (в FLOPs) и меньшем размере самой модели MoR показывает более низкую перплексию и лучшие результаты в few-shot задачах, чем стандартные и рекурсивные аналоги.

▶️ Попробовать MoR можно на практике - код для трейна и оценки доступен в репозитории проекта на Github.

📌Лицензирование: Apache 2.0 License.

🟡

Arxiv

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #Architecture #MoR

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤28👍9🔥5😁4

4.72K views10:22

Machine learning Interview

🧠 Sam Altman: целые профессии исчезнут из‑за ИИ — и это уже началось

Выступая в Вашингтоне, CEO OpenAI заявил:

🗣️ “Некоторые профессии, как, например, поддержка клиентов — просто исчезнут. Совсем. Звонок в поддержку? Это будет ИИ — и это нормально.”

📞 По его словам, современные линии поддержки уже работают на больших языковых моделях:
— мгновенные ответы
— ноль переводов
— минимум ошибок

🩺 Та же технология помогает в медицине: ИИ учится на миллионах пар “симптом → диагноз” и быстрее врачей находит причины болезней.

⚠️ Но есть и тёмная сторона:
“Представьте: враждебная страна соединяет ИИ с кибератаками — и за секунды стирает балансы или останавливает биржи. Вот это меня пугает.”

🔜

Полный материал

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

💊36👍12❤7🔥4🍌2🤪2

4.57K views09:23

Machine learning Interview

📊

Metabase — это мощная и простая в использовании платформа для бизнес-аналитики!

🌟 Она позволяет визуализировать данные, создавать отчёты и дашборды, а также находить инсайты без необходимости писать сложные SQL-запросы. Metabase поддерживает подключение к различным базам данных, включая MySQL, PostgreSQL, MongoDB и другие, предоставляя интуитивный интерфейс для работы с данными.

🔐 Лицензия: AGPL-3.0

🖥

Github

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

👍23🔥8❤6💊5

5.28K views14:03

Machine learning Interview

🌠 CoreML-Models — коллекция готовых ML-моделей для iOS-разработчиков. Этот репозиторий содержит более 50 предобученных моделей машинного обучения, конвертированных в формат CoreML для легкой интеграции в iOS-приложения. Среди них — классификаторы изображений, детекторы объектов, модели для сегментации и даже Stable Diffusion для генерации изображений.

Все модели доступны через Google Drive с указанием лицензий оригинальных проектов. Для удобства разработчиков есть примеры интеграции в Xcode и скрипты для конвертации дополнительных моделей.

🤖 Github

@machinelearning_interview

❤22👍8🥰4👨‍💻2

5.51K views11:01

Machine learning Interview

Forwarded from Анализ данных (Data analysis)

🔮 SuperDuperDB — фреймворк для создания AI-приложений, напрямую интегрированных с базами данных. Позволяет развертывать модели машинного обучения и векторные поиски прямо в MongoDB, SQL, Snowflake или Redis, избегая сложных ETL-процессов.

Вместо выгрузки данных в отдельные ML-пайплайны, вы добавляете AI-функциональность поверх существующей БД через простые Python-декораторы. Поддерживает популярные библиотеки вроде PyTorch и Hugging Face, что упрощает переход от прототипа к продакшену.

🤖 GitHub

@data_analysis_ml

❤18👍8😁7🔥3👨‍💻3

4.3K views16:40

Machine learning Interview

⚡️ Почему лучшие разработчики всегда на шаг впереди?

Потому что они знают, где брать настоящие инсайд!
Оставь “программирование в вакууме” в прошлом, выбирай свой стек — подпишись и погружайся в поток идей, лайфхаков и знаний, которые не найдёшь в открытом доступе.

ИИ: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Базы данных: t.me/sqlhub
Мл собес t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
МЛ: t.me/machinelearning_ru
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/java_library
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://t.me/gamedev
Физика: t.me/fizmat
SQL: t.me/databases_tg

Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🖥 Chatgpt для кода в тг: @Chatgpturbobot -

📕Ит-книги: https://t.me/addlist/BkskQciUW_FhNjEy
💼ИТ-вакансии t.me/addlist/_zyy_jQ_QUsyM2Vi

Подпишись, чтобы всегда знать, куда двигаться дальше!

Please open Telegram to view this post

VIEW IN TELEGRAM

❤20👍9🔥6😁4👨‍💻2

5.23K views10:18

Machine learning Interview

💣 Higgsfield — фреймворк для распределённого обучения ML-моделей, который обещает избавить разработчиков от адской настройки окружений и конфигов. Проект сочетает в себе оркестрацию GPU-ресурсов с готовыми шаблонами для обучения больших языковых моделей, таких как LLaMA 70B.

Репозиторий интегрируется с GitHub Actions для автоматического развертывания экспериментов на выделенных нодах. Вместо тонн YAML-конфигов Higgsfield предлагает простой Python-интерфейс, поддерживающий как стандартные PyTorch-практики, так и сложные сценарии вроде Zero-3 шардинга.

🤖 GitHub

@machinelearning_interview

👍22❤9🔥5🐳5👨‍💻3

5.65K views11:20

Machine learning Interview

🧠 Intern-S1 — мощная open-source модель для мультимодальных научных задач

Команда InternLM представила Intern-S1 — продвинутую модель, способную обрабатывать и текст, и изображения, включая научные данные.

Что под капотом:
– Языковая модель 235B (MoE) + визуальный энкодер 6B
– Предобучена на 5 триллионах токенов, больше половины — научные данные
– Понимает молекулярные формулы, белковые последовательности, сейсмические сигналы — благодаря динамическому токенизатору
– Сопоставима по качеству с закрытыми коммерческими моделями в научных бенчмарках

🤗 HuggingFace: https://huggingface.co/internlm/Intern-S1-FP8
💻 GitHub: https://github.com/InternLM/Intern-S1
🌐 Онлайн-демо: https://chat.intern-ai.org.cn

@machinelearning_interview

#ml #ai #Intern

❤24🔥11👍7😁2👨‍💻2

5.41K views14:01

Machine learning Interview

🧠 NVIDIA выпустила обновлённые модели Llama Super v1.5 и *Nemotron Super v1.5* — они помогут делать AI-агентов точнее и эффективнее.

Что нового:
— *Llama Super v1.5* — улучшенная версия модели для диалогов, логических задач и RLHF
— *Nemotron Super v1.5* — набор для обучения, ориентированный на код, инструкции и математику
— Используются методы DPO и rejection sampling для более стабильных и полезных ответов

Обе модели работают с NeMo и оптимизированы под GPU NVIDIA, включая H100.

Если вы строите собственного ИИ-ассистента, пишете агента для задач или просто экспериментируете с LLM — можно попробовать.

🔗Скачать модель: https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-v1_5
🔗 Блог NVIDIA:
https://developer.nvidia.com/blog/build-more-accurate-and-efficient-ai-agents-with-the-new-nvidia-llama-nemotron-super-v1-5/

👍25❤7🔥4👨‍💻3

4.8K views11:01

Machine learning Interview

😤 Anthropic становится с каждым днём всё хуже:

— Ужасные лимиты
— Дорогие тарифные планы
— Теперь ещё и недельные ограничения

Единственное, что их спасает — лучшая кодинг‑модель.

Но как только выйдет GPT‑5 или кто-то сделает что-то лучше — их сметут.

⏳ Ждём смены лидера для вайбкодина.

🫡34👍13❤5🔥4👨‍💻2

4.97K views09:16

Machine learning Interview

📊 MLU — практический курс по табличными данным. Бесплатный образовательный проект от Amazon для погружения в машинное обучение. Включает видео-лекции, Jupyter-ноутбуки и реальные датасеты для отработки методов работы с табличными данными.

Курс охватывает все этапы — от разведочного анализа до нейросетей и AutoML. Особый акцент сделан на feature engineering и классические алгоритмы.

🤖 GitHub

@machinelearning_interview

👍40🔥8❤5🥰2😁2👨‍💻2

5.14K views10:04

Machine learning Interview

🔥 Реализация ResNet‑34 с нуля на TensorFlow (Keras)!

Модель, выигравшая ILSVRC 2015, — всего в ~40 строк кода 🥳

Писать было просто...
Понимать — не очень 🤯🤢

📌 Residual блоки
📌 Shortcut соединения
📌 Keras Functional API
📌 Полная архитектура ResNet‑34

Попробуй повторить проект и разобраться глубже — отличный способ прокачаться в CNN!

Вот гист с реализацией 👇
https://gist.github.com/TM23-sanji/3e50c165b33999af0a57816251afc12b

@machinelearning_interview

❤28👍11🥴9🔥5👨‍💻2

5.39K viewsedited 09:41

Machine learning Interview

🖥

120 ключевых вопросов по SQL за 2025 год

Статья содержит 120 ключевых вопросов по SQL для собеседований, разделённых по темам и уровням сложности, с краткими пояснениями.

Основываясь на актуальных требованиях 2025 года, вопросы охватывают базу данных, оптимизацию, практические задачи и нюансы СУБД (MySQL, PostgreSQL, SQL Server).

🔜

Подробности

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

👍24🔥7❤6👨‍💻1

5K views08:38

Machine learning Interview

🚀 Step 3 — новая звезда среди мультимодальных open-source моделей

StepFun представили Step 3 — мощную и удивительно быструю VLM‑модель, которая может работать даже на доступных GPU.

🔷 321B параметров (38B активных) — всё для топ‑производительности и дешёвого инференса
🔷 Новые подходы MFA + AFD — ускоряют работу модели и снижают требования к железу
🔷 Обучена на 20+ трлн токенов, из них 4T мультимодальные (текст + изображение)
🔷 До 4 039 токенов/сек/на GPU — на 70% быстрее, чем DeepSeek‑V3
🔷 Минимум галлюцинаций, максимум логики — особый фокус на качество данных

💎 Step 3 устанавливает новую Pareto‑границу между мощностью, скоростью и реальной практичностью.

🔗 Попробовать: https://huggingface.co/stepfun-ai/step3
📖 Блог: https://stepfun.com/research/zh/step3

👍21❤12🔥4👨‍💻2

5.11K views15:30

About

Blog

Apps

Platform