Forwarded from Machinelearning
Архитектура Mixture-of-Recursions (MoR), предложенная Google в соавторстве с KAIST AI объединяет в едином фреймворке традиционные подходы разделения параметров и адаптивные вычисления, заставляя модель думать над каждым токеном с разной глубиной.
Под капотом MoR - рекурсивный трансформер, который прогоняет входные данные через один и тот же блок слоев несколько раз. Но главная фишка в том, что количество этих прогонов, или глубина рекурсии, не фиксированное, а динамическое и определяется для каждого токена индивидуально.
Легковесный обучаемый роутер анализирует токен и решает, сколько вычислительных усилий на него потратить. Простые слова могут пройти всего один цикл рекурсии, в то время как семантически нагруженные термины отправятся на более глубокую обработку из нескольких циклов.
Это дает два главных преимущества:
При одинаковом бюджете на обучение (в FLOPs) и меньшем размере самой модели MoR показывает более низкую перплексию и лучшие результаты в few-shot задачах, чем стандартные и рекурсивные аналоги.
@ai_machinelearning_big_data
#AI #ML #LLM #Architecture #MoR
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤24👍9🔥5😁4
🧠 Sam Altman: целые профессии исчезнут из‑за ИИ — и это уже началось
Выступая в Вашингтоне, CEO OpenAI заявил:
🗣️ “Некоторые профессии, как, например, поддержка клиентов — просто исчезнут. Совсем. Звонок в поддержку? Это будет ИИ — и это нормально.”
📞 По его словам, современные линии поддержки уже работают на больших языковых моделях:
— мгновенные ответы
— ноль переводов
— минимум ошибок
🩺 Та же технология помогает в медицине: ИИ учится на миллионах пар “симптом → диагноз” и быстрее врачей находит причины болезней.
⚠️ Но есть и тёмная сторона:
“Представьте: враждебная страна соединяет ИИ с кибератаками — и за секунды стирает балансы или останавливает биржи. Вот это меня пугает.”
🔜 Полный материал
@machinelearning_interview
Выступая в Вашингтоне, CEO OpenAI заявил:
🗣️ “Некоторые профессии, как, например, поддержка клиентов — просто исчезнут. Совсем. Звонок в поддержку? Это будет ИИ — и это нормально.”
📞 По его словам, современные линии поддержки уже работают на больших языковых моделях:
— мгновенные ответы
— ноль переводов
— минимум ошибок
🩺 Та же технология помогает в медицине: ИИ учится на миллионах пар “симптом → диагноз” и быстрее врачей находит причины болезней.
⚠️ Но есть и тёмная сторона:
“Представьте: враждебная страна соединяет ИИ с кибератаками — и за секунды стирает балансы или останавливает биржи. Вот это меня пугает.”
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
💊35👍11❤7🔥4🍌2🤪2
Как_построить_стратегию_поиска_работы_Практикум_Гайд.pdf
17.8 MB
Когда я решил сменить профессию и пойти в IT, было ощущение, будто ныряю в незнакомую воду. Я уже немного писал код, сделал пару проектов по туториалам, прошёл курс. Казалось, вот-вот начну — но как только дошло до реального поиска работы, возникла куча вопросов.
Куда откликаться? Что вообще писать в резюме, если до этого работал в другой сфере? Как показать, что ты не просто «посмотрел пару видео», а реально готов к работе? И как пройти собеседование, не впав в ступор от первого же вопроса?
На все это ушло много времени и нервов — методом проб, ошибок и пустых откликов. Сейчас понимаю: без чёткой стратегии в этом хаосе легко потеряться.
🗺 Как раз такую стратегию подготовил Яндекс Практикум.
Они выпустили понятный и конкретный гайд по поиску первой работы в IT — с разбором, как устроен найм, что важно работодателям и как новичку не потеряться на старте.
📌 В гайде есть ответы на главные вопросы:
— Как составить резюме, если нет опыта?
— Как грамотно показать обучение и проекты?
— Где искать вакансии, чтобы не тратить месяцы впустую?
— Как пройти интервью и не сгореть от волнения?
🎥 Плюс у Практикума есть большая подборка видео от карьерных экспертов:
→ как выделиться среди других,
→ как оформить резюме,
→ как уверенно пройти собеседование.
Скачать гайд можно под этим постом, а посмотреть видео с экспертами по ссылке. Всё чётко, по делу и без лишней воды.
Реклама, АНО ДПО “Образовательные технологии Яндекса”, ИНН 7704282033
Куда откликаться? Что вообще писать в резюме, если до этого работал в другой сфере? Как показать, что ты не просто «посмотрел пару видео», а реально готов к работе? И как пройти собеседование, не впав в ступор от первого же вопроса?
На все это ушло много времени и нервов — методом проб, ошибок и пустых откликов. Сейчас понимаю: без чёткой стратегии в этом хаосе легко потеряться.
🗺 Как раз такую стратегию подготовил Яндекс Практикум.
Они выпустили понятный и конкретный гайд по поиску первой работы в IT — с разбором, как устроен найм, что важно работодателям и как новичку не потеряться на старте.
📌 В гайде есть ответы на главные вопросы:
— Как составить резюме, если нет опыта?
— Как грамотно показать обучение и проекты?
— Где искать вакансии, чтобы не тратить месяцы впустую?
— Как пройти интервью и не сгореть от волнения?
🎥 Плюс у Практикума есть большая подборка видео от карьерных экспертов:
→ как выделиться среди других,
→ как оформить резюме,
→ как уверенно пройти собеседование.
Скачать гайд можно под этим постом, а посмотреть видео с экспертами по ссылке. Всё чётко, по делу и без лишней воды.
Реклама, АНО ДПО “Образовательные технологии Яндекса”, ИНН 7704282033
❤18🔥5🕊5🗿4🥰3👏3🤣3😭1
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥8❤6💊5
🌠 CoreML-Models — коллекция готовых ML-моделей для iOS-разработчиков. Этот репозиторий содержит более 50 предобученных моделей машинного обучения, конвертированных в формат CoreML для легкой интеграции в iOS-приложения. Среди них — классификаторы изображений, детекторы объектов, модели для сегментации и даже Stable Diffusion для генерации изображений.
Все модели доступны через Google Drive с указанием лицензий оригинальных проектов. Для удобства разработчиков есть примеры интеграции в Xcode и скрипты для конвертации дополнительных моделей.
🤖 Github
@machinelearning_interview
Все модели доступны через Google Drive с указанием лицензий оригинальных проектов. Для удобства разработчиков есть примеры интеграции в Xcode и скрипты для конвертации дополнительных моделей.
🤖 Github
@machinelearning_interview
❤20👍8🥰4👨💻2
Яндекс представил крупнейшую языковую модель в облаке — Qwen3‑235B.
Она поддерживает работу с длинным контекстом, владеет 119 языками и обеспечивает высокое качество генерации. Модель доступна в Yandex AI Studio: можно протестировать в интерфейсе или подключить через API.
Стоимость начинается от 50 копеек за 1000 токенов.
Реклама. ООО Яндекс.Облако. ИНН 7704458262
Она поддерживает работу с длинным контекстом, владеет 119 языками и обеспечивает высокое качество генерации. Модель доступна в Yandex AI Studio: можно протестировать в интерфейсе или подключить через API.
Стоимость начинается от 50 копеек за 1000 токенов.
Реклама. ООО Яндекс.Облако. ИНН 7704458262
🥱31❤11👍7🥴4🔥3👨💻2🗿2
Forwarded from Анализ данных (Data analysis)
🔮 SuperDuperDB — фреймворк для создания AI-приложений, напрямую интегрированных с базами данных. Позволяет развертывать модели машинного обучения и векторные поиски прямо в MongoDB, SQL, Snowflake или Redis, избегая сложных ETL-процессов.
Вместо выгрузки данных в отдельные ML-пайплайны, вы добавляете AI-функциональность поверх существующей БД через простые Python-декораторы. Поддерживает популярные библиотеки вроде PyTorch и Hugging Face, что упрощает переход от прототипа к продакшену.
🤖 GitHub
@data_analysis_ml
Вместо выгрузки данных в отдельные ML-пайплайны, вы добавляете AI-функциональность поверх существующей БД через простые Python-декораторы. Поддерживает популярные библиотеки вроде PyTorch и Hugging Face, что упрощает переход от прототипа к продакшену.
🤖 GitHub
@data_analysis_ml
❤17👍8😁6🔥3👨💻3
⚡️ Почему лучшие разработчики всегда на шаг впереди?
Потому что они знают, где брать настоящие инсайд!
Оставь “программирование в вакууме” в прошлом, выбирай свой стек — подпишись и погружайся в поток идей, лайфхаков и знаний, которые не найдёшь в открытом доступе.
ИИ: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Базы данных: t.me/sqlhub
Мл собес t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
МЛ: t.me/machinelearning_ru
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/java_library
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://t.me/gamedev
Физика: t.me/fizmat
SQL: t.me/databases_tg
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno
🖥 Chatgpt для кода в тг: @Chatgpturbobot -
📕Ит-книги: https://t.me/addlist/BkskQciUW_FhNjEy
💼ИТ-вакансии t.me/addlist/_zyy_jQ_QUsyM2Vi
Подпишись, чтобы всегда знать, куда двигаться дальше!
Потому что они знают, где брать настоящие инсайд!
Оставь “программирование в вакууме” в прошлом, выбирай свой стек — подпишись и погружайся в поток идей, лайфхаков и знаний, которые не найдёшь в открытом доступе.
ИИ: t.me/ai_machinelearning_big_data
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Devops: t.me/DevOPSitsec
Базы данных: t.me/sqlhub
Мл собес t.me/machinelearning_interview
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
МЛ: t.me/machinelearning_ru
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/java_library
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://t.me/gamedev
Физика: t.me/fizmat
SQL: t.me/databases_tg
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno
📕Ит-книги: https://t.me/addlist/BkskQciUW_FhNjEy
💼ИТ-вакансии t.me/addlist/_zyy_jQ_QUsyM2Vi
Подпишись, чтобы всегда знать, куда двигаться дальше!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤18👍9🔥6😁4👨💻2
💣 Higgsfield — фреймворк для распределённого обучения ML-моделей, который обещает избавить разработчиков от адской настройки окружений и конфигов. Проект сочетает в себе оркестрацию GPU-ресурсов с готовыми шаблонами для обучения больших языковых моделей, таких как LLaMA 70B.
Репозиторий интегрируется с GitHub Actions для автоматического развертывания экспериментов на выделенных нодах. Вместо тонн YAML-конфигов Higgsfield предлагает простой Python-интерфейс, поддерживающий как стандартные PyTorch-практики, так и сложные сценарии вроде Zero-3 шардинга.
🤖 GitHub
@machinelearning_interview
Репозиторий интегрируется с GitHub Actions для автоматического развертывания экспериментов на выделенных нодах. Вместо тонн YAML-конфигов Higgsfield предлагает простой Python-интерфейс, поддерживающий как стандартные PyTorch-практики, так и сложные сценарии вроде Zero-3 шардинга.
🤖 GitHub
@machinelearning_interview
👍22❤8🔥5🐳5👨💻3
🧠 Intern-S1 — мощная open-source модель для мультимодальных научных задач
Команда InternLM представила Intern-S1 — продвинутую модель, способную обрабатывать и текст, и изображения, включая научные данные.
Что под капотом:
– Языковая модель 235B (MoE) + визуальный энкодер 6B
– Предобучена на 5 триллионах токенов, больше половины — научные данные
– Понимает молекулярные формулы, белковые последовательности, сейсмические сигналы — благодаря динамическому токенизатору
– Сопоставима по качеству с закрытыми коммерческими моделями в научных бенчмарках
🤗 HuggingFace: https://huggingface.co/internlm/Intern-S1-FP8
💻 GitHub: https://github.com/InternLM/Intern-S1
🌐 Онлайн-демо: https://chat.intern-ai.org.cn
@machinelearning_interview
#ml #ai #Intern
Команда InternLM представила Intern-S1 — продвинутую модель, способную обрабатывать и текст, и изображения, включая научные данные.
Что под капотом:
– Языковая модель 235B (MoE) + визуальный энкодер 6B
– Предобучена на 5 триллионах токенов, больше половины — научные данные
– Понимает молекулярные формулы, белковые последовательности, сейсмические сигналы — благодаря динамическому токенизатору
– Сопоставима по качеству с закрытыми коммерческими моделями в научных бенчмарках
🤗 HuggingFace: https://huggingface.co/internlm/Intern-S1-FP8
💻 GitHub: https://github.com/InternLM/Intern-S1
🌐 Онлайн-демо: https://chat.intern-ai.org.cn
@machinelearning_interview
#ml #ai #Intern
❤24🔥10👍7😁2👨💻2
🧠 NVIDIA выпустила обновлённые модели Llama Super v1.5 и *Nemotron Super v1.5* — они помогут делать AI-агентов точнее и эффективнее.
Что нового:
— *Llama Super v1.5* — улучшенная версия модели для диалогов, логических задач и RLHF
— *Nemotron Super v1.5* — набор для обучения, ориентированный на код, инструкции и математику
— Используются методы DPO и rejection sampling для более стабильных и полезных ответов
Обе модели работают с NeMo и оптимизированы под GPU NVIDIA, включая H100.
Если вы строите собственного ИИ-ассистента, пишете агента для задач или просто экспериментируете с LLM — можно попробовать.
🔗Скачать модель: https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-v1_5
🔗 Блог NVIDIA:
https://developer.nvidia.com/blog/build-more-accurate-and-efficient-ai-agents-with-the-new-nvidia-llama-nemotron-super-v1-5/
Что нового:
— *Llama Super v1.5* — улучшенная версия модели для диалогов, логических задач и RLHF
— *Nemotron Super v1.5* — набор для обучения, ориентированный на код, инструкции и математику
— Используются методы DPO и rejection sampling для более стабильных и полезных ответов
Обе модели работают с NeMo и оптимизированы под GPU NVIDIA, включая H100.
Если вы строите собственного ИИ-ассистента, пишете агента для задач или просто экспериментируете с LLM — можно попробовать.
🔗Скачать модель: https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-v1_5
🔗 Блог NVIDIA:
https://developer.nvidia.com/blog/build-more-accurate-and-efficient-ai-agents-with-the-new-nvidia-llama-nemotron-super-v1-5/
👍25❤6🔥3👨💻3
📊 MLU — практический курс по табличными данным. Бесплатный образовательный проект от Amazon для погружения в машинное обучение. Включает видео-лекции, Jupyter-ноутбуки и реальные датасеты для отработки методов работы с табличными данными.
Курс охватывает все этапы — от разведочного анализа до нейросетей и AutoML. Особый акцент сделан на feature engineering и классические алгоритмы.
🤖 GitHub
@machinelearning_interview
Курс охватывает все этапы — от разведочного анализа до нейросетей и AutoML. Особый акцент сделан на feature engineering и классические алгоритмы.
🤖 GitHub
@machinelearning_interview
👍38🔥8❤5🥰2😁2👨💻2
🔥 Реализация ResNet‑34 с нуля на TensorFlow (Keras)!
Модель, выигравшая ILSVRC 2015, — всего в ~40 строк кода 🥳
Писать было просто...
Понимать — не очень 🤯🤢
📌 Residual блоки
📌 Shortcut соединения
📌 Keras Functional API
📌 Полная архитектура ResNet‑34
Попробуй повторить проект и разобраться глубже — отличный способ прокачаться в CNN!
Вот гист с реализацией 👇
https://gist.github.com/TM23-sanji/3e50c165b33999af0a57816251afc12b
@machinelearning_interview
Модель, выигравшая ILSVRC 2015, — всего в ~40 строк кода 🥳
Писать было просто...
Понимать — не очень 🤯🤢
📌 Residual блоки
📌 Shortcut соединения
📌 Keras Functional API
📌 Полная архитектура ResNet‑34
Попробуй повторить проект и разобраться глубже — отличный способ прокачаться в CNN!
Вот гист с реализацией 👇
https://gist.github.com/TM23-sanji/3e50c165b33999af0a57816251afc12b
@machinelearning_interview
❤28👍9🥴8🔥5👨💻2