Media is too big
VIEW IN TELEGRAM
🧠 Современные методы статистической теории в машинном обучении
- Видео
- Colab
- Полный курс
@machinelearning_interview
- Видео
- Colab
- Полный курс
@machinelearning_interview
👍9❤2🔥1
⭐️ База ресурсов для поиска удаленно работа
• Toptal — ИТ фриланс для разработчиков с опытом;
• Wellfound — различные вакансии для стартапов и фрилансеров;
• RemoteOK — база для разных профессий;
• Remotive — удалёнка для айти и маркетинга;
• Галилео.ру — для инженеров;
• FlexJobs — для поиска подработок;
• JustRemote — парт-тайм работа тут;
• PowerToFly — для женщин в ИТ и бизнесе;
• RemoteWoman — для женщин, ищущих удалёнку в разных областях;
• AI Jobs — вакансии в сфере ИИ;
• Working Nomads — для цифровых кочевников, вакансии в маркетинге и ИТ;
• Simply Hired — поиск вакансий по всему миру;
• Angel List — стартапы, удалёнка в технологиях и бизнесе;
• Virtual Vocations — удалённые вакансии в разных сферах (администрация, маркетинг, ИТ);
• Remote Work — общий сайт;
• LinkedIn — ищем удалёнку среди обычных вакансий в профиле;
• We Work Remotely — удалёнка для разработчиков, дизайнеров и маркетологов;
• Jobspresso — качественные удалённые вакансии для профессионалов;
• Jobgether — удалёнка в разных профессиях, от маркетинга до ИТ;
• Fiverr — фриланс-платформа для самых разных краткосрочных проектов;
• Daily Remote — база удалённых вакансий в ИТ, маркетинге и других сферах;
• Crossover — высококачественная удалёнка для разработчиков и менеджеров;
• Outsourcely — фриланс для разных профессий;
• Upwork — крупнейшая платформа для фрилансеров, включает ВСЕ профессии;
• Dribbble — для дизайнеров и креативщиков, в том числе удалённая работа;
• Monster.com — вакансии по всему миру, в том числе удалённые;
• Angel.co — стартапы, удалёнка в сфере технологий;
• Otta — вакансии в стартапах, в том числе удалённые.
@machinelearning_interview
• Toptal — ИТ фриланс для разработчиков с опытом;
• Wellfound — различные вакансии для стартапов и фрилансеров;
• RemoteOK — база для разных профессий;
• Remotive — удалёнка для айти и маркетинга;
• Галилео.ру — для инженеров;
• FlexJobs — для поиска подработок;
• JustRemote — парт-тайм работа тут;
• PowerToFly — для женщин в ИТ и бизнесе;
• RemoteWoman — для женщин, ищущих удалёнку в разных областях;
• AI Jobs — вакансии в сфере ИИ;
• Working Nomads — для цифровых кочевников, вакансии в маркетинге и ИТ;
• Simply Hired — поиск вакансий по всему миру;
• Angel List — стартапы, удалёнка в технологиях и бизнесе;
• Virtual Vocations — удалённые вакансии в разных сферах (администрация, маркетинг, ИТ);
• Remote Work — общий сайт;
• LinkedIn — ищем удалёнку среди обычных вакансий в профиле;
• We Work Remotely — удалёнка для разработчиков, дизайнеров и маркетологов;
• Jobspresso — качественные удалённые вакансии для профессионалов;
• Jobgether — удалёнка в разных профессиях, от маркетинга до ИТ;
• Fiverr — фриланс-платформа для самых разных краткосрочных проектов;
• Daily Remote — база удалённых вакансий в ИТ, маркетинге и других сферах;
• Crossover — высококачественная удалёнка для разработчиков и менеджеров;
• Outsourcely — фриланс для разных профессий;
• Upwork — крупнейшая платформа для фрилансеров, включает ВСЕ профессии;
• Dribbble — для дизайнеров и креативщиков, в том числе удалённая работа;
• Monster.com — вакансии по всему миру, в том числе удалённые;
• Angel.co — стартапы, удалёнка в сфере технологий;
• Otta — вакансии в стартапах, в том числе удалённые.
@machinelearning_interview
👍10❤4🥰1
Forwarded from Machinelearning
Открытый препринт книги Тарсиса Соуза (Tharsis Souza), PhD Лондонсого университета, в которой представлен критический анализ проблем и ограничений, возникающих у инженеров и руководителей технических проектов при разработке приложений на основе LLM.
Цель книги, по заявлению автора – помочь создавать надежные и безопасные системы на основе LLM, избегая распространенных ошибок.
Она ориентирована на разработчиков, технических менеджеров проектов и технических руководителей, стремящихся к углубленному пониманию и преодолению практических трудностей, связанных с внедрением LLM.
В отличие от преобладающего дискурса, акцентирующего возможности LLM, книга сосредоточена на практических сложностях и потенциальных ошибках реализации, предлагая подробное руководство по их преодолению.
В книге рассматриваются проблемы: структурной ненадежности, управления входными данными, тестирования, аспектов безопасности и элайнмента, зависимости от поставщиков и оптимизации затрат.
Книга сопровождается репозиторием с практическими примерами на Python, анализом реальных сценариев и решений.
@ai_machinelearning_big_data
#AI #ML #LLM #Book #Tutorial
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤1🔥1
Forwarded from Machinelearning
Он предназначенный для преобразования PDF-документов в персонализированный аудиоконтент с использованием технологий генеративного ИИ.
Ключевые компоненты:
- Инструмент преобразования PDF в Markdown: Извлекает содержимое из PDF-файлов и конвертирует его в формат Markdown для дальнейшей обработки.
- Сервис создания монологов или диалогов: Обрабатывает Markdown-контент, обогащая или структурируя его для создания естественного аудиоконтента.
- Сервис преобразования текста в речь (TTS): Преобразует обработанный контент в высококачественную речь.
Преимущества использования:
- Персонализация: Возможность адаптации решения под специфические потребности организации, включая брендинг, аналитику, реальное время перевода или интерфейс цифрового человека для повышения вовлеченности.
- Конфиденциальность: Решение соответствует требованиям конфиденциальности на всех этапах обработки данных.
- Гибкость: Модульная структура позволяет добавлять дополнительные функции, соответствующие потребностям пользователей.
- Микросервисы NVIDIA NIM используются для развертывания и масштабирования моделей на GPU.
- Модели Llama 3.1 применяются для обработки и генерации текста.
- Langchain используется для обработки и интеграции данных.
- Docling применяется для парсинга документов.
- ElevenLabs предоставляет сервисы преобразования текста в речь.
Лицензирование:
Использование моделей в этом проекте регулируется NVIDIA AI Foundation Models Community License.
▪ Github: https://github.com/NVIDIA-AI-Blueprints/pdf-to-podcast
▪Project: build.nvidia.com/nvidia/pdf-to-podcast
@ai_machinelearning_big_data
#nim #tts #pdftopodcast
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥3❤2
Forwarded from Machinelearning
scGPT-spatial - расширенная версия модели scGPT в помощь ученым-биологам для анализа пространственной транскриптомики. Основная цель scGPT-spatial — интегрировать информацию о пространственной локализации клеток и их транскриптомных профилях с знаниями scGPT для расширения понимания организации тканей и взаимодействия клеток в микроокружении.
scGPT-spatial обучалась с с учётом пространственных координат на наборе данных SpatialHuman30M (30 миллионов клеток и спотов из 4 протоколов секвенирования: Visium, Visium HD, MERFISH и Xenium) и использует архитектуру MoE.
В тестах scGPT-spatial показала отличные результаты в задачах кластеризации клеточных типов, деконволюции спотов и импутации генной экспрессии. В экспериментах на интеграцию данных из нескольких слайдов и модальностей модель обошла методы PCA и Seurat v4, достигнув показателя AvgBIO 0.86.
В задаче деконволюции клеточных типов scGPT-spatial превзошла Tangram и Cell2location, со средним Macro F1 в 0.58, а медианный коэффициент корреляции Пирсона в импутации генной экспрессии составил значение 0.6.
Веса модели опубликованы в открытом доступе, а в репозитории проекта на Github - подробная инструкция по настройке окружения для scGPT и ipynb демо-ноутбук инференса.
@ai_machinelearning_big_data
#AI #ML #MedML #ScGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥5❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Классный сайт для тренировки навыков SQL.
На сайте размещены задачи, которые решаются через базу данных больницы.
Уровни сложности разные — от простых запросов с SELECT до по-настоящему сложных.
Берём на вооружение для практики!
https://www.sql-practice.com/
@machinelearning_interview
На сайте размещены задачи, которые решаются через базу данных больницы.
Уровни сложности разные — от простых запросов с SELECT до по-настоящему сложных.
Берём на вооружение для практики!
https://www.sql-practice.com/
@machinelearning_interview
❤18👍6🔥1
🚀Яндекс представил YandexGPT 5 и впервые за 3 года выложил в опенсорс большую языковую модель
Основные детали:
• YandexGPT 5 Pro — мощная модель нового поколения, уже внедрена в чат с Алисой и доступна через API в Yandex Cloud.
• YandexGPT 5 Lite — 8B модель с контекстным окном 32k токенов, впервые за 3 года опубликована в открытом доступе. Выложена без финального этапа обучения и этических фильтров — идеально для исследований и кастомизации.
Модели открывают широкие возможности для автоматизации бизнес-процессов: от интеллектуальной обработки обращений в контакт-центрах (выделение ключевых моментов, категоризация, суммаризация для отчетов) до создания ИИ-ассистентов для умного поиска по базам знаний.
На сегодняшний день YandexGPT 5 Lite 8B Pretrain в ряде ключевых русскоязычных и англоязычных бенчмарков показывает результаты, превосходящие сопоставимые base-версии моделей Llama и Qwen.
◾️Хабр: https://habr.com/ru/companies/yandex/articles/885218/
◾️HF: https://huggingface.co/yandex/YandexGPT-5-Lite-8B-pretrain
@machinelearning_interview
Основные детали:
• YandexGPT 5 Pro — мощная модель нового поколения, уже внедрена в чат с Алисой и доступна через API в Yandex Cloud.
• YandexGPT 5 Lite — 8B модель с контекстным окном 32k токенов, впервые за 3 года опубликована в открытом доступе. Выложена без финального этапа обучения и этических фильтров — идеально для исследований и кастомизации.
Модели открывают широкие возможности для автоматизации бизнес-процессов: от интеллектуальной обработки обращений в контакт-центрах (выделение ключевых моментов, категоризация, суммаризация для отчетов) до создания ИИ-ассистентов для умного поиска по базам знаний.
На сегодняшний день YandexGPT 5 Lite 8B Pretrain в ряде ключевых русскоязычных и англоязычных бенчмарков показывает результаты, превосходящие сопоставимые base-версии моделей Llama и Qwen.
◾️Хабр: https://habr.com/ru/companies/yandex/articles/885218/
◾️HF: https://huggingface.co/yandex/YandexGPT-5-Lite-8B-pretrain
@machinelearning_interview
👍11🔥3❤2
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍2🔥1
Forwarded from Machinelearning
Проект написан на CUDA и рассчитан исключительно на использование тензорных ядер архитектуры NVIDIA Hopper, что уже само по себе делает его очень современным
В основе DeepGEMM лежит идея максимально эффективного выполнения операций умножения матриц с использованием 8-битной точности.
Для решения проблемы накопления в FP8 (которое может давать неточные результаты) разработчики внедрили двухуровневое накопление, которое использует возможности CUDA-ядра для повышения точности без потери производительности.
Что действительно радует – это минимализм кода.
✔ Ядро библиотеки представлено всего в одном ключевом модуле, состоящем примерно из 300 строк, что позволяет легко разобраться в его работе и даже внести собственные улучшения.
При этом все ядра компилируются «на лету» с помощью легковесного JIT-компилятора, так что нет долгого этапа сборки при установке.
DeepGEMM поддерживает разные режимы работы: обычные GEMM для плотных моделей, а также группированные операции для моделей типа Mix-of-Experts, где требуется обрабатывать данные в нескольких форматах – как в «континуальном», так и в «masked» виде. Это особенно актуально для современных решений в области глубокого обучения.
Оптимизации, заложенные в DeepGEMM, включают использование новых функций Hopper, таких как Tensor Memory Accelerator (TMA) для асинхронной передачи данных, а также тонкую настройку блоковых размеров и оптимизацию инструкций FFMA для лучшего перекрытия вычислений и загрузки данных. Результаты говорят сами за себя: производительность этой библиотеки на ряде тестовых примеров сравнима или даже превосходит решения, построенные на базе CUTLASS.
DeepGEMM – это лаконичный и эффективный инструмент, который может послужить отличной базой для исследований и практических разработок в области ускорения вычислений для глубокого обучения.
▪ Github
#ai #deepseek #opensource #DeepEP #OpenSourceWeek:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤1
OpenAI полностью откроет улучшенную и обновленную функцию deep research для пользователей ChatGPT Plus, Team, Edu и Enterprise. Вместе с анонсом опубликована карта deep research системы, в которой подробно рассказывается о том, как OpenAI проводили глубокие исследования, оценивали их возможности и риски, а также повышали уровень безопасности.
Новая версия поддерживает обработку изображений и улучшает возможности понимания и цитирования загруженных файлов. Пользователи Plus, Team, Enterprise и Edu могут использовать 10 deep research запросов в месяц, а на тарифе Pro месячная квота составит 120 запросов.
OpenAI в X
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🔥1
В обоих случаях есть базовые элементы вроде входных эмбеддингов, механизмов самовнимания (self-attention) и последовательного наложения блоков (N слоёв), но в «Mixture of Experts» внутри каждого блока появляется «router» (маршрутизатор).
Этот маршрутизатор решает, какие «эксперты» (специализированные подмодули) должны обработать текущие данные.
Таким образом, в отличие от обычного Transformer’а, где у нас один набор весов на слой, в «Mixture of Experts» несколько разных «экспертов» конкурируют или дополняют друг друга для более гибкой и точной обработки информации.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5⚡3👍1🤡1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤2🔥2