🤔 Кто скупил все GPU NVIDIA H100 с тензорными ядрами?
Исследовательская компания Omdia показала инфографику, из которой ясно, что Microsoft и Meta* — уверенные лидеры по закупкам H100. К концу года каждый из них получил по 150 тысяч ускорителей. Это в три раза больше, чем получили их ближайшие конкуренты по рейтингу — Google, Amazon и Oracle.
Как предполагают разработчики, GPT4 обучалась около 90 дней на 25 тысячах GPU A100. 150 тысяч штук H100 должно хватить, чтобы обучить модель такого уровня всего за семь дней.
*организация, деятельность которой запрещена на территории РФ
Исследовательская компания Omdia показала инфографику, из которой ясно, что Microsoft и Meta* — уверенные лидеры по закупкам H100. К концу года каждый из них получил по 150 тысяч ускорителей. Это в три раза больше, чем получили их ближайшие конкуренты по рейтингу — Google, Amazon и Oracle.
Как предполагают разработчики, GPT4 обучалась около 90 дней на 25 тысячах GPU A100. 150 тысяч штук H100 должно хватить, чтобы обучить модель такого уровня всего за семь дней.
*организация, деятельность которой запрещена на территории РФ
👍9❤1
🦾Подборка бесплатных курсов по Machine Learning
✍️Открытый курс машинного обучения
Подробная и понятная серия статей на «Хабре» от сообщества OpenDataScience. На сайте mlcourse.ai материал также доступен на английском языке.
✍️Введение в Data Science и машинное обучение
Курс на Stepik, простыми словами объясняющий Pandas и некоторые алгоритмы.
✍️Курсы на Kaggle
Множество обучающих материалов по необходимым темам: от Python до обучения с подкреплением.
✍️«Ударный» курс по Machine Learning от Google
Рассказывает про основные алгоритмы и концепции.
✍️Deep Learning School
Курс проходит бесплатно и онлайн на платформах Stepik и Google Colab. На сайте можно зарегистрироваться на новые потоки (следите за обновлениями). Однако, в целом, материал уже доступен на Stepik.
✍️Открытый курс машинного обучения
Подробная и понятная серия статей на «Хабре» от сообщества OpenDataScience. На сайте mlcourse.ai материал также доступен на английском языке.
✍️Введение в Data Science и машинное обучение
Курс на Stepik, простыми словами объясняющий Pandas и некоторые алгоритмы.
✍️Курсы на Kaggle
Множество обучающих материалов по необходимым темам: от Python до обучения с подкреплением.
✍️«Ударный» курс по Machine Learning от Google
Рассказывает про основные алгоритмы и концепции.
✍️Deep Learning School
Курс проходит бесплатно и онлайн на платформах Stepik и Google Colab. На сайте можно зарегистрироваться на новые потоки (следите за обновлениями). Однако, в целом, материал уже доступен на Stepik.
❤7👏6🤩1
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Продолжаем наш опрос — вторая часть👇
В какой стране вы живете последние 3 месяца?
Anonymous Poll
63%
Россия
6%
Украина
4%
Беларусь
5%
Казахстан
1%
Польша
1%
Кыргызстан
2%
Узбекистан
1%
США
1%
Грузия
15%
Другое
Ваш доход в месяц после налогов:
Anonymous Poll
22%
до $500
9%
от $501 до $800
12%
от $801 до $1100
21%
от $1101 до $2000
16%
от $2001 до $3000
9%
от $3001 до $4000
4%
от $4001 до $5001
1%
от $5001 до $6000
6%
от $6001
Какой у вас коммерческий опыт работы в IT?
Anonymous Poll
21%
от 6 лет
17%
от 3 до 6 лет включительно
25%
от 1 до 3 лет включительно
11%
до 1 года
27%
нет опыта
💬Как вы думаете, какая из приведённых ниже величин скорее распределена нормально?
🥰 — срок службы автомобиля марки X
🎉 — масса тела младенцев при рождении
❤️ — чеки пользователей некого мобильного приложения
👾 — продолжительность болезни при заражении некоторым несмертельным вирусом
#интерактив
🥰 — срок службы автомобиля марки X
🎉 — масса тела младенцев при рождении
❤️ — чеки пользователей некого мобильного приложения
👾 — продолжительность болезни при заражении некоторым несмертельным вирусом
#интерактив
🎉89👾9🥰8❤3
🧑💻 Статьи для IT: как объяснять и распространять значимые идеи
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
This media is not supported in your browser
VIEW IN TELEGRAM
🪄Заставить Джоконду бежать? Диффузионные модели на это способны
А если быть точнее, модели, лежащие в основе фреймворка MagicAnimate. Он позволяет реалистично анимировать изображения людей. И ничего при этом не дёргается.
Для использования понадобится скачать предобученные базовые модели StableDiffusion V1.5 и MSE-finetuned VAE.
👩💻Изучить код проекта на GitHub
📖Прочесть статью
🤗Демка на Hugging Face
А если быть точнее, модели, лежащие в основе фреймворка MagicAnimate. Он позволяет реалистично анимировать изображения людей. И ничего при этом не дёргается.
Для использования понадобится скачать предобученные базовые модели StableDiffusion V1.5 и MSE-finetuned VAE.
👩💻Изучить код проекта на GitHub
📖Прочесть статью
🤗Демка на Hugging Face
🔥6❤5👍1
🧠 Школа анализа данных Яндекса открыла своё пространство в Петербурге
К 2026 году ШАД планирует выпустить 700 топовых специалистов по ML и DS, из которых 200 человек выйдут из питерского филиала.
На новой офлайн-площадке, помимо основной учебной программы, будут проводить открытые лектории, воркшопы и интенсивы с экспертами Яндекса и преподавателями Школы. Участвовать в них смогут все, кто интересуется ИИ и сферой его применения. Также обещают соревнования по ML, алгоритмам, хакатоны по разработке и другой движ для ML-комьюнити.
К 2026 году ШАД планирует выпустить 700 топовых специалистов по ML и DS, из которых 200 человек выйдут из питерского филиала.
На новой офлайн-площадке, помимо основной учебной программы, будут проводить открытые лектории, воркшопы и интенсивы с экспертами Яндекса и преподавателями Школы. Участвовать в них смогут все, кто интересуется ИИ и сферой его применения. Также обещают соревнования по ML, алгоритмам, хакатоны по разработке и другой движ для ML-комьюнити.
🔥9🎉1
Чем градиентный бустинг на деревьях отличается от случайного леса?
Здесь достаточно вспомнить базовые принципы построения этих двух алгоритмов.
🌲Градиентный бустинг:
Комбинирует предсказания нескольких базовых моделей, в данном случае решающих деревьев. Эти базовые модели строятся последовательно, и каждая новая учится исправлять ошибки предыдущих.
🌲Случайный лес:
Использует совокупность деревьев решений, построенных параллельно на случайно выбранных подмножествах обучающего набора данных. Конечный результат получается путём усреднения или выбора большинства среди предсказаний всех деревьев.
#вопросы_с_собеседований
Здесь достаточно вспомнить базовые принципы построения этих двух алгоритмов.
🌲Градиентный бустинг:
Комбинирует предсказания нескольких базовых моделей, в данном случае решающих деревьев. Эти базовые модели строятся последовательно, и каждая новая учится исправлять ошибки предыдущих.
🌲Случайный лес:
Использует совокупность деревьев решений, построенных параллельно на случайно выбранных подмножествах обучающего набора данных. Конечный результат получается путём усреднения или выбора большинства среди предсказаний всех деревьев.
#вопросы_с_собеседований
🔥5👍3😁3
gemini_final_text_table_bigger_font_amendment_lines.gif
124.4 KB
Google представила свою крупнейшую ИИ-модель — Gemini
⭐Модель является мультимодальной — может работать и с текстом, и с изображениями, и с видео, и с аудио.
⭐Google заявляет, что Gemini превосходит людей-экспертов в задачах MMLU (Massive Multitask Language Understanding).
⭐Доступна в трёх версиях: Ultra (самая большая для сложных задач), Pro и Nano. У последней есть нативная поддержка в смартфоне Pixel 8 Pro.
⭐Google делает акцент на том, что Gemini может хорошо генерировать код на Python, Java, C++ и Go.
⭐Google Bard начал использовать Gemini Pro. Доступность расширяется постепенно: Google обещает поддержку обновлённого чат-бота на английском языке в более чем 170 странах и территориях. В будущем появится и поддержка других языков.
👩💻С 13 декабря разработчики смогут получить доступ к Gemini Pro через Gemini API в Google AI Studio или Google Cloud Vertex AI.
🔗Читать о новинках подробнее в блоге Google
⭐Модель является мультимодальной — может работать и с текстом, и с изображениями, и с видео, и с аудио.
⭐Google заявляет, что Gemini превосходит людей-экспертов в задачах MMLU (Massive Multitask Language Understanding).
⭐Доступна в трёх версиях: Ultra (самая большая для сложных задач), Pro и Nano. У последней есть нативная поддержка в смартфоне Pixel 8 Pro.
⭐Google делает акцент на том, что Gemini может хорошо генерировать код на Python, Java, C++ и Go.
⭐Google Bard начал использовать Gemini Pro. Доступность расширяется постепенно: Google обещает поддержку обновлённого чат-бота на английском языке в более чем 170 странах и территориях. В будущем появится и поддержка других языков.
👩💻С 13 декабря разработчики смогут получить доступ к Gemini Pro через Gemini API в Google AI Studio или Google Cloud Vertex AI.
🔗Читать о новинках подробнее в блоге Google
🔥8👍4🤔2
🍏«PyTorch для MacBook»: Apple выпустила собственный фреймворк для ML на Apple Silicon
MLX должен быть прост в использовании, если вы уже знакомы с самыми популярными библиотеками для машинного обучения. Вот основные особенности фреймворка:
▫️Под капотом Python API и интерфейсы, похожие на PyTorch.
▫️Ленивые вычисления.
▫️Унифицированная память, в которой хранятся массивы. Операции с ними могут выполняться на любом из поддерживаемых типов устройств без перемещения данных.
▫️Встроенные функции для автоматического дифференцирования, автоматической векторизации и оптимизации вычислительного графа.
👩💻Репозиторий MLX на GitHub
MLX должен быть прост в использовании, если вы уже знакомы с самыми популярными библиотеками для машинного обучения. Вот основные особенности фреймворка:
▫️Под капотом Python API и интерфейсы, похожие на PyTorch.
▫️Ленивые вычисления.
▫️Унифицированная память, в которой хранятся массивы. Операции с ними могут выполняться на любом из поддерживаемых типов устройств без перемещения данных.
▫️Встроенные функции для автоматического дифференцирования, автоматической векторизации и оптимизации вычислительного графа.
👩💻Репозиторий MLX на GitHub
❤6👏2🤯1
💬Итак, настало время узнать: PyTorch или TensorFlow
Есть мнение, что единственная причина использовать TensorFlow — вас заставили это делать. Но вдруг у вас другая точка зрения? Расскажите, чем пользуетесь чаще, что больше по душе.
❤️ — PyTorch
👍 — TensorFlow
Пишите свои соображения в комментарии👇
#интерактив
Есть мнение, что единственная причина использовать TensorFlow — вас заставили это делать. Но вдруг у вас другая точка зрения? Расскажите, чем пользуетесь чаще, что больше по душе.
❤️ — PyTorch
👍 — TensorFlow
Пишите свои соображения в комментарии👇
#интерактив
❤84👍21🤯3
✏️Очередная хитрость по работе с LLM
Исследователи продолжают изучать поведение собственных больших языковых моделей. На этот раз создатели Claude 2.1 из Anthropic выяснили, что достаточно добавить в промпт одну фразу, чтобы повысить качество ответа с 27% до 98%.
Дело в том, что модель может неохотно давать ответы на базе отдельных предложений в документе, особенно если эти предложения как-то искажены или неуместны. Это следствие того, что Claude 2.1 специально обучили не генерировать недостаточно аргументированные ответы. Поэтому, чтобы исправить такое поведение, нужно добавить в промпт следующее:
✍️«Assistant: Here is the most relevant sentence in the context:» («Ассистент: Вот самое релевантное предложение из контекста:»)
Исследователи продолжают изучать поведение собственных больших языковых моделей. На этот раз создатели Claude 2.1 из Anthropic выяснили, что достаточно добавить в промпт одну фразу, чтобы повысить качество ответа с 27% до 98%.
Дело в том, что модель может неохотно давать ответы на базе отдельных предложений в документе, особенно если эти предложения как-то искажены или неуместны. Это следствие того, что Claude 2.1 специально обучили не генерировать недостаточно аргументированные ответы. Поэтому, чтобы исправить такое поведение, нужно добавить в промпт следующее:
✍️«Assistant: Here is the most relevant sentence in the context:» («Ассистент: Вот самое релевантное предложение из контекста:»)
👍12
⚡️Свершилось: канал с книгами только по Data Science
Мы создали для вас канал, куда будем публиковать самые полезные книги только для специалистов по Data Science. Подписывайтесь!
👉 Книги для дата сайентистов | Data Science
Мы создали для вас канал, куда будем публиковать самые полезные книги только для специалистов по Data Science. Подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5👍4