Новый AI-чип от AMD
Во вторник на прошлой неделе AMD объявила о создании нового AI-чипа Instinct MI325X и о планах запустить его производство в конце 2024 года.
По словам представителей AMD, чип MI325X быстрее, чем H200 от NVIDIA, как в инференсе, так и в обучении ИИ-моделей. Решение от AMD включает 256 ГБ VRAM с большей пропускной способностью — 8 ТБ/с. Это больше, чем у последней NVIDIA H200, у которой 141 ГБ и 4,8 ТБ/с соответственно. Это позволяет чипу MI325X выполнять операции с числовыми типами fp16 и fp8 примерно в 1,3 раза быстрее. Карта, в первую очередь, предназначена для работы в специализированной серверной инфраструктуре OCP (цепи питания чипа — 54 В!), и в AMD надеются, что компании-поставщики облачных услуг, а также крупные AI-разработчики с собственными дата-центрами будут покупать у них эти чипы. В AMD сообщили, что OpenAI, Microsoft и некоторые другие крупные клиенты уже используют их GPU для своих приложений.
Сильным преимуществом главного конкурента AMD, NVIDIA, является наличие развитого и популярного программного стека (CUDA и других библиотек), ставшего стандартом в AI-разработке. Например, в облаке immers.cloud все серверы с видеокартами NVIDIA, и доступен выбор образов с предустановленным CUDA-стеком, что упрощает настройку рабочего окружения. AMD предлагает разработчикам переходить с CUDA на ROCm для того, чтобы использовать их GPU.
На главной странице вы можете подписаться на нашу рассылку, и если эта видеокарта появится у нас, вы узнаете об этом одними из первых.
Во вторник на прошлой неделе AMD объявила о создании нового AI-чипа Instinct MI325X и о планах запустить его производство в конце 2024 года.
По словам представителей AMD, чип MI325X быстрее, чем H200 от NVIDIA, как в инференсе, так и в обучении ИИ-моделей. Решение от AMD включает 256 ГБ VRAM с большей пропускной способностью — 8 ТБ/с. Это больше, чем у последней NVIDIA H200, у которой 141 ГБ и 4,8 ТБ/с соответственно. Это позволяет чипу MI325X выполнять операции с числовыми типами fp16 и fp8 примерно в 1,3 раза быстрее. Карта, в первую очередь, предназначена для работы в специализированной серверной инфраструктуре OCP (цепи питания чипа — 54 В!), и в AMD надеются, что компании-поставщики облачных услуг, а также крупные AI-разработчики с собственными дата-центрами будут покупать у них эти чипы. В AMD сообщили, что OpenAI, Microsoft и некоторые другие крупные клиенты уже используют их GPU для своих приложений.
Сильным преимуществом главного конкурента AMD, NVIDIA, является наличие развитого и популярного программного стека (CUDA и других библиотек), ставшего стандартом в AI-разработке. Например, в облаке immers.cloud все серверы с видеокартами NVIDIA, и доступен выбор образов с предустановленным CUDA-стеком, что упрощает настройку рабочего окружения. AMD предлагает разработчикам переходить с CUDA на ROCm для того, чтобы использовать их GPU.
На главной странице вы можете подписаться на нашу рассылку, и если эта видеокарта появится у нас, вы узнаете об этом одними из первых.
👍6🎉5⚡4❤2
OpenAI, вероятно, увидели необходимость ответить на появление Llama Stack и представили открытый фреймворк Swarm для создания AI агентов.
Это python-библиотека, цель которой — упростить программирование систем агентов, подробнее о которых читайте здесь: Orchestrating Agents: Handoffs & Routines. Однако есть нюансы.
С одной стороны, OpenAI постарались в этот раз казаться по-настоящему “open”, утверждая, что “Swarm выполняется (почти) полностью на стороне клиента”, а клиентский код открыт и выложен на Github. Но по факту этот код - обертка вокруг Chat Completions API с закрытыми моделями OpenAI. Если сравнивать с Llama Stack и его Agentic API, последний предназначен для работы с моделями Llama, которые могут быть полностью self-hosted, например, развернуты в GPU-облаке, что дает разработчику значительно больший контроль. Наша платформа immers.cloud предоставляет удобный функционал для конфигурации собственного GPU сервера. С его помощью ML-разработчики могут проще управлять инфраструктурой, пользуясь при этом всеми преимуществами открытых AI-моделей.
В заключение о минусах Swarm стоит отметить, что он заявлен как экспериментальный фреймворк без официальной поддержки, это следует иметь в виду, выбирая стек для AI-приложения.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3❤🔥3🔥2🎉1
Хотите узнать, как создавать реалистичные анимации в играх и NLA графике? Даня Грызлов делится своими знаниями в новой статье, где на примере Silent Hill 2 рассказывает о ключевых принципах анимации и её реализации в игровом процессе.
👉 ВКонтакте
👉 vc.ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤3🎉3👍1
Отличные новости!
С радостью сообщаем вам о расширении нашего интернет-канала провайдера Westcall с 2 до 20 Гбит/с!
🔹 Обратите внимание: в рамках одного соединения доступно до 10 Гбит/с. Это связано с тем, что канал подключен через два интерфейса по 10 Гбит/с. Балансировка нагрузки настроена так, что один поток (от исходного до конечного IP) всегда проходит через один и тот же линк.
С радостью сообщаем вам о расширении нашего интернет-канала провайдера Westcall с 2 до 20 Гбит/с!
🔹 Обратите внимание: в рамках одного соединения доступно до 10 Гбит/с. Это связано с тем, что канал подключен через два интерфейса по 10 Гбит/с. Балансировка нагрузки настроена так, что один поток (от исходного до конечного IP) всегда проходит через один и тот же линк.
👏7❤🔥3❤3👍1
🔔 NVIDIA сначала закрыла доступ к обновлениям драйверов в РФ, но доступ снова открыт. Что дальше?
Вчера интернет всколыхнула новость: NVIDIA ограничила пользователям из РФ доступ к обновлениям драйверов видеокарт. Утром стало известно, что доступ восстановлен. Но кто знает, надолго ли? Риски повторной блокировки остаются, и это может поставить под угрозу стабильную работу как геймеров, так и профессионалов, работающих с 3D-графикой, искусственным интеллектом и другими вычислительными задачами.
Что это значит для вас?
Если вы используете GPU в своих проектах, завязанных на вычислительных мощностях, отсутствие доступа к драйверам и обновлениям может привести к снижению производительности, проблемам с совместимостью и даже полному простою.
🚀 Почему аренда GPU RTX & Tesla в immers.cloud — это выход?
Мы понимаем, как важен стабильный доступ к актуальному железу и обновлениям. В immers.cloud вы получаете доступ к мощным GPU на базе RTX с гарантией того, что драйверы и все необходимые обновления будут всегда на месте.
🔹 Всегда в актуальном состоянии — наши серверы обновляются своевременно, чтобы обеспечить наилучшую производительность.
🔹 Гибкость использования — арендуйте мощные GPU на сколько нужно для ваших задач.
🔹 Посекундная тарификация - платите только за использованные ресурсы. Цены стартуют от 23 руб в час
🔹 Наши серверы обновляются своевременно, содержат предустановленные драйвера и CUDA Toolkit, чтобы обеспечить актуальный функционал и не тратить ваше время
Не дайте внешним факторам повлиять на ваши проекты — переходите на аренду мощностей в immers.cloud и оставайтесь уверенными в завтрашнем дне!
Вчера интернет всколыхнула новость: NVIDIA ограничила пользователям из РФ доступ к обновлениям драйверов видеокарт. Утром стало известно, что доступ восстановлен. Но кто знает, надолго ли? Риски повторной блокировки остаются, и это может поставить под угрозу стабильную работу как геймеров, так и профессионалов, работающих с 3D-графикой, искусственным интеллектом и другими вычислительными задачами.
Что это значит для вас?
Если вы используете GPU в своих проектах, завязанных на вычислительных мощностях, отсутствие доступа к драйверам и обновлениям может привести к снижению производительности, проблемам с совместимостью и даже полному простою.
🚀 Почему аренда GPU RTX & Tesla в immers.cloud — это выход?
Мы понимаем, как важен стабильный доступ к актуальному железу и обновлениям. В immers.cloud вы получаете доступ к мощным GPU на базе RTX с гарантией того, что драйверы и все необходимые обновления будут всегда на месте.
🔹 Всегда в актуальном состоянии — наши серверы обновляются своевременно, чтобы обеспечить наилучшую производительность.
🔹 Гибкость использования — арендуйте мощные GPU на сколько нужно для ваших задач.
🔹 Посекундная тарификация - платите только за использованные ресурсы. Цены стартуют от 23 руб в час
🔹 Наши серверы обновляются своевременно, содержат предустановленные драйвера и CUDA Toolkit, чтобы обеспечить актуальный функционал и не тратить ваше время
Не дайте внешним факторам повлиять на ваши проекты — переходите на аренду мощностей в immers.cloud и оставайтесь уверенными в завтрашнем дне!
❤🔥3 3👏2❤1👍1😱1
• OpenAI выпустила десктопное приложение ChatGPT для Windows
Теперь ChatGPT доступен на ПК с Windows через официальное приложение. Программа пока предназначена для пользователей с платной подпиской и поддерживается на Windows 10 версии 17763.0 и выше. Приложение весит всего 283 МБ, но не поддерживает голосовые команды, а также пока не все интеграции с GPT Store работают. Тем не менее, это важный шаг в сторону большего удобства для пользователей ChatGPT.
• Акции NVIDIA снова на вершине благодаря новым ИИ-чипам
NVIDIA продолжает впечатлять рынок своими новейшими разработками в области искусственного интеллекта. Недавние заявления компании о выпуске новых ИИ-чипов подстегнули рост стоимости акций компании к новым рекордам. Для пользователей облачных решений это открывает новые возможности — аренда GPU в облаке позволяет использовать мощь этих передовых технологий без необходимости приобретения дорогого оборудования, делая вычисления доступнее и экономичнее.
• Midjourney представила новый визуальный редактор для пользователей
В начале следующей недели Midjourney выпустит новый инструмент для ограниченного числа пользователей. Редактор позволит загружать любые изображения из интернета и вносить детализированные изменения, такие как корректировка текстур, цвета и других визуальных элементов. Этот шаг делает использование Midjourney ещё более гибким и удобным для креаторов, стремящихся к максимальной персонализации своих изображений.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3❤🔥2👍2🔥1🎉1🏆1 1
Сегодня поговорим о видеокарте NVIDIA RTX 3080. Это один из популярных вариантов для тех, кто ищет баланс между высокой производительностью и доступной ценой. Давайте рассмотрим её ключевые технические характеристики и узнаем, для каких задач она подходит лучше всего.
В immers.cloud вы можете арендовать мощные видеокарты, такие как RTX 3080, 4090 и даже Tesla H100 и А100, для любых задач — от игр до рендеринга и работы с ИИ. С нашими облачными решениями вам не нужно покупать дорогое оборудование: вы получаете доступ к мощным ресурсам ровно в тот момент, когда они вам нужны.
Будущее за облачными технологиями, и с immers.cloud вы можете оптимизировать затраты и ускорить свои проекты.
Попробуйте уже сегодня! 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4❤🔥4👍3🔥1🎉1
🚀 HUGS - Инфраструктура для автоматизации AI-систем
На днях HuggingFace анонсировала HUGS — Hugging Face Generative AI Services. Эта платформа предназначена для автоматизации AI-приложений и ориентирована на использование открытых моделей, таких как Llama и Gemma.
Несмотря на то что HUGS построен на опенсорсных технологиях, таких как сервер TGI и библиотека Transformers, сама платформа платная с тарификацией за использование ресурсов. HUGS может работать в облаке — AWS, GCP, Azure, Digital Ocean — и оптимизирован под графические процессоры NVIDIA и AMD.
С HUGS инструменты для работы с открытыми AI-моделями пополнились новым мощным средством автоматизации бизнес-систем. Для разработчиков важно, что HUGS предлагает API в OpenAI-совместимом формате, взаимодействовать с которым можно с помощью знакомых библиотек — huggingface_hub или openai.
Тем не менее, HUGS ограничивает клиентов в выборе облачного провайдера, что может стать минусом в вопросе цены. Построение собственной инфраструктуры на immers.cloud потребует вложений в разработку, но может оказаться более эффективным по стоимости использования самой системы.
На днях HuggingFace анонсировала HUGS — Hugging Face Generative AI Services. Эта платформа предназначена для автоматизации AI-приложений и ориентирована на использование открытых моделей, таких как Llama и Gemma.
Несмотря на то что HUGS построен на опенсорсных технологиях, таких как сервер TGI и библиотека Transformers, сама платформа платная с тарификацией за использование ресурсов. HUGS может работать в облаке — AWS, GCP, Azure, Digital Ocean — и оптимизирован под графические процессоры NVIDIA и AMD.
С HUGS инструменты для работы с открытыми AI-моделями пополнились новым мощным средством автоматизации бизнес-систем. Для разработчиков важно, что HUGS предлагает API в OpenAI-совместимом формате, взаимодействовать с которым можно с помощью знакомых библиотек — huggingface_hub или openai.
Тем не менее, HUGS ограничивает клиентов в выборе облачного провайдера, что может стать минусом в вопросе цены. Построение собственной инфраструктуры на immers.cloud потребует вложений в разработку, но может оказаться более эффективным по стоимости использования самой системы.
@ruslandevlive — мысли о современных AI/ML технологиях
⚡5❤3🔥3👍2
1. В России разработали «распределяющую шляпу» с нейроинтерфейсом для выбора профессии
Новая технология в виде «распределяющей шляпы» с нейроинтерфейсом создана для помощи людям в выборе профессии. Инновация позволяет анализировать предпочтения и способности пользователей, предоставляя рекомендации по наиболее подходящим карьерным путям. Этот проект может значительно упростить процесс выбора профессии и помочь молодым специалистам найти свое призвание.
2. Интерес российского бизнеса к искусственному интеллекту вырос в семь раз
Аналитические исследования показывают, что интерес российских компаний к технологиям искусственного интеллекта с 2022 года увеличился в семь раз. Это свидетельствует о стремлении бизнеса к внедрению ИИ-решений для повышения эффективности и оптимизации процессов. Увеличение инвестиций в данную сферу открывает новые возможности для инновационных стартапов и улучшения конкурентоспособности на рынке.
3. Этические стандарты в разработке ИИ: новое видение от разработчиков
В условиях быстрого развития технологий искусственного интеллекта возникает необходимость в установлении этических стандартов. Разработчики обсуждают важность этих норм для обеспечения ответственного использования ИИ. Вопросы о том, как ИИ влияет на общество, безопасность данных и личные права становятся актуальными как никогда, и специалисты стремятся выработать подходы для их регулирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4❤🔥4🔥3👍1
В нашей новой статье амбассадора Ruslan Dev вы узнаете о возможностях мультимодальных приложений, созданных на базе Llama 3.2 и Llama Stack. Откройте для себя, как эти технологии меняют подход к разработке приложений и какие преимущества они предлагают. Не пропустите интересные идеи и практические примеры!
👉 Хабр: Мультимодальные приложения на Llama 3.2
👉 vc.ru: Как создавать мультимодальные приложения
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5⚡4🔥4👍1🎉1
Нужен гибкий и простой способ управления виртуальными дисками? В immers.cloud вы можете легко создавать, переносить и расширять тома для ваших виртуальных машин!
Тома в immers.cloud — это гибкий инструмент для хранения данных и управления виртуальными машинами. Создавайте, переносите, расширяйте их под любые задачи! Не забудьте вовремя удалять ненужные тома, чтобы не тратить средства зря.
Расскажем, как это сделать, и на что важно обратить внимание. Управляйте ресурсами легко и эффективно с нашими инструментами.
Тома в immers.cloud — это гибкий инструмент для хранения данных и управления виртуальными машинами. Создавайте, переносите, расширяйте их под любые задачи! Не забудьте вовремя удалять ненужные тома, чтобы не тратить средства зря.
Расскажем, как это сделать, и на что важно обратить внимание. Управляйте ресурсами легко и эффективно с нашими инструментами.
👍4⚡3❤3🔥2
Пользуйтесь надёжным облачным решением для любых задач абсолютно бесплатно.
Подробности об использовании S3 ищите в нашем FAQ по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤4🏆2 2👍1