immers.cloud | Облако с GPU
1.01K subscribers
955 photos
8 videos
261 links
immers.cloud — облачный GPU-сервис с широким выбором видеокарт для ML, генеративных моделей, 3D и рендеринга.

Самый большой ассортимент GPU Tesla и RTX 💻

👉 Наш сайт https://immers.cloud/
🎧 @immerscloudsupport

Чат по ИИ - https://t.me/immersAI
Download Telegram
📢 Дайджест новостей мира ИИ

1. Nvidia готова представить RTX 5090 и 5080
Компания Nvidia объявила о скором релизе первых видеокарт серии RTX 50. Новинки RTX 5090 и 5080 будут презентованы в январе 2025 года на выставке CES.

RTX 5090: 32 ГБ GDDR7 памяти, цена — $1999.
RTX 5080: 16 ГБ GDDR7 памяти, цена — $999.
С февраля 2025 года линейка пополнится моделями RTX 5070 и 5060, которые предложат отличное соотношение цены и производительности.


Архитектура Blackwell обещает значительный прирост производительности и энергоэффективности благодаря памяти GDDR7.

2. Проблемы с перегревом серверов на Nvidia Blackwell
Новые серверные чипы Nvidia Blackwell страдают от перегрева при установке в стойки на 72 GPU.

• Проблемы особенно актуальны для моделей Blackwell NVL72, потребляющих до 1 кВт на один чип.
• Nvidia работает над решением, но поставки могут быть ограничены до устранения неисправностей.


💡В immers.cloud таких проблем нет благодаря иммерсионному охлаждению, которое эффективно защищает оборудование от перегрева.

3. Российские ученые повысили точность распознавания объектов на фото
Ученые из T-Bank AI Research совместно с МИСИС и МФТИ разработали метод SDDE, который на 20% уменьшает ошибки распознавания ранее неизвестных объектов.

• Метод основан на глубоких ансамблях, использующих карты внимания для повышения точности.
• Технология имеет потенциал в медицинской диагностике и беспилотных автомобилях.


Мировой рынок компьютерного зрения растет, прогнозируя увеличение с $25,8 млрд в 2024 до $47 млрд к 2030 году.
👍43🎉3
📖 DeepSeek-R1-Lite-Preview: открытый аналог o1

Китайский AI-разработчик Deepseek разрабатывает открытую модель, способную строить пошаговые логические рассуждения - как OpenAI o1. Сейчас доступна ранняя версия этой модели DeepSeek-R1-Lite-Preview.

У этой модели интересные результаты по математическим бенчмаркам и задачам на логику - некоторые из них превосходят o1. Ещё одним безусловным преимуществом R1 является открытая цепочка мыслей, наконец-то можно наблюдать весь ход рассуждений модели в "сыром" виде. Как мы помним, OpenAI скрывают цепочку мыслей o1, показывают только саммари и результат.

DeepSeek-R1-Lite-Preview пока доступен через чат на сайте разработчика, скоро обещают доступ по API и, самое главное, открытый доступ к весам. Разработчики гадают, каков размер R1 Lite. Пока лишь известно, что модель "относительно небольшая", а значит, ее можно эффективно использовать на одной или нескольких видеокартах.

В связи с этим рекомендуем ознакомиться гайдом нашего амбассадора Ruslan Dev по облачным GPU immers.cloud и обучению LLM. Процесс инференса и файнтюнинга модели с логическими цепочками мыслей должен отличаться от рассмотренных мной моделей Llama, но это невероятно интересная и перспективная область.

@ruslandevlive — мысли о современных AI/ML технологиях
4🔥3👏3👍1
Что такое OpenAI Operator

Согласно недавнему отчёту Блумберг, OpenAI работает над AI-агентом, релиз которого состоится в январе. Новая система известна как Operator и предназначена для автоматического выполнения задач на пользовательском компьютере - от веб-запросов в браузере до написания кода.

AI-агенты управляются большими языковыми языковыми и интегрированы с различными API, чтобы обеспечить автономное выполнение задач. 
Кстати, в последних рейтингах среди открытых LLM, подходящих для создания AI-агентов, лидирует Qwen 2.5. Неизвестно, какими возможностями будет обладать Operator, но у открытых моделей есть перед ним большое преимущество - разработчики могут файнтюнить их на собственных данных.

На канале @ruslandevlive есть множество примеров файнтюнинга Llama с помощью GPU immers.cloud. Эти инструкции работают и для Qwen. Кроме того, только с открытой LLM агент может стать по-настоящему автономным, не зависящим от сторонних API. Это критично для некоторых задач, например, связанных с обработкой конфиденциальных данных.
4🎉442👍2
💾 Нужно больше места на диске вашей Виртуальной Машины? Расширить его в immers.cloud проще простого!

Рассказываем, как это сделать для разных типов ВМ — Volume-backed и Local. Управляйте ресурсами быстро и удобно.

Будь то ВМ Volume-backed или Local, расширение диска — это всего пара кликов в immers.cloud. Следуйте простой инструкции и забудьте о нехватке места!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤‍🔥4🎉41
🛠 Простое подключение к виртуальной машине с Windows Server: пошаговая инструкция.

По умолчанию мы предоставляем подключение через Remote Desktop Protocol (RDP). Если для работы с Виртуальной Машиной (ВМ) требуется подключение другими способами (например, SSH для Linux), их необходимо будет настроить вручную.

Подключение из Windows
1. Расшифруйте пароль:
• В меню «Действия» выберите пункт Get password.
• На открывшейся странице нажмите кнопку «Показать».


2. Нажмите на IP-адрес, отображаемый на странице виртуальной машины, и сохраните на свой компьютер файл vmname.rdp.

3. Запустите скачанный файл.

4. Для входа используйте:
• Имя пользователя: admin.
• Пароль: тот, который вы расшифровали ранее.


Подключение из MacOS
1. Установите приложение Microsoft Remote Desktop из Mac App Store.

2. В приложении нажмите Add PC, введите IP-адрес ВМ в поле PC name и нажмите Add.

3. Расшифруйте пароль:
• В меню «Действия» выберите пункт Get password.
• На открывшейся странице нажмите кнопку «Показать».


4. Подключитесь к добавленной Виртуальной машине.

5. Для входа используйте:
• Имя пользователя: admin.
• Пароль: тот, который вы расшифровали ранее.


Для выключения Виртуальной Машины воспользуйтесь командой Stop в выпадающем меню «Действия».

❗️Важно:
Биллинг vCPU и RAM Виртуальной машины прекращается только при использовании указанного способа выключения.

Узнайте больше о возможностях наших ВМ и настройке подключения на странице с подробными инструкциями.
👍75🔥5
🤖 AI агенты — это не только интеграция LLM с внешними системами

Большое разнообразие GenAI приложений в последнее время все чаще включает рабочие процессы, управляемые агентами.

Одно из свойств AI агентов — это способность интегрироваться с различными внешними API (вызов функций).

Наше облако immers.cloud предлагает новейшие видеокарты для быстрого инференса, что так важно для агентских систем, ведь они требуют значительно больше токенов в секунду, чем обычные zero-shot чатботы.

Помимо облачной инфраструктуры важна архитектура самой нейросети, сейчас получают распространение модели рассуждений, Large Reasoning Model - на моем телеграм канале выходят публикации об этом. Рекомендую рассмотреть Marco-o1, LRM на базе Qwen 2, которая дает представление о том, как обучать такие модели, какие использовать стратегии промптинга.

@ruslandevlive — мысли о современных AI/ML технологиях
👏53🔥3👍2
🎬 Новогодний киномарафон для айтишников

Праздники — время расслабиться, зарядиться вдохновением и немного поразмышлять о технологиях, которые делают нашу жизнь ярче. Мы собрали подборку фильмов и сериалов, которые идеально подойдут для уютных зимних вечеров.

От биографий гениальных изобретателей до фантастических историй о будущем — каждый найдет что-то интересное!

Заваривайте какао, укутывайтесь в плед и готовьтесь погрузиться в мир ИТ и праздничный киномарафон начинается! 🎉
🔥6👏54👍2
Новости ИТ: Генеративный ИИ в России и новинки от Nvidia

1. Генеративный ИИ в России: перспективы роста
Эксперты прогнозируют, что российский рынок генеративного искусственного интеллекта (GenAI) будет расти быстрее мирового — до 46,49% ежегодно. Основной драйвер — синергия бизнеса и вузов, поддержка разработок и внедрение больших языковых моделей в производственные процессы.
К примеру, уже сейчас GenAI помогает оптимизировать бизнес, автоматизировать процессы в металлургии, энергетике и транспорте, а также создавать интеллектуальные системы поддержки клиентов.

2. Nvidia представляет Fugatto
Компания Nvidia анонсировала революционную звуковую ИИ-модель Fugatto, которая позволяет генерировать или изменять звуки с помощью текстовых запросов. От создания прототипов песен для музыкальных продюсеров до разработки сложных игровых звуковых эффектов — возможности модели открывают новые горизонты в аудиопроизводстве.

3. Google Genie 2: ИИ для создания 3D-миров
Google презентовала нейронку Genie 2, способную генерировать разнообразные 3D-окружения для обучения и тестирования ИИ-агентов. Модель создает интерактивные игровые миры на основе одного изображения, что делает её полезной как для разработчиков, так и для пользователей.

🌟 Будущее за ИИ!
Погрузитесь в мир инноваций и обучайте свои модели на наших мощных облачных серверах. Узнайте больше в immers.cloud!
👍4🏆332
🚀 Новостной пост от immers.cloud

1. Загрузили Windows Server 2025 RU/EN
Мы добавили новый образ Windows Server 2025 с обновленным интерфейсом и улучшенной производительностью.

🆕Что нового
• Современный графический интерфейс — новый дизайн упрощает навигацию и делает работу интуитивной.
• Оптимизация SSD и NVMe — серверы работают быстрее и стабильнее, что особенно важно для высоконагруженных задач.
• Поддержка многопроцессорных систем (NUMA) — эффективное использование ресурсов на многопроцессорных конфигурациях.
• WinGet по умолчанию — удобный инструмент управления пакетами для быстрой установки приложений и утилит.
• Упрощение системы — удалены устаревшие функции и программы для повышения надежности и скорости работы.



👉Подробнее о Windows Server 2025

2. Обновили Blender 4.3
Теперь работать с Blender стало еще удобнее! Мы добавили обновленный образ с последней версией Blender 4.3, улучшенными драйверами и поддержкой Windows Server 2025.

🆕Что нового
• Переезд на Windows Server 2025 — обновленная серверная платформа с поддержкой SSD/NVMe и улучшенной производительностью многопроцессорных систем.
• Обновления драйверов — новые версии драйверов GPU, Virtio и Baremetal обеспечивают лучшую поддержку оборудования и увеличивают скорость рендеринга.


👉Подробнее о Blender 4.3
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9441
🆕 Отличные новости!

Мы завершили перевод интернет-канала от провайдера Инетком на площадку М9. Теперь никаких падений и лагов!

🔹 Подробности:
В рамках договора с Инетком доступна полоса пропускания трафика до 2x10 Гбит/с по схеме burstable, что было реализовано через два физических интерфейса по 10 Гбит/с, с динамической распределением нагрузки.

🚀 Убедитесь сами в скорости и надежности — заходите на наш сайт по ссылке и подключайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👏54👍2
🐓💻 Как я сделал детализированного 3D-петуха в Blender за сутки?

Создать сложного и яркого персонажа за короткий срок — звучит как вызов, но это отличный способ прокачать навыки. В новом гайде я рассказываю, как:

1️⃣ Подобрать референсы и составить план.
2️⃣ Сделать блокинг из базовых форм и перейти к детализации.
3️⃣ Создать реалистичные перья вручную и текстурировать их.
4️⃣ Оптимизировать проект и сделать финальный рендер.


А если ваш компьютер не тянет большие сцены, подключайтесь к immers.cloud и рендерьте на мощных серверах с видеокартами NVIDIA RTX 4090. 🚀

📹 Полное видео с пошаговым процессом — на моём YouTube-канале!
👍54🔥4
Новости мира IT: главные события за неделю

1. Квантовая революция от Google: компания создала квантовый чип Willow
Google представила рекордный квантовый процессор Willow, который может решать задачи за считанные минуты, на которые суперкомпьютеру понадобилось бы 10 септиллионов лет. Новая технология уменьшает количество ошибок при масштабировании кубитов, приближая нас к первой полезной квантовой вычислительной задаче.

2. В России появится Лаборатория ИИ и анализа данных. Ее открывают Центральный университет и Институт AIRI
Центральный университет и Институт AIRI создали лабораторию искусственного интеллекта и анализа данных. Возглавит проект профессор Александр Горбань, а фокус будет на фундаментальных исследованиях и развитии алгоритмов для бизнеса. Это шаг к воспитанию нового поколения ученых и продвижению AI в России.

3. Apple выпустила iOS 18.2 с поддержкой ChatGPT в Siri и генератором эмодзи 
Apple добавила поддержку ChatGPT в Siri и презентовала генератор эмодзи Genmoji. Также обновление включает инструмент Image Playground для создания иллюстраций и функцию Image Wand для генерации изображений по наброскам.

4. Google запустила своего первого ИИ-агента Project Mariner для покупок в интернете и других задач
Google запустила Project Mariner — ИИ-помощник для онлайн-шопинга, который управляет браузером за вас. Также представлена универсальная модель Gemini 2.0 для создания многофункциональных AI-агентов.
4🔥3👏3👍2
Развертывание Marco o1: языковая модель для логики и математики на вашем PC 💡🖥

Недавно я тестировал Marco o1 — опенсорсную LLM с продвинутыми алгоритмами рассуждений: Chain-of-Thoughts и поиском по дереву Монте-Карло (MCTS). Это позволяет модели решать задачи по логике, математике и программированию эффективнее.

Что интересного:
• Вес модели — всего 7B параметров, можно запустить даже на RTX 4060.
• Поддержка квантизации (bitsandbytes) ускоряет инференс на локальном PC.
• Готовые решения для LLM-сервера на TGI и ollama.


🚀 Запуск в Docker с Text Generation Inference
docker run --gpus all --shm-size 1g -p 8080:80 -v $path_to_volume:/data \
ghcr.io/huggingface/text-generation-inference:2.4.1 --model-id AIDC-AI/Marco-o1 --quantize bitsandbytes-nf4


🔥 Если нужен сервер попроще — попробуйте ollama
ollama pull marco-o1  
ollama serve


⚡️ Почему immers.cloud?
Если вашей машине не хватает мощности, запускайте Marco o1 в облаке immers.cloud на GPU-серверах. Это удобно и быстро!
22👍2🏆2