Artificial Intelion | Новости ИИ – Telegram

Artificial Intelion | Новости ИИ

@artificial_intelion

2.19K subscribers

217 photos

11 videos

1 file

276 links

Самое интересное про ИИ.
Новости AI и ML для бизнеса.
Изучаем, тестируем, рекомендуем

Аренда серверов: https://intelion.cloud/tg

Обратная связь: @IntelionCloud или по email ai@intelion.cloud

Download Telegram

About

Blog

Apps

Platform

Artificial Intelion | Новости ИИ

2.19K subscribers

Artificial Intelion | Новости ИИ

GPT-5 выходит уже этим летом — и у нас есть повод волноваться

Слухи подтвердились: OpenAI готовит релиз GPT-5 уже в августе, и сразу несколько инсайдеров сообщают, что задержка в «несколько месяцев» подошла к концу.

Модель уже замечена в продуктах Microsoft, включая Copilot — а это всегда тонкий намёк на скорый релиз.

Что известно о GPT-5:

☹️ Три формата: GPT-5, GPT-5 mini и GPT-5 nano. Первые две — для ChatGPT, последняя — только через API.
☹️ Модель заменит текущую россыпь OpenAI-версий — от o3 до reasoning-агентов.
☹️ Включает улучшенное «агентское поведение»: речь идёт не только о генерации текста, но и о планировании, выполнении команд и цепочках задач.
☹️ Скорость и глубина reasoning, как утверждают тестеры, «ощутимо выше».
☹️ Альтман уверяет, что это будет новый уровень, но мы сдержанно оптимистичны — пока не протестим сами, не поверим.

Что там с открытыми моделями?
OpenAI также обещает открытую модель, которая должна выйти либо до, либо сразу после GPT-5.

Хотите быть первыми, кто протестирует GPT-5 или развернёт свою модель?
Арендуйте сервер с GPU в Интелион Облако — подключение за пару минут, почасовая оплата и гибкие конфигурации под inference и fine-tune.
#ии #нейросети #chatgpt #GPT5

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍32

441 views14:32

Artificial Intelion | Новости ИИ

NVIDIA обновила свои модели: встречайте Llama-3.3-Nemotron-Super-49B-v1.5

Если вы разрабатываете AI-агентов, LLM-интерфейсы или просто хотите получить максимум от обучения и reasoning — у NVIDIA для вас хорошие новости.

Компания выпустила две обновлённые модели, оптимизированные под свои GPU:

Что нового?

☹️Модель для продвинутых диалогов, логических задач, RLHF-флоу и цепочек рассуждений.
☹️Набор моделей, специально обученный для генерации кода, выполнения инструкций и решения задач по математике.
☹️Использованы техники DPO (Direct Preference Optimization) и rejection sampling, чтобы фильтровать бесполезные или опасные ответы.
☹️Модели уже оптимизированы под GPU NVIDIA.
☹️Архитектура адаптирована под задачи ассистентов, reasoning-LLM, кодинг-агентов и симуляторов пользователей.

Скачать: HuggingFace
Блог: NVIDIA Developer Blog

Готовы протестировать новую LLM?
Запускайте модели на GPU сервере от Интелион Облако — с посекундной оплатой, гибкими конфигурациями и поддержкой A100, A10, A500 и RTX 3090.
#ии #нейросети #nvidia #Llama

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍22

380 views14:49

Artificial Intelion | Новости ИИ

This media is not supported in your browser

VIEW IN TELEGRAM

Microsoft DAViD: синтетика вместо миллионов датасетов — и это работает

Компьютерное зрение с фокусом на человека (Human-centric CV) давно перешло в категорию «дорого и долго»: гигабайты данных, тысячи GPU-часов и этикетки, от которых кровь из глаз.

Но Microsoft снова поднимает планку — и делает это синтетически.

Компания представила DAViD — open-source фреймворк для генерации цифровых людей с пиксельно-точной геометрией, материалами и разметкой.

Что можно делать с DAViD?

⚡️Depth Prediction — предсказываем глубину на изображении с нуля
⚡️ Normal Estimation — восстанавливаем наклоны поверхностей лица и тела
⚡️ Segmentation — отделяем фон от человека с ювелирной точностью

Почему это реально круто?

☹️ Пиксельная точность в каждом слое
☹️ Нереально богатое разнообразие сцен, освещения, ракурсов и поз
☹️ Сотни тысяч примеров для старта без сбора данных
☹️ Прекрасно дообучается под конкретную задачу

В комплекте:

☹️300 000 синтетических сэмплов
☹️Предобученные модели
☹️Исходники самого фреймворка

Проект: DAViD от Microsoft
Статья: arXiv 2507.15365
GitHub: microsoft/DAViD

Разрабатываешь CV-решения? Создаёшь сегментатор или depth-модель?
Запусти эксперименты на GPU-сервере от Интелион Облако — с A10, A100, RTX 3090 и почасовой оплатой, без переплат.

Храни виртуалку бесплатно, запускай проекты с первой строки кода.
#ии #нейросети #microsoft #david

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

5❤2👍2

352 viewsedited 14:28

Artificial Intelion | Новости ИИ

LoRA-инференс на максималках

Если вы используете LoRA-модули для кастомизации моделей генерации изображений, то вы точно сталкивались с проблемой: как запустить LoRA в проде — быстро и без боли?

Команда HuggingFace поделилась новым рецептом оптимизации LoRA-инференса на моделях Flux, и он выглядит... мощно.

Что они предлагают:

☹️ torch.compile() — ускоряем инференс прямо на уровне графа
☹️ Flash Attention 3 — если модель это умеет, будет быстрее
☹️ FP8-квантизация — динамическая, для подходящих GPU
☹️ Hotswapping LoRA — да, теперь можно менять адаптеры на лету, без перекомпиляции.

Подход актуален для продакшена, когда вам нужно быстро адаптировать генерацию без пересборки всей модели.

☹️

Читать статью и смотреть код

Если вы хотите протестировать Flux с быстрым LoRA-инференсом — берите сервер с A100 или RTX 3090 в Интелион Облако. Моментальный запуск, без тикетов и задержек.
#LoRA #Flux #HuggingFace #ии #нейросети

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍32

392 views14:52

Artificial Intelion | Новости ИИ

This media is not supported in your browser

VIEW IN TELEGRAM

OpenAI строит ИИ-будущее в Норвегии: второй датацентр Stargate

OpenAI продолжает разворачивать глобальный проект Stargate — на этот раз в Норвегии. До конца 2026 года в стране появится датацентр нового поколения: 100.000 GPU, 230 МВт потребления, работающий исключительно на возобновляемых источниках энергии.

Если датацентр в ОАЭ — это ИИ-супероружие на нефтедолларах, то Норвегия делает ставку на зелёную инфраструктуру и европейскую экосистему:

☹️Охлаждение: замкнутый цикл жидкостного охлаждения — вода прямо на чипы. Максимальная эффективность, минимум потерь.
☹️Реутил воды: тепло от GPU пойдёт на обогрев местных предприятий.
☹️Экосистема: доступ для ИИ-стартапов, исследователей и публичного сектора Северной Европы.
☹️Локализация: граждане смогут использовать персонализированный ChatGPT, дообученный под язык, культуру и нужды страны.

Встаёт важный вопрос: если Stargate — это суверенные ИИ-ядра, то кто решает, на что натравить AGI? Образование или здравоохранение? Теоремы или лечение Альцгеймера?

Подробнее: OpenAI Stargate Norway

А пока Stargate в пути — можно запускать модели на своих A100 и A10 в Интелион Облако. GPU-серверы в России, доступ за 2 минуты, с оплатой по секундам.
#OpenAI #GPU #ии #нейросети

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍22

394 views18:35

Artificial Intelion | Новости ИИ

This media is not supported in your browser

VIEW IN TELEGRAM

Инна Телионова рассказала про свой опыт использования серверов Интелион Облако

Чтобы ускорить работу своих LLM на десятки часов — берите GPU сервер в Интелион Облако.

☹️

Промокод: START

Ставьте ❤️ если понравился такой формат
#GPU #ии #нейросети

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

7👍4❤3😁1🤔1

397 views14:09

Artificial Intelion | Новости ИИ

Gemini Deep Think теперь в Ultra-подписке: элитный ИИ для тех, кто мыслит в 4 потока

Google продолжает наращивать ИИ-мощности — и завозит в Ultra-подписку новую оптимизированную версию Gemini Deep Think.

Что это за зверь?

☹️ Это модель, на которой Google взяла золото на Международной математической олимпиаде (IMO). Да, модель умеет решать задачи, от которых у обычных LLM начинают дрожать токены.
☹️ Deep Think запускает параллельные потоки рассуждения, а потом собирает из них лучший результат — примерно как делает o3 Pro от OpenAI.

Чем интересна:

☹️ Даже без доступа к тулзам уверенно разваливает Grok 4 и o3 на Humanity’s Last Exam и других строгих бенчах.
☹️ Умеет выполнять код и пользоваться поиском.
☹️ По сути — это Google Gemini в режиме максимального IQ.

Подписка Google AI Ultra стоит $250 в месяц — дороже чем GPT-4 Pro или Claude Max. Но:

⚡️ Туда входит Veo 3
⚡️ Продвинутая Gemini
⚡️ Плюс 30 ТБ на Google Drive
⚡️ 50% скидка на первые три месяца

Если вам нужно протестировать свои LLM-пайплайны, обучить модели или построить reasoning-агента — не обязательно подписываться на Ultra.

Можно арендовать сервер с A100, A10, A5000 или RTX 3090 в Интелион Облако и запускать свой Deep Think локально с посекундной тарификацией и скидками до 30%.
#Gemini #Google #ии #нейросети

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍22

298 views16:01

Artificial Intelion | Новости ИИ

Media is too big

VIEW IN TELEGRAM

Genie 3 от Google: нейросетка, которая держит мир в голове (и рисует его в 720p)

Google DeepMind выкатила Genie 3 — новое поколение World Models. Это не просто генератор картинок, а нейронные игровые движки, создающие целые миры по текстовому промпту. И в них можно жить.

Чем Genie 3 круче своего предка (Genie 2)?

☹️ 720p vs 360p: Четкость выросла в разы — мир больше не напоминает кашу из пикселей.
☹️ Минуты vs секунды: Взаимодействие длится не жалкие 10-20 секунд, а целые минуты стабильной симуляции.
☹️ Память, а не дырявое решето: Главный прорыв — модель помнит. Покрасил стену, отвернулся, покрутился по комнате — а краска на месте! Год назад нейросетка забыла бы всё, стоило тебе моргнуть.

Что умеет этот "нейронный Майнкрафт"?

⚡️ Генерит не просто статичные сцены, а живые миры с событиями. Промпт = сценарий. Деревня? Пусть в ней кипит жизнь. Лаборатория? Пусть там что-то взрывается.
⚡️ Симулирует физику взаимодействий на уровне, достаточном для тренировки ИИ-агентов. Мечтаете о роботе-поваре? Тренируйте его сначала в Genie-кухне.
⚡️ Открывает двери в новую эру игр: представьте генерацию уникальных миров и сюжетов на лету. Не зря Tencent вбухивает миллиарды в World Models!

Хотите поиграть с Genie 3?
Возьмите сервер с RTX 3090, A100, A5000 или A10 в Интелион Облако. Запускайте свои нейронные симуляции с посекундной оплатой, сохраняйте образы бесплатно.
#Genie3 #Google #ии #нейросети

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤22🤔1

295 viewsedited 16:11

Artificial Intelion | Новости ИИ

Как посчитать VRAM для LLM: гайд, который сэкономит вам кучу времени (и денег)

Вы запускаете нейросеть, всё готово — и…
CUDA out of memory. Знакомо?

Мы написали подробный, но простой гайд о том, как рассчитать, сколько VRAM реально нужно для запуска больших языковых моделей (LLM).

Для кого статья:

☹️ Data Scientists, которые экспериментируют с LLaMA, Mistral и другими LLM
☹️ ML-инженеры и те, кто fine-tune'ит модели под узкие задачи
☹️ Стартаперы, планирующие MVP с нейросетями
☹️ Руководители команд, которым надо понимать — почему 40 GB может не хватить

Что внутри:

☹️ Формула расчёта VRAM (с примерами и пояснениями)
☹️ Разбор моделей на 7B, 13B и 70B параметров
☹️ Влияние квантизации (FP16 vs INT8 vs INT4)
☹️ Способы экономии: LoRA, градиентный чекпоинт, параллелизм
☹️ Когда выгоднее арендовать сервер с GPU, а не покупать
☹️ Python-скрипты и калькуляторы, чтобы не считать вручную

Если вы работаете с моделями машинного обучения или просто планируете свой AI-продукт — прочитайте этот гайд до того, как выберете сервер. Он избавит от ошибок, сэкономит бюджет и время.

Читать статью 👉 статья
#машинноеобучение #DataScience

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍32

314 views15:00

Artificial Intelion | Новости ИИ

Qwen3-4B: китайский локомотив опенсорса разгоняется до 256K токенов

Alibaba Cloud снова врывается в тренды — их флагманская Qwen3-4B получила серьезный апдейт.

Теперь это не просто "еще одна локальная моделька", а полноценный конкурент GPT-oss с контекстом в 256K токенов и двумя режимами на выбор:

☹️

Thinking — для глубокого анализа

☹️

Instruct — для четких инструкций

Что за прорыв?

☹️ Рост метрик — модель стала умнее, быстрее и стабильнее
☹️ Гигантский контекст — 256K токенов против прежних скромных лимитов
☹️ Бешеная скорость релизов — 6-7 обновлений за месяц, китайский опенсорс не спит

Главный вопрос:
Сможет ли новая GPT-oss 20B переиграть Qwen3-4B? Пока Alibaba не оставляет конкурентам шанса, заваливая всех обновлениями.

Хотите протестировать Qwen3-4B в деле?
Разверните её на своем сервере с RTX 3090 или A100 в Интелион Облако — моментальный доступ, оплата по секундам и никаких ограничений.
#Qwen #OpenSource #ии

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

❤32👍1

348 views14:23

Artificial Intelion | Новости ИИ

GPT-OSS от OpenA - это MoE-ракета

OpenAI наконец-то показала карты: их open-source флагман GPT-OSS 20B — это Mixture of Experts (MoE) на стероидах. Быстрее, умнее, контекстнее. Но не без косяков.

Что интересного:

☹️ MoE + FlashAttention 3 + MXFP4 квантизация = бешеная скорость в своем классе.
☹️ Контекст 256K по схеме RoPE + Sliding Window — глобальные связи + локальная скорость. Не full context, а умный гибрид (схемы гуглите!).
☹️ Заточка под агентов и код: Метрики в районе o4-mini, но с упором на CoT, Tool Calling, JSON, Structured Output. Идеально для пайплайнов.
☹️ Публичные MoE LoRA-тюны! Наконец-то можно кастомизировать без боли.

Где собака зарылась:

☹️ Требует топовое железо: vLLM/Ollama/HF API есть, но запуск на старых картах — боль. Готовьтесь к RTX 3090 или A100.
☹️ Токсичный позитив: Английские ответы слишком жизнерадостные (ладно, "токсично-жизнерадостные") и водянистые. Лаконичность — не её конёк.

Хотите гонять GPT-OSS 20B без апгрейда железа?
Арендуйте сервер с A100 или RTX 3090 в Интелион Облако. Посекундная оплата, мгновенный доступ, никаких танцев с тикетами.
Сохраняйте образы бесплатно — тюньте MoE-LoRA хоть 24/7.
#OpenAI #OpenSource #нейросети #LLM

🙂

Artificial Intelion

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥2❤1😁1

361 viewsedited 14:28