Artificial Intelion | Новости ИИ
2.19K subscribers
217 photos
11 videos
1 file
276 links
Самое интересное про ИИ.
Новости AI и ML для бизнеса.
Изучаем, тестируем, рекомендуем

Аренда серверов: https://intelion.cloud/tg

Обратная связь: @IntelionCloud или по email ai@intelion.cloud
Download Telegram
Представлена новая русскоязычная модель T-pro 2.0 — быстрее, точнее и мощнее аналогов

Выпущена свежая версия нейросети T-pro 2.0 — русскоязычной модели нового поколения, которая значительно превосходит по качеству и скорости другие открытые LLM.

Почему T-pro 2.0 так хороша?
☹️Модель обучена на большом русскоязычном датасете и оптимизирована для задач, связанных с русским языком и контекстом.
☹️Скорость генерации ответов существенно выше аналогов благодаря улучшенным алгоритмам оптимизации.
☹️В тестах T-pro 2.0 показывает более точные и релевантные ответы по сравнению с другими открытыми русскоязычными LLM.


Доступные варианты модели:

T-pro 2.0 — стандартная версия для общего использования.
T-pro 2.0 Eagle — оптимизированная версия с ускоренной генерацией ответов.


Подробнее:
Обзор модели на РБК
Коллекция моделей T-pro 2.0 на HuggingFace


Хотите убедиться сами?
Запустите и протестируйте T-pro 2.0 на серверах «Интелион Облако» — получите доступ к мощным GPU и изучите новую модель.
#ии #нейросети #huggingface

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍33🔥1
Lucy 1.7B — новая RL-модель, рвущая DeepSeek-v3 в поиске

Появилась новая легковесная LLM для мобильных и edge-задач — Lucy 1.7B.

Её обучили специально под веб-поиск с помощью обратного обучения с подкреплением (RLHF), и результаты уже впечатляют: в своих задачах Lucy обходит DeepSeek-v3, оставаясь при этом компактной и быстрой.

Чем хороша Lucy?
☹️Размер: всего 1.7B параметров — легко запускается на CPU.
☹️RLHF-обучение: модель натренирована в цикле с обратной связью, что повышает релевантность и точность ответов.
☹️Ориентирована на поиск: обучена на задачах ранжирования, генерации и сжатия поисковых ответов.
☹️Локальный запуск: идеальна для мобильных, edge-сценариев и частных развертываний.


HuggingFace: Lucy 1.7B Collection

Хотите протестировать Lucy в своём поисковом стекe или embed-боте?
☹️ Разверните её в Интелион Облако. Компактная модель, большие выводы.
#ии #нейросети #huggingface #Lucy

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
33👍2🔥1
NVIDIA выпустила OpenReasoning-Nemotron — линейку моделей для сложных рассуждений

NVIDIA представила OpenReasoning-Nemotron — мощный стек reasoning-моделей с открытым доступом, обученных на 5 миллионах примеров логических цепочек и пошаговых рассуждений. Это не просто LLM, это — LLM с аргументацией.

Главная звезда линейки — Nemotron-32B, которая достигла 96,7% точности на HMMT (Human Model of Mathematical Thinking) — одном из самых сложных тестов на рассуждение и multi-hop логику.

Что делает OpenReasoning особенной:
☹️ Обучение на структурированных reasoning-трейсах, а не просто текстах.
☹️ Поддержка всех масштабов — от 1.5B до 32B параметров.
☹️ Оптимизирована под задачи с развернутыми выводами: math QA, multi-hop chain of thought, science reasoning.


Доступна через HuggingFace в 4 конфигурациях: 1.5B, 7B, 14B, 32B
Подробнее в официальном блоге NVIDIA на HuggingFace

Хотите развернуть reasoning-агента, которому действительно есть что сказать?

Разверните OpenReasoning-Nemotron в Интелион Облако — оцените, как 32B рассуждает на практике, и протестируйте цепочки выводов под свои задачи.
#ии #нейросети #nvidia

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🤯22
Alibaba представила Qwen3-Coder — open-source модель, обошедшую GPT-4.1

Компания выпустила Qwen3-Coder, масштабную open-source модель для генерации, анализа и поддержки кода, которая по результатам тестов превосходит GPT-4.1 на ключевых бенчмарках.

Модель поддерживает до 480B параметров в комбинированной архитектуре.

Что делает Qwen3-Coder особенной?
⚡️ Работает в real-time и поддерживает длинный контекст (до 200K токенов).
⚡️ Использует инструкционную fine-tune-подготовку на миллиардах строк кода.
⚡️ Поддерживает более 30 языков программирования, включая Python, C++, SQL, JavaScript и Rust.
⚡️ В некоторых задачах — например, HumanEval и MBPP — модель обходит не только GPT-4.1, но и DeepSeek-Coder.


Демо и исходники:
Модель на HuggingFace
Демо
Исходники на GitHub
Официальный блог Qwen


Хотите попробовать Qwen3-Coder в продакшене или на своём pet-проекте?
Разверните модель на сервере в Интелион Облако — с GPU-конфигурацией под любые задачи и подключением за пару минут.

Еще у нас новые условия:
☹️ Скидки до 30% в зависимости от срока аренды. Чем больше предоплата — тем дешевле обходится аренда.
#ии #нейросети #qwen #code

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
👍422
MegaScience — новый датасет для обучения моделей научному мышлению

На HuggingFace появился свежий open-source датасет MegaScience, который создавался с прицелом на глубокое понимание научных текстов. Он уже показывает результат выше, чем многие официальные Instruct-бейзлайны.

Что делает MegaScience особенным?
⚡️ Состоит из реальных научных публикаций и экспертных аннотаций (более 1,2 миллиона примеров).
⚡️ Использует строгие критерии отбора — на вход идут только те тексты, что можно использовать для рассуждений, аргументации и интерпретации данных.
⚡️ Участвует в новом научном бенчмарке LM-Open-Science, который выходит за рамки обычного QA или summarization.


Ссылки:
Оригинал на HuggingFace
GitHub проекта


Хотите протестировать MegaScience?
Запустите её на сервере в Интелион Облако — с GPU, который справится с тяжёлыми датасетами. С почасовой оплатой: запустил — потестировал — остановил — заплатил только за фактическое время.
#ии #нейросети #huggingface

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍22
GPT-5 выходит уже этим летом — и у нас есть повод волноваться

Слухи подтвердились: OpenAI готовит релиз GPT-5 уже в августе, и сразу несколько инсайдеров сообщают, что задержка в «несколько месяцев» подошла к концу.

Модель уже замечена в продуктах Microsoft, включая Copilot — а это всегда тонкий намёк на скорый релиз.

Что известно о GPT-5:
☹️ Три формата: GPT-5, GPT-5 mini и GPT-5 nano. Первые две — для ChatGPT, последняя — только через API.
☹️ Модель заменит текущую россыпь OpenAI-версий — от o3 до reasoning-агентов.
☹️ Включает улучшенное «агентское поведение»: речь идёт не только о генерации текста, но и о планировании, выполнении команд и цепочках задач.
☹️ Скорость и глубина reasoning, как утверждают тестеры, «ощутимо выше».
☹️ Альтман уверяет, что это будет новый уровень, но мы сдержанно оптимистичны — пока не протестим сами, не поверим.


Что там с открытыми моделями?
OpenAI также обещает открытую модель, которая должна выйти либо до, либо сразу после GPT-5.

Хотите быть первыми, кто протестирует GPT-5 или развернёт свою модель?
Арендуйте сервер с GPU в Интелион Облако — подключение за пару минут, почасовая оплата и гибкие конфигурации под inference и fine-tune.
#ии #нейросети #chatgpt #GPT5

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍32
NVIDIA обновила свои модели: встречайте Llama-3.3-Nemotron-Super-49B-v1.5

Если вы разрабатываете AI-агентов, LLM-интерфейсы или просто хотите получить максимум от обучения и reasoning — у NVIDIA для вас хорошие новости.

Компания выпустила две обновлённые модели, оптимизированные под свои GPU:

Что нового?
☹️Модель для продвинутых диалогов, логических задач, RLHF-флоу и цепочек рассуждений.
☹️Набор моделей, специально обученный для генерации кода, выполнения инструкций и решения задач по математике.
☹️Использованы техники DPO (Direct Preference Optimization) и rejection sampling, чтобы фильтровать бесполезные или опасные ответы.
☹️Модели уже оптимизированы под GPU NVIDIA.
☹️Архитектура адаптирована под задачи ассистентов, reasoning-LLM, кодинг-агентов и симуляторов пользователей.


Скачать: HuggingFace
Блог: NVIDIA Developer Blog


Готовы протестировать новую LLM?

Запускайте модели на GPU сервере от Интелион Облако — с посекундной оплатой, гибкими конфигурациями и поддержкой A100, A10, A500 и RTX 3090.
#ии #нейросети #nvidia #Llama

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍22
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft DAViD: синтетика вместо миллионов датасетов — и это работает

Компьютерное зрение с фокусом на человека (Human-centric CV) давно перешло в категорию «дорого и долго»: гигабайты данных, тысячи GPU-часов и этикетки, от которых кровь из глаз.

Но Microsoft снова поднимает планку — и делает это синтетически.

Компания представила DAViD — open-source фреймворк для генерации цифровых людей с пиксельно-точной геометрией, материалами и разметкой.

Что можно делать с DAViD?
⚡️Depth Prediction — предсказываем глубину на изображении с нуля
⚡️ Normal Estimation — восстанавливаем наклоны поверхностей лица и тела
⚡️ Segmentation — отделяем фон от человека с ювелирной точностью


Почему это реально круто?
☹️ Пиксельная точность в каждом слое
☹️ Нереально богатое разнообразие сцен, освещения, ракурсов и поз
☹️ Сотни тысяч примеров для старта без сбора данных
☹️ Прекрасно дообучается под конкретную задачу


В комплекте:
☹️300 000 синтетических сэмплов
☹️Предобученные модели
☹️Исходники самого фреймворка


Проект: DAViD от Microsoft
Статья: arXiv 2507.15365
GitHub: microsoft/DAViD


Разрабатываешь CV-решения? Создаёшь сегментатор или depth-модель?
Запусти эксперименты на GPU-сервере от Интелион Облако — с A10, A100, RTX 3090 и почасовой оплатой, без переплат.

Храни виртуалку бесплатно, запускай проекты с первой строки кода.
#ии #нейросети #microsoft #david

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
52👍2
LoRA-инференс на максималках

Если вы используете LoRA-модули для кастомизации моделей генерации изображений, то вы точно сталкивались с проблемой: как запустить LoRA в проде — быстро и без боли?

Команда HuggingFace поделилась новым рецептом оптимизации LoRA-инференса на моделях Flux, и он выглядит... мощно.

Что они предлагают:
☹️ torch.compile() — ускоряем инференс прямо на уровне графа
☹️ Flash Attention 3 — если модель это умеет, будет быстрее
☹️ FP8-квантизация — динамическая, для подходящих GPU
☹️ Hotswapping LoRA — да, теперь можно менять адаптеры на лету, без перекомпиляции.


Подход актуален для продакшена, когда вам нужно быстро адаптировать генерацию без пересборки всей модели.

☹️ Читать статью и смотреть код

Если вы хотите протестировать Flux с быстрым LoRA-инференсом — берите сервер с A100 или RTX 3090 в Интелион Облако. Моментальный запуск, без тикетов и задержек.
#LoRA #Flux #HuggingFace #ии #нейросети

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍32
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI строит ИИ-будущее в Норвегии: второй датацентр Stargate

OpenAI продолжает разворачивать глобальный проект Stargate — на этот раз в Норвегии. До конца 2026 года в стране появится датацентр нового поколения: 100.000 GPU, 230 МВт потребления, работающий исключительно на возобновляемых источниках энергии.

Если датацентр в ОАЭ — это ИИ-супероружие на нефтедолларах, то Норвегия делает ставку на зелёную инфраструктуру и европейскую экосистему:
☹️Охлаждение: замкнутый цикл жидкостного охлаждения — вода прямо на чипы. Максимальная эффективность, минимум потерь.
☹️Реутил воды: тепло от GPU пойдёт на обогрев местных предприятий.
☹️Экосистема: доступ для ИИ-стартапов, исследователей и публичного сектора Северной Европы.
☹️Локализация: граждане смогут использовать персонализированный ChatGPT, дообученный под язык, культуру и нужды страны.


Встаёт важный вопрос: если Stargate — это суверенные ИИ-ядра, то кто решает, на что натравить AGI? Образование или здравоохранение? Теоремы или лечение Альцгеймера?

Подробнее: OpenAI Stargate Norway

А пока Stargate в пути — можно запускать модели на своих A100 и A10 в Интелион Облако. GPU-серверы в России, доступ за 2 минуты, с оплатой по секундам.
#OpenAI #GPU #ии #нейросети

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍22
This media is not supported in your browser
VIEW IN TELEGRAM
Инна Телионова рассказала про свой опыт использования серверов Интелион Облако

Чтобы ускорить работу своих LLM на десятки часов — берите GPU сервер в Интелион Облако.

☹️ Промокод: START

Ставьте ❤️ если понравился такой формат
#GPU #ии #нейросети

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍43😁1🤔1
Gemini Deep Think теперь в Ultra-подписке: элитный ИИ для тех, кто мыслит в 4 потока

Google продолжает наращивать ИИ-мощности — и завозит в Ultra-подписку новую оптимизированную версию Gemini Deep Think.

Что это за зверь?
☹️ Это модель, на которой Google взяла золото на Международной математической олимпиаде (IMO). Да, модель умеет решать задачи, от которых у обычных LLM начинают дрожать токены.
☹️ Deep Think запускает параллельные потоки рассуждения, а потом собирает из них лучший результат — примерно как делает o3 Pro от OpenAI.


Чем интересна:
☹️ Даже без доступа к тулзам уверенно разваливает Grok 4 и o3 на Humanity’s Last Exam и других строгих бенчах.
☹️ Умеет выполнять код и пользоваться поиском.
☹️ По сути — это Google Gemini в режиме максимального IQ.


Подписка Google AI Ultra стоит $250 в месяц — дороже чем GPT-4 Pro или Claude Max. Но:
⚡️ Туда входит Veo 3
⚡️ Продвинутая Gemini
⚡️ Плюс 30 ТБ на Google Drive
⚡️ 50% скидка на первые три месяца


Если вам нужно протестировать свои LLM-пайплайны, обучить модели или построить reasoning-агента — не обязательно подписываться на Ultra.

Можно арендовать сервер с A100, A10, A5000 или RTX 3090 в Интелион Облако и запускать свой Deep Think локально с посекундной тарификацией и скидками до 30%.
#Gemini #Google #ии #нейросети

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍22
Media is too big
VIEW IN TELEGRAM
Genie 3 от Google: нейросетка, которая держит мир в голове (и рисует его в 720p)

Google DeepMind выкатила Genie 3 — новое поколение World Models. Это не просто генератор картинок, а нейронные игровые движки, создающие целые миры по текстовому промпту. И в них можно жить.

Чем Genie 3 круче своего предка (Genie 2)?
☹️ 720p vs 360p: Четкость выросла в разы — мир больше не напоминает кашу из пикселей.
☹️ Минуты vs секунды: Взаимодействие длится не жалкие 10-20 секунд, а целые минуты стабильной симуляции.
☹️ Память, а не дырявое решето: Главный прорыв — модель помнит. Покрасил стену, отвернулся, покрутился по комнате — а краска на месте! Год назад нейросетка забыла бы всё, стоило тебе моргнуть.


Что умеет этот "нейронный Майнкрафт"?
⚡️ Генерит не просто статичные сцены, а живые миры с событиями. Промпт = сценарий. Деревня? Пусть в ней кипит жизнь. Лаборатория? Пусть там что-то взрывается.
⚡️ Симулирует физику взаимодействий на уровне, достаточном для тренировки ИИ-агентов. Мечтаете о роботе-поваре? Тренируйте его сначала в Genie-кухне.
⚡️ Открывает двери в новую эру игр: представьте генерацию уникальных миров и сюжетов на лету. Не зря Tencent вбухивает миллиарды в World Models!


Хотите поиграть с Genie 3?
Возьмите сервер с RTX 3090, A100, A5000 или A10 в Интелион Облако. Запускайте свои нейронные симуляции с посекундной оплатой, сохраняйте образы бесплатно.
#Genie3 #Google #ии #нейросети

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
👍522🤔1
Как посчитать VRAM для LLM: гайд, который сэкономит вам кучу времени (и денег)

Вы запускаете нейросеть, всё готово — и…
CUDA out of memory. Знакомо?

Мы написали подробный, но простой гайд о том, как рассчитать, сколько VRAM реально нужно для запуска больших языковых моделей (LLM).

Для кого статья:
☹️ Data Scientists, которые экспериментируют с LLaMA, Mistral и другими LLM
☹️ ML-инженеры и те, кто fine-tune'ит модели под узкие задачи
☹️ Стартаперы, планирующие MVP с нейросетями
☹️ Руководители команд, которым надо понимать — почему 40 GB может не хватить


Что внутри:
☹️ Формула расчёта VRAM (с примерами и пояснениями)
☹️ Разбор моделей на 7B, 13B и 70B параметров
☹️ Влияние квантизации (FP16 vs INT8 vs INT4)
☹️ Способы экономии: LoRA, градиентный чекпоинт, параллелизм
☹️ Когда выгоднее арендовать сервер с GPU, а не покупать
☹️ Python-скрипты и калькуляторы, чтобы не считать вручную


Если вы работаете с моделями машинного обучения или просто планируете свой AI-продукт — прочитайте этот гайд до того, как выберете сервер. Он избавит от ошибок, сэкономит бюджет и время.

Читать статью 👉 статья
#машинноеобучение #DataScience

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍32
Qwen3-4B: китайский локомотив опенсорса разгоняется до 256K токенов

Alibaba Cloud снова врывается в тренды — их флагманская Qwen3-4B получила серьезный апдейт.

Теперь это не просто "еще одна локальная моделька", а полноценный конкурент GPT-oss с контекстом в 256K токенов и двумя режимами на выбор:

☹️ Thinking — для глубокого анализа
☹️ Instruct — для четких инструкций

Что за прорыв?
☹️ Рост метрик — модель стала умнее, быстрее и стабильнее
☹️ Гигантский контекст — 256K токенов против прежних скромных лимитов
☹️ Бешеная скорость релизов — 6-7 обновлений за месяц, китайский опенсорс не спит


Главный вопрос:
Сможет ли новая GPT-oss 20B переиграть Qwen3-4B? Пока Alibaba не оставляет конкурентам шанса, заваливая всех обновлениями.

Хотите протестировать Qwen3-4B в деле?
Разверните её на своем сервере с RTX 3090 или A100 в Интелион Облако — моментальный доступ, оплата по секундам и никаких ограничений.
#Qwen #OpenSource #ии

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
32👍1
GPT-OSS от OpenA - это MoE-ракета

OpenAI наконец-то показала карты: их open-source флагман GPT-OSS 20B — это Mixture of Experts (MoE) на стероидах. Быстрее, умнее, контекстнее. Но не без косяков.

Что интересного:
☹️ MoE + FlashAttention 3 + MXFP4 квантизация = бешеная скорость в своем классе.
☹️ Контекст 256K по схеме RoPE + Sliding Window — глобальные связи + локальная скорость. Не full context, а умный гибрид (схемы гуглите!).
☹️ Заточка под агентов и код: Метрики в районе o4-mini, но с упором на CoT, Tool Calling, JSON, Structured Output. Идеально для пайплайнов.
☹️ Публичные MoE LoRA-тюны! Наконец-то можно кастомизировать без боли.


Где собака зарылась:
☹️ Требует топовое железо: vLLM/Ollama/HF API есть, но запуск на старых картах — боль. Готовьтесь к RTX 3090 или A100.
☹️ Токсичный позитив: Английские ответы слишком жизнерадостные (ладно, "токсично-жизнерадостные") и водянистые. Лаконичность — не её конёк.


Хотите гонять GPT-OSS 20B без апгрейда железа?
Арендуйте сервер с A100 или RTX 3090 в Интелион Облако. Посекундная оплата, мгновенный доступ, никаких танцев с тикетами.
Сохраняйте образы бесплатно — тюньте MoE-LoRA хоть 24/7.
#OpenAI #OpenSource #нейросети #LLM

🙂 Artificial Intelion
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥21😁1