Машинное обучение RU
18.1K subscribers
1.67K photos
240 videos
11 files
2.11K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
Just AI Agent Platform теперь доступна в облаке.

Раньше такие платформы чаще были историей для крупного enterprise: долгий запуск, отдельная инфраструктура, большой бюджет на внедрение. Теперь всё проще - зарегистрировался и можно сразу собирать AI-агентов под свои задачи.

Это low-code-платформа, где агентов можно настраивать в конструкторе без полноценной разработки с нуля. Удобно, если нужно быстро проверить гипотезу, собрать прототип и понять, где автоматизация реально даёт пользу бизнесу.

Что можно делать:

• обрабатывать обращения клиентов

• собирать внутренних помощников для сотрудников

• автоматизировать рутину в отделах

• подключать базы знаний через RAG

• интегрироваться с внутренними системами

• использовать разные LLM-модели под конкретные сценарии

Агентные сценарии можно тестировать быстрее, дешевле и без необходимости сразу запускать большой проект разработки.

Попробовать тут

Реклама. ООО «Маинд Крафт», ИНН: 7813286694, erid:2VtzqwzrhUj
🤔1
Пользователи твиттера разгромили картину Клода Моне, так как поверили, что это генерация ИИ:

> Чувак под ником SHL0MS написал, что сгенерировал картину в стиле Моне, и попросил подробно рассказать, чем она уступает настоящему Моне

> Диванные искусствоведы начали критиковать работу со светом, деталями, цветами и так далее

> В итоге оказалось, что это не генерация ИИ, а настоящая картина Клода Моне из цикла «Кувшинки»
😁173👏3🔥1
🧠 Mercury: Soul-Driven AI Agent

Mercury — это умный AI-агент, который запрашивает разрешения перед выполнением действий и запоминает важные детали. Он работает 24/7 через CLI или Telegram, имеет 31 встроенный инструмент и расширяемые навыки, а также память на основе SQLite.

🚀 Основные моменты:
- Запрашивает разрешения перед выполнением команд.
- Обладает структурированной памятью с автоэкстракцией.
- Легко настраивается и расширяется с помощью пользовательских навыков.
- Работает в фоновом режиме и автоматически перезапускается при сбоях.
- Поддерживает многоканальный доступ через Telegram и CLI.

📌 GitHub: https://github.com/cosmicstack-labs/mercury-agent

#javascript
🔥32👍2
✔️ Intern-S2-Preview - эффективная научная мультимодальная foundation-модель на 35B параметров.

1. Показывает качество, сопоставимое с trillion-scale моделью Intern-S1-Pro на ключевых научных задачах.

2. Первая open-source модель с возможностью генерации кристаллических структур материалов и сильными общими способностями.

3. Значительно усиливает возможности научных агентов на нескольких бенчмарках.

4. Повышает MTP acceptance rate и скорость генерации токенов за счёт shared-weight MTP + KL loss.

5. CoT compression сокращает ответы, сохраняя сильное рассуждение, что улучшает и качество, и эффективность.

Теперь поддерживается vLLM и SGLang. В будущем обещают больше интеграций с экосистемой.

Модель:
https://huggingface.co/collections/internlm/intern-s2

ModelScope:
https://modelscope.cn/collections/Shanghai_AI_Laboratory/Intern-S2

GitHub:
https://github.com/InternLM/Intern-S1

Попробовать:
https://chat.intern-ai.org.cn
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥3👏1
😁231🥰1
🚀 Примеры использования Cursor SDK для разработки

Репозиторий содержит небольшие примеры для работы с Cursor SDK на TypeScript. Он позволяет интегрировать кодирующего агента в ваши приложения, управлять состоянием и взаимодействовать с агентами в облаке и локально.

🚀 Основные моменты:
- Примеры для создания агентов и работы с API.
- Веб-приложение для быстрой разработки и тестирования.
- Канбан-доска для управления агентами и артефактами.
- CLI для запуска агентов из терминала.

📌 GitHub: https://github.com/cursor/cookbook
Forwarded from Machinelearning
Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash

Похоже, Google снова пытается перехватить повестку в ИИ.

Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.

Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:

- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте

Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.

Второй релиз - Gemini 3.5 Flash.

Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.

По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.

Если коротко:

- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами


Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.

Релиз https://x.com/GoogleDeepMind/status/2056786446636212467

Попробовать: https://gemini.google.com/app
3
Forwarded from Machinelearning
Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash

Похоже, Google снова пытается перехватить повестку в ИИ.

Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.

Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:

- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте

Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.

Второй релиз - Gemini 3.5 Flash.

Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.

По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.

Если коротко:

- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами


Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.

Релиз https://x.com/GoogleDeepMind/status/2056786446636212467

Попробовать: https://gemini.google.com/app
👍2🥰21🤬1
Tencent выкатил переводчик, который помещается почти куда угодно

Tencent Hunyuan открыли Hy-MT2 - серию мультиязычных моделей для перевода с Dense и MoE-вариантами.

Главная фишка не в том, что это «ещё одна модель для перевода». Самое интересное - маленькая версия на 1.8B параметров.

Её ужали через AngelSlim до 1.25-bit, и теперь модель занимает всего 440 МБ. При этом на Apple A15 она работает в 1.5 раза быстрее, чем обычный 4-bit inference.

То есть нормальный on-device перевод уже не выглядит как фантазия, где нужно жертвовать либо скоростью, либо размером.

Что заявляют по моделям:

• поддержка 33 языков и 5 китайских диалектов
• версия 1.8B обходит Microsoft Translate и другие коммерческие API на FLORES-200
• версии 7B и 30B-A3B обходят DeepSeek-V4-Pro
• 7B достигает 97.9% от уровня Gemini 3.1 Pro Think
• 30B-A3B достигает 98.6% от уровня Gemini 3.1 Pro Think
• все три модели показывают 96-99% от Gemini 3.1 Pro Think на реальных и доменных бенчмарках

Плюс Tencent вместе с моделями открыли IFMTBench - бенчмарк для проверки того, насколько хорошо переводческие модели следуют инструкциям.

🤖 https://modelscope.ai/collections/Tencent-Hunyuan/Hy-MT2
3