🔥 Маск обвинил Apple в нарушении антимонопольного законодательства
Поводом стало размещение в App Store — Apple отказалась добавить X и Grok от xAI в секцию “Must Have”, хотя X лидировал в новостных чартах, а Grok был близок к топу общего рейтинга.
📈 Накануне xAI сделали Grok 4 бесплатным для ограниченного числа запросов, что резко ускорило установки и подняло приложение в топ.
@machinelearning_interview
Поводом стало размещение в App Store — Apple отказалась добавить X и Grok от xAI в секцию “Must Have”, хотя X лидировал в новостных чартах, а Grok был близок к топу общего рейтинга.
📈 Накануне xAI сделали Grok 4 бесплатным для ограниченного числа запросов, что резко ускорило установки и подняло приложение в топ.
@machinelearning_interview
🔥28❤10👍5🤣5
📘 Готовитесь к ML-собеседованию? На Stepik вышел курс — «Vector DB & RAG Developer»
Этот курс закрывает типичные вопросы интервью: эмбеддинги, ANN-индексы (HNSW/IVF/IVF-PQ), тюнинг ef_search/M, выбор индекса под 1–10 млн векторов, метрики Recall@K / nDCG и ошибки RAG.
🔍 Что вы получите:
• Практика с Qdrant, Weaviate, FAISS: от эмбеддингов до продакшн-RAG
• 200+ интерактивных заданий и кейсов в стиле собес-вопросов
• Лабы с ручным рецензированием + готовые Python-шаблоны
• Чек-листы для интервью: «как объяснить HNSW», «как обосновать метрики», «как выбрать индекс»
🎓 Cертификат Stepik — добавьте в резюме или LinkedIn
🚀 Начните сегодня и получите скидку 25 % в течение 24 часов
👉 Пройти курс на Stepik
Этот курс закрывает типичные вопросы интервью: эмбеддинги, ANN-индексы (HNSW/IVF/IVF-PQ), тюнинг ef_search/M, выбор индекса под 1–10 млн векторов, метрики Recall@K / nDCG и ошибки RAG.
🔍 Что вы получите:
• Практика с Qdrant, Weaviate, FAISS: от эмбеддингов до продакшн-RAG
• 200+ интерактивных заданий и кейсов в стиле собес-вопросов
• Лабы с ручным рецензированием + готовые Python-шаблоны
• Чек-листы для интервью: «как объяснить HNSW», «как обосновать метрики», «как выбрать индекс»
🎓 Cертификат Stepik — добавьте в резюме или LinkedIn
🚀 Начните сегодня и получите скидку 25 % в течение 24 часов
👉 Пройти курс на Stepik
❤18👍13🥰4🐳2🤣1
SWE‑Swiss-32B — модель с 32 млрд параметров, оптимизированная для эффективного исправления программных проблем.
Что входит в рецепт обучения:
- Мulti‑Task Fine‑Tuning + Reinforcement Learning — обучаем модель сразу на нескольких навыках и усиливаем через RL.
- Ключевые навыки:
- Локализация ошибок (файлы)
- Генерация патчей
- Создание unit-тестов
По результатам тестов на SWE‑bench Verified, модель показывает производительность на уровне передовых закрытых моделей, несмотря на свою среднюю размерность.
Плюсы:
- Доступно на Hugging Face под лицензией MIT
- Использует
transformers
— просто интегрировать в пайплайнПочему это круто:
SWE‑Swiss — пример того, как грамотно комбинация мультизадочного обучения и RL позволяет добиться высоких результатов в решении понятийно сложных задач, делая LLM доступнее и эффективнее для разработчиков.
📑Notion: https://pebble-potato-fc6.notion.site/SWE-Swiss-A-Multi-Task-Fine-Tuning-and-RL-Recipe-for-High-Performance-Issue-Resolution-21e174dedd4880ea829ed4c861c44f88?pvs=143
💻Github: https://github.com/zhenyuhe00/SWE-Swiss
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16👍11🔥8
🚀 Вышла Mistral Medium 3.1
- Повышена общая производительность
- Улучшен тон общения
- Обновлена и улучшена работа в вебе
Попробовать можно в Le Chat (стоит как модель по умолчанию)
или через API: mistral-medium-2508
- Повышена общая производительность
- Улучшен тон общения
- Обновлена и улучшена работа в вебе
Попробовать можно в Le Chat (стоит как модель по умолчанию)
или через API: mistral-medium-2508
👍25🔥10❤8
🚀 LiveMCPBench — новый бенчмарк для LLM-агентов в мире инструментов MCP
Что это:
LiveMCPBench тестирует ИИ-агентов в масштабных, реалистичных сценариях с использованием MCP (Model Context Protocol) — стандарта для взаимодействия модели с внешними данными, API и инструментами.
Ключевые факты:
- 95 реальных задач в экосистеме MCP
- 70 MCP-серверов и 527 инструментов в коллекции LiveMCPTool
- Автоматическая оценка через LiveMCPEval (LLM-судья) с точностью 81 % по сравнению с экспертами
- Протестировано 10 ведущих моделей: лидер — Claude-Sonnet-4 с результатом 78.95 % успеха
Почему это важно:
LiveMCPBench — первый воспроизводимый фреймворк, который проверяет, как агенты справляются с обилием инструментов и динамично меняющейся средой.
🔗 Подробнее: https://icip-cas.github.io/LiveMCPBench
Что это:
LiveMCPBench тестирует ИИ-агентов в масштабных, реалистичных сценариях с использованием MCP (Model Context Protocol) — стандарта для взаимодействия модели с внешними данными, API и инструментами.
Ключевые факты:
- 95 реальных задач в экосистеме MCP
- 70 MCP-серверов и 527 инструментов в коллекции LiveMCPTool
- Автоматическая оценка через LiveMCPEval (LLM-судья) с точностью 81 % по сравнению с экспертами
- Протестировано 10 ведущих моделей: лидер — Claude-Sonnet-4 с результатом 78.95 % успеха
Почему это важно:
LiveMCPBench — первый воспроизводимый фреймворк, который проверяет, как агенты справляются с обилием инструментов и динамично меняющейся средой.
🔗 Подробнее: https://icip-cas.github.io/LiveMCPBench
👍16🔥9❤7