gemma4:31b-cloud наконец-то добавили в оллама
Не прошло и полгода.
Запуск:
Ну что, затестим?
https://ollama.com/library/gemma4
Не прошло и полгода.
Запуск:
ollama run gemma4:31b-cloud
ollama launch claude --model gemma4:31b-cloud
ollama launch opencode --model gemma4:31b-cloud
Ну что, затестим?
https://ollama.com/library/gemma4
👍4
Протестировал Gemma4 в Claude Code через Ollama-claude еще раз - это не работает
И тут я не выдержал, ну Гемма 4 реально очень плохо понимает куда она попала и что от нее хотят.
Ну не рождена она для кодирования, потому что у модели проблемы с использованием tools, ну не понимает она что это такое. Подробнее причины описал тут.
Модель вообще не вызывает мастер вопросов, и она замахнулась на очень сложную реализацию через TypeScript и она просто не может установить зависимости проекта (показал на скриншоте). Просто по 5 раз по кругу вызывает установщик.
Через 30 минут работы меня это достало и я вырубил.
И тут я не выдержал, ну Гемма 4 реально очень плохо понимает куда она попала и что от нее хотят.
Ну не рождена она для кодирования, потому что у модели проблемы с использованием tools, ну не понимает она что это такое. Подробнее причины описал тут.
Модель вообще не вызывает мастер вопросов, и она замахнулась на очень сложную реализацию через TypeScript и она просто не может установить зависимости проекта (показал на скриншоте). Просто по 5 раз по кругу вызывает установщик.
Через 30 минут работы меня это достало и я вырубил.
This media is not supported in your browser
VIEW IN TELEGRAM
Завершение тестирования Gemma4
Ребят, я это сделал! И это полностью не рабочий аппарат! (Из бонусов ровный корпус, но кнопки перепутаны).
Тестировал в связке Ollama Cloude + OpenCode
Промпт:
Имеет смысл попробовать сравнить с каким-нибудь GPT-4.1 из любопытства.
Рекомендуется:
• Для экспириментов, если у вас много свободного времени (и мало денег).
В OpenСlaw я это использовать не рекомендую.
И последний важный вопрос, так сколько же лимитов на это ушло?
Ответ: 0
т.е. Ollama походу денег за это не берет.
Ребят, я это сделал! И это полностью не рабочий аппарат! (Из бонусов ровный корпус, но кнопки перепутаны).
Тестировал в связке Ollama Cloude + OpenCode
ollama launch opencode --model gemma4:31b-cloud
Промпт:
Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.Имеет смысл попробовать сравнить с каким-нибудь GPT-4.1 из любопытства.
Рекомендуется:
• Для экспириментов, если у вас много свободного времени (и мало денег).
В OpenСlaw я это использовать не рекомендую.
И последний важный вопрос, так сколько же лимитов на это ушло?
Ответ: 0
т.е. Ollama походу денег за это не берет.
❤1
Forwarded from Да придет ИИ: ChatGPT, Claude, Gemini, Grok
#AIДайджест за неделю 27 марта по 4 апреля 2026
* Утечка исходного кода Claude от Anthropic: Код был случайно слит в сеть через реестр npm. Анализ кода раскрыл будущие планы компании: новую трехслойную архитектуру памяти, разработку фонового автономного ИИ-агента KIROS, который работает 24/7, упоминания новой модели следующего поколения Capiara (или Mythos) и скрытую систему терминальных «питомцев» в стиле Тамагочи.
* Рекордные инвестиции и новые планы OpenAI: Компания привлекла 122 милр. долларов при оценке в 852 миллиарда (среди инвесторов — Microsoft). OpenAI планирует создать единое «суперприложение», которое объединит ChatGPT, веб-браузинг и Codex.
* Масштабное обновление интерфейса и функций ChatGPT:
• Передача геопозиции: Позволяет делать локализованные запросы, например, искать ближайшие кафе, и получать ответы с интерактивной картой и изображениями.
• Умная работа с длинным текстом: Если вы вставляете в чат текст длиной более 5000 символов, он не занимает место в самом сообщении, а автоматически прикрепляется как .txt файл. Это сделано для экономии токенов контекстного окна, но пользователь может нажать специальную кнопку, чтобы принудительно развернуть файл как обычный текст.
• Унификация подключенных сервисов: Интеграции с Google Docs, Sheets и Slides теперь объединены в единый коннектор Google Drive. Также были обновлены приложения Box, Notion, Linear и Dropbox внутри чат-бота (нужно перепройти авторизацию).
• Редизайн мобильного приложения: Меню стало полноэкранным, элементы интерфейса увеличились, и теперь навигация удобно разделена свайпами между историей чатов и списком GPT.
• Улучшенный интерфейс покупок (Shopping): Переработан визуальный стиль отображения товаров внутри чата, и модель стала чаще получать свежие данные о продуктах от брендов-партнеров.
* Новая модель MAI Transcribe 1 от Microsoft: Выпущена новая модель распознавания речи, созданная специально для транскрипций. Она превосходит аналоги (Whisper, Gemini).
* Google выпустила Veo 3.1 Light: Это более дешевая версия модели для генерации видео (стоимость составляет всего 5 центов за видео в 720p). Также было анонсировано снижение цен на версию Veo 3.1 Fast, которое ожидается 7 апреля.
* Запуск AI Inbox от Google: Новая бета-функция для умной сортировки электронной почты и ежедневных персонализированных сводок. Только для Ultra.
* Релиз открытой модели Gemma 4: Google выпустила мощную open-source модель под лицензией Apache 2.0, предназначенную для локального запуска на устройствах Android и ноутбуках.
* Две новые модели от Alibaba: Представлены Qwen 3.5 Omni — модель, работающая с текстом, изображениями, аудио и видео, и Qwen 3.6 Plus — модель для реальных агентов и написания кода, обладающая контекстным окном в 1 миллион токенов по умолчанию.
* Новая модель Trinity Large Thinking от RC: Американская компания выпустила открытую (Apache 2.0) модель, которая по тестам показывает результаты на уровне с передовыми закрытыми моделями.
* Функция управления компьютером в Claude Code: ИИ теперь может управлять мышью и клавиатурой прямо в браузере (функция доступна в предпросмотре для подписчиков Pro и Max).
* Плагин Codex для Claude Code: Пользователи теперь могут использовать API-ключ OpenAI прямо в интерфейсе Claude Code, объединяя возможности двух систем в одном рабочем процессе.
* ChatGPT в Apple CarPlay: Популярный чат-бот теперь интегрирован напрямую в систему Apple CarPlay для автомобилей.
* OpenAI купила подкаст TBPN: Компания приобрела ежедневное прямоэфирное шоу/подкаст о технологиях и бизнесе Tech Business Production Network.
* Perplexity запустила Computer for Taxes: Инструмент загружает налоговые модули для помощи с федеральными налогами США и может самостоятельно заполнять официальные формы IRS.
* Slack получает 30 новых ИИ-функций: Salesforce делает мессенджер более агентным, добавляя транскрипцию встреч (в том числе из Zoom), сохраняемые ИИ-навыки, глубокий поиск и автоматическое обновление данных о клиентах напрямую из чатов.
* Утечка исходного кода Claude от Anthropic: Код был случайно слит в сеть через реестр npm. Анализ кода раскрыл будущие планы компании: новую трехслойную архитектуру памяти, разработку фонового автономного ИИ-агента KIROS, который работает 24/7, упоминания новой модели следующего поколения Capiara (или Mythos) и скрытую систему терминальных «питомцев» в стиле Тамагочи.
* Рекордные инвестиции и новые планы OpenAI: Компания привлекла 122 милр. долларов при оценке в 852 миллиарда (среди инвесторов — Microsoft). OpenAI планирует создать единое «суперприложение», которое объединит ChatGPT, веб-браузинг и Codex.
* Масштабное обновление интерфейса и функций ChatGPT:
• Передача геопозиции: Позволяет делать локализованные запросы, например, искать ближайшие кафе, и получать ответы с интерактивной картой и изображениями.
• Умная работа с длинным текстом: Если вы вставляете в чат текст длиной более 5000 символов, он не занимает место в самом сообщении, а автоматически прикрепляется как .txt файл. Это сделано для экономии токенов контекстного окна, но пользователь может нажать специальную кнопку, чтобы принудительно развернуть файл как обычный текст.
• Унификация подключенных сервисов: Интеграции с Google Docs, Sheets и Slides теперь объединены в единый коннектор Google Drive. Также были обновлены приложения Box, Notion, Linear и Dropbox внутри чат-бота (нужно перепройти авторизацию).
• Редизайн мобильного приложения: Меню стало полноэкранным, элементы интерфейса увеличились, и теперь навигация удобно разделена свайпами между историей чатов и списком GPT.
• Улучшенный интерфейс покупок (Shopping): Переработан визуальный стиль отображения товаров внутри чата, и модель стала чаще получать свежие данные о продуктах от брендов-партнеров.
* Новая модель MAI Transcribe 1 от Microsoft: Выпущена новая модель распознавания речи, созданная специально для транскрипций. Она превосходит аналоги (Whisper, Gemini).
* Google выпустила Veo 3.1 Light: Это более дешевая версия модели для генерации видео (стоимость составляет всего 5 центов за видео в 720p). Также было анонсировано снижение цен на версию Veo 3.1 Fast, которое ожидается 7 апреля.
* Запуск AI Inbox от Google: Новая бета-функция для умной сортировки электронной почты и ежедневных персонализированных сводок. Только для Ultra.
* Релиз открытой модели Gemma 4: Google выпустила мощную open-source модель под лицензией Apache 2.0, предназначенную для локального запуска на устройствах Android и ноутбуках.
* Две новые модели от Alibaba: Представлены Qwen 3.5 Omni — модель, работающая с текстом, изображениями, аудио и видео, и Qwen 3.6 Plus — модель для реальных агентов и написания кода, обладающая контекстным окном в 1 миллион токенов по умолчанию.
* Новая модель Trinity Large Thinking от RC: Американская компания выпустила открытую (Apache 2.0) модель, которая по тестам показывает результаты на уровне с передовыми закрытыми моделями.
* Функция управления компьютером в Claude Code: ИИ теперь может управлять мышью и клавиатурой прямо в браузере (функция доступна в предпросмотре для подписчиков Pro и Max).
* Плагин Codex для Claude Code: Пользователи теперь могут использовать API-ключ OpenAI прямо в интерфейсе Claude Code, объединяя возможности двух систем в одном рабочем процессе.
* ChatGPT в Apple CarPlay: Популярный чат-бот теперь интегрирован напрямую в систему Apple CarPlay для автомобилей.
* OpenAI купила подкаст TBPN: Компания приобрела ежедневное прямоэфирное шоу/подкаст о технологиях и бизнесе Tech Business Production Network.
* Perplexity запустила Computer for Taxes: Инструмент загружает налоговые модули для помощи с федеральными налогами США и может самостоятельно заполнять официальные формы IRS.
* Slack получает 30 новых ИИ-функций: Salesforce делает мессенджер более агентным, добавляя транскрипцию встреч (в том числе из Zoom), сохраняемые ИИ-навыки, глубокий поиск и автоматическое обновление данных о клиентах напрямую из чатов.
❤1
Протестировал GPT-4.1
Ребята, Ребята, посмотрите какую игру змейка сделал старичок GPT-4.1
Промпт:
Решил я тут понастальгировать, и чтобы осознать насколько прогресс ушел далеко за эти 3 года, подключил к OpenCode GPT-4.1 из подписки GitHub Copilot
Задание для этих старых моделей настолько сложное, что аппарат получился 100% кривой косой и не рабочий.
GPT-4o тестировать будем?
Ребята, Ребята, посмотрите какую игру змейка сделал старичок GPT-4.1
Промпт:
Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.Решил я тут понастальгировать, и чтобы осознать насколько прогресс ушел далеко за эти 3 года, подключил к OpenCode GPT-4.1 из подписки GitHub Copilot
Задание для этих старых моделей настолько сложное, что аппарат получился 100% кривой косой и не рабочий.
GPT-4o тестировать будем?
Протестировал Qwen 3.6 Plus
Оценка 3 из 5 (Может ему не свезло и если делать 10 шотов, то результат получился бы другой).
Промпт:
Один апарат поломан, не работает рингтон и смс глючит
Один аппарат полностью поломано смс
Стоит отметить:
• Корпусы все ровные а аккурантые, 4 из 5 экранов не вылазят за пределы корпуса.
• Работает довольно шустро самый быстрый за 53 сек., самый долгий 3 минуты
• Инференс от Алибабы подвисает, на старте так всегда быват (все хотят попробовать модель, мощности еще не масштабировали).
Цена: $3\1M - ну за такие деньги ничего интересного она из себя не представляет. Я думал дешевле будет.
Результаты тестирования GLM-5 и Kimi K2.5
Оценка 3 из 5 (Может ему не свезло и если делать 10 шотов, то результат получился бы другой).
Промпт:
Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.
Один апарат поломан, не работает рингтон и смс глючит
Один аппарат полностью поломано смс
Стоит отметить:
• Корпусы все ровные а аккурантые, 4 из 5 экранов не вылазят за пределы корпуса.
• Работает довольно шустро самый быстрый за 53 сек., самый долгий 3 минуты
• Инференс от Алибабы подвисает, на старте так всегда быват (все хотят попробовать модель, мощности еще не масштабировали).
Цена: $3\1M - ну за такие деньги ничего интересного она из себя не представляет. Я думал дешевле будет.
Результаты тестирования GLM-5 и Kimi K2.5
❤2
Forwarded from OpenClaw канал про ИИ-агентов
Telegram разрешил ботам создавать ботов — что это значит для OpenClaw
Telegram выпустил крупнейшее обновление Bot API: теперь один бот может создавать и управлять другими ботами. Звучит как мелочь? Это меняет всё.
Что нового:
• Боты могут создавать других ботов через API — без участия человека
• Бот может деплоить, масштабировать и управлять сетью ботов
• Ноль кода — AI-бот сам создаёт нужные боты по запросу
Почему это важно для OpenClaw:
OpenClaw работает через Telegram-бот. Сейчас один агент = один бот. С новым обновлением один OpenClaw-агент может создавать специализированных субагентов-ботов под конкретные задачи — мониторинг, уведомления, интеграции — и управлять ими централизованно.
По сути Telegram дал OpenClaw то, чего не хватало — нативную оркестрацию на уровне платформы.
Что ещё в обновлении:
• AI-редактор — встроенный в строку ввода, работает через Cocoon Network (privacy-first). Перевод, смена стиля, грамматика. Стили: Formal, Short, Tribal, Corp, Zen, Biblical, Viking
• Опросы 2.0 — медиа в вопросах, подсказки от пользователей, таймеры, перемешивание вариантов
• Live Photos — нативная поддержка iOS Live Photos и Android Motion Photos
Что это значит на практике:
Если вы задумывались запустить нескольких агентов OpenClaw для разных задач — теперь это можно сделать из одного экземпляра. Агент-оркестратор создаёт ботов-исполнителей, даёт им задачи, собирает результаты.
🔗 https://telegram.org/blog/ai-editor-mighty-polls-and-more
Подпишитесь на @openclawc
Telegram выпустил крупнейшее обновление Bot API: теперь один бот может создавать и управлять другими ботами. Звучит как мелочь? Это меняет всё.
Что нового:
• Боты могут создавать других ботов через API — без участия человека
• Бот может деплоить, масштабировать и управлять сетью ботов
• Ноль кода — AI-бот сам создаёт нужные боты по запросу
Почему это важно для OpenClaw:
OpenClaw работает через Telegram-бот. Сейчас один агент = один бот. С новым обновлением один OpenClaw-агент может создавать специализированных субагентов-ботов под конкретные задачи — мониторинг, уведомления, интеграции — и управлять ими централизованно.
По сути Telegram дал OpenClaw то, чего не хватало — нативную оркестрацию на уровне платформы.
Что ещё в обновлении:
• AI-редактор — встроенный в строку ввода, работает через Cocoon Network (privacy-first). Перевод, смена стиля, грамматика. Стили: Formal, Short, Tribal, Corp, Zen, Biblical, Viking
• Опросы 2.0 — медиа в вопросах, подсказки от пользователей, таймеры, перемешивание вариантов
• Live Photos — нативная поддержка iOS Live Photos и Android Motion Photos
Что это значит на практике:
Если вы задумывались запустить нескольких агентов OpenClaw для разных задач — теперь это можно сделать из одного экземпляра. Агент-оркестратор создаёт ботов-исполнителей, даёт им задачи, собирает результаты.
🔗 https://telegram.org/blog/ai-editor-mighty-polls-and-more
Подпишитесь на @openclawc
Telegram
AI Editor, Mighty Polls, Live Photos, Bots Managed by Bots, and More
In today's update we introduce an AI Editor that can translate, transform, or fix your text in just two taps, new features for Polls like attaching media and suggesting new responses for active polls, support for Live and Motion Photos in all apps, bots that…
❤1
Zhipu AI выпустили SOTA модель GLM-5.1
Эта модель не только лучше Opus 4.6 и GPT-5.4 в задачах кодирования, так она еще может вам кофе приготовить!!!
Но, не спешите радоваться:
Цена новинки $4.4\1M - дешевле, чем Haiku, но уже в 2 раза дороже GLM-4.7.
Go тестить?
https://z.ai/blog/glm-5.1
https://docs.z.ai/guides/llm/glm-5.1
Эта модель не только лучше Opus 4.6 и GPT-5.4 в задачах кодирования, так она еще может вам кофе приготовить!!!
Но, не спешите радоваться:
Для подписчиков тарифного плана GLM Coding Plan: Мы внедряем GLM-5.1 для всех пользователей тарифного плана Coding Plan. Вы можете включить GLM-5.1 прямо сейчас, обновив название модели "GLM-5.1"(например, ~/.claude/settings.jsonдля Claude Code). Как наша самая мощная модель, GLM-5.1 потребляет квоту в 3 раза больше в часы пик и в 2 раза больше в непиковые часы. В рамках ограниченной по времени акции до конца апреля, использование в непиковые часы оплачивается по тарифу 1×. (Часы пик — с 14:00 до 18:00 UTC+8 (Пекинское время) ежедневно)
Цена новинки $4.4\1M - дешевле, чем Haiku, но уже в 2 раза дороже GLM-4.7.
Go тестить?
https://z.ai/blog/glm-5.1
https://docs.z.ai/guides/llm/glm-5.1
👍6
А вы тоже замечали, что лимиты в Кодекс какие-то странные?
Один скрнишот я сделал в 8 утра, а второй в 9:30 утра.
Один скрнишот я сделал в 8 утра, а второй в 9:30 утра.
❤2
GLM-5.1 нагнул GPT-5.4 и Gemini 3.1 Pro на arena.ai
1530 elo это не 5.1 - это GLM-6 (или хотя бы 5.5)
Чтобы нагнуть Opus 4.6 не хватило 18 баллов, это разница в 1.1%, и при разнице в цене 468% (4.4$ vs $25).
Лицензия MIT в отличие от MiniMax, а это значит, что скоро мы увидим много много клонов этого GLM-5.1
Ну чего, погнали тестить?
1530 elo это не 5.1 - это GLM-6 (или хотя бы 5.5)
Чтобы нагнуть Opus 4.6 не хватило 18 баллов, это разница в 1.1%, и при разнице в цене 468% (4.4$ vs $25).
Лицензия MIT в отличие от MiniMax, а это значит, что скоро мы увидим много много клонов этого GLM-5.1
Ну чего, погнали тестить?
Ребят, кто ждете результатов по GLM-5.1
Плохо ждете, но еще есть шанс перегословоать )))
Кстати, при таких бенчах его уже надо выставлять против чемпиона arena.ai
GLM-5.1 vs Opus 4.6 - бой в сверхтяжелом весе на звание чемпиона вайб кодирования.
Спойлер:По моим предыдущим скриншотам, вы можете догадаться, что я уже чутка потестил GLM-5.1 и результат меня не очень поразил. Поэтому нужно его уже выставлять против Опуса, потому что разница в цене ну в 5 раз... это очень много.
Плохо ждете, но еще есть шанс перегословоать )))
Кстати, при таких бенчах его уже надо выставлять против чемпиона arena.ai
GLM-5.1 vs Opus 4.6 - бой в сверхтяжелом весе на звание чемпиона вайб кодирования.
Спойлер:
🔥3
Протестировал GLM-5.1
Особой разницы между GLM-5.1 и GLM-5.1 мой тест не находит. Оба набирают по 4 балла из 5, но есть нюансы.
Промпт:
Работает ну очень долго:
• Планирование где-то 2 минуты 30 сек. Иногда вопросы задает, иногда не задает (я так догадываюсь, это зависит от тренированности модели использования тулс)
• Реализация 8 минут 53 сек. минимум, а то все 15 минут и дольше. Иногда просто вырубается и ничего не делает, надо писать "продолжи", чтобы снова начал делать.
Но в тесте GLM-5 я уже жаловался на скорость работы, в последтсвии это поправили и сейчас работает намного быстрее и стабильнее, чем при старте инференса.
Корпусы телефонов ровные, 4 из 5, как и у GLM-5.1 (один из экранов вылазит за пределы корпуса)
У одного телефона все шрифты, они не то что вверх ногами они повернуты боком (показал на скриншоте), так что прочитать что написано в меню вообще не возможно.
У одного телефона из 5 не работают смс, поэтому 4 балла из 5.
Будем ли тестировать в CludeCode? Наверное нет, я заметил, что на телефонах с игрой змейка, эти китайские модели в OpenCode лучше себя показывают, так что потратим время на что-то более полезное.
Особой разницы между GLM-5.1 и GLM-5.1 мой тест не находит. Оба набирают по 4 балла из 5, но есть нюансы.
Промпт:
Создайте Nokia 3310 с пиксельным экраном, игрой Змейка, составлением SMS и визуализатором классического рингтона.Работает ну очень долго:
• Планирование где-то 2 минуты 30 сек. Иногда вопросы задает, иногда не задает (я так догадываюсь, это зависит от тренированности модели использования тулс)
• Реализация 8 минут 53 сек. минимум, а то все 15 минут и дольше. Иногда просто вырубается и ничего не делает, надо писать "продолжи", чтобы снова начал делать.
Но в тесте GLM-5 я уже жаловался на скорость работы, в последтсвии это поправили и сейчас работает намного быстрее и стабильнее, чем при старте инференса.
Корпусы телефонов ровные, 4 из 5, как и у GLM-5.1 (один из экранов вылазит за пределы корпуса)
У одного телефона все шрифты, они не то что вверх ногами они повернуты боком (показал на скриншоте), так что прочитать что написано в меню вообще не возможно.
У одного телефона из 5 не работают смс, поэтому 4 балла из 5.
Будем ли тестировать в CludeCode? Наверное нет, я заметил, что на телефонах с игрой змейка, эти китайские модели в OpenCode лучше себя показывают, так что потратим время на что-то более полезное.