Анонимный телеграм-канал

Apple launches MLX — an efficient machine learning framework specifically designed for Apple silicon (i.e. your laptop!). MLX design is inspired by existing frameworks such as PyTorch, Jax, and ArrayFire. However, MLX adds support for a unified memory model, which means arrays live in shared memory and operations can be performed on any of the supported device types without performing data copies.

https://www.computerworld.com/article/3711408/apple-launches-mlx-machine-learning-framework-for-apple-silicon.html

33 viewsedited 17:22

https://blog.google/technology/ai/google-gemini-ai/

#LLM #Gemini

Google

Introducing Gemini: our largest and most capable AI model

Gemini is our most capable and general model, built to be multimodal and optimized for three different sizes: Ultra, Pro and Nano.

36 viewsedited 17:32

Анонимный телеграм-канал

https://deepmind.google/technologies/gemini/

#LLM #Gemini

Google DeepMind

Gemini 3

Our most intelligent AI model that brings any idea to life

43 viewsedited 17:51

Анонимный телеграм-канал

6:22

Media is too big

VIEW IN TELEGRAM

Если это и правда будет работать примерно так, без натужного черри-пикинга, то это отвал башки. Мультимодальность в основе (а не как связующий костыль) — это круто.

143 views18:06

Анонимный телеграм-канал

Немного потестировал Gemini Pro с другими крупнейшими LLM. Никаких сюрпризов, все так же, как и было до этого. Безусловным победителем оказался (сюрприз!) GPT 4 Turbo, за ним идут GPT 4 Bing / Anthropic Claude 2.1. Результат гугловского апгрейда Барда пока не очень впечатляет, в большинстве случаев он отвечает даже хуже Claude, тягаться может разве что с GPT 3.5 Turbo (но тут зависит от задачи, необходимости свежих данных, и это еще пока не Gemini Ultra). Скриншоты с примерами в приложенном архиве:

1. Вопрос про количество бананов:

GPT 3.5 Turbo — ❌ (логическая ошибка)
GPT 4 Turbo — ✅ (отлично)
Gemini Pro / Bard — ❌ (логическая ошибка)
GPT 4 Bing — ❌ (почти ОК, но ошибка в логике)
Anthropic Claude 2.1 — ✅ (отлично)

2. Простая арифметика с порядком операций:

GPT 3.5 Turbo — ❌ (полный провал)
GPT 4 Turbo — ✅ (отлично)
Gemini Pro / Bard — ✅ (отлично)
GPT 4 Bing — ✅ (корявенький вывод)
Anthropic Claude 2.1 — ✅ (отлично)

3. Логика с подсчетом слоновьих ног:

GPT 3.5 Turbo — ✅ (отлично)
GPT 4 Turbo — ✅ (отлично)
Gemini Pro / Bard — ❌ (полный провал, консистентно)
GPT 4 Bing — ✅ (отлично)
Anthropic Claude 2.1 — ✅ (отлично)

4. Шутка Маска с рогозинским батутом:

GPT 3.5 Turbo — ❌ (полный провал)
GPT 4 Turbo — ✅ (отлично)
Gemini Pro / Bard — ✅ (отлично)
GPT 4 Bing — ✅ (отлично)
Anthropic Claude 2.1 — ❌ (полный провал)

5. Вывод слов с заданными параметрами:

GPT 3.5 Turbo — ❌
GPT 4 Turbo — ✅
Gemini Pro / Bard — ❌
GPT 4 Bing — ❌
Anthropic Claude 2.1 — ➖ (почти, но нет)

#llm

👍2

62 viewsedited 20:52

Анонимный телеграм-канал

llms_comparison.zip

6.7 MB

59 views20:54

Анонимный телеграм-канал

😁2💔1

61 views03:08

About

Blog

Apps

Platform