эйай ньюз
57.2K subscribers
1.37K photos
722 videos
7 files
1.69K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

В свободное время работаю как Staff Research Scientist в Meta Generative AI в Швейцарии.

Aвтор: @asanakoy

PR: @kander426
Download Telegram
К слово о Midjourney, наткнулся на очень стильные генерации Midjourney V6 в стиле Grimes по мотивам шедевров.

Шикарное качество и стиль!

1. “Mona Lisa” by Leonardo da Vinci
2. “Girl with a Pearl Earring” by Johannes Vermeer
3. “The Scream” by Edvard Munch
4. “The Kiss” by Gustav Klimt
5. “American Gothic” by Grant Wood
6. “Self-Portrait with a Straw Hat” by Vincent van Gogh ❤️

___

Кто-то спросил в комментах к предыдущему посту: "Можно ли купить акции Midjourney?". Круче — можно пойти к ним работать.

@ai_newz
Там Google подвез Gemini Ultra в прод. И, конечно, небесплатно, ведь моделька жирная, дорогая.

У меня просят 22 евро в месяц, но к этому ещё идёт 2TB на Google Drive и прочие ништяки типа интеграции LLM с почтой и календарем в будущем. Проапгрейдится можно тут.

Gemini Ultra бьёт GPT-4 на 7 из 8 бенчмарках по тексту и на всех бенчмарках по зрению, если сравнивать с GPT-4V.

Что ж, бенчмарки — это хорошо, и появление серьезной конкуренции для GPT-4 не может не радовать. Однако, бенчмарки имеют свойство попадать в тренировочную выборку, особенно когда речь идёт о триллионах токенов со всего интернета. Так что посмотрим, как Ultra покажет себя на практике, когда тысячи людей протестируют её. 🤔

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Меня разодрало любопытство и уже я подписался на Gemini Ultra.

Первые тесты выглядят гораздо слабее чем GPT-4. По крайней мере фото она гораздо хуже понимает. Вот например сцена по мотивам Attack on Titan с элементами Sailor Moon — Gemini же вообще ничего из этого не понял. А любые фото с людьми он вообще отказывается принимать.

Кстати, может там действительно ещё нет их самой мощной мультимодалки Gemini Ultra Vision, а есть только самые базовые способности понимания фото.

@ai_newz
YC как и Alliance делится идеями в которые они хотят инвестировать в request for startups, и буквально сегодня они этот список обновили!

Очень увлекательное чтиво с ожидаемыми (МЛ для роботов, лекарство от рака, пространственные вычесления (AR)) и очень даже неожиданными напрявлениями (стейблы, climate tech (который уже все похоронили), оборонка (!), коммерческий опенсорс, внутренние энтерпрайз тулы). YC обычно знают о чем говорят, поэтому подумайте о тех идеях, которые сюда не вошли, и почему так.

Весь список с подробными комментариями по ссылкам:

1. Applying machine learning to robotics
2. Using machine learning to simulate the physical world
3. New defense technology
4. Bring manufacturing back to America
5. New space companies
6. Climate tech
7. Commercial open source companies
8. Spatial computing
9. New enterprise resource planning software (ERPs)
10. Developer tools inspired by existing internal tools
11. Explainable AI
12. LLMs for manual back office processes in legacy enterprises
13. AI to build enterprise software
14. Stablecoin finance
15. A way to end cancer
16. Foundation models for biological systems
17. The managed service organization model for healthcare
18. Eliminating middlemen in healthcare
19. Better enterprise glue
20. Small fine-tuned models as an alternative to giant generic ones
эйай ньюз
YC как и Alliance делится идеями в которые они хотят инвестировать в request for startups, и буквально сегодня они этот список обновили! Очень увлекательное чтиво с ожидаемыми (МЛ для роботов, лекарство от рака, пространственные вычесления (AR)) и очень…
Любопытный список. Особенно интересно видеть ожидание, что ML наконец выйдет в физический мир. Это касается стартапов с ML для робототехники и ML для симуляции физического мира.

Ещё прям интересно, что YC заинтересовался стартапами, которые предложат маленькие зафайнтюненые модели как альтернативу огромным LLM с общими знаниями. Кажется тут речь также пойдет о деплое маленьких, но сильных в своей области моделей на edge девайсы.
Ещё из новостей, Андрей Карпатый ушел из OpenAI, пробыв там всего около года. Говорит, что там нет никакой драмы. Андрей просто собирается больше времени уделить тому, чтобы пилить свои проекты. Так что ждём нового классного образовательного контента от Андрея!

Если пропустили, то вот тут я писал про его последнюю лекцию "Интро в большие языковые модели" — рекомендую.

Интересно, если там все так круто в OpenAI, то почему Андрей ушел после одного года?🤔 Хотя возможно он хотел набраться максимально разнообразного опыта, перед тем как начать работать над своим стартапом. Как мне сказал во время ужина один из VP в Мете: "Чтобы максимально быстро расти, нужно регулярно менять компании либо команды, в которых вы работаете." Золотые слова.

@ai_newz
Кажется, Шейхи пытаются задобрить Яна ЛеКуна— его фото вчера красовалось на 828-метровой башне Бурдж-Халифа в Дубае. Сейчас в заливе пытаются сделать большую ставку на развитие AI и привлечение высококлассных учёных в свои институты и компании. Кстати, такая реклама могла стоить от $100к.

Ян ЛеКун как-то отказался читать лекцию в Саудовской Аравии из-за своего атеизма. Но ребята не теряют надежды.

@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Google анонсировал новую LLM Gemini 1.5 - до 1M токенов!

У гугла с неймингом продуктов и моделей большие пролемы. Давайте разбираться что за 1.5.

То что сейчас крутится у них в проде, и что я недавно тестил, Gemini Ultra (Advanced), - это Gemini 1.0. А тут анонсировали, что уже сделали новую версию - Gemini 1.5.

Что нового?
- Эта модель уже основана на Mixture of Experts (MoE).
- может работать с контекстами в длиной 1M токенов, что на порядок больше чем у конкурентов.
- Причем, токены могут быть из разных модельностей. Например, в Gemini 1.5 можно тупо загрузить видео и попросить модель проанализировать его.

В 1M токенов поместится примерно часовое видео, 11 часов аудио, более 30k строк кода или более 700к строк текста.

Подробности есть в тех-репорте (58 стр). Либо в блог блог-посте.

@ai_newz
Из тех-репорта Gemini 1.5: тут сравнивали работу на больших контекстах. 1.5 Pro, конечно, рвет модель 1.0 на больших контекстах.

Кроме того сравнили с Claude 2.1 на контексте в 200kt. Gemini 1.5 выдает Recall 100% - то есть всегда находит скрытые факты в тексте. Причем 100% recall сохранятеся вплоть до длины контекста в 530kt.

А вот Claude 2.1 выдает Recall 98% на 200к токенов.

@ai_newz
OpenAI только что показали очень мощную модель text2video : https://openai.com/sora

@ai_newz