эйай ньюз
57.3K subscribers
1.38K photos
722 videos
7 files
1.69K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

В свободное время работаю как Staff Research Scientist в Meta Generative AI в Швейцарии.

Aвтор: @asanakoy

PR: @kander426
Download Telegram
Если вы активно пользовались MidJourney, возможно, заметили, что галерея на сайте в последнее время состоит из картинок с очень коротким промптом и каким-то рандомным sref-кодом.

Мало того, что это просто неинтересно, так ещё и повторить результат совершенно не получается без конкретного сида, так как такой короткий промпт оставляет модели слишком много свободы и не содержит конкретного описания, что грустно, если хочешь сделать что-то похожее.

Вот если проблема со стилем кое-как решается через местный ip-adapter (--sref), то с содержимым придётся помучиться, и это я не говорю о том, что злоупотребление аргументами cref, sref и personalization чревато артефактами и непослушным промптом.

Крутой штукой была команда /describe. Это одна из команд бота в Дискорде: отправляешь ему картинку, а MidJourney Vision выдаёт тебе описание в четырёх вариантах. Собственно, так они и размечают датасеты для тренировки, судя по всему. Но сейчас как-то даже стремно заходить в Дис, когда есть сайт, но там такой команды так и не появилось.

Зато недавно я обнаружил вот такую иконку (см. картинку 1). Кликаем — и вуаля, полное описание картинки по категориям. Берём и лепим свой собственный промпт. Метод, скажем так, для ленивых или тех, кто не обладает широким искусствоведческим вокабуляром. Пользуемся!

Кстати, художники, я знаю, вы тут есть. Как там вообще MidJourney поживает? Не съел его еще Flux?

@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Добро пожаловать в киберпанк - Маск провёл презентацию Tesla

Показал пару прототипов новых тачек в стилистике Cybertruck вообще без водительских мест - Cybercab (робо-такси) и Robovan (робо-маршрутка). Когда выйдут - непонятно, обещает "до 2027", но с дедлайнами у Маска так себе.

Но вы только посмотрите на этих танцующих роботов Optimus! Они ещё стояли у бара, играли в камень-ножницы-бумагу и вообще всячески взаимодействовали с посетителями. Правда, скорее всего, ими управляли живые люди удалённо.

@ai_newz
Как найти ментора по карьере и AI - Стрим в субботу

Многие наверное слышали про такое явления как менторинг. Кроме постоянного самообразование в нашей сфере очень помогает иметь старшего товарища, который может направить в правильную сторону и подскажет советом как поступать в той или иной ситуации. Это действительно дорогого стоит, ведь не все актуальные знания изложены где-то на бумаге или в лекциях, плюс личное общение с человеком, который заинтересован помочь развиваться дает тебе гораздо более сильный толчок.

Про менторство мы по чуть-чуть поговорили на недавнем большом стриме. Но я хотел бы по-подробнее обсудить эту тему.

Позтому в субботу в 19:00-19:30 CET проведу небольшой стрим, где поговорим именно про менторинг:
- Почему это полезная штука для роста по карьере как для ресерчеров так и для инженеров. Какие преимущества вам это принесет.
- Советы как получить наибольшую пользу от работы с ментором.
- Где и как можно искать подходящих менторов.
- В чем интерес для ментора прокачивать других людей.
- Еще расскажу про свой опыт менторинга ребят, и как я сам учусь и где нахожу менторов для себя, которые дальше меня по карьере.

Жду вас на стриме завтра в 18:30 19:00 CET! (передвинул на 30 минут)
Добавляйте в календарь: ссылка

@ai_newz
Live stream scheduled for
Live stream scheduled for
Live stream started
Пост для чата стрима про менторинг.

@ai_newz
Live stream finished (44 minutes)
Ну что, 13-го октября (завтра) в 23:59 CET подходит к концу набор на интенсив по карьере в AI/ML.

Все 1:1 разобраны. Charity spots разыграны и выданы лучшим кандидатам.

К комьюнити присоединилось уже более 200 человек: Есть много людей, у которых 5+ лет опыта, а также те, кто только начинает свой путь в AI. От студентов до синьоров+ в FAANG. Причем участники географически распределены по всему миру.

Ребята уже бурно общаются по разным темам и обмениваются техническим опытом. А на следующий неделе мы начинаем наш двухнедельный интенсив с четырьмя стримами, которые помогут мотивированным ребятам стать сильными кандидатами на такие роли как Data Scientist, ML Engineer, Research Engineer или Research Scientist.

Уже писал в бота, но скажу еще раз здесь. Я не планирую повторять эту программу в ближайшем будущем. Время ограничено, проектов у меня много, но при этом менторить толковых людей, продвигаться в сфере AI и обмениваться опытом мне очень нравится.

Сейчас это интересный эксперимент для меня и возможность поделиться ценной информацией со своими ребятами в формате, который я ещё не видел.

🚨Осталось совсем немного времени, чтобы присоединиться. Если вы хотите
1) перейти в AI и понять как стать сильным кандидатом, а также успешно проходить собеседования;
2) увидеть как проходят разные интервью в FAANG на AI позиции и получить обратную связь,
3) нетворкать и общаться в комьюнити cо мной, с людьми вашего уровня и спецами уровнем выше,

то присоединяйтесь к нам, чтобы двигаться по карьерной лестнице в сфере AI: @ai_newz_intensive_bot

#карьера
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Мой доклад про Imagine Flash

На прошлой неделе я делал доклад на Цюрихском AI+X саммите про модель Imagine Flash (пост). Выкладываю запись доклада.

Если вам давно хотелось узнать, как мы ускоряли диффузионные модели, то вот повод глянуть.

Youtube: тык

#personal
@ai_newz
Нейродайджест за неделю (#39)

Нобелевская премия
- Нобелевка в физике machine learning. Впервые премию вручили за метод обратного распространения ошибки для тренировки нейросетей.
- AlphaFold. Вторая в истории "нобелевка" по AI за предсказание структуры белков.

Генеративные модели
- Pixtral-12B. Тех-репорт с подробным описанием архитектуры, полезно почитать.
- Midjourney Describe. Они очень старались спрятать эту кнопку на сайте, но я её нашёл. И немного мыслей про копирование стиля с референса.
- Imagine Flash. Запись моего доклада с Цюрихского AI+X саммита про то, как мы ускоряли наши диффузионные модели для картинок и видео.

Роботех
- Роботы-стриптизёры и машины без водительских мест. Учимся закатывать вечеринки у Илона Маска.

Career advancements
- Ищем ментора и как не быть кринжом на желанном созвоне. Рассказал о своем опыте поиска ментора и о том, как я смотрю на своих менти.
- 🚨Final call на интенсив. Через пару часов закрываю регистрацию. Спасибо всем, кто присоединился. Ну, а у остальных ещё есть последняя возможность ;)

> Читать дайджест #38

#дайджест
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Если любишь музыку и AI, то самое время залететь на хакатон XLabs AI, который пройдет с 2 по 17 ноября! (Это те, которые сделали первый IP-adapter для FLUX.1).

Цель — научить нейронку петь на русском языке по текстовому промпту, с потенциалом на другие языки.

Тебя ждут:
👉 Уникальная задача и 2 недели на разработку решения совместно с экспертами AI индустрии.
👉 Призовой фонд 2 миллиона рублей!
👉 Возможность стать сотрудником в передовой AI-лаборатории и выступить на международной конференции в Минске.

Скорее собирай команду до 5 человек или ищи будущих тиммейтов, которые готовы объединиться и победить в чате ✌️

Подай заявку до 1 ноября 23:59 и стань частью революции в мире музыки! 🔥

#промо
Please open Telegram to view this post
VIEW IN TELEGRAM
😮 А вот подъехала и первая публичная цена на DGX B200. За него придётся отдать чуть больше полумиллиона долларов.

Серваки с H100, для сравнения, стоят где-то в районе 300к (для больших компаний явно дешевле, но они покупают их десятками или даже сотнями тысяч).

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Turbo Alignment - файнтюны LLM для народа

Для создания продуктов на основе LLM готовые API часто не подходят. Причин для этого может быть море - как приватность, так и качество генерации. Маленькие затюненные модели часто обгоняют даже SOTA LLM по качеству, но непрофильные команды часто не могут затюнить модельки из-за отсутствия необходимой экспертизы. И хорошо если есть уже готовый пайплайн для каждого этапа работы над LLM в продуктах: SFT, preference tuning, инференс, анализ полученных моделей и др. Я как раз сегодня заметил, что Т-Банк зарелизил либу Turbo Alignment - это библиотека специально для файнтюна уже готовых моделек с полезными фичами:

Поддержка SFT, DPO, CPO, IPO, KTO и других оффлайн-методов алаймента

Готовые end-to-end пайплайны для тюнинга без написания кода

Multi-GPU и Multi-Node тренировка

Обучение и инференс мультимодальных моделей и RAG

Широкий набор метрик для анализа методов алаймента: Self-BLEU, KL-divergence, diversity и др.

Либа была создана с участием ребят из лаборатории T-Bank AI Research. Говорят, что с такой либой проверять продуктовые и исследовательские гипотезы получится намного быстрее, потому что разработчики библиотеки этот путь прошли на своем опыте уже немало раз. В будущем её ещё будут улучшать - обещают имплементацию RL методов.

https://github.com/turbo-llm/turbo-alignment

@ai_newz
Mistral выпустили линейку новых моделей - Ministral.

Идут в двух размерах - 3B и 8B. Слегка лучше Llama 3.1 в тех же весовых категориях. К сожалению, публикуют веса лишь большой модели и только под research-only лицензией. Понятно что компании нужно кормить, но всё равно грустно.

Бенчами как всегда манипулируют, так что даже не буду постить таблички. К примеру, Base модель вообще не сравнивают с Gemma 9B PT, которая на 5+ поинтов обгоняет Ministral 8B Base почти на всех бенчах.

Из приятного - заметьте как разгорается соревнование в 3B моделях. Сначала это была лишь StableLM, а сейчас есть уж несколько конкурирующих моделей (Gemini Nano-2, Llama 3.2, StableLM, Apple Intelligence, Phi) и постоянно выходят новые.

@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Авторы Chatbot Arena выпустили расширение для VS Code для оценки моделей для кодинга. По сути, это бесплатный копайлот, где предлагают выбирать из нескольких вариантов, сгенеренных разными моделями. Это должно позитивно повлиять на оценку моделей для кода, ведь именно автодополнение никто больше не бенчит. Отдельная арена тут может помочь до какой-то степени, пока разработчики на неё не оверфитнулись. А дальше придётся придумывать новые бенчи.

Если хотите попользоваться, учтите, что ваш код будут отправлять хостерам моделек на арене, что допустимо для опенсорс разработок и каких-то личных проектов. А вот для коммерческой разработки, конечно же, такое использовать не стоит.

Скачать

@ai_newz
Только технологии, только хардкор!
 
24 октября состоится IT-конференция от компании Cloud․ru, посвящённая облачным решениям и искусственному интеллекту в России — GoCloud Tech!
 
Что вас ждёт:

Четыре технологических направления:
1️⃣  Практические сценарии применения облачных решений.
2️⃣ «Внутренняя кухня» и особенности разработки облачных сервисов.
3️⃣ Развитие искусственного интеллекта и актуальные тренды в области Data Science в России.
4️⃣ Обзор новых сервисов и обновлений платформы.
 
Бонусный трек — Networking:
Открытые дискуссии о возможностях open source, преимуществах и сложностях миграции в облако.
Мастер-класс о том, как эффективно выстраивать нетворкинг и использовать контакты, полученные на конференции.
 
Демонстрационные зоны сервисов Cloud․ru Evolution:
Мы расскажем и покажем вам флагманскую платформу Cloud․ru Evolution и платформу для создания частного и гибридного облака Cloud․ru Evolution Stack.
 
Afterparty:
Вечеринка с диджеями и турниром по beer pong’у! Отличный способ расслабиться и пообщаться с сообществом. Знакомьтесь, обменивайтесь опытом и заводите полезные контакты. Гарантированы инсайты и атмосфера праздника.
 
Регистрируйся, чтобы не пропустить!

#промо
Запускаем Voice Mode ChatGPT если вы не из США 😆

и устанавливаем официальную апку на андройд.

Недавно интернет заполонили тесты новой фичи OpenAI, которую (наконец-то!) раскатили для всех платных подписчиков аккурат перед презентацией Meta, ведь там тоже показали голосовой режим.

Но потестить новый функционал в OpenAI удалось далеко не всем, потому что большинство русскоговорящих пользователей используют чат в браузере, где Voice Mode не работает, а приложения в плейсторе нет.

#гайд ChatGPT из Play Market и как пользоваться им без VPN.

Шаг 1. Самый муторный.
Меняем страну аккаунта Google на США.

(Можно попытаться пропустить этот шаг и скачать apk с какого-нибудь зеркала, но, скорее всего, это не сработает)

1.1 Открываем payments.google.com > Настройки.

1.2 Создаём новый платёжный профиль в США. Жмём на карандаш рядом с пунктом «Страна», см. скрин.

1.3 Переходим на сайт bestrandoms.com и генерируем американский адрес.
(Желательно в Аляске — если вдруг что-то будете оплачивать с карты US, не будет налога. Аналогично можно сгенерировать адрес для других стран и карт)

1.4 Для надёжности можно удалить старый non-US профиль.

1.5 Заходим в Google Play (Play Market) > Настройки > Общие > Настройки аккаунта и устройства. В разделе «Страна и профили» меняем страну на США.

Плеймаркет обновится не сразу, так что если не получилось с первого раза, подождите ещё суток, и приложение появится. (По крайней мере вышло именно, так когда мы тестировали)


Шаг 2. Кайфовый.
Включаем Private DNS.

2.1 Открываем настройки устройства, вводим в поиске «Private DNS» и вписываем туда адрес сервиса DoT от Comss (подробнее здесь).

2.2 Идём в Настройки > Подключение и общий доступ > Частный DNS сервер и вставляем туда адрес: comss.dns.controld.com.

2.3 Всё! Теперь ChatGPT (а также Bing, Bard и Claude) будет работать без VPN. К тому же, это избавит от большей части рекламы на сайтах и в приложениях, ещё и повысит безопасность сети.

Шаг 3. Финальный.
Устанавливаем приложение ChatGPT из Google Play.

3.1 Установили.

3.2 Вошли.

Готово! Если у вас есть подписка, то Voice Mode уже должен быть доступен. Делитесь своими экспериментами в комментах.

Warning: данные шаги нарушают гугловский EULA.

Источник 4PDA

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM