AI Для Всех
12.8K subscribers
1.17K photos
153 videos
10 files
1.38K links
Канал, в котором мы говорим про искусственный интеллект простыми словами

Главный редактор и по рекламе: @crimeacs

Иногда пишут в канал: @GingerSpacetail, @innovationitsme
Download Telegram
OSS AI на подъеме

Сегодня ходил на митап по разработке ИИ с открытым исходным кодом (или open source software). Митап проходил в довольно модном коворкинге Shack15 и был организован CerebralValley x OLlama.

Daniel представил обновление для Ollama, которая теперь поддерживает Windows (начиная с Windows 10) и GPU NVidia.

Lance из LangChain показал LangGraph — инструмент для построения агентных процессов в виде графов, где каждое действие LLM является узлом графа.

Charlie из Replicate продемонстрировал забавный проект "Прокрастинационный коуч", который использует LLava для мониторинга экрана пользователя и предупреждения о прокрастинации.

Joao из CrewAl и Radamés из Hugging Face представили новые агентные фреймворки и исследования в области генерации изображений в реальном времени, продемонстрировав значительный прогресс в визуализации и интерактивности.

Ty из Continue.dev рассмотрел, какие открытые LLM используют разработчики для написания кода (на их платформе это LlamaCode 7B), а Sourabh из LlamaIndex показал RagCLI — мультимодальный интерфейс для взаимодействия с файлами на локальной системе через чат.

Eric Hartford
(на мой взгляд самый прикольный доклад митапа) показал интересный подход к слиянию моделей ИИ с помощью MergeKit, позволяя объединять различные модели для создания улучшенных версий с расширенными возможностями. Он сравнил 🤗 с чашкой Петри, в которой происходят неконтролируемые мутации моделей (или скрещивание), которое скорее всего приведёт к чумовым результатам (LLM хаска vs LLM мопс).

Так и живем после работы
Заработай на своем баритоне

ElevenLabs представляет программу лицензирования голоса, открывающую возможности для монетизации вашего голоса. Если у вас какой-то особенный голос - то это ваш шанс не только оставить свой след в мире цифровых технологий, но и получить пассивный доход.

Как это работает? Процесс прост: вы предоставляете образцы своего голоса, после чего специалисты ElevenLabs используют передовые технологии для его клонирования. Ваш цифровой голосовой двойник затем размещается в специализированном магазине ElevenLabs, где его могут приобрести или арендовать для различных целей – от создания контента до использования в качестве голоса виртуального ассистента.

Кажется что это возможность заработать на своем голосе. Каждый раз, когда кто-то покупает или берет в аренду ваш голос, вы получаете роялти. Это открывает потенциал для постоянного дохода без дополнительных усилий со стороны владельца голоса.

🎤 Сдать свой голос
Андрей Карпаты ушел из OpenAI

Андрей Карпаты, знаменитый исследователь искусственного интеллекта и один из основателей OpenAI, покинул компанию 12ого февраля 2024 года.

Говорит, что ушел не почему то конкретному, и что вообще ему нравилось тусоваться в OpenAI.

Из его сообщения можно предположить, что он ушел разрабатывать LLM OS (и видимо в ближайшем будущем, не стоит ждать этого направления от OpenAI).

Обещает не забрасывать свои видео-лекции (в комментах написал что уже работает над новой).

Ну что ж, будем посмотреть 👀

Х
Infinite Craft: игра, с LLM в качестве движка

Давным давно, во времена, когда я учился в школе и скучал на уроках, была такая игра - надо было соединять элементы и из них получались новые (кто вспомнит название - пишите).

Так вот, на днях, кто-то сделал реанимировал ее с помощью языковых моделей.

Как играть:
Нажимаем на 2 элемента -> они соединяются в новый (конечно же, что за новый элемент, решает Мистраль на серверах together.ai). Местами получается очень даже забавно.

🦝 Играть
Forwarded from Сиолошная
Как обещал, пост про интересное применение длинного контекста в новой Gemini Pro v1.5

Google доучили свою модельку работать с миллионом токенов (GPT-4 поддерживает 128 тысяч, Claude 2 200 тысяч), причём, мультимодальных — то есть это могут быть и раскадровки видео, и текст, и просто набор изображений. Сюда влезет вся «Война и мир», наконец-то!

Но каждый раз когда мы говорим про длинный контекст встаёт вопрос: а он вообще работает? И какие возможности открывает? Я не буду отвечать на второй вопрос, но постараюсь пересказать пример ответа на первый — ведь это один из самых интересных пунктах в демках Google. И связан он с переводом каламанга. Каламанг — это язык, на котором говорят менее 200 человек (не тысяч, просто человек) в западной части Новой Гвинеи, на востоке индонезийского Папуа. Каламанг почти не представлен в Интернете, и любая модель просто не будет его знать — как и профессиональный лингвист.

Однако недавно был предложен бенчмарк по оценке навыков перевода модели с помощью 573-страничной книги лингвистки Eline Visser. В своей работе «A Grammar of Kalamang» она описывает правила языка, его устройство, часто используемые фразы итд. Это уникальный артефакт, позволяющий другим лингвистам с книжкой в одной руке и табличкой «слово -> перевод» в другой за несколько часов разобраться в языке и начать хоть как-то его переводить. Без контекста (книга+словарь) модель Gemini Pro v1.5 делает переводы, сравнимые по качеству со случайным гаданием.

Идея: давайте в промпт языковой модели положим и всю книгу от корки до корки, и словарик, и затем попросим LLM перевести текст либо с каламанга на английский, либо наоборот.

Тогда качество переводов становится сравнимым с качеством перевода человека, который работал с теми же материалами (в рамках бенчмарка им отводилось до 10 часов на перевод определенных текстов). Метрики вышли даже чуть выше, чем у кожаных, что, как предполагают авторы, модель очень эффективно утилизирует контекст, используя знания из книги на полную для выполнения сложной интеллектуальной задачи.

Так как в лабораториях Google тестируется модель на 10M токенов (20-30 книг и учебников?), то можно предположить, что качество перевода для очень редких и малоизученных языков в ближайшие полгода оооооочень сильно скакнёт.

Если вам интересно, как можно сделать такой длинный контекст, то отсылаю вас к этой работе, вышедшей за пару дней до гугловской, и по сути показыающей те же самые навыки (но применительно к видео и точности поиска в контексте).
Вы уже активно используете плоды работы ИИ (искусственного интеллекта), даже не задумываясь об этом:
навигатор простраивает вам маршрут,
онлайн-кинотеатр рекомендует фильмы в разделе "вам понравится",
чат-боты отвечают на ваши вопросы
- и это лишь верхушка айсберга.

Сделала подборку топовых онлайн-курсов для тех, кто решил разобраться в новом всемирном тренде и понять принципы работы ИИ.

Introduction to Generative AI

Introduction to Large Language Models
Нейронные сети и их применение в научных исследованиях
Introduction to Artificial Intelligence (AI)
AI Foundations for Everyone Specialization
HarvardX: CS50's Introduction to Artificial Intelligence with Python

***
Подбор индивидуальной программы обучения от Полины Кривых

Гайд, как бесплатно проходить курсы на Coursera
OpenAI Forum: платформа для формирования будущего ИИ с учётом вашего мнения

Форум – это инициатива OpenAI, объединяющая экспертов, исследователей и студентов для сотрудничества и (условно) совместной лепки искусственного интеллекта на благо всего человечества. На мой взгляд, круто, что OpenAI решили спросить человечество, в чем это благо.

Участники получат доступ к мероприятиям, к сети экспертов, включая исследователей и технологов OpenAI, а также возможность участия в исследовательских проектах OpenAI (за вознаграждение).

Цель - построить экосистему сотрудничества и создать площадку для обсуждения и формирования вариантов взаимодействия ИИ в различных областях жизни общества. Хочется верить, что самых разных областей - от запуска космических кораблей до юмора и флирта. Поэтому не стесняйтесь дропнуть заявку, ладушки?

Критерии для присоединения:
⁃ возможность уделять по часу времени в квартал на участие в мероприятиях,
⁃ демонстрируемая экспертиза в своей профессиональной области или академической дисциплине,
⁃ интерес на пересечении своего экспертного домена и ИИ. Например, к техническим и/или этическим вопросам.

Заявки рассматриваются на постоянной основе, потому что эта инициатива про максимальную представленность, инклюзивность и внимание к разнообразными точками зрения.

Подать заявку можно по ссылке
Google выпустил опенсорс версию Gemini

Новую модель Гугла, с открытыми весами и коммерческой лицензией, зовут Gemma. LLM доступна в 2х вариантах - 2B (работает на телефоне) и 7B (gpu).

7B модель по качеству обгоняет Мистраль 7B v0.1 и почти догоняет Llama 2 70B (на LLM Leaderboard).

Дать задание Instruct модели можно тут

Обратите внимание, что это (пока что) не чат-бот, а модель которой нужно давать инструкции (например напиши email)

🤗
Блог-пост
🖥 Блог-пост
Please open Telegram to view this post
VIEW IN TELEGRAM
Выпустят ли OpenAI GPT-7B в открытый доступ?
Anonymous Poll
21%
Думаю да
53%
Наверное нет
26%
Посмотреть результаты