AI Для Всех
12.8K subscribers
1.16K photos
150 videos
10 files
1.37K links
Канал, в котором мы говорим про искусственный интеллект простыми словами

Главный редактор и по рекламе: @crimeacs

Иногда пишут в канал: @GingerSpacetail, @innovationitsme
Download Telegram
LLEMMA - языковая модель для математики

Недавно исследователи из Princeton и компании EleutherAI представили LLEMMA - большую языковую модель, специализированную для математических задач.

Модель была обучена на огромном массиве научных текстов и кода, связанных с математикой - всего 55 миллиардов слов!

В результате LLEMMA научилась решать математические задачи, доказывать теоремы и даже использовать специальные компьютерные программы для математических вычислений.

По сравнению с общими языковыми моделями, LLEMMA показала гораздо лучшие результаты на тестах по математическому выводу. Например, в формате 4-shot она решила 43% задач из набора MATH.

Вся модель, данные и код для её обучения выложены в открытый доступ. Это позволит ученым улучшать модели для математики и смежных областей.

В будущем подобные модели смогут автоматизировать рутинные задачи, помогать с доказательствами теорем и делать открытия!

👍 Статья
🎉 Код
Please open Telegram to view this post
VIEW IN TELEGRAM
Большая языковая модель для наук о Земле K2

Ученые создали первую в мире большую языковую модель, специализированную в области геологии, географии и других наук о Земле. Её назвали K2 - в честь второй по высоте горы на планете.

Модель K2 научили отвечать на вопросы и решать задачки по географии и геологии. Для этого ей "дали прочитать" 5.5 миллиарда слов из научных статей и Википедии про науки о Земле.

Кроме того, K2 может сама искать нужную информацию в поисковиках и базах данных. Таким образом она становится помощником для геологов и географов в их исследованиях.

По сравнению с обычными языковыми моделями, K2 лучше отвечала на вопросы из экзаменов для поступающих в аспирантуру по геологии и географии. Это показывает, что она действительно хорошо "разбирается" в геонауках.

Разработчики K2 выложили в открытый доступ все данные и код, которые использовали для её обучения. Это позволит улучшать такие "модели-геологи" и создавать похожие модели для других областей науки.

🔖 Статья
🐙 Код
🗻 Поговорить с K2
Please open Telegram to view this post
VIEW IN TELEGRAM
Друзья, нужен совет сообщества 🤝

Последнее время я столкнулся с проблемой - несмотря на сильное резюме, меня редко приглашают на собеседования по ИИ и Data Science.

Не могу понять, в чём причина. Возможно, в моём резюме есть какие-то ошибки или недочёты, которые снижают интерес HR.

Хотелось бы услышать ваше мнение - какие проблемы или упущения вы видите в моём резюме? Что в нём нужно улучшить, чтобы привлекать больше внимания работодателей?

Я открыт к любым предложениям и советам от вас! Давайте вместе разберёмся, как сделать моё резюме по-настоящему конкурентным 💪

В целом, если кому-то нужны мои навыки в области ИИ и анализа данных, пишите мне в личку @crimeacs. Я готов рассмотреть интересные предложения о работе или сотрудничестве!

Жду ваши идеи в комментариях. Буду благодарен за помощь и советы! Рефералы тоже очень приветствуются.
Слили количество параметров в ChatGPT

Исследователи из Microsoft опубликовали количество параметров в gpt-3.5-turbo. Их оказалось 20B. Как думаете, это типа дистиллят? А сколько параметров в GPT-4?

Ссылка
RedPajama - новый датасет на 30 триллионов токенов!

Компания Together Computer представила обновлённую версию открытого набора текстовых данных RedPajama. Теперь он содержит 30 триллионов токенов - в 30 раз больше, чем было в первой версии!

Это колоссальный объём информации, отфильтрованной из сотен миллиардов веб-страниц. Такие данные послужат фундаментом для обучения по-настоящему масштабных открытых языковых моделей.

Преимущества нового датасета не заканчиваются на внушительных размерах. В набор добавлены десятки готовых аннотаций качества текста. Они позволят исследователям гибко фильтровать и взвешивать данные под конкретные задачи.

Все это существенно упростит и ускорит разработку открытых моделей ИИ. Каждый сможет с лёгкостью создать свою собственную уникальную выборку на основе RedPajama. А значит, ждём новую волну экспериментов и прорывных результатов!

В общем, RedPajama 2 - это мощный импульс для всего сообщества ИИ. Крупные данные, гибкость, доступность - так рождается прогресс!

🦙 Блог-пост
🦙 Датасет
🐙 Git
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Как услышать болезнь сердца?

Исследователи из Google нашли способ распознавать болезнь сердца по звуку. Для этого предлагается использовать обычные наушники с активным подавлением шума.

Этот метод называется аудиоплетизмография. Он позволяет измерять частоту сердечных сокращений и вариабельность сердечного ритма без добавления дополнительных датчиков или снижения срока службы батареи.

Устройство посылает ультразвуковую волну низкой интенсивности, регистрирует отраженную волну через встроенные микрофоны и выявляет важную информацию о сердечном ритме, например, дикротические вырезки. Диагностический сигнал совершенно не слышен и на него не влияет воспроизведение музыки.

Два раунда экспериментов с 153 участниками показали, что этот универсальный метод обеспечивает неизменно точные измерения частоты сердечных сокращений и вариабельности сердечного ритма.

Аудиоплетизмография превращает любые наушники с активным шумоподавлением в карманного ушного кардиолога с помощью простого обновления ПО.

💊 Блог
Открытый вебинар для разработчиков уровня Middle+, Senior и Architect

Ждем вас на открытом вебинаре [Технический лидер] 1 ноября в 19:00 по МСК.

Что вы узнаете:
- как растёт инженер и какие роли доступны после уровня Senior
- какие hard- и soft-скилы нужны TechLead, чтобы двигаться по карьерной лестнице
- какие задачи выполняют TeamLead и TechLead
- как получать за свои навыки 2х в компаниях CША и Европы
- поймёте текущую ситуацию на рынке IT и прогнозы развития на 2024 год

После вебинара вас ждет бонус — рекомендации по поиску работы Senior-инженеру и выше

👉 Регистрация на вебинар

#реклама
AI Для Всех
Друзья, нужен совет сообщества 🤝 Последнее время я столкнулся с проблемой - несмотря на сильное резюме, меня редко приглашают на собеседования по ИИ и Data Science. Не могу понять, в чём причина. Возможно, в моём резюме есть какие-то ошибки или недочёты…
Как улучшить CV

На днях провел небольшой эксперимент - выложил свое CV в наш канал @nn_for_science и попросил помочь его улучшить.

Вот ключевые советы и рекомендации по улучшению резюме, которые были даны в комментариях к посту:

- Четко определить желаемую должность и направление - научная работа или индустрия.

- Адаптировать резюме под конкретную целевую позицию.

- Больше акцентировать внимание на практических результатах и бизнес-ориентированности опыта.

- Добавить цифры, факты, конкретные достижения.

- Использовать более простой и понятный широкой аудитории язык, избегать сложных терминов.

- Выделить в отдельный раздел ключевые технические навыки и "мягкие навыки".

- Добавить мотивационное письмо, чтобы полнее раскрыть сильные стороны.

- Сделать резюме более визуально привлекательным, используя современные шаблоны.

- Под каждую конкретную вакансию подготавливать персонализированное резюме и сопроводительное письмо.

- Расширять профессиональную сеть на мероприятиях и платформах типа LinkedIn.

- Попробовать пройти стажировку в интересной компании.

В целом, основная рекомендация - сделать резюме максимально ориентированным на практическую ценность для бизнеса и удобным для восприятия HR.
GPT-4 почти прошел тест Тюринга

Новое исследование ставит волнующий вопрос: может ли ИИ GPT-4 пройти знаменитый тест Тьюринга на разумность? Ученые решили проверить это в публичном онлайн-эксперименте.

Люди и машина сражались в увлекательной битве. Суть теста - убедить собеседника в чате, что проходящий тест - человек.

Результаты оказались любопытны: GPT-4 обманул людей в 41% случаев. Впечатляет, но недостаточно, чтобы объявить победу ИИ.

Есть подозрение, что эту цифру можно увеличить с помощью дополнительного файн-тюна. А вы что думаете?

🔖 Статья
PhaseHunter - SOTA детектор землетрясений

Я очень рад представить вам PhaseHunter - SOTA нейронную сеть, предназначенную для обнаружения землетрясений.

В преддверии выхода моей статьи, хочу собрать фидбек. Даже если сейсмология - это не ваш конек, я буду рад, если вы примите участие в тестировании проекта.

PhaseHunter использует сверточную нейронную сеть для обнаружения сейсмических фаз P и S в непрерывных записях путем извлечения иерархических признаков и регрессии. Главная особенность модели - то, что она знает когда она не права.

PhaseHunter использует операцию Masksembles для оценки неопределенности предсказаний фаз P и S. Masksembles применяет разные маски к входным данным, чтобы создать множество слегка измененных представлений. Затем модель делает предсказания для каждого представления и анализирует их распределение, чтобы оценить уверенность в обнаружении фазы. Чем шире распределение, тем выше неопределенность и соответсвенно меньше уверенности в предсказании.

Как вы можете помочь?
1. Установка: потестируйте процесс установки (все ли гладко?)
2. Функциональность: Работает ли PhaseHunter так, как ожидалось? Есть ли какие-либо заминки?
3. Документация: Все ли понятно? Что-нибудь упущено или непонятно?
4. Производительность: Насколько быстро/медленно работает? Выскакивают ли какие-либо ошибки?
5. Общие замечания: От дизайна до структуры кода - все мнения приветствуются.

Помимо этого, если вы не умеете в код, но умеете в дизайн - очень нужны поясняющие картинки/видео/анимации, что бы проект стал более доступным для широкой аудитории. Советы от специалистов по UX тоже очень приветствуются!

🔗 PhaseHunter (git)
Вот что думает Сэм Альтман, который и заварил всю эту кашу.

Недавно был принят исполнительный приказ (EO) Президентом США, касающийся искусственного интеллекта. Этот документ регулирует подход правительства США к разработке, регулированию и внедрению технологий ИИ.

В контексте нашей научной области, такое решение может оказать влияние на деятельность малых исследовательских групп и стартапов. @Sama подчеркнул важность того, чтобы, реализуя этот приказ, не замедлять инновационную деятельность. Особое внимание стоит уделить тому, чтобы малые команды и исследовательские группы могли продолжать свою работу без лишних препятствий.

Ссылка
Илон Маск представил твиттер чат бота ИИ Grok

Прямо перед закрытием биржи на выходные Илон Маск анонсировал запуск Grok - чат бота, который живет в Твиттере.

Слово "grok" в переводе с английского означает "понимать интуитивно, сопереживая".

Таким образом, название Grok отражает одну из особенностей системы - умение понимать людей и сопереживать им.

Grok умеет обрабатывать естественный язык и вести диалоги. В твиттере Маск продемонстрировал возможности системы в шуточном диалоге.

Особенность Grok - способность реагировать на шутки и глупые вопросы с юмором, но этично.

По словам Маска, Grok имеет прямой доступ к актуальной информации в твиттере (то есть по сути real-time информацию со всей планеты). Это важное преимущество перед другими чат-ботами.

Выход Grok - значимое событие на рынке ИИ. Появление публичной системы от Илона Маска может дать новый импульс развитию больших языковых моделей.

Твит
Poe - монетизация для создателей ботов

Вчера я ходил на хакатон в AGI House и вот что рассказал Адам Д’Анджело, CEO Quora, о новой платформе чат-ботов Poe

Poe создаёт новую экосистему и экономику вокруг чат-ботов на базе ИИ. Это нечто вроде магазина приложений, но для ботов.

Poe предоставляет разработчикам распространение ботов, монетизацию и даже покрывает расходы на модели ИИ типа Claude или GPT.

Боты в Poe можно монетизировать, устанавливая плату за сообщение. При этом Poe делится доходами с создателями ботов. Цель - сделать разработку ботов полноценным бизнесом.

Особенности Poe:

- Мультиплатформенность - веб, мобильные приложения
- Совместимость с разными моделями ИИ
- Встроенные интеграции пользователей

Скоро в Poe появится поддержка изображений, видео, звука и другие полезные фичи.

Благодаря Poe теперь создать своего чат-бота на ИИ и зарабатывать на нем сможет каждый разработчик или стартап.

Платформа
AI Для Всех
Poe - монетизация для создателей ботов Вчера я ходил на хакатон в AGI House и вот что рассказал Адам Д’Анджело, CEO Quora, о новой платформе чат-ботов Poe Poe создаёт новую экосистему и экономику вокруг чат-ботов на базе ИИ. Это нечто вроде магазина приложений…
Победа на Poe хакатоне в AGI house

На фото мы с Лешей (очень крутой, срочно берите на работу) и Адамом Д’Анжело (CEO Quora) улыбаемся, потому что Адам только что объявил нас победителями хакатона 🥇

Задача стояла такая: разработать бот для платформы Poe. When gold rush, sell shovels подумали мы и сделали бота, который позволяет создавать других ботов за секунды.

Попробуйте сами: poe.com/PoeFactory

P.S.: лучше всего работает на английском
Forwarded from Сиолошная
Новая модель:
— контекст длиннее. 128K токенов (365 страниц обычной книги)
— модель более аккуратна при работе с длинным текстом, не теряет то, что было в серединке
— фича для разрабов: можно заставить модель писать ответы в JSON-формате
— можно вызывать несколько функций за раз
— можно указать seed генерации, чтобы получать воспроизводимость
— скоро добавят logprobs в API
— Retrieval прямо из коробки, можно загружать документы на платформу и они будут подтягиватсья (F стартапам chatWithPDF)
— Теперь модель знает события не до сентября 2021го, а апреля 2023го
— Эта новая модель принимает картинки на вход через API

— DALLE-3 + text-to-speech (6 голосов) сегодня появятся в API
— Для GPT-4 появится файнтюнинг сегодня (но на узкую выборку пользователей)
— Custom Models: программа плотной работыт инженеров OpenAI с вашей компанией, чтобы помочь адаптировать тренировку под ваши проблемы

ЦЕНА НА GPT-4-TURBO (Sam говорит, что эта модель ещё и умнее GPT-4) уменьшена в 3 раза для промпта и в 2 раза для генерации!

Обещают скоро ещё больше ускорить GPT-4 Turbo
Новый AppStore, рынка хватит
на всех!


OpenAI представляет новинку в мире искусственного интеллекта — GPT Store, AppStore для индивидуально созданных AI. Это пространство, где каждый может разработать и поделиться своим персональным ChatGPT, адаптированным под конкретные задачи и потребности. Теперь учителя, разработчики, творческие личности — любой из нас — могут легко создавать и монетизировать свои AI-продукты.

Интеграция с внешними API и возможность задействовать AI в реальных задачах открывает двери для бесконечных инноваций. Мы стоим у порога новой эры, где возможности AI станут еще более доступными и понятными для широкой аудитории.

В субботу мы с Лешей победили на Poe’s Hackathon в AGI House. Платформа Пое - это тоже аппстор, и апсторов будет много! Это совершенно новый уровень экономики!

Теперь мы работаем над агентом для эпстора OpenAI, и изначально закладываем его кросс-апсторность. Мы ищем инвесторов готовых вкладываться в будущее технологий. Для диалога и возможного сотрудничества свяжитесь со мной @crimeacs.
🔥Международное AI соревнование — AI Journey Contest 2023 в самом разгаре!

Продемонстрируй свои навыки, ведь на кону ценный опыт, признание от экспертов и впечатляющий призовой фонд в размере более 11 миллионов рублей!

Задачи конкурса в этом году – настоящий вызов: от создания мультимодальных диалоговых систем до распознавания русского жестового языка на основе видео. Предстоит не только показать свои технические навыки, но и проявить креативность.

Успей отправить своё решение до 10 ноября, участвовать может каждый старше 18 лет.
Присоединяйся к AI Journey Contest 2023 и ворвись в лидерборды, где кто-то уже замер в ожидании победы!

#реклама
На пути к AGI. Необходимые и достаточные критерии достижения цели

Кажется, на планерке в Google, разобрали существующие определения AGI и решили, что ни одно из них не является практичным. Практичное позволило бы сравнивать модели, оценивать риски и управлять ими, определять цели исследований, критерии регулирования, и вообще понимать, на каком этапе пути к AGI мы находимся.

Авторы статьи предложил 6 критериев, которые помогли бы четко определенить AGI:

1. Возможности, а не процессы (Capabilities, not Processes)
Определение "думать или учиться как человек" интересный философский вопрос, но способности не определяет. И возможности легче измерять, чем процессы.

2. Универсальность И качество выполненных действий (Generality and Performance)
Например, текущие LLM могут классно рассказать, что на картинке или видео. А вот в математику и код ненадежно.

3. Способность решать когнитивные и метакогнитивные задачи
Готовить по рецепту на незнакомой кухне умно (Marcus, 2022a), но требует тела. Оно бывает очень полезно, чтобы составить картину мира, но не должно быть необходимым условием AGI.

4. Потенциал, а не применение (Potential, not Deployment)
Факта, что система способна выполнять задачи вместо человека, должно быть достаточно. Не стоит определять AGI по уровню внедрения в экономику (панч в сторону OpenAI)

5. Экологичность (в широком смысле)
Если измерять экономический эффект, как в "современном тесте Тьюринга», в котором ИИ дают капитал в размере $100к долларов с задачей превратить его в миллион в течение нескольких месяцев. ИИ же может вести себя неэтично и даже разрушительно.

6. Путь к AGI - не одна конечная точка
Имеет смысл ввести разные "уровни AGI" и определить четким набором показателей, выявленных рисков и способом взаимодействия человека и машины.

Мне понравились названия уровней, но даже не буду пытаться их перевести:
Emerging
Competent
Expert
Virtuouso
Superhuman

Устроим безумие. Кидайте свои варианты в комменты. Не могу решить, Virtuoso будет Маэстро или Шоколатье...

📖 Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
GPT-конструкторы: как мы шаг за шагом приближаемся к AGI

На новом маркетплейсе OpenAI пользователи смогут создавать простых агентов, каждый из которых умеет что-то одно, но делает это хорошо. Эти агенты – это специализированные версии GPT, настроенные под определённые задачи.

Я думаю что уже в ближайшее время пользователи смогут брать этих “специалистов” и объединять в одного “суперагента”, который уже способен справляться с целым спектром задач, как универсал. Немного похоже на компании и корпорации, где у каждого своя роль, но вместе они могут делать гораздо больше.

Представьте, что это как собирать звездолет из Лего: из множества маленьких блоков – простых агентов – мы собираем большую и сложную конструкцию.

В конечном счете, такое сотрудничество и обмен навыками между агентами могут привести к появлению искусственного общего интеллекта, AGI.