Step-by-step гайд по изучению основ алгоритмов машинного обучения с ссылками на посты нашего канала:
1. Обычно все подобные списки начинаются с регрессии, но мы советуем начать с KNN. Простой и интересный алгоритм, который поймет любой.
2. А вот теперь регрессия:
– Линейная регрессия
– Пуассоновская регрессия
– Гребневая и лассо регрессия
– Elastic Net регрессия
3. Линейная классификация:
– Логистическая регрессия
– LDA
– SGD классификация
4. Метод опорных векторов
5. Деревья и ансамбли:
– Cart, ID3 и С4.5
– Случайный лес
6. Бустинг:
– Градиентный бустинг
– Adaboost
7. Кластеризация:
– K-means
– DBSCAN
– Иерархическая кластеризация
– BIRCH
8. Finally: нейросети
- Перцептрон
- CNN
- RNN
- LSTM
- GAN
- Трансформеры
Есть среди нас новички? Отзовитесь в комментариях😻
1. Обычно все подобные списки начинаются с регрессии, но мы советуем начать с KNN. Простой и интересный алгоритм, который поймет любой.
2. А вот теперь регрессия:
– Линейная регрессия
– Пуассоновская регрессия
– Гребневая и лассо регрессия
– Elastic Net регрессия
3. Линейная классификация:
– Логистическая регрессия
– LDA
– SGD классификация
4. Метод опорных векторов
5. Деревья и ансамбли:
– Cart, ID3 и С4.5
– Случайный лес
6. Бустинг:
– Градиентный бустинг
– Adaboost
7. Кластеризация:
– K-means
– DBSCAN
– Иерархическая кластеризация
– BIRCH
8. Finally: нейросети
- Перцептрон
- CNN
- RNN
- LSTM
- GAN
- Трансформеры
Есть среди нас новички? Отзовитесь в комментариях
Please open Telegram to view this post
VIEW IN TELEGRAM
👍90🔥21🫡7❤5🤯3🦄1
Forwarded from XOR
Там небезызвестный в ИИ кругах Ян Лекун выдал базу. Да-да, это тот самый перец, фото которого красовалось на башне Бурдж-Халифа со ставкой от властей ОАЭ на привлечение специалиста к себе.
Так вот база:
Язык имеет низкую пропускную способность: менее 12 байт/сек. Человек может прочитать 270 слов/мин, что составляет 12 байт/с (2 байта за токен). Современные модели обычно тренируются на 2х10^13 байтах, что займет для нас около 100.000 лет чтения по 12 часов в сутки.
У зрения же пропускная способность гораздо выше: около 20 МБ/с. Каждый из двух оптических нервов имеет 1 миллион нервных волокон, каждый принимает около 10 байт/с. 4-летний ребенок не спит в общей сложности 16.000 часов, что означает 10^15 байт.
Это говорит нам о трех вещах:
🟢 Текст очень излишен, а визуальные сигналы в оптических нервах еще более избыточны (несмотря на 100-кратно сжатые версии выходов в сетчатке). Но избыточность данных — это *точно* то, что нам нужно для Self-Supervised Learning (SSL - самоконтролируемого обучения), чтобы захватить структуры данных. То есть чем больше избыточность, тем лучше для SSL.
🟢 Большая часть знаний человека (и почти все знания животных) исходит из нашего сенсорного опыта физического мира. Язык - это вишенка на торте. Нам нужен торт для поддержки глазури.
🟢 ИИ никогда не достигнет человеческого уровня без обучения на сенсорных входах с высокой пропускной способностью, таких как зрение.
Да, некоторые люди могут быть умнее остальные, даже будучи одновременно слепым и глухим. Но не без прикосновений, они тоже имеют довольно высокую пропускную способность.
@xor_journal
Так вот база:
Язык имеет низкую пропускную способность: менее 12 байт/сек. Человек может прочитать 270 слов/мин, что составляет 12 байт/с (2 байта за токен). Современные модели обычно тренируются на 2х10^13 байтах, что займет для нас около 100.000 лет чтения по 12 часов в сутки.
У зрения же пропускная способность гораздо выше: около 20 МБ/с. Каждый из двух оптических нервов имеет 1 миллион нервных волокон, каждый принимает около 10 байт/с. 4-летний ребенок не спит в общей сложности 16.000 часов, что означает 10^15 байт.
Другими словами:
- Пропускная способность данных визуального восприятия примерно в 16 млн раз превышает пропускную способность данных письменного (или разговорного) языка.
- Всего за 4 года ребенок увидел в 50 раз больше данных, чем самые крупные LLM, обучаемые по всему тексту, доступному в интернете.
Это говорит нам о трех вещах:
Да, некоторые люди могут быть умнее остальные, даже будучи одновременно слепым и глухим. Но не без прикосновений, они тоже имеют довольно высокую пропускную способность.
@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍78🔥13🤨7❤4🥰4🤔1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Коктейль выходного дня заказывали?
😁93🔥20👍11😨3👀1
Краткая история AI:
Каждый раз, открывая новую эффективную акхитектуру или подход, ученые верили, что в ближайшее время это приведет их к ИИ уровня человека. Цитаты из карточки – забавное тому доказательство. Тем не менее, каждый раз все оказывается немного сложнее, чем кажется.
Как по вашему: через сколько лет на самом деле человечество достигнет AGI?
For x in [перцептрон, глубокое обучение, RL, LSTM, LLM] :
print("Через пару лет у нас будет AGI.”)
Каждый раз, открывая новую эффективную акхитектуру или подход, ученые верили, что в ближайшее время это приведет их к ИИ уровня человека. Цитаты из карточки – забавное тому доказательство. Тем не менее, каждый раз все оказывается немного сложнее, чем кажется.
Как по вашему: через сколько лет на самом деле человечество достигнет AGI?
❤32🔥10👍7😁2
Через сколько лет человечество достигнет AGI?
Anonymous Poll
5%
В ближайший год
20%
3-5 лет
37%
10-20 лет
20%
50-100 лет
18%
AGI недостижим
🤯16😁9👏4🕊2😎1
Не время чувствовать себя обделенным. Знай, ты тоже достоин оскара, и не одного, а целых шести.
Не забудь отправить каждому из коллег по статуэтке или устроить в рабочем чатике собственное награждение.
Не забудь отправить каждому из коллег по статуэтке или устроить в рабочем чатике собственное награждение.
🏆70😁23🍾5👍3❤1❤🔥1
2024 – год робототехники. Вслед за OpenAI и Google в разработку роботов ударились Hugging Face.
Они анонсировали новый опенсорс проект под руководством Реми Кадена – бывшего ресерчера Tesla. В своем посте об этом проекте Каден также сообщил, что он в поисках новых членов команды 👀
Они анонсировали новый опенсорс проект под руководством Реми Кадена – бывшего ресерчера Tesla. В своем посте об этом проекте Каден также сообщил, что он в поисках новых членов команды 👀
👍37❤4🔥4❤🔥1
Сегодня у нас прямо день опенсурса: OpenAI катнули код для Transformer Debugger.
Это тулза для исследования поведения Small LM. Она поможет интерпретировать модель и, например, понять, почему в генерации появился тот или иной токен, или почему какая-то голова атеншена сработала так, как сработала.
Вот самый удачный пример, который поможет понять, как это работает. В репозитории разработчики также поделились подробными инструкциями по пользованию и другими онбординговыми материалами.
Это тулза для исследования поведения Small LM. Она поможет интерпретировать модель и, например, понять, почему в генерации появился тот или иной токен, или почему какая-то голова атеншена сработала так, как сработала.
Вот самый удачный пример, который поможет понять, как это работает. В репозитории разработчики также поделились подробными инструкциями по пользованию и другими онбординговыми материалами.
😁14🔥9❤8❤🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Любители Colab, для вас хорошие новости. В Google Sheets появилось обновление, которое позволяет моментально переносить данные из таблиц в Colaboratory. Один щелчок – и вы получаете код для импорта. Попробовать тут.
🔥89👍28❤10
Media is too big
VIEW IN TELEGRAM
Сенсация! Cognition Labs анонсировали "программиста из коробки" - Devin AI.
На SWE Bench модель порешала 13.86% всех задач (основные модели сейчас могут порешать меньше 5%). Уже нашли пример его MR.
Кроме того, Девин может познавать неизвестные ему технологии. Например, в процессе тестов нейросеть, прочитав блог компании, научилась пользоваться Stable Diffusion и ControlNet. А еще умеет деплоить end-to-end.
На всех еще не раскатили, но можно попробовать предложить задачу авторам в твиттере, и те (может быть) дадут Девину ее порешать.
P. S. Сегодня уже много кто высказался о новинке. Андрей Карпаты, например, старается поддержать паранойющих о работе программистов. Говорит, автоматизация разработки будет похожа на беспилотные автомобили – контроль человека все-равно останется.
На SWE Bench модель порешала 13.86% всех задач (основные модели сейчас могут порешать меньше 5%). Уже нашли пример его MR.
Кроме того, Девин может познавать неизвестные ему технологии. Например, в процессе тестов нейросеть, прочитав блог компании, научилась пользоваться Stable Diffusion и ControlNet. А еще умеет деплоить end-to-end.
На всех еще не раскатили, но можно попробовать предложить задачу авторам в твиттере, и те (может быть) дадут Девину ее порешать.
P. S. Сегодня уже много кто высказался о новинке. Андрей Карпаты, например, старается поддержать паранойющих о работе программистов. Говорит, автоматизация разработки будет похожа на беспилотные автомобили – контроль человека все-равно останется.
👍25🫡11❤5🔥3😁1🤯1🍌1
Data Secrets
Skynet, глава первая: OpenAI теперь будут разрабатывать роботов Они подписали контракт о сотрудничестве с компанией Figure, которая занимается AI-робототехникой. Вместе с OpenAI стартап будет работать над моделями для автономных гуманоидов. Кроме того,…
Media is too big
VIEW IN TELEGRAM
Помните мы рассказывали про начало сотрудничества OpenAI с роботех-стартапом Figure? Так вот, результаты не заставили себя долго ждать.
Благодаря OpenAI, Figure 01 теперь обладает языковым и визуальным интеллектом и может полноценно общаться с людьми. Скорость и ловкость его движений, в свою очередь, обеспечивают модели со стороны Figure (кстати, тоже трансформер, только visuomotor).
Обратите внимание, что видео даже не ускорено. Особенно здорово выглядит то, что робот умеет планировать и рефлексировать.
Благодаря OpenAI, Figure 01 теперь обладает языковым и визуальным интеллектом и может полноценно общаться с людьми. Скорость и ловкость его движений, в свою очередь, обеспечивают модели со стороны Figure (кстати, тоже трансформер, только visuomotor).
Обратите внимание, что видео даже не ускорено. Особенно здорово выглядит то, что робот умеет планировать и рефлексировать.
❤24🔥15👍5🤯4
Эпилог:
Первый в мире масштабный закон о регулировании ИИ в очередной раз приняли в ЕС. Он вступит в силу в мае этого года. Закон запрещает использовать ИИ правоохранительным органам и предполагает ряд «защитных мер в области ИИ».
На самом деле, один из самых больших рисков, с которым мы сталкиваемся – это отношение к ИИ как к сопернику, а не как к партнеру.
Первый в мире масштабный закон о регулировании ИИ в очередной раз приняли в ЕС. Он вступит в силу в мае этого года. Закон запрещает использовать ИИ правоохранительным органам и предполагает ряд «защитных мер в области ИИ».
😁30👍19🙈6❤🔥1👨💻1