Введение в искусственный интеллект

239 viewsedited 19:59

10 советов как достичь SOTA
Идем по графику и разбираем сегодня, что такое соревнование в мире машинлернинга.
Термин SOTA (сОта) активно используется в такой области искусственного интеллекта, как machine learning (машинное обучение). Означает он одно слово “state-of-the-art”, буквально “состояние развития”. Под “art” (искусство) имеется в виду искусство решения проблем при помощи инженерии. Берем живую проблему и решаем ее искусственными методами. Обычно проблемы в живом мире очень сложные, многофакторные, поэтому с кондачка их со стопроцентным успехом не решить. Приходится сравнивать разные “арты”, методы, алгоритмы, чтобы найти тот, который справится лучше всех. Анализ решений приводит обычно к выяснению, что проблема решается вот уже на таком уровне эффективности. Ниже этой эффективности падать смысла нет. Правда, эффективность тоже можно по-разному померить, да и рассказать про негативный результат (мы попробовали такое-то, а оно не работает) тоже бывает полезно, но об этом будут отдельные посты.
Получается, SOTA - это своего рода результат соревнования за самое эффективное решение. Решения можно собрать по разным научным статьям и отчетам, но гораздо удобнее, если они публикуются в одном месте. Существуют платформы для соревнований в машинлернинге. Там можно и задачу опубликовать, и свое решение, часто вместе с кодом. За результаты разрабы получают не только символические медальки, но и денюжку, и возможность опубликовать статью.
Самая известная платформа для соревнований за медальку и денюжку: Kaggle (Кегл). Не так давно в вакансиях стали упоминать, что медальки на Кегле являются положительным бонусом к основным скилам.
Ученые меряются решениями на CodaLab. Там можно посмотреть и executable papers, т.е. статьи с кодом, который можно выполнить и получить тот же результат, который зарепорчен (to report - “опубликовать, заявить”) в статье.
Но тру компьютерные лингвисты соревнуются, конечно, на SemEval (семевАл, почти как “сеновал”). Это ежегодное соревнование по актуальным, трендовым задачам в области NLP. По итогам соревнования есть хороший шанс выпустить статью в материалах Ассоциации компьютерной лингвистики (ACL), крупнейшего объединения комп. лингвистов в мире.
Так как же достичь SOTA? Итак, советы от Жака Фреско. Важно, они относятся к какой-то выбранной вами области ИИ. Можно, наверно, преуспеть во многом, но мой путь в ИИ был довольно узко-задачным. Советы:
1. Тут довольно банально - надо подточить навыки, скилы (МООКи, вот это все).
2. Найдите какую-то научную мысль, загадку, которая вас прям ведет, прям вот хочется ее разгадать. И пытайтесь разгадать. В этот момент ваши скиллы бустятся прям космически.
3. Попробуйте маленькое без конкретной даты окончания соревнование на Кегле, например, MNIST. Повисите там в турнирной таблице. Поймете, что это не страшно, даже если вы где-то внизу висите - всем пофиг.
4. Найдите более серьезное соревнование, в котором хотите участвовать всерьез.
5. Найдите товарища или команду таких же амбициозных товарищей. Желательно, чтобы у них были разные суперспособности и чтобы у них было все в порядке с софт-скилами.
6. Запаситесь валокордином и кока-колой. Научитесь плакать, если вы еще не умеете этого делать.
7. Приготовьтесь морально и подготовьте ваших близких и друзей, что пока вы участвуете в соревновании, у вас не будет личной жизни и есть риск, что вы на кого-нибудь кинетесь.
8. Пишите код и тестите на странице соревнования. Очень много. Вот встали утром, поели и арбайтен.
9. Но не забывайте про здоровье. Иначе вы тупо сгорите. Выиграете что-то или нет - это всегда лотерея. А вот здоровье уже не вернуть.
10. Не забывайте про шаманский бубен. Ну или таро, свечку поставить. Короче, любой magic (мэджик), который вам помогает по жизни.
Good luck! И помните: the odds are never in our favour!
💪
#база #эссеиистика

Kaggle

Kaggle: The World’s AI Proving Ground

Discover what actually works in AI. Join millions of builders, researchers, and labs evaluating agents, models, and frontier technology through crowdsourced benchmarks, competitions, and hackathons.

🔥4

297 viewsedited 11:37