Эта последняя я обещаю, но тут авторы еще размеры матриц указывают и все еще понятней
https://lionbridge.ai/articles/what-are-transformer-models-in-machine-learning/
https://lionbridge.ai/articles/what-are-transformer-models-in-machine-learning/
Telusinternational
AI Data Solutions | TELUS International
High-quality AI training data at scale, with human-intelligence. Our platform handles text, images, audio, video and geo data types across 500+ languages.
Forwarded from настенька и графики
Подборка интересных сетевых данных для тренировки сразу с возможными задачами, которые к ним можно применить💫
https://github.com/benedekrozemberczki/datasets
https://github.com/benedekrozemberczki/datasets
GitHub
GitHub - benedekrozemberczki/datasets: A repository of pretty cool datasets that I collected for network science and machine learning…
A repository of pretty cool datasets that I collected for network science and machine learning research. - benedekrozemberczki/datasets
Немного праздничного контента:
В средневековых рукописях знак сердца (♥) иногда использовали как современный эмодзи — вставляли вместо слов «сердце» или «любовь». Хотя часто возникают теории о том, что форма символа произошла от чего-то еще, например формы ягодиц, на самом деле схожесть значка с реальным сердцем достаточно высока. Многие кардиологи полагают, что символ родился в наблюдениях за сердцами птиц или рептилий, которые гораздо больше напоминают ♥, т.к. в средневековой Европе аутопсия мертвецов была запрещена. Гален и Аристотель, которым средневековые медики верили больше, чем своим глазам, сообщали, что человеческое сердце состоит из трех камер и углубления в центре, что в целом соотносится с символом сердца.
А в 1415 году появилась первая валентинка: французский граф Карл I Орлеанский написал жене любовное послание из заключения в лондонском Тауэре в день памяти святого.
https://knife.media/heart/
В средневековых рукописях знак сердца (♥) иногда использовали как современный эмодзи — вставляли вместо слов «сердце» или «любовь». Хотя часто возникают теории о том, что форма символа произошла от чего-то еще, например формы ягодиц, на самом деле схожесть значка с реальным сердцем достаточно высока. Многие кардиологи полагают, что символ родился в наблюдениях за сердцами птиц или рептилий, которые гораздо больше напоминают ♥, т.к. в средневековой Европе аутопсия мертвецов была запрещена. Гален и Аристотель, которым средневековые медики верили больше, чем своим глазам, сообщали, что человеческое сердце состоит из трех камер и углубления в центре, что в целом соотносится с символом сердца.
А в 1415 году появилась первая валентинка: французский граф Карл I Орлеанский написал жене любовное послание из заключения в лондонском Тауэре в день памяти святого.
https://knife.media/heart/
Из классики еще хочу запостить 36 вопросов, чтобы влюбиться, которые сформулировали очень серьезные люди-ученые, и не абы как, а в ходе экспериментов (и даже есть очень серьезная статья на сейджпаб с пруфами). NY times еще постил фидбек от читателей на эти 36 вопросов – в основном там все восторженно, и у всех повышается closeness. Так что ищите себе подопытных, дорогие подписчики, если еще не нашли...
NY Times
The 36 Questions That Lead to Love (Published 2015)
A series of personal questions used by the psychologist Arthur Aron to explore the idea of fostering closeness through mutual vulnerability.
👍1
Контент для тех, кто еще не нашел подопытных:
Статья с прикольной бигдатой по Тиндеру и OkCupid. Много неочевидных инсайтов типа того, что фото в полный рост повышают ваши шансы кого-то встретить на 200%, а еще во время снегопадов шансы метча растут на 230%!!!! А в День Святого Валентина еще на 60%!! Пользуйтесь случаем так сказать!!
Статья с прикольной бигдатой по Тиндеру и OkCupid. Много неочевидных инсайтов типа того, что фото в полный рост повышают ваши шансы кого-то встретить на 200%, а еще во время снегопадов шансы метча растут на 230%!!!! А в День Святого Валентина еще на 60%!! Пользуйтесь случаем так сказать!!
XX2 век
Big Dating. Возможен ли научно обоснованный онлайн-пикап?
Примечание для ленивых: если вы не любите читать, но любите рассматривать занятные картинки, графики и схемы, можете сразу пролистать к инфографике. Если анализ данных в наши дни делает настоящую революцию в целом ряде областей знания — от микробиологии до…
Еще две статьи закину завтра, иначе опоздаю на концерт, всем классно провести вечер, мои хорошие!!
Так вот, еще материалы про то, как люди пытались либо хакнуть алгоритмы дейтинговых приложений, либо сами моделировали CRM-подобные алгоритмы для своих романтических целей:
Первый кейс происходил на OkCupid (запущен, кстати, выпускниками Гарварда). Специфика сайта в том, что вы рандомно выбираете пул вопросов, на которые вы отвечаете, и оцениваете, насколько отношение к какому-то вопросу вам приницпиально в другом человеке (от веры в бога до любви к ужастикам). Проблема в том, что если вы выбрали непопулярные вопросы, ваша совместимость с другими в любом случае будет низкой.
В итоге чел создал алгоритм, чтобы семплировать только те вопросы, которые были важны женщинам, которые ему нравились. Для этого была проскреплена дата с профилей + несколько ботов рандомно отвечали на вопросы, чтобы посмотреть, что на этот же вопрос отвечали женщины. OkCupid этих ботов быстро заблочил, поэтому боты должны были become human. Для этого чел с согласия друга, который тоже сидел на сайте, установил контроль над его компом, боты копировали его поведение с какой-то случайной погрешностью.
Потом данные 20 000 профилей удалось уложить в 7 кластеров, из которых 2 этому челу понравилось. Он создал два акканута – один тюнился под один кластер, второй – под другой. На вопросы он отвечал честно, но алгоритм (адаптивный бустинг) должен был подсказывать ему, насколько "важным" отметить тот или иной вопрос, чтобы понравиться тому или иному кластеру женщин.
По результатам: десятки профилей с совместимостью > 90%, 88 (!) свиданий и long lasting relationship спустя несколько месяцев. И это в районе Сан-Франциско, где вообще мало женщин, и при условии того, что чел получал пхд по математике, а не был программистом с зп 1000$/секунда.
Конечно, к таким ресерчам всегда хочется приделать контрольную группу и посмотреть, что бы было, если бы человек с похожими параметрами не занимался никаким реверс инжинирингом, но все равно интересное чтиво, и статистика по кластерам тоже ничего
Первый кейс происходил на OkCupid (запущен, кстати, выпускниками Гарварда). Специфика сайта в том, что вы рандомно выбираете пул вопросов, на которые вы отвечаете, и оцениваете, насколько отношение к какому-то вопросу вам приницпиально в другом человеке (от веры в бога до любви к ужастикам). Проблема в том, что если вы выбрали непопулярные вопросы, ваша совместимость с другими в любом случае будет низкой.
В итоге чел создал алгоритм, чтобы семплировать только те вопросы, которые были важны женщинам, которые ему нравились. Для этого была проскреплена дата с профилей + несколько ботов рандомно отвечали на вопросы, чтобы посмотреть, что на этот же вопрос отвечали женщины. OkCupid этих ботов быстро заблочил, поэтому боты должны были become human. Для этого чел с согласия друга, который тоже сидел на сайте, установил контроль над его компом, боты копировали его поведение с какой-то случайной погрешностью.
Потом данные 20 000 профилей удалось уложить в 7 кластеров, из которых 2 этому челу понравилось. Он создал два акканута – один тюнился под один кластер, второй – под другой. На вопросы он отвечал честно, но алгоритм (адаптивный бустинг) должен был подсказывать ему, насколько "важным" отметить тот или иной вопрос, чтобы понравиться тому или иному кластеру женщин.
По результатам: десятки профилей с совместимостью > 90%, 88 (!) свиданий и long lasting relationship спустя несколько месяцев. И это в районе Сан-Франциско, где вообще мало женщин, и при условии того, что чел получал пхд по математике, а не был программистом с зп 1000$/секунда.
Конечно, к таким ресерчам всегда хочется приделать контрольную группу и посмотреть, что бы было, если бы человек с похожими параметрами не занимался никаким реверс инжинирингом, но все равно интересное чтиво, и статистика по кластерам тоже ничего
WIRED
How a Math Genius Hacked OkCupid to Find True Love
Mathematician Chris McKinlay hacked OKCupid to find the woman of his dreams.
Ну и вторая статья чисто про CRM (Customer Relationship Management) – часто используется для построения работы с клиентами, автоматизации продаж, конкретно в этом случае все завязано на воронке продаж).
Осуществлялось это все предпринимательницей Екатериной Ким. Как она сама описывает идею: "сначала нужно определить потенциальный «пул» кандидатов, которые подходят вам по определенным параметрам. Затем провести их по «воронке продаж»: первый контакт, оценка обратной связи, предложение, а в конце — заключение сделки (брака)".
Сначала Екатерина собрала пул кандидатов, которые отвечали определенным ее требованиям (43 челоека, скрейпинг был по группам в соцсетям, так как требовались именно корейцы). За выполнение каждого требования накидывались баллы вроде +10 баллов за корейские корни, +4 за работу в IT и так далее. При 30+ баллов кандидат переводился из этапа "Первичный контакт" на этап "Верифицирован".
Далее после встречи с кандидатами составлялись более подробные карточки, чтобы их запомнить и отличать между собой)))) Еще Екатерина настроила автоматом отправлять людям сообщения (вроде поздравлений с днем рождения), но это чет прям extreme. + CRM-система присылала уведомления на телефон о свиданиях, что тоже чет extreme.
Дальше часть людей перешли в категорию "Приятное впечатление", и CRM автоматом назначал дату второго свидания. До этого этапа дошло 8 из 43
Теперь моя любимая часть статьи. Автор НАСТРОИЛА ТАРГЕТ на этих 8 мужчин, чтобы у них в ленте соцсетей высвечивалсь инфа о ее компании или ее паблик токах.
В итоге до 8 пункта в воронке дошел ОДИН кандидат, зато с ним у автора поучилась семья детки бизнес ипотека все как надо и никогда не ссорятся! Эксперимент очень впечатляет, в конце автор рассуждает о том, что брак по рассчету это круто, и нельзя полагаться на то, что хороший бизнес-партнер придет сам и отдаст нам все деньги (ну fair enough наверное)
Осуществлялось это все предпринимательницей Екатериной Ким. Как она сама описывает идею: "сначала нужно определить потенциальный «пул» кандидатов, которые подходят вам по определенным параметрам. Затем провести их по «воронке продаж»: первый контакт, оценка обратной связи, предложение, а в конце — заключение сделки (брака)".
Сначала Екатерина собрала пул кандидатов, которые отвечали определенным ее требованиям (43 челоека, скрейпинг был по группам в соцсетям, так как требовались именно корейцы). За выполнение каждого требования накидывались баллы вроде +10 баллов за корейские корни, +4 за работу в IT и так далее. При 30+ баллов кандидат переводился из этапа "Первичный контакт" на этап "Верифицирован".
Далее после встречи с кандидатами составлялись более подробные карточки, чтобы их запомнить и отличать между собой)))) Еще Екатерина настроила автоматом отправлять людям сообщения (вроде поздравлений с днем рождения), но это чет прям extreme. + CRM-система присылала уведомления на телефон о свиданиях, что тоже чет extreme.
Дальше часть людей перешли в категорию "Приятное впечатление", и CRM автоматом назначал дату второго свидания. До этого этапа дошло 8 из 43
Теперь моя любимая часть статьи. Автор НАСТРОИЛА ТАРГЕТ на этих 8 мужчин, чтобы у них в ленте соцсетей высвечивалсь инфа о ее компании или ее паблик токах.
В итоге до 8 пункта в воронке дошел ОДИН кандидат, зато с ним у автора поучилась семья детки бизнес ипотека все как надо и никогда не ссорятся! Эксперимент очень впечатляет, в конце автор рассуждает о том, что брак по рассчету это круто, и нельзя полагаться на то, что хороший бизнес-партнер придет сам и отдаст нам все деньги (ну fair enough наверное)
vc.ru
Воронка знакомств: как я искала (и нашла!) мужа с помощью CRM — Офтоп на vc.ru
Одно из основных направлений деятельности компании iTrack — это подбор и внедрение CRM-систем, которые наилучшим образом решают бизнес-задачи клиентов. В рамках своей работы я настолько привыкла автоматизировать продажи своих заказчиков с помощью CRM, что…
Это последняя, обещаю
Если вам лень читать, есть еще видос по реверс инжинирингу алгоритмов. Там есть:
* Начисление баллов за какие харакеристики и присвоение им весов в зависимости от важности той или иной фичи. Та же система с воронкой, когда для прохода на другой уровень нужно было набрать какое-то количество баллов.
* Маркет ресерч: девушка создала несколько аккаунтов, симулируя "своего идеального мужчину" и анализировала, с какими женщинами этот идеальный мужчина мэтчится. Например, оказалось, что гораздо популярнее оказались девушки, которые использовали "позитивные слова" в описании профилей (типа "люблю" или "счастье"), реже отвечали на имейлы (да, видео очень старое...).
В конечном итоге тоже нашла себе мужчину у них детки и все такое! Очень позитивные истории сегодня
https://www.youtube.com/watch?v=d6wG_sAdP0U
Если вам лень читать, есть еще видос по реверс инжинирингу алгоритмов. Там есть:
* Начисление баллов за какие харакеристики и присвоение им весов в зависимости от важности той или иной фичи. Та же система с воронкой, когда для прохода на другой уровень нужно было набрать какое-то количество баллов.
* Маркет ресерч: девушка создала несколько аккаунтов, симулируя "своего идеального мужчину" и анализировала, с какими женщинами этот идеальный мужчина мэтчится. Например, оказалось, что гораздо популярнее оказались девушки, которые использовали "позитивные слова" в описании профилей (типа "люблю" или "счастье"), реже отвечали на имейлы (да, видео очень старое...).
В конечном итоге тоже нашла себе мужчину у них детки и все такое! Очень позитивные истории сегодня
https://www.youtube.com/watch?v=d6wG_sAdP0U
YouTube
How I hacked online dating | Amy Webb
Amy Webb was having no luck with online dating. The dates she liked didn't write her back, and her own profile attracted crickets (and worse). So, as any fan of data would do: she started making a spreadsheet. Hear the story of how she went on to hack her…
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
А теперь действительно о важных сервисах: с одного клика эта страничка сгенерирует вам самое лучшее bio для вашего клабхауз профиля, включая вдохновляющую цитату в конце – все по самым высоким CH стандартам 🌚 https://perchance.org/owh9gelu4t
Вдогонку пост на Медиуме о том, как с помощью NLP улучшить свое резюме. Автор, правда, во многом исходит из того, что ваше резюме читать также будет робот, а не человек, но в целом там есть и вполне логичные советы. например, сделать через gensim саммари описания вакансии и своего резюме, посмотреть, насколько они метчатся (автор просто делает векторные представления слов и считает косинусное сходство матриц). Потом с помощью spacy автор считает, насколько совпадают ключевые слова, сколько раз в резюме вы повторяете какие-то ключевые фразы. Потом оказывается, что автор из тех, кто уже написал свою собственную библиотеку для НЛП, и юзает из нее свои собственные классы, чтобы посчитать веса ключевых фраз... Но думаю на гитхабе код налутать можно! В целом интересненько
Medium
Using NLP to improve your Resume
Performing keyword matching and text analysis on job descriptions