Spark in me - Internet, data science, math, deep learning, philosophy
1.8K members
196 photos
30 files
1.6K links
All this - lost like tears in rain.

Data science, ML, a bit of philosophy and math. No bs.

Our website
- http://spark-in.me
Our chat
- https://t.me/joinchat/Bv9tjkH9JHbxiV5hr91a0w
DS courses review
- http://goo.gl/5VGU5A
- https://goo.gl/YzVUKf
Download Telegram
to view and join the conversation
Если вы не знаете в деталях про метод главных компонент (PCA), то ссылки для вас
- Бойлерплейт на питоне - https://goo.gl/O3W4jy (осторожно там реклама сервиса)
- Визуализация того как работает PCA - https://goo.gl/e7K9pc

#data_science
Нашел отличный сайт с простыми визуализациями
- http://setosa.io/ev/

Человек явно тратит очень много времени и старается, но не нашел мейнстрима.
Гениальные мошенники - просят зарегестрировать свой домен в поисковиках.
Базу свою собирают парся whois всех доменов в мире.
=)
Если у кого-то не открылась карта артистов, то вот ссылка просто на простой HTML который точно работает:
http://spark-in.me/graphs.html
Лайтовый видосик про то, какие активационные функции использовать для нейросетей
https://www.youtube.com/watch?v=-7scQpJT7uo&t=0s

По сути повторяет содержимое этой главы книги про нейросети (но не говорит, какие методы оптимизации использовать и какую метрику использовать)
http://neuralnetworksanddeeplearning.com/chap3.html

In a nutshell из того что я сам видел
- Надо использовать batch norm и dropout для регуляризации
- В качестве оптимизатора лучше всего использовать adam
- Для задачи регрессии подойдет линейная функция последней активации и mse
- Для классификации в случае большого числа классов - softmax + логлосс
- В качестве функций активации для внутренних слоев лучше всего подходит relu

Как-то так.
#data_science
Про Excel, оценку и финансовый анализ. Случайно похожая информация из 3 источников:
- Внезапно канал про эксель с 17к подписчиков
https://t.me/excel_everyday
На канале даже 50% постов - не реклама
Excel - пожалуй единственная программа, у которой нет аналогов на Линуксе или у сервисов Google

- Блог профессора Да Модарана - мастера финансового анализа и оценки - https://goo.gl/7b9J8S

- Тинькофф журнал про финансы и оценку простыми словами - https://goo.gl/U1SXcI
Уважаемые потенциальные авторы и люди, кому есть что сказать:
- Вы можете стать автором на http://spark-in.me (зачем это надо я напишу в планируемой статье)
- Вы можете получить такой веб-фид своего канала - http://kseniacadaques.spark-in.me (сервис в бете, пока сделали за спасибо, потом может поменяется)
- Это все бесплатно, без политики и задней мысли

Критерия только три
- Никакой политики и религии. Только условно-фальсифицируемые вещи / идеи
- Вы должны быть знатоком своего дела или относиться к тому, что вы делаете с рвением (если вы чему-то учитесь - это тоже прекрасно). Главное улучшать окружающую среду, а не ухудшать
- Придется мириться с неадекватом админа (меня)

Да, конечно, это все можно просто выложить на гитхаб или сделать блог на Medium / ЖЖ / tumbler итд. Но почему мне так не нравится - напишу отдельно.

Как-то так.
Заметка про применение очень простых байесовых моделей в бизнес практике - все не просто, а очень просто

http://spark-in.me/post/crude-bayesian-network-approach

#data_science
Сайт будет доступен через 10 минут.
Сайт доступен, на него были добавлены группы тегов и были исправлены баги + модификации SEO прошивки и рефакторинг АПИ.
Внезапно пример примитивного bash скрипта для деплоя spark-in-me
# redeploy script
rm -rf /var/www/spark-in-me/blog/*
rm -rf /var/www/spark-in-me/blog/.*
eval $(ssh-agent -s)
ssh-add ~/.ssh/git
git clone git@github.com:snakers4/spark-in-me-vds .
sudo yarn install
sudo yarn run build --release
touch /var/www/spark-in-me/blog/build/public/sitemap.xml
touch /var/www/spark-in-me/blog/build/public/main.rss
chmod 777 /var/www/spark-in-me/blog/build/public/sitemap.xml
chmod 777 /var/www/spark-in-me/blog/build/public/robots.txt
chmod 777 /var/www/spark-in-me/blog/build/public/main.rss
echo "# www.robotstxt.org/
Sitemap: http://www.spark-in.me/sitemap.xml
# Allow crawling of all content
User-agent: *
Disallow:" > /var/www/spark-in-me/blog/build/public/robots.txt
php /var/www/spark-in-me/admin/Api/Sitemap/sitemapMaker.php
Самое интересное на канале за неделю - http://tinyletter.com/snakers41/letters/spark-in-me-4

Для всех, кто недавно присоединился, есть
- подборки статей с канала (поиск по слову подборка)
- теги (кликните по слову с #)
- сайт http://spark-in.me
- ссылка на файл с отобранными бесплатными образовательными курсами про data science в описании канала