„Chillin‘“ at Amazon – Telegram

„Chillin‘“ at Amazon

618 subscribers

27 photos

1 video

7 files

370 links

Amazonian SDE is sharing, 'cause sharing is caring 👨‍💻

note: I do not represent any of my employers in this channel

Download Telegram

About

Blog

Apps

Platform

„Chillin‘“ at Amazon

618 subscribers

„Chillin‘“ at Amazon

#FTS #Go

Let's build a Full-Text Search engine in Go

Full-Text Search (FTS) is a technique for searching text in a collection of documents. A document can refer to a web page, a newspaper article, an email message, or any structured text.

Today we are going to build our own FTS engine. By the end of this post, we'll be able to search across millions of documents in less than a millisecond. We'll start with simple search queries like "give me all documents that contain the word cat" and we'll extend the engine to support more sophisticated boolean queries.

https://artem.krylysov.com/blog/2020/07/28/lets-build-a-full-text-search-engine/

242 viewsedited 06:03

„Chillin‘“ at Amazon

#aws #spot #instances #cost #optimization

https://habr.com/ru/post/509790

Создание масштабируемого API на спотовых инстансах AWS

Всем привет! Меня зовут Кирилл, я CTO в Adapty. Большая часть нашей архитектуры находится на AWS, и сегодня я расскажу о том, как мы сократили расходы на сервера...

250 views06:26

„Chillin‘“ at Amazon

Forwarded from Deleted Account

Если вы думаете о зарубежной магистратуре, то почему бы не рассмотреть теплую южную страну? Например Италию. Ловите подборку англоязычных ИТ программ в этой прекрасной стране.

Politecnico di Milano:
📌MSc in CS and Engineering
📌MSc in Geoinformatics Engineering

Politecnico di Torino:
📌MSc in Data Science and Engineering
📌MSc in Computer Engineering

Sapienza Università di Roma:
📌MSc in Artificial Intelligence and Robotics
📌MSc in Computer Science
📌MSc in Cybersecurity
📌MSc in Data Science
📌MSc in Engineering in CS

University of Bologna:
📌MSc in AI
📌MSc in bioinformatics

University of Trento:
📌MSc in AI systems
📌MSc in human-computer interaction
📌MSc in Computer Science

University of Padua:
📌MSc in cybersecurity
📌MSc in Data Science
📌MSc in Physics of data

Free University of Bozen-Bolzano
📌MSc in Computational Data Science
📌MSc in Software Engineering

The programme degree aims to form Artificial Intelligence expert able to deal with design, development, integration and maintenance of innovative and complex computer systems.

272 views06:11

„Chillin‘“ at Amazon

https://martinfowler.com/articles/patterns-of-distributed-systems/

martinfowler.com

Catalog of Patterns of Distributed Systems

A catalog of patterns to better understand, communicate, and teach the design of distributed systems

247 views17:14

„Chillin‘“ at Amazon

#DL

A really cool specialisation on deep learning from amazing instructors

If you want to master it and have a portfolio by the end then you should for for it.

The price is quite affordable. You'll pay it back very soon, I believe

Deep Learning
https://www.coursera.org/specializations/deep-learning

Offered by DeepLearning.AI. Become a Machine Learning ... Enroll for free.

255 viewsedited 21:10

„Chillin‘“ at Amazon

Recently, I've been looking for resources on DL/ML and production. Here's a good resource that addresses the full cycle starting from setting/formulation of a problem to deployment

https://course.fullstackdeeplearning.com/

Fullstackdeeplearning

Full Stack Deep Learning | Full Stack Deep Learning

Full Stack Deep Learning helps you bridge the gap from training machine learning models to deploying AI systems in the real world.

245 views06:07

„Chillin‘“ at Amazon

https://engineering.fb.com/security/pysa/

Engineering at Meta

Pysa: An open source static analysis tool to detect and prevent security issues in Python code

Today, we are sharing details about Pysa, an open source static analysis tool we’ve built to detect and prevent security and privacy issues in Python code. Last year, we shared how we built Zoncola…

249 views12:51

„Chillin‘“ at Amazon

Forwarded from Tech Crunch

В США протестировали сеть спутникового интернета от SpaceX

Микроспутники Starlink от компании SpaceX Илона Маска раздают интернет со скоростью до 60 мегабит. Исследование спутникового проекта показало, что для потребительских целей средние показатели достаточно высокие.

Пока компания ведет работу над запуском на орбиту новых спутников для раздачи интернета, возник вопрос о том, какова будет скорости связи в реальности. Пробные замеры показали, что 11—60 мегабит. Средняя скорость — чуть несколько больше 40 мегабит.

Значительно ниже скорость для выгрузки данных – 4-17 мегабит. Замеры делались в Лос-Анджелесе, Сиэтле и Вашингтоне.

Таким образом скорость загрузки и выгрузки ниже желаемой руководством SpaceX — 1 гигабит. Хотя для пользователей достаточно и 15 мегабит, поскольку стандартная скорость «земного» широкополосного интернета в США такая же, а в сельской местности и того ниже.

Сейчас сеть спутников Starlink еще тестируется и, не исключено, что в конце концов скорость соединения приблизится к желанной для SpaceX. В настоящее время на орбите находятся примерно 600 спутников. Их количество планируется расширить до несколько тысяч, чтобы обеспечить глобальное покрытие.

254 views12:53

„Chillin‘“ at Amazon

Для тех кто изучает МЛ и хочет лучше понять что такое AUC, ROC

https://dyakonov.org/2017/07/28/auc-roc-%D0%BF%D0%BB%D0%BE%D1%89%D0%B0%D0%B4%D1%8C-%D0%BF%D0%BE%D0%B4-%D0%BA%D1%80%D0%B8%D0%B2%D0%BE%D0%B9-%D0%BE%D1%88%D0%B8%D0%B1%D0%BE%D0%BA/

Анализ малых данных

AUC ROC (площадь под кривой ошибок)

Площадь под ROC-кривой – один из самых популярных функционалов качества в задачах бинарной классификации. На мой взгляд, простых и полных источников информации «что же это такое» нет. Как правило, …

258 viewsedited 12:54

„Chillin‘“ at Amazon

#ML, #softmax
I've asked my self why Softmax uses exponent. Here's a good response:

- Monotonically increasing — To ensure that larger inputs are mapped to larger outputs.
- Non-negative outputs — Because probability values must be non-negative.
- The outputs should sum to one — This can be achieved by simply dividing each element of the output by the sum of all elements of the output.

https://www.quora.com/Why-is-exponential-function-used-in-softmax-function-in-machine-learning

Why is exponential function used in softmax function in machine learning?

Answer (1 of 2): A2A.

The goal of softmax function is to take a vector of arbitrary real numbers, such as [-1, 3, 2], and generate a probability distribution with the same number of elements (three in the example) such that larger elements get higher probabilities…

260 views17:20

„Chillin‘“ at Amazon

Here's another good question, that Daniil you may ask shortly: Why logit is slower than relu

https://www.coursera.org/learn/neural-networks-deep-learning/discussions/weeks/1/threads/OC2Bh8ahEeetfwrt7EZTMA

We've been discussing it with Agerke last week.

Coursera | Online Courses & Credentials From Top Educators. Join for Free | Coursera

Learn online and earn valuable credentials from top universities like Yale, Michigan, Stanford, and leading companies like Google and IBM. Join Coursera for free and transform your career with degrees, certificates, Specializations, & MOOCs in data science…

261 views17:23

„Chillin‘“ at Amazon

#ML #Sigmoid #Gradient Decent

Сижу читаю, про gradient decent сигмоидной фунцкции. Как мне нравится когда реализация может быть супер простой/эллегантной.

Зная/выведя формулу, в питоне, имплементация просто: dw = X.dot(H - Y).T / m

#. Кому интересно, докозательство формулы доступно по: https://medium.com/analytics-vidhya/derivative-of-log-loss-function-for-logistic-regression-9b832f025c2d

#. Имплементация алгоритма Логистической Регресси: https://ml-cheatsheet.readthedocs.io/en/latest/logistic_regression.html

The Derivative of Cost Function for Logistic Regression

Linear regression uses Least Squared Error as loss function that gives a convex loss function and then we can complete the optimization by…

290 viewsedited 19:27

„Chillin‘“ at Amazon

#gradient #decent #DL

Хорошая статья на тему разбора различных типов Gradient Decent for logistics regression and cross entropy

“Gradient Descent — Demystified” by Avinash Kadimisetty https://link.medium.com/5exHc0Y8a9

Gradient Descent — Demystified

In this article, I am going to discuss Gradient Descent in detail, explaining the different algorithms for optimisation apart from the…

278 viewsedited 07:06

„Chillin‘“ at Amazon

#ML #System #Design

This booklet covers four main steps of designing a machine learning system:

Project setup
Data pipeline
Modeling: selecting, training, and debugging
Serving: testing, deploying, and maintaining

https://github.com/chiphuyen/machine-learning-systems-design

GitHub - chiphuyen/machine-learning-systems-design: A booklet on machine learning systems design with exercises. NOT the repo for…

A booklet on machine learning systems design with exercises. NOT the repo for the book "Designing Machine Learning Systems", which is `dmls-book` - chiphuyen/machine-learning-systems-design

288 viewsedited 07:25

„Chillin‘“ at Amazon

#ML #System #Design

"We can characterize the challenges for integrating machine learning within our systems as the three Ds. Decomposition, Data and Deployment."

"The first two components decomposition and data are interlinked, but we will first outline the decomposition challenge. Below we will mainly focus on supervised learning because this is arguably the technology that is best understood within machine learning."

http://inverseprobability.com/talks/notes/the-three-ds-of-machine-learning.html

Neil Lawrence’s Talks

Machine Learning Systems Design

Machine learning solutions, in particular those based on deep learning methods, form an underpinning of the current revolution in “artificial intelligence” t...

298 views07:28

„Chillin‘“ at Amazon

#CV #HighResolution

What a time to be alive!

https://www.youtube.com/watch?v=MwCgvYtOLS0

TecoGAN: Super Resolution Extraordinaire!

❤️ Check out Weights & Biases and sign up for a free demo here: https://www.wandb.com/papers
❤️ Their instrumentation of a previous paper is available here: https://app.wandb.ai/authors/alae/reports/Adversarial-Latent-Autoencoders--VmlldzoxNDA2MDY

📝 The…

294 views17:43

„Chillin‘“ at Amazon

“TensorFlow vs PyTorch for Deep Learning” by Andreas Stöffelbauer https://link.medium.com/OV7ZUmUcl9

TensorFlow vs PyTorch for Deep Learning

Here’s what coding Deep Neural Networks in TensorFlow and PyTorch looks like

287 views08:37

„Chillin‘“ at Amazon

Forwarded from vc.ru

Ночью Илон Маск показал компактный беспроводной нейроинтерфейс Link, вживляемый под кожу черепа, и продемонстрировал его работу на свиньях, которым имплантировали чип для считывания мозговой активности.

С помощью Link можно будет лечить болезни — например, паралич, депрессию и болезнь Альцгеймера, играть в игры и управлять устройствами. Маск пообещал поддержку Tesla и StarCraft.

Главное из презентации Neuralink: vc.ru/future/154015

303 views06:24

„Chillin‘“ at Amazon

Forwarded from DataEng

Mastering a data pipeline with Python / Robson Luis Monteiro Junior (Microsoft)

https://youtu.be/25fUlUsmg38

Mastering a data pipeline with Python / Robson Luis Monteiro Junior (Microsoft)

Python Conf++ 2020 Online

Тезисы и презентация:
https://conf.python.ru/moscow/2020/abstracts/6316

Building data pipelines are a consolidated task, there are a vast number of tools that automate and help developers to create data pipelines with few clicks…

312 views07:55

„Chillin‘“ at Amazon

Вкратце, хочу поделиться своим опытом прохождения на курсе по Глубокому Обучению.

Пока прошел первый модуль. Ушло примерно 2-3 недели, в основным по выходным. Если в часах, то около 20 часов. Доволен на 100% без преувеличений!

Из плюсов (минусов вообще пока не заметил):

1. Отлично продуманная программа: постепенно от логистической регресси, через однослойную сетку, к глубокой. Все сопровождается блестящим и подробным объяснением что-зачем-и-почему. Я, по-крайней мере, получил ответы на больинство своих вопросов, а на несколько тех, что не понял, смог добить самостоятельно в Гугле.

2. Супер профессиональный инструктор (сейчас именно об умении обучать, а не о его статусности в МЛ): Andrew Ng расставляет нужные акценты там где нужно, говорит о чем волноваться, а о чем не нужно. Дает понять где на математику нужно надавить, а где можно не сильно переживать. В моем случае это очень нужно, так как меня постоянно сопровождает Синдром Самозванца и я постоянно сомневаюсь, в своих способностях :)) И тот факт, что я в Амазоне, не всегда служит оправданием :))

3. Достаточно много практики. Задания в ноутбуках, среда разработки настроена - на лишнее отвлекаться не нужно. За первый модуль, пришлось несколько раз реализовать forward feed и back propagation, что сильно повысило мою уверенность в понимании как это устроено изнутри. Раньше я понимал, что используется chain rule и думал, что идет какая-то нереально навороченная реализация. На деле оказалось все куда проще: в зависимости от cost function и активационных функций, выбирается нужный метод, который знает как брать производную функции.

В общем, за первый модуль, я прокачал свой взгляд на сети и теперь уже могу осознано выбирать нужные гипер-параметры. Второй модуль как раз таки о практической части тренировки сетей и тюнинг параметров. Не могу не отметить профессионально упорядоченный материал и задания, отвечающие на вопрос "Почему?".

Все кому интересен Deep Learning и начинаете с нуля, рекомендую этот курс!

Чуть позже напишу свой отзыв о втором модуле.

https://www.coursera.org/specializations/deep-learning

Offered by DeepLearning.AI. Become a Machine Learning ... Enroll for free.

2.52K viewsedited 19:27

„Chillin‘“ at Amazon

https://youtu.be/Pu4dhJA8irU

GPU-accelerated SQL and Data Science - Rodrigo Aramburu

PyData NYC/Miami/Philly joint virtual meetup - August 13, 2020

GPUs are notoriously difficult, but they don’t have to be. We’re going to go over BlazingSQL (BSQL) & RAPIDS, a Pythonic ecosystem for accelerating and scaling data science workloads through…

282 views05:17