I hate overtime
865 subscribers
129 photos
4 videos
54 files
961 links
Some DevOps, SRE and IT development stuff
Download Telegram
Forwarded from AvitoTech
Как работает поиск?

Андрей Аксёнов, руководитель разработки инфраструктуры поиска в Авито, рассказал в подкасте «Подлодка» из каких задач состоит работа над поиском, как измерить его качество и какие технологии используются под капотом.

Ссылки на выпуск и полезные материалы по теме можно найти на сайте подкаста → http://amp.gs/NMyM
Statistics_cheat_sheet.pdf
1.3 MB
#datascience
Четкая шпаргалка по матстату
#datascience
Крутая инструкция и просто интересная статья про то как чистят датасеты на примере поиска депрессивных твитов
Forwarded from oleg_log (Oleg Kovalov)
Вчера нашел себе развлечение на ночь, залип над статьей от гугла по поводу их новой(?) БД - Procella. Аналитика на масштабируемых стероидах.

Интересно, что у них data cache-hit 90%, много С++ шаблонов и компайл-тайм штук для компиляции запросов, а еще все завязано на Borg(отца к8с)(что очевидно).

https://ai.google/research/pubs/pub48388/
Блин-блин-блин, это даже круче Uplink'a
This media is not supported in your browser
VIEW IN TELEGRAM
Тут игру подвезли

ThreatGEN: Red vs. Blue
https://store.steampowered.com/app/994670/ThreatGEN_Red_vs_Blue/

Это пошаговая стратегия в которой вы можете играть за одну из сторон: атакующие (красная команда) или защищающие инфраструктуру (синяя команда).

Утверждают, что
Every single member of the development team for this game actually comes from the cybersecurity (or INFOSEC) community.
. . .
Developers Clint Bodungen and Aaron Shbeeb are authors of the book, Hacking Exposed: Industrial Control Systems.
Forwarded from DOFH - DevOps from hell
В Санфране проходит ежегодный сабантуй Oracle Openworld 2019, где компания объявляет самые бомбические анонсы на грядущий год. Один из важных take-away сегодняшнего дня - Always free cloud tier.

Ранее существовал только один способ получения бесплатного клауда – 30 дневный триал. Это расстраивало многих любителей неспешного изучения новых технологий.

Теперь у вас есть возможность получить в вечное бесплатное пользование:
a. 2шт VM 1/8ядра 1G RAM
b. 2шт Block volume 100Gb total
c. 10Gb S3 + 10Gb S3 Archive
d. 2 Автономных БД 1 ядро 20Gb storage (SQLdev и APEX web на борту)
Играем на здоровье: https://www.oracle.com/cloud/free/#always-free
#books
Если вдруг кто-то давно не читал Таненбаума, то тут новое издание вышло
Debian_Tanenbaum.pdf
13.8 MB
А какой ОС пользуетесь вы?
Тут вот критика монорепы подъехала. Автор по пунктам идет по всем "бенефитам" и популярно на примерах объясняет, что не так все радужно.
Нашел блог "того самого" Майка Нейгарда. Наслаждайтесь!
Нашёл в твиттере ссылку на интересную статью Николаса Закаса 2015-го года — "The bunny theory of code".

В статье Николас рассуждает о том, как код похож на кроликов. Стоит немного подождать, и кусочек кода, который находился в одном файле, через некоторое время начинает жить уже в трёх местах. Размножение не зависит от того, хороший это код или плохой, поэтому стоит заботиться о том, какой код попадает в общий репозиторий.

Почему так происходит? Мы редко начинаем писать что-то с нуля в существующем проекте. В первую очередь мы ищем то, как данную проблему решали наши коллеги. Если решение было найдено, то с большой вероятностью оно будет скопировано в новый файл, так как закомиченный код неявно выступает неким гарантом качества. Поэтому стоит делать всё возможное, чтобы поддерживать это качество. Например, с помощью хорошего код ревью, воркшопов, обсуждения спонтанно возникших паттернов (“accidental standards") и т.п.

Читал статью с улыбкой. Николас хорошо описал, как работают разработчики с кодом. По крайней мере, лично я стараюсь не изобретать велосипед в рабочем проекте, но сначала ищу, не был ли этот велосипед изобретён другими.

#musings #programming

https://humanwhocodes.com/blog/2015/05/14/the-bunny-theory-of-code/
Forwarded from addmeto
Как-то я вчера не разглядел, а OpenAI показали результаты довольно простого эксперимента, на который я теперь часто буду ссылаться. Они построили модель мира, в которой виртуальные боты-игроки играют в прятки-догонялки, т.е. условно физический мир в котором одни боты делают все чтобы их не нашли другие. Боты, разумеется, обучались с подкреплением, запоминая какие их действия с большей вероятностью приводили к победе. И научились довольно неплохо прятаться, используя подручные предметы. А потом исследователи стали усложнять правила, добавляя новые обьекты, позволяя перелазить через некоторые стены и тд, не меняя конфигурацию изначальной сети. И каждый раз боты выбирали новую оптимальную стратегию чтобы прятаться или искать. Обязательно посмотрите видео по ссылке, оно того стоит!

Почему этот эксперимент так важен? Потому что это показательная история: для первоначальных простых условий не стоило бы писать нейронную сеть и вообще ИИ, достаточно было описать очень простые алгоритмы, которые эффективно решали бы задачу. Но чем сложнее становились условия, тем эффективнее было именно решение с ИИ. Так и в жизни происходит. Часто велик соблазн решить задачу по-старинке, без всяких там умностей. Но по мере усложнения задачи все больше смысла в том, чтобы использовать ИИ. А задачи у нас все сложнее и сложнее. https://openai.com/blog/emergent-tool-use/
А вот кому DNS, который все резолвит в котиков? Кстати, блог у мадам очень даже ничего
#product
Тут наткнулся на очень крутую статью про продукт. Много, казалось бы, очевидных инсайтов, но, тем не менее, очень мало продуктов действуют так, как там рекомендуется. Например советы:
1. Тестировать все идеи, какими бы крутыми они не казались
2. Концентрироваться на проблеме, а не на решении
3. Решать одну проблему, но хорошо, а не много, но кое-как
и т.д. очень часто игнорируются. Кароч в качестве пятничного нетехнического чтива прям советую
Пятничный мем
#datascience #logging
Нашел группу энтузиастов, которые занимаются анализом логов. У них несколько интересных тулзов и куча ссылок на матчасть на гитхабе