Код в мешке
249 subscribers
8.94K photos
1.58K videos
2.11K files
42.1K links
Код в мешке - про кодинг, и не только...
Это личная записная книжка

https://t.me/joinchat/AAAAAEIy6oGlr8oxqTMS5w
Download Telegram
Forwarded from Костыль
This media is not supported in your browser
VIEW IN TELEGRAM
Мастхэв для научных статей

Claude 3.7 добавили в мегаархив alphaXiv со всеми научными работами аж с 1991 года.

Как работает:

• Выделите любой кусок текста и Claude объяснит его, выжмет или даже переведёт на русский
• Через «@» можно в своем запросе сослаться на любую другую статью. Claude сравнит результаты, подходы, выводы и вообще ВСЁ, что вы попросите.
• Все работает бесплатно.

Идеальный курсач лежит — тут.

Костыль | Подписаться
Открыл городской сайт, который получал 200 посетителей в день благодаря табличкам в автобусах

История о том, как студент сделал городской форум и нашел необычный источник трафика, благодаря которому заработал 1 млн рублей за месяц. 
https://habr.com/ru/articles/886550/
Author: dad_business01
@dad_business01
Forwarded from Типичный программист
Шпаргалка по соответствию консольных команд Windows и Linux

Может пригодиться при переходе между ОС или если часто приходится переключаться между системами.

Сохраняем, чтобы не гуглить лишний раз 👍

#windows #linux
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Хакер — Xakep.RU
В наборе данных для обучения ИИ нашли 12 000 ключей API

В наборе данных Common Crawl, который используется для обучения множества ИИ-моделей, обнаружили около 12 000 секретов, в том числе пароли и ключи API.

https://xakep.ru/2025/03/03/common-crawl-secrets/
UX-проектирование на кошке

В статье ниже расскажу, как можно знания разработки продуктов использовать для себя.
Насколько интереснее становится их применять и глубже изучать.

https://habr.com/p/864822/
...
Сотрудник Disney Мэттью ван Андел скачал генератор изображений с GitHub и потерял всё.

Внутри оказался вирус, который передал хакерам все его пароли. Через полгода в сети появился архив на 1 ТБ — внутренняя информация Disney плюс личные данные Ван Андела.

Цена ошибки: увольнение, потеря страховки и бонусов на $200 тыс.
🖥 Репозиторий: Книга сокровенных знаний — это сборник ценной информации.

Книга сокровенных знаний представляет собой коллекцию вдохновляющих списков, инструкций, шпаргалок, блогов, лайфхаков, однострочных кода, веб-инструментов и многого другого.

— Этот репозиторий включает в себя разнообразные материалы и инструменты, которые ежедневно используются в работе. Он содержит много полезной информации.

Ссылка на GitHub (https://github.com/trimstray/the-book-of-secret-knowledge)

#Book #GitHub
@hackernews_lib
🖥 Репозиторий: Quivr — мозг, усиленный генеративным ИИ

Quivr — это платформа с открытым исходным кодом, основанная на ИИ, созданная для преобразования частных и корпоративных знаний в персонализированные и интерактивные помощники, которые называются "Мозги".

Этот инструмент способен управлять и взаимодействовать с различными типами данных, включая документы, электронные письма и API, предоставляя пользователям ресурс с знаниями, который обучается и развивается.

Ссылка на GitHub (https://github.com/QuivrHQ/quivr)

#ИИ
@hackernews_lib
🖥 Репозиторий: Huginn — это простая платформа для интеграции

Huginn представляет собой платформу с открытым исходным кодом, предназначенную для создания автоматизированных агентов, которые могут выполнять задачи от имени пользователя.

— Этот инструмент позволяет следить за изменениями на веб-сайтах, получать электронные письма и инициировать действия на основе этих событий.

Ссылка на GitHub (https://github.com/huginn/huginn)

#Monitoring #Scraper #Web #Agent
@hackernews_lib
🖥 Репозиторий: Руководство по DevOps

Руководство по DevOps включает все конфигурации от этапа разработки до рабочей среды с важными заметками для эффективной отладки.

— Этот репозиторий содержит:
1. Определение DevOps;
2. Дорожную карту DevOps;
3. Практические лабораторные работы по IBM Kubernetes;
4. Как стать DevOps-инженером за шесть месяцев и многое другое.

Ссылка на GitHub (https://github.com/Tikam02/DevOps-Guide)

#DevOps #GitHub
@hackernews_lib
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Репозиторий: Geospy — определение местоположения по фотографиям

Geospy — это инструмент на Python, который использует геолокационную службу Graylark, основанную на искусственном интеллекте, для определения места, где были сделаны фотографии.

— Этот инструмент не требует никаких метаданных. Нейросеть просто анализирует вид из окна на ваших снимках и определяет ваше местоположение.

Ссылка на GitHub (https://github.com/atiilla/geospy)

#GeoOSINT #Soft #OSINT #Spy
@hackernews_lib
Под маской банков и маркетплейсов: как распознать фишинговые сайты и защитить свои данные от мошенников
https://rg.ru/2025/03/05/chto-takoe-fishing-chem-opasen-i-kak-zashchitit-sebia-ot-moshennicheskih-shem.html

В МВД объяснили, как при онлайн-покупках распознать сайт мошенников
https://rg.ru/2025/03/04/v-mvd-obiasnili-kak-pri-onlajn-pokupkah-raspoznat-sajt-moshennikov.html

МВД: Мошенники маскируют фишинговые ресурсы под антивирус "Касперский"
https://rg.ru/2025/03/03/mvd-moshenniki-maksiruiut-fishingovye-resursy-pod-antivirus-kasperskij.html
...
Эксперты объяснили, почему iPad все еще круче Android-планшетов

Как же разрывают эти планшеты:
https://click-or-die.ru/2025/03/eksperty-obyasnili-pochemu-ipad-vse-eshhe-kruche-android-planshetov/

Какой iPad взять: базовый или Air? Разбираем новые модели

Разбираемся вместе:
https://click-or-die.ru/2025/03/kakoj-ipad-vzyat-bazovyj-ili-air-razbiraem-novye-modeli/

Вот сколько будут стоить iPad и iPad Air в России. Где покупать и как сэкономить?

Сравнили цены:
https://click-or-die.ru/2025/03/vot-skolko-budut-stoit-ipad-i-ipad-air-v-rossii-gde-pokupat-i-kak-sekonomit/

Новинки Apple уже появились на CDEK.Shopping.

В наличии:
MacBook Air с чипом M4, 16 ГБ ОЗУ и 256 ГБ памяти. Держит зарядку до 18 часов и работает в два раза быстрее MacBook Air на M1;

iPad Air с чипом M3, поддержкой Magic Keyboard и ИИ-функций Apple Intelligence. Есть версии диагональю 11 и 13 дюймов;

Базовый iPad с обновленным процессором А16 и минимальным объемом памяти 128 ГБ.

....
Forwarded from Ivan Begtin (Ivan Begtin)
Полезные ссылки про данные, технологии и не только:
- Kreuzberg [1] библиотека для Python по извлечению текста из документов, поддерживает множество форматов, внутри использует Pandoc и Tesseract OCR. Создано как раз для использования в задачах RAG (Retrieval Augmented Generation) с прицелом на локальную обработку данных и минимумом зависимостей. Лицензия MIT
- Validoopsie [2] другая библиотека для Python для валидации данных. Использует библиотеку Narwhals благодаря которой подключается к почти любым видами дата-фреймов. Выглядит полезной альтернативой Great Expectations, лично для меня в валидации данных глобальный нерешённый вопрос в том что тут правильнее, код или декларативное программирования. Иначе говоря, правила проверки должны ли быть отчуждаемыми от языка разработки. Здесь валидация встроена в код, но поверх можно сделать и декларативный движок. Лицензия MIT
- Scripton [3] коммерческое IDE для Python с необычной фичей визуализации данных в реальном времени. Есть только скриншоты, записи экрана и коммерческая версия для macOS. Для тех кто занимается алгоритмической визуализацией может быть удобно, для остальных задач пока нет такой уверенности.
- New horizons for Julia [4] по сути статья о том что язык программирования Julia ещё жив и развивается. Правда медленно, на мой взгляд, но вроде как есть позитивное движение за пределами научных областей. Лично я почти не сталкивался с Julia кроме как на уровне примеров кода, но хорошо если он кому-то нравится и полезен.
- Data-Driven Scrollytelling with Quarto [5] визуализация дата-историй с помощью движка Quarto, итоги конкурса таких визуализаций с большим числом примеров и победителей. Примеры все от команды компании Posit которая этот open-source движок Quarto и разрабатывает. Скажу отдельно что это очень правильно. Если ты делаешь любой движок по визуализации, то просто обязательно надо проводить такие конкурсы.
- The Best Way to Use Text Embeddings Portably is With Parquet and Polars [6] ещё один обзор о том насколько эффективен Parquet в связке с Polars для работы с данными, в данном случае данными карт Magic of the Gathering. Автор тоже задаётся вопросом о том почему Parquet не поддерживается в MS Excel.
- How to Make Superbabies [7] особенно длинный лонгрид о том как генетическими изменениями можно улучшать человека, создавать супер детей или "оптимизированных детей", как ещё пишет автор. Читать и думать об этом надо потому что всё идёт к тому что скоро это станет ещё одной острой социальной и геополитической темой.

Ссылки:
[1] https://github.com/Goldziher/kreuzberg
[2] https://github.com/akmalsoliev/Validoopsie
[3] https://scripton.dev/
[4] https://lwn.net/Articles/1006117/
[5] https://posit.co/blog/closeread-prize-winners/
[6] https://minimaxir.com/2025/02/embeddings-parquet/
[7] https://www.lesswrong.com/posts/DfrSZaf3JC8vJdbZL/how-to-make-superbabies

#opensource #data #datatools #dataviz #genetics #python
Forwarded from Ivan Begtin (Ivan Begtin)
Я не пропустил совсем новость о том что Пр-во России анонсировало национальный проект "Экономика данных и цифровая трансформация государства" на который предполагается что потратят более 1 триллиона рублей до 2030 года [1], но долго думал как прокомментировать.

Меня в этом проекте всегда смущало слово экономика, оно как бы неявно, завуалировано, так сказать, создавало ощущение что где-то здесь, вот тут вот, совсем рядом, надо только вчитаться, но есть экономический эффект, оценка оборота данных, снижение регуляторных барьеров и так далее. Иначе говоря моделирование регуляторного и деятельностного пространства. И, конечно, введение в оборот большего числа/объёма данных находящихся в введении органов власти или напрямую ими регулируемых.

Я долго это искал в нацпроекте Цифровая экономика, но не мог найти. И сейчас не могу найти в новом нац проекте. А вот цифровая трансформация государства представлена в полной мере, здесь вопросов нет, здесь всё понятно.

И, конечно, как всегда, не могу не отметить отсутствие тематики открытых данных в официальной государственной повестке. Это не значит что их нет, это значит что их приоритет улетел куда-то, далеко улетел, но не совсем.

Но давайте я немного отвлекусь. Не все знают, а я напомню, что большая часть Bigtech'ов (Google/Amazon/Microsoft/Facebook) - это дата корпорации. Многие из них легко делятся технологиями и выкладывают их в открытый код потому что для всех из них (кроме разве что Microsoft) данные - это основной актив, важнейший актив. Большая часть из них живут по принципу DINDO (Data-in-no-data-out), по-русски это звучит как "Данные входят, данные не выходят".

Особенность российского регулирования данных и основных инициатив, на текущем этапе, в том что российское государство трансформируется в data корпорацию, в первую очередь на федеральном уровне. Медленнее чем можно было бы подумать, тяжелее чем можно было представить, но последовательнее чем можно было бы ожидать.

Это приводит всех нас в ситуацию когда, к примеру, запрос от бизнеса на государственные данные приводит к контр-вопросу "А Вы нам что?". Государство из распределителя общественного блага превращается в супер-дата-корпорацию не заинтересованную делиться данными потому что, вспоминаем, это ценный актив.

Это уникальное для мира явление и лично мне не нравится эта тенденция. В каждой новой инициативе я пытаюсь разглядеть отход от движения в эту сторону и пока не вижу.

Ссылки:
[1] https://tinyurl.com/data-economy-2025

#data #russia #regulation