Devs.kz
8.43K subscribers
2.63K photos
170 videos
129 files
3.2K links
IT карьера в Казахстане и мире. Воркшопы и митапы Google и др. компаний. Наш офиц. портал devs.kz

Обратная связь @AskarAi Аскар Айтуов

Реклама: https://t.me/devs_kz/5211

Youtube @devs_kz

Курс AI Product engineer: https://t.me/+CG8Tpmy0RtxkZjZi
Download Telegram
Они семейная пара. Пару лет назад прошли собеседование в ИТ компании в Британии. Недавно нашли британскую гос программу и по ней купили в ипотеку в Шотландии. Постараюсь все вопросы от вас задать (про самозванца, резюме и прочее). Или вы можете сами напрямую задать сегодня в 15:00 GMT+5 https://www.youtube.com/live/0fD_pYzxRBw?feature=shared. @devs_kz
5👍1
Devs.kz pinned «Они семейная пара. Пару лет назад прошли собеседование в ИТ компании в Британии. Недавно нашли британскую гос программу и по ней купили в ипотеку в Шотландии. Постараюсь все вопросы от вас задать (про самозванца, резюме и прочее). Или вы можете сами напрямую…»
Мессадж для православных участников: Христос воскрес! С праздником вас!
16
ISO 42001-2023 Artifical Intelligence Management System.pdf
842.6 KB
Свежий стандарт ISO 42001 AI management в основном описывают так называемые контроли. Например, документ AI policy, документирование датасетов бизнес требований и т. п. Оглядываясь назад, как его предшественник ISO 22989 представлял такие концепции, как автономное ML L0-L6 (тогда это было отражено во всех современных электромобилях, я думаю, что ISO 42001 будет отражено) в корпоративном законодательстве довольно скоро. Чуть детальнее расписал в статье. Полезно только если вы ИТ аудитор/консультант/инфобезопасник. А если вы разработчик или менеджер, то лучше взять простой курс по Responsible AI коих сейчас много. @devs_kz
👍1🔥1
Катя рассказывается про ATS систему (CV) https://www.youtube.com/watch?v=0fD_pYzxRBw
👍3
Джереми Кун написал книгу которая обьясняет математику для гуманитариев программистов. На картинке объяснение формулы сигмы https://pimbook.org/ @devs_kz
🔥17👍3😨31
Психиатр: успокойся, гитхаб тебя не преследует. Слетай в отпуск.

Я лечу в отпуск. Вид из иллюминатора: ….. автор Дима Рожков @devs_kz
😁16🤣6
По признанию ряда дата инженеров, не зависимо от сложности AI систему, контроль процесса тренировки проводиться в банальном Google sheets. Не знаю правда или нет. Найден пример типичного шаблона. https://docs.google.com/spreadsheets/d/1rtosyNRjd1ZNAuoY9s13c9xZ6ZvAkOfoOT0ij9yMfJk/edit#gid=0 @devs_kz
3
В апреле я побывал в гостях в Университете Тарту. И одна из свежих штук, которую мне там показали - это эстонская LLaMA, названная llammas (по-эстонски баран, ибо модель получилась весьма упрямая 🐏). Вот статья про неё.

Что её авторы сделали:
1. До-предобучили Llama-2-7B на 5B токенов: 75% эстонских и 25% английских (чтобы английский не забывался).
1. Сгенерировали с помощью GPT-3.5-turbo датасет, аналогичный Alpaca, на эстонском (50K примеров).
1. Взяли кучу открытых шумных датасетов для перевода между английским и эстонским, и сконвертировали их в формат инструкций (1М примеров). Дополнительно взяли ещё 2К более чистых примеров для перевода.
1. Дообучили эту модель: сначала опционально на полном датасете перевода (1М примеров), потом на чистом переводе и английских и эстонских инструкциях (100К примеров из английской и эстонской альпак, и ещё 25К из более качественных английских инструкций).
1. Оценили модель на задачах question answering, choice of plausible alternative, grammatical error correction, и перевода.

Что выяснили:
- Для большинства задач (кроме CoPA) большая часть эффекта от продолженного предобучения на эстонском была достигнута уже на 1B токенов.
- Если дообучать сначала на полном датасете для перевода, а потом на инструкциях, то перевод и исправление ошибок даются модели лучше, а логика и ответы на вопросы - хуже, чем если дообучать сразу на инструкциях.
- Модели, дообученные на инструкциях, в принципе способны поддерживать осмысленную беседу на эстонском, хоть они и не всегда звучат естественно.
- Модель переводит между эстонским и английским достаточно близко к уровню SOTA (типа NLLB).
- На большинстве английских бенчмарков модель, которую до-предобучили на смеси эстонского с английским, не очень сильно падает в качестве по сравнению с исходной.
- Нужно ли дообучаться на большом датасете для перевода, и нужно ли это делать вперемешку с инструкциями или до них, не вполне понятно (разные задачи дают разные сигналы). Но в целом нет свидетельств, что реально много параллельных текстов для такой модели нужно.

Из этого, казалось бы, можно сделать вывод, что для адаптации LLM к новому языку не очень-то и нужно иметь много хороших параллельных данных для этого языка; достаточно иметь большой моноязычный датасет для продолженного предобучения (хотя бы 1B токенов, при том что токенайзер LLaMA даёт для эстонского в среднем вдвое больше токенов на предложение, чем для английского) и умеренно большой датасет с инструкциями.
Но как раз наличие датасета с инструкциями и представляет из себя большое "но": он был получен благодаря магии GPT, который уже каким-то чудом знает эстонский достаточно хорошо. А значит, для языков, на которых GPT работает не так классно, такой датасет нужно будет ли собирать вручную с нуля, или переводить с других языков. Так что я думаю, что без этапа создания хорошего машинного перевода - а значит, и сбора хороших параллельных корпусов - всё-таки не обойтись.

Ну и да, основной позитивный сингал: если таки вы нашли данные, то даже такую англоцентричную модель, как LLaMA 2, можно адаптировать на такой нишевой язык, как эстонский, за где-то 1300 GPU-часов (как это сделали TartuNLP), или даже, скажем, всего за 300 (если предобучаться на 1 млрд токенов, а не на 5, что уже тоже даёт неплохой результат). То есть: doable даже в домашних условиях.
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2
Яндекс открывает прием заявок на ежегодную международную научную премию Yandex ML Prize

Казахстанские исследователи в области искусственного интеллекта смогут претендовать на международную научную премию. Победители получат от 2,5 до 5 миллионов тенге в зависимости от номинации. Также Yandex Cloud предоставит победителям гранты, что позволит им выполнять облачные вычисления на платформе, обрабатывать данные экспериментов и обучать ML-модели.

Премия вручается молодым исследователям, научным руководителям и преподавателям за достижения в области компьютерного зрения, обработки естественного языка и машинного перевода, распознавания и синтеза речи, информационного поиска и анализа данных, генеративных моделей.

Премия в этом году будет вручаться в пяти номинациях. На неё смогут претендовать исследователи и их наставники из 11 стран, в том числе из Казахстана. Награждение Yandex ML Prize состоится осенью 2024 года.

Заявки принимаются на сайте премии до 21 июня.

Номинации Yandex ML Prize в 2024 году:

● «Первая публикация»
● «Исследователи»
● «Молодые научные руководители»
● «Научные руководители»
● «Преподаватели ML»
👍41🤬1
Приветствуем любителей инноваций!

🌟 Приглашаем вас на Google I/O Extended Oral 2024!

📅 13 мая
🕒 14:30
📍 Уральск, ул. Маметовой, 81, Дворец студентов КазИИТУ

Google I/O Extended - это серия мероприятий, которые проходят по всему миру и являются дополнением к ежегодной конференции разработчиков Google I/O. На этих мероприятиях участники могут узнать о последних разработках Google, пообщаться с другими разработчиками и поделиться своими знаниями.

В качестве спикеров мы пригласили для вас международных экспертов. Не бойтесь языкового барьера, все выступления будут сопровождаться синхронным переводом.

🚀 Мероприятие организовано при поддержке Jaiq Hub.

Присоединяйтесь к уникальному событию, не упустите шанс задать свои вопросы и обменяться идеями с опытными специалистами.

📝 Регистрация на Google I/O Extended Oral 2024
Для тех кто пишет научные статьи с методами качественных (qualitative) исследований и сталкивается с злыми ревьюерами. Как отвечать на типичные комменты https://docs.google.com/document/d/1jHiWJdkjm6Go683GIxi0tz8l-17rQQpadn9qb7zZDh4/heading=h.e86h69sdez6d#heading=h.2uezojvhv0la
Куда применить свой потенциал. Если не знаете, как вариант изучайте технологии роя дронов. Будет актуально в любой стране в последующие годы как в гражданской так и других отраслях. Наковырял пару гит репозиториев с мирных use кейсов и симуляций от 2018 года. На 2024 технологии далеко шагнули у наших соседей в постсоветских странах, Западе и даже Турции. Последнии тенденции координация группы дронов, и из полуавтономная работа. Репо 1 https://github.com/mlpi-unipi/drones-swarm Репо 2 https://github.com/lis-epfl/swarmlab. @devs_kz
👍2
Github copilot не надо платить 100 usd / месяц. По этой ссылке бесплатно https://education.github.com/ @devs_kz
6
От Технодома. Гаджеты для дома весной 2024

1. Робот-пылесос: Автоматизируйте уборку пола с помощью умного робота-пылесоса, который самостоятельно пройдет по всем комнатам и под мебелью.

2. Пароочиститель: Очистите поверхности от грязи и бактерий при помощи пароочистителя, который безопасно использует пар для дезинфекции.

3. Умный мойщик окон: Забудьте о скучной и трудоемкой уборке окон с помощью устройства, которое автоматически моет стекла, экономя ваше время и усилия.

4. Многофункциональный пылесос: Ищите пылесос, который не только пылесосит, но и удаляет пятна с ковров и диванов, а также очищает воздух от пыли и аллергенов.

Промокоды для, покупки гаждетов в Technodom:
REAL131 – дополнительная скидку 5% на 2 любых заказа. Минимальная и максимальная суммы не учитываются. Не распространяется на товары в кредит или рассрочку. Имеются исключения по брендам: Apple, Bork, Dyson, Laurastar, Miele, игровые приставки Sony, смартфоны Samsung, сертификаты, техносервис, установки.


Специальные предложения доступны ТОЛЬКО по этой ссылке https://technodom5.prfl.me/devs_kz/7oxynp

Подробнее на technodom.kz
👍21
Отель Rixos Almaty в поиске квалифицированного IT Manager
Требуемый опыт работы: 3–6 лет
Полная занятость, полный день
Responsibilities:
-Plans and coordinates new installations of software and hardware within the Hotel, reviews hardware and software purchase ensuring new products are in line with corporate standards and remain the focal contact point with vendors (including the terms and due dates of all maintenance contracts covering the Hotel software and hardware);
-Responsible for the administration and security access control to the local area network. Prepares and supervises all backup and restore procedures;
-Provides all users within the Hotel with advanced technical support on all aspects of hotel technology;
-Participates in the preparation of the Hotel Capital Plan and Departmental Budget. Ensures that project releases for technical projects are completed as required;
-Provides regular training on IT security and ensure that all PMS access passwords are regularly updated, automatic standby mode on servers and PMS activated and IT procedures strictly follows by all employees of the hotel;
-Performs regular computer audits searching for unauthorized programs, improper setup or loopholes in the security setup.
Must have skills:
-Bachelor degree required. Solid knowledge of Microsoft Operating systems, Active Directory, GPO, TCP/IP, WLAN, Hospitality software (Opera PMS / Fidelio, Micros), setup network (e.g. Cisco);
-A minimum of 3 years of experience in IT support roles (Hospitality, Operations preferred). Minimum of 1-year of Supervisory / Managerial experience;
-Proficient in English and Russian languages;
-Must be able to demonstrate: Outstanding professional communication and personal presentation, Personal initiative, resolve and high energy towards tasks and goals;
-Hotel Pre-opening experience is a plus.
Working conditions:
-Competitive salary, according to your experience. Employment in accordance with legislation;
-Staff canteen;
-Working schedule: 5 working days/ 2 days.
Ключевые навыки
-Работа в команде
-MS PowerPoint
-Английский язык
-MS Access
-Microsoft Access
Просим резюме высылать по данному номеру 🤝Rhala.hr@rixos.com
1👍1
Совокупная рыночная стоимость семи крупнейших технологических компаний США составляет 12 триллионов долларов. Семь крупнейших технологических компаний Европы оцениваются в 705 миллиардов долларов. Это в 20 (!) раз ниже, чем у американских аналогов. Профессор Ану Брэдфорд утверждает, что к технологическому разрыву между США и ЕС привели еще 4 фактора:

- Единого рынка нет, их 27. И новаторам труднее масштабироваться, когда вам приходится иметь inдело с 27 культурами, 27 администрациями и 24 официальными языками. @devs_kz
4👍4🔥2
🚀 158 дней в поиска работы!
~375 откликов и ~50 интервью.
2 оффера на позицию senior front-end разработчика. Список вакансий на которые подавался чел. Автор crazytimon88 https://spark-wood-3fc.notion.site/dd33e95d056d45afb60e98381ff7ab45?v=5e09da38f97341c582051f2911b18218&pvs=4. В итоге Тимур устроился в Праге на позицию разработчика, хотя искал Engineering manager. @devs_kz
😭22👍18🔥3
"If you’re thinking without writing, you only think you’re thinking."

— Leslie Lamport. Я бы добавил [writing Code],{writing ТЗ, user story},…{design system}, {database schema} и т.п. @devs_kz
14👍3🤡1
SSRN-id4802463.pdf
8 MB
Шаблоны промптов для инструкторов и преподавателей. Как слепить симулятор внутри GPT / Gemini @Devs_kz
🔥4❤‍🔥1👍1