HFLabs — о клиентских данных
1.39K subscribers
170 photos
8 videos
5 files
418 links
Канал о работе с клиентскими данными в крупном бизнесе. Технологии, тренды, мнения.

О людях и работе в HFLabs пишем в «Лабсовой» — @hflabs_people

Куратор — @alina_solominka

Чат для обсуждений: @hflabs_official_chat.

www.hflabs.ru
Download Telegram
🇷🇺 «Единый клиент» включили в реестр отечественного ПО

Развлечения на карантине — это прекрасно, но не забавами едиными.

Раньше лишь один продукт HFLabs — «Фактор» — входил в Единый реестр российских программ для электронных вычислительных машин и баз данных. Но 7 апреля рядом с ним расположился и «Единый клиент». It's official: ЕК — на 100% российский продукт.

Теперь государственным компаниям будет еще проще построить CDI-систему с помощью разработок HFLabs. Ура!
HFLabs сегодня 15 лет. В понедельник созвонимся в «Зуме» и попьем игристого, а сегодня — поздравления.

Спасибо за то, что вы с нами!
Forwarded from Elena Zhuravleva
@Tbuntik, ты меня опередила! Спасибо! Держите апрельское обращение 😊

HFLabs сегодня 15 лет и это одна из тех компаний, которые я хотела бы видеть на российском рынке. Небольшая российская компания (82 сотрудника), делающая хороший и сложный софт и с любовью относящаяся к своим клиентам.

Рынок отвечает нам взаимностью. Прошлый год был, наверное, самым успешным за последние 15 лет — ну хотя бы из-за того, что мы заработали миллиард.

В прошлом году у нас был сложный выбор — сделаться частью чужой экосистемы или остаться самостоятельными. Мы выбрали второе. Потому что поняли, что свобода быть такими, как мы хотим, для нас дороже денег (и поверьте, деньги были реально очень большие :-).

Занимательный факт: из 82 сотрудников 18,3% работают с нами больше 9,5 лет. Спасибо вам за ваше время и энергию!

Коллеги, которые работают меньше 9,5 лет — вы тоже молодцы, не думайте, что я про вас забыла!

Спасибо и всем тем сотрудникам, которые были с нами, но ушли.

Меня часто спрашивают, как получилось построить компанию, которая работает почти сама, без нашего с Димой активного ежедневного участия. Я не знаю универсального рецепта, но главный ингредиент — это люди.

Как и всегда :-)
🌊 Персданные россиян опять в открытом доступе

Из программы лояльности финских ритейлеров утекли 970 тысяч строк: ФИО, даты рождения, телефоны, емейлы, города проживания.

Утечки у ритейлеров стали чем-то обыденным, но что с ними делать — не очень понятно. Гендиректор HFLabs Дмитрий Журавлев комментирует для «Коммерсанта»: Универсального решения нет: если жестче контролировать безопасность, то клиенту по любым мелким вопросам придется лично обращаться в главный офис компании и станет сложнее реализовывать проекты с аналитикой. А у сотрудников появится больше стимулов работать не с общей защищенной базой, а с локальными копиями, что приведет только к повышению вероятности сливов.

Другие эксперты высказались в том же духе — мол, методы есть, но по разным причинам работать не будут. Пока все выглядит так, что персональные данные защитить не получается. Утечки будут продолжаться, а надежного и удобного решения пока нет.

https://www.kommersant.ru/doc/4322807
🏡 Встречайте «Единый адрес» — новый продукт HFLabs

Карантин карантином, а в корпоративном секторе всегда горячо. Поэтому мы вовсю трудимся и даже выпустили новый продукт.

«Единый адрес» создает для компаний эталонный адресный справочник. Учетные системы подключают к нашей новой разработке, чтобы «подружить» их и создать общее пространство адресов.

Новинка полезна крупному бизнесу, работающему с адресами: логистическим и транспортным компаниям, телекому, госсектору.

Анонс получился объемным, запихивать его в канал — пустая затея. Поэтому все подробности с примерами, картинками и кейсами мы описали в блоге https://blog.hflabs.ru/vstriechaitie-iedinyi-adries-novyi-produkt-hflabs/
📞 С «Единым клиентом» рассылки и обзвоны эффективнее

Клиенты все время меняют контакты: заводят новые сим-карты, отказываются от домашнего телефона, забывают о старых емейлах и создают новые. Чем дольше клиент известен компании, тем больше контактов в его карточке.

Раньше «Единый клиент» собирал все известные контакты вместе и останавливался — всё вроде бы на ладони. Но когда доходило до обзвона или рассылки, начинались приключения. Если у клиента россыпь телефонов и емейлов, какой из них выбрать — непонятно. А в маркетинге такое не любят.

Поэтому мы научили «Единый клиент» скорингу контактов. Он считает специальный коэффициент надежности, а затем присваивает каждому контакту ранг. Телефоны сравнивает с телефонами, емейлы — с емейлами и так далее.

Подключаем по запросу как новый модуль «Скоринг контактов».

Правила, по которым система расчитывает ранги, — в нашем блоге http://amp.gs/30LJ.
☄️ Сегодня приняли закон «О едином федеральном информационном регистре…». Что нам не нравится в нем

В Госдуме очень бодро продвинули закон, вводящий в России единый регистр данных о гражданах страны. Данных не обезличенных, а совершенно наоборот — предельно личных. Также закон вводит понятие «идентификатора», указывающего «на совокупность сведений о человеке в государственном информационном ресурсе».

Неплохой разбор выложил Regnum.

Только что закончилось последнее чтение в Госдуме. Для вступления в силу закон осталось прочитать в Совете Федерации, подписать у президента и опубликовать. Судя по скоростям, едва ли на каком-то из этапов дело застопорится.

Почему мы думаем, что единый реестр в утвержденном виде — это опасная и мрачная перспектива.

1. Неограниченный круг лиц получает бесконтрольный доступ ко всей информации о каждом гражданине. В регистр попадают данные из всех органов власти, потенциально включая медицинские данные, информацию с камер наблюдения, информацию о детях и вообще что угодно.

2. Граждане даже не узна́ют, какие данные о них хранятся в регистре. Потому что «Регистр начинает наполняться персональными данными сразу со дня опубликования закона в 2020 году, а право граждан на получение информации о том, какие сведения о них внесены в Регистр, появляется с 2026 года (ч. 5 ст. 11, ч. 6 ст. 14).» <…> «Только с 2026 года граждане получат право попросить об изменении сведений о них в Регистре».

Даже если предположить, что в 2026 году общество ужаснется открывшимся горизонтам и мы все вместе продавим поправки, поменять федеральный закон — это затея в среднем на два года. Минимум до 2028-го мы получим неуправляемый и ненаблюдаемый гражданами сбор личных данных.

На полях заметим, что статья 24 Конституции гласит: «Сбор, хранение, использование и распространение информации о частной жизни лица без его согласия не допускаются».

Любые руки с таким ресурсом будут отравлены бесконтрольной властью.

Напоследок обратимся к опыту других стран.

— «Реестр населения был в 2006 году сформирован в Англии. Однако спустя 4 года было принято решение об уничтожении реестра и связанных с ним ID-карт, поскольку власти признали, что такой реестр — нарушение неприкосновенности частной жизни и угроза безопасности. Правительство Великобритании говорило о непрактичности и неуправляемых нарушениях конфиденциальности в качестве причин уничтожения реестра».

— «Относительно присвоения номера-идентификатора гражданам четкую позицию занял законодатель Португалии: согласно п. 5 ст. 35 Конституции Португалии „запрещается присваивать гражданам единственный в национальном масштабе номер“».

— Решением Конституционного суда Венгрии от 1991 года присвоение гражданам единого номера признано антиконституционным.

С данными можно делать много захватывающих и полезных вещей, если их разделить (федерализировать) и обезличить. Вот тогда возможностей для злоупотреблений будет значительно меньше, а пользы — столько же.

То, как это делают сейчас, опасно
💻 Открытое демо релизов HFLabs

В четверг, 28 мая, мы проведем в онлайне демо релизов HFLabs. Подобные мероприятия годами практикуем внутри команды, а теперь приглашаем желающих присоединиться.

Начнем в 18:00. На демо выступят три эксперта из HFLabs и каждый расскажет о фиче, внедрение которой курировал:
— что нового появилось;
— как это применять заказчикам;
— как в команде придумали и воплотили идею.

Все это с деталями и подробностями, которые обычно мы не выносим наружу. Будет интересно прежде всего тем, кто давно знает HFLabs. Поучаствовать — это как заглянуть за кулисы.

Если интересно, запишитесь в гуглоформе. Рассмотрим заявку и на следующей неделе пришлем ссылку на zoom-конференцию.

А в блоге мы подробно разобрали программу https://blog.hflabs.ru/prighlashaiem-na-otkrytoie-diemo-rielizov-hflabs/
🤖 Открытое демо HFLabs начнется в 18:00

Друзья, напоминаем: сегодня мы проведем открытое демо релизов HFLabs.

Выступят три эксперта и каждый расскажет о фиче, внедрение которой курировал:
— что нового появилось;
— как это применять заказчикам;
— как в команде придумали и воплотили идею.

Всем, кто зарегистрировался, мы разослали ссылку на конференцию в Zoom. Уже можно подключиться и проверить, все ли в порядке. Если не обнаружили письмо в ящике, пожалуйста, проверьте в спаме — очень может быть, что письмо попало туда.

И да, еще есть время подать заявку — если зарегистрируетесь до 17:45, мы пришлем ссылку на трансляцию. Форма для регистрации — в предыдущем посте
👩‍🦰🤠 Антидубли — новый подход к сужению «серой зоны»

Как только компания начинает борьбу с дублями клиентов, всплывает проблема «серой зоны». «Серая зона» — это масса карточек, которые вроде бы похожи, но их «похожести» недостаточно для автоматического слияния.

Из-за «серой зоны» неясно, сколько у компании клиентов

Пока существует «серая зона», компания не знает, скольких клиентов обслуживает. Такое положение не устраивает аналитиков, маркетинг, менеджмент, да и вообще никого.

При этом разобрать дубль вручную — задача нетривиальная. Где-то понадобятся первичные документы, а где-то придется и с клиентом связаться. Ручной разбор — это дорого и долго. Поэтому мы где можем сужаем «серую зону» без дата-стюардов.

Но давать автоматике слишком большую свободу опасно. Если объединять карточки «на глазок», последствия будут болезненными. И мы зашли с другой стороны.

Вместо гарантированных дублей удаляем антидубли

Мы решили, что пойдем от противоположного: будем автоматически убирать из «серой зоны» тех, кто точно дублями не является. На этом направлении даже ошибка не повлечет опасных последствий.

Итак, антидубли — это похожие карточки из «серой зоны», которые точно принадлежат разным людям. Мы добавили в «Единый клиент» новые правила, которые эти самые антидубли ищут. Вот что происходит с найденными карточками:
1. Они покидают «серую зону» и не мешают считать клиентов.
2. Уходят из фокуса внимания дата-стюардов.
3. Не объединяются автоматически, если обе похожи на третью карточку.

Антидубли уже внедрили в крупном банке. «Единый клиент» нашел у заказчика 53 273 антидубля. Так мы автоматически сократили «серую зону» банка на год работы дата-стюарда.

Если интересно, обращайтесь, все расскажем. Подключаем как доработку: предварительно анализируем данные заказчика и полируем алгоритмы поиска.
Единый регистр граждан РФ — чем он грозит

Гендиректор HFLabs Дмитрий Журавлев дал первое за многие годы публичное интервью. Повод — закон «О едином федеральном информационном регистре…», который Госудума приняла 21 мая.

В итоге обсудили не только будущий единый регистр, но и безопасность информации вообще.

1. Лучше иметь такой закон, чем не иметь никакого. Появится хоть какая-то регуляция, но это единственный плюс.

2. Любая база, которая представляет ценность, утечет. Сто процентов.

3. По закону у граждан РФ появится уникальный номер, который оставят человеку даже после смерти. Причем в тексте закона это прописали очень иносказательно.

4. Безопаснее под каждый контакт с государством генерировать для человека новый ID. Тогда не будет понимания, что за разными услугами обращается один и тот же гражданин. И это замечательно.

5. Приватность — это приятно само по себе. Мы не ходим по улицам голыми, хотя более или менее одинаково устроены. С перепиской и личными данными то же самое — нормально их скрывать, даже если не делаешь ничего противозаконного.

6. Чтобы оказать большинство услуг, государству или бизнесу не нужно знать, кто ты такой. Нужны только твои полномочия или ключевое свойство: например, вот этот человек имеет троих детей и еще не получал на них пособий. Неважно, как зовут человека и где он живет.

7. Мировой тренд — не анонимность, а, наоборот, полная биометрия. Права человека привязывают к телу намертво. И ни в одной стране нет ощутимого протеста граждан.

8. Защита информации о личной жизни перестает иметь ценность. Тайны переписки, можно сказать, нет.

9. Если с регистром ничего не сделать, хотелось бы по крайней мере больше ограничений и контроля.

10. Хорошо бы этот регистр сделать федеративным. Чтобы разные части хранились в разных ведомствах, чтобы царь-базы нигде не появилось.

11. Пусть информацию по человеку собирают из разных источников только динамически, по запросу. А в собранном виде она никогда не хранится.

12. Распространена позиция, что власть — это монолитное зло. И у него есть единая задача, как бы похитрее и жестче нахлобучить население. Это точно не так.

13. Власть — это множество людей, часто с противоположными интересами. С ними со всеми можно строить диалог, хотя это и непросто;

14. Если мы хотим влиять на закон, это нужно делать в самой логике госуправления. Ходить и объяснять каждому заинтересованному чиновнику, что лично для него будет значить регистр. «Чувак, ты понимаешь, что информация о твоих несовершеннолетних детях будет доступна примерно 15 тысячам человек? Ты ок с этим?»

Полное интервью смотрите на Youtube (внутри безопасность данных, диверсанты на атомных станциях и температура 37° С как важнейшая для человечества).

https://www.youtube.com/watch?v=HLmN3uSHU1w
📞 Сбербанк сделал сервис для проверки телефонных номеров

Крупнейший банк страны выкатил страничку, где можно проверить, не мошенники ли на проводе https://www.sberbank.ru/promo/antifraud/check.html.

Штука в принципе полезная: например, во время самоизоляции чуть ли не всем в HFLabs звонили из «банков» и c тревогой сообщали, что по карте прошла подозрительная операция. Мол, давайте примем меры, пришлите реквизиты.

Но в реализации есть нюансы. Например, вот как сервис аттестует телефон колл-центра «Тинькофф банка»:

> Внимание! Данный номер является подозрительным. Риск средний. Рекомендуем проявлять осторожность при звонке с данного номера. Будьте внимательны.

Для «Альфа-банка» и вовсе:

> Внимание! На данный номер телефона зафиксированы жалобы. Риск высокий.

Еще интересно, что для проверки телефон отправляется по адресу https://fraud.test.chulakov.ru/check/fraud. Так написано в коде странички. Тут мы понимаем, что новый сервис для «Сбера» сделала студия Чулакова. Что, впрочем, нормально: контора большая и известная, регулярно делает проекты для государства и крупного бизнеса.

Но шкалу откалибровать бы, конечно. Мы бы не стали пользоваться сервисом в нынешнем виде.

UPD. Адрес проверки телефона поменяли на https://antifraud.sber.me/check/fraud
🤷‍♂️ Весь год с ФИАСом творится неладное — пока справочник лучше не обновлять

ФИАС — это справочник адресов России, которым заведует ФНС. ФИАС широко используют в бизнесе, потому что более полного реестра российских адресов в открытом доступе попросту нет. Например, к справочнику привязывают адреса клиентов из CRM, тарифы на доставку грузов и много что еще.

Каждый месяц ФНС выкладывает обновления ФИАСа в виде архива с набором файлов. Причем любое обновление может обернуться веселым квестом: то архив побьется, то еще что-нибудь. Наши спецы уже привыкли и накопили опыт: мол, пусть выходят свежие данные, а мы их как-нибудь да починим.

В этом году обновления удивляют даже старожилов

С началом 2020 года все стало значительно интереснее. В январе и феврале новые версии ФИАСа просто не выходили. С марта обновления возобновились, но каждый раз со своими увлекательными особенностями.

2 марта:
• появилась 1000 объектов на уровне «сельское поселение». Раньше на этом уровне объектов не было. А в апреле они снова пропали;
• началась веселая круговерть ссылок между адресными объектами. В ФИАСе у каждого объекта есть версии. Если версия отмечена как неактуальная, она содержит ссылку на следующую. Переходя по цепочке из ссылок, мы выходим, наконец, на свежие данные. В новом ФИАСе бывает так: версия 1 ссылается на 2, 2 — на 3, а 3 — обратно на 1;
• некоторые цепочки ссылок прервались. Это сестра предыдущей проблемы: объект 1 ссылается на 2, 2 — на 3, а 3 не существует;
• тысячи улиц и домов вдруг стали неактуальными. Случись такое в реальности, это был бы снос масштаба нацпроекта.

9 марта пропала Уфа и другие города Башкортостана. 31 марта пропала запись о Краснодарском крае. 13 апреля пропал Адлерский район в городе Сочи.

Мы фиксили критичные проблемы, но в каждой следующей выгрузке появлялись и появляются новые. «Примерно так я представляла борьбу с гидрой» (Лена Расторгуева, главная по продукту «Фактор»).

Все окончательно запуталось, когда девять крупных городов Московской области переехали на уровень «район»

В обновлении от 5 июня Одинцово, Наро-Фоминск и еще семь городов МО вдруг превратились в районы.

Для тех, кто разбирается в структуре ФИАСа: теперь у Одинцово aolevel = 3 (район). При этом деревни, которые и раньше были ему подчинены, сохранили подчинение с aolevel = 6 (населенный пункт). А города, которые были в Одинцовском районе, тоже стали подчинены Одинцово, сохранив aolevel = 4. Таким образом, город Кубинка, например, теперь принадлежит городу Одинцово. Получается город в городе.

Причем у нас есть основания полагать, что список «переехавших» городов будет только расширяться.

Если привязать к бизнесу, новый расклад означает, что из CRM у кого-то исчезнут Одинцово и Наро-Фоминск. Не получится посчитать стоимость доставки или выбрать клиентов из города для рассылки. Потому что теперь это районы, а не города.

Все это очень неприятно

По названным причинам мы не будем загружать последнюю версию ФИАСа, пока не придумаем костыли. В своих продуктах используем ФИАС от 2 июня, города там еще в порядке. Заказчикам поставим эту же версию.

Но нам еще ничего — HFLabs 15 лет только и занимается тем, что приводит данные в порядок и разбирается в справочниках. Жалко остальной бизнес в стране, который озабочен совершенно другими вещами: логистикой, страхованием, банковским делом и чем угодно, связанным с адресами. ФИАС заставляет и этих специалистов вникать в причудливую структуру адресов и ошибки справочника.

У нас один совет и одна просьба

1. Если вы хоть где-то используете ФИАС, лучше пока не трогать обновления после 2 июня. Если и обновлять, то с тестированием всех процессов, завязанных на адреса.
2. Нет ли у вас контакта, по которому можно выйти на ответственного человека в ФНС? Официальная служба поддержки повлиять на ситуацию не в состоянии. А хотелось бы по меньшей мере понять, что вообще происходит со справочником. Если есть какой-то контакт, напишите в личку Елене Расторгуевой @elenar_17, пожалуйста
🍩 Блоги авторов, которые работают в HFLabs

Собрали подборку блогов (в широком смысле), которые ведут коллеги. Авторы — золото, смело рекомендуем.

1. «Интерфейсы без шелухи». Заметки о продуктоводстве, здравом смысле и разработке софта. Без шелухи, визуальной карамели и «полезных ссылок».

Канал ведет Антон Жиянов, главный по dadata.ru. «Интерфейсы без шелухи», не побоюсь этого слова, — сложившееся и даже цитируемое издание. На минуточку, 12 000 подписчиков. Внутри — личный опыт Антона и четко сформулированные, лаконичные, законченные мысли о продуктоводстве.

2. Oh My Py. Голубь Френк (а на самом деле все тот же Антон Жиянов) раскрывает возможности стандартной библиотеки Python, о которых лучше бы знать.

Добавить к описанию особо нечего — это канал о программировании на «Питоне». От человека, который этот «Питон» перебирал своими руками, да еще и не раз.

3. «Почему так дорого?». Байки про переговоры и отношения с клиентами.

Свежайший канал Константина Степанова — одного из главных по продажам в HFLabs. Костя «тащит» тяжелые корпоративные проекты с выручкой в сотни миллионов рублей. А еще классно рассказывает истории — и на пятничных созвонах команды в «Зуме», и на новогодних корпоративах, и на совещаниях. Подписывайтесь, там будет интересно и полезно (давайте не дадим Косте забросить :)

4. Thank Go! Неожиданный взгляд на язык программирования Golang от двух продактов.

Канал ведет продуктовод нашего «Единого клиента» Михаил Берёзин, на бэк-вокале — Антон Жиянов (куда же без него). Здесь хардкор и разработка-разработка: «Как работают слайсы», «Язык программирования как продукт», «Обработка ошибок в Go» и так далее. Если понимаете, о чем речь, горячо рекомедую: Михаил знает, о чем говорит.

5. Блог Ольги Назиной о тестировании (и совсем немного — о личном).

Ольга 12 лет тестирует ПО, из них 6 — в HFLabs. У нее своя школа начинающих тестировщиков и книга о тестировании в стадии активного наполнения. В последнее время много пишет для новичков, эти посты полезны даже для общего развития. Но можно и поглубже копнуть, такие материалы тоже есть.

В нагрузку — youtube-канал Ольги, тоже о тестировании.

И немного шалостей под конец. Мы не знаем, кто ведет эти аккаунты, но точно кто-то из HFLabs.

1. Логи «Фактора» в «Инстаграме». Очень странно, многозначительно и завораживает.
2. Твиттер ФИАСа. О злоключениях и мытарствах адресного справочника (который на самом деле девочка)
🤼‍♂️ Какой ФИАС вы бы выбрали для работы?

Недавно мы писали о приключениях с государственным справочником адресов. С тех пор ситуация нисколько не улучшилась, попробуем найти выход.

Вот есть у вас учетная система: АБС, CRM, еще что-нибудь важное для бизнес-процессов. Какой ФИАС вы бы подключили?

1. Оставлю тот, что работает сейчас. Пусть старая версия, зато проверенная. Ничего, что могут быть проблемы с отчетностью в ЦБ и АСВ.

2. Выберу новую версию, где вручную поправили проблемы с городами Московской области (Одинцово — опять город, а не район). Переживу, что с отчетностью в ЦБ и АСВ тоже могут быть проблемы.

3. Предпочту свежую версию, которую выкладывает ФНС. С ней, по крайней мере, можно сдать отчетность в ЦБ и АСВ. Предусмотрю, что из-за путешествий городов МО между уровнями может отвалиться бизнес-логика.

4. Мне для работы вообще не нужен ФИАС.

Какой вариант ФИАСа выберете?
Если есть развернутый комментарий, пожалуйста, напишите в чате или продуктоводу «Фактора» Лене Расторгуевой @elenar_17. Ответы повлияют на то, как мы будем действовать дальше
🧑‍🤝‍🧑 Как работает поиск антидубликатов в «Едином клиенте»

В начале июня мы представили «Антидубликаты» — свежий подход к сокращению «серой зоны». «Единый клиент» по-новому проверяет карточки, которые формально могут описывать одного человека. Теперь система по неким признакам понимает, когда речь точно идет о разных клиентах. Такие записи «Единый клиент» выводит из «серой зоны», сокращая ее без участия дата-стюардов.

При поиске антидублей важны паспорта, телефоны и адреса

90+% «серой зоны» — это люди, у которых совпадают только ФИО и день рождения. Именно в этой массе мы ищем антидубли.

Итак, задача: найти среди пар похожих клиентов тех, кто гарантированно не является одним человеком. Посмотрев на статистику, мы собрали три правила поиска таких антидубликатов:
•‎ конфликтуют паспорта РФ, а также регионы в адресах;
•‎ конфликтуют регионы в адресах и телефонах (и хотя бы в одной карточке нет паспорта);
•‎ конфликтуют регионы в адресах (хотя бы в одной карточке нет паспорта, хотя бы в одной карточке нет телефона).

Дополнительный критерий: места рождения

Придумав критерии, мы нашли антидубли в базе заказчика и отдали дата-стюардам. Ребята посмотрели: «В целом хорошо. Но мы опасаемся ставить „Антидубликат“ парам, у которых кроме ФИО и даты рождения совпадает место рождения. Велик риск, что речь идет об одном человеке».

Поэтому места рождения хорошо бы сравнить. А для этого привести их к одному формату — стандартизировать. Но название регионов, городов и стран меняются. Даже один населенный пункт записывают в паспортах по-разному.

Не буду рассказывать о сложностях, с которыми мы столкнулись. Было тяжело, но мы наладили стандартизацию.

Чтобы «Единый клиент» посчитал места рождения разными, должен сработать любой из критериев:
•‎ не совпали страны в карточках клиентов;
•‎ не совпали регионы при одинаковой стране;
•‎ не совпали группы «район + город + населенный пункт» при одинаковых стране и регионе.

Проверка места рождения — опция, можно и без нее.

Исключения и тонкости

Изучив кейсы с антидублями, мы нашли исключения из правил.

Сравнивая паспорта, мы сравниваем ОКАТО-коды регионов. При этом за прошедшие годы часть кодов мигрировала между субъектами, некоторые коды упразднили. А еще есть два резервных кода, паспорта с ними выдают в разных регионах. Поэтому при сравнении паспортов мы считаем некоторые коды неконфликтными.

Сравнивая адреса и телефоны, мы также считаем неконфликтными часть регионов. Обычно это субъекты федерации, которые территориально находятся внутри других субъектов.

Подключаем антидубли как доработку

Мы уже внедрили новую технологию в крупном банке. Подключаем как доработку: предварительно анализируем данные заказчика и полируем алгоритмы поиска. Если интересно, обращайтесь, все расскажем.

Полная статья с примерами картинками, примерами и списками неконфликтных регионов — в нашем блоге http://amp.gs/wj6x
HFLabs — о клиентских данных
📞 Сбербанк сделал сервис для проверки телефонных номеров Крупнейший банк страны выкатил страничку, где можно проверить, не мошенники ли на проводе https://www.sberbank.ru/promo/antifraud/check.html. Штука в принципе полезная: например, во время самоизоляции…
Помните, мы писали о сервисе Сбера для проверки мошеннических звонков? Он больше не считает телефоны «Тинькофф банка» и «Альфа-банка» подозрительными. Молодцы, что допиливают