Как найти клиентов дубли

В прошлой статье мы осторожно познакомились с «кентаврами» — существами, часто очень волшебными, которые появляются из-за ошибок при создании единой клиентской базы. Разговор получился довольно поверхностным, мы не рассмотрели детали вблизи.

Исправляемся, начинаем цикл статей о поиске похожих клиентов, слиянии их данных, последующем обновлении и возможном разделении. Начнем с поиска дубликатов.

Знакомьтесь — Иван Травин

Иван Травин — обычный клиент обычного банка. Этот замечательный гражданин поможет нам разобраться с поиском дублей в клиентских базах.

Иван открыл в банке счет, получил кредитную карту и недавно отправил через сайт заявку на кредит наличными. Поскольку у господина Травина три продукта, банк хранит записи о нем в трех разных IT-системах.

Иван Травин открыл банковский счет, оформил кредитную карту и подал заявку на кредит наличными
Для простоты и наглядности представим: все, что известно банку об Иване — имя, фамилия и номер телефона без кода города

И вот настал чудесный день: банк решил прибраться в клиентской базе, а для этого загрузил данные из всех источников в CDI-систему. Ее задача: собрать данные из разных баз в единые «золотые» карточки клиентов, а дубли удалить.

На этом этапе система должна решить, какие записи относятся к одним и тем же людям. Но как она это сделает?

Есть три главных подхода к поиску похожих карточек.

Жесткие правила

Самый простой вариант, который первым приходит в голову: если данные совпадают, карточки принадлежат одному человеку. Если нет — разным. Получается примерно следующая ситуация.

Все просто: номера телефонов разные — люди разные

Но буду честным: я бы не поставил зарплату на то, что Иваны Травины справа — разные. Опечатки в номерах встречаются постоянно: порядок цифр мог перепутать оператор, когда заполнял карточку клиента. Или сам Иван, когда оставлял заявку на кредит. Различие столь мало, что перед нами наверняка один клиент.

Что ж, исправим ситуацию: добавим жесткое правило, что карточки из примера справа мы считаем идентичными.

Принимаем волевое решение: считать клиентов одним человеком, если карточки различаются только порядком двух цифр в номерах телефонов

Тут и проявляется главная проблема подхода: на каждое несоответствие данных теперь понадобится свое правило: для опечаток, замен (например, «ул.» и «улица») и так далее. Причем все ситуации с расхождением данных не предусмотреть, их бесконечно много.

Как ни старайся, все случаи различий в данных правилами не покрыть
В одних случаях мы задали жесткое правило: карточки признавать дублями. В других строго определили: клиентов считать разными. Но большинство квадратов белые, потому что невозможно покрыть правилами все многообразие ситуаций

К тому же правила жестко привязаны к данным. Если формат или характер данных однажды изменится — правила сломаются.

Дата-стюарды заметили, что абоненты одного из сотовых операторов часто ошибаются в телефонном коде. Например, при заполнении формы на сайте порядок цифр. Под опечатку в банке создали правило.

Через год у мобильного оператора сменили код, и все завязанные на этот код правила сломались.

Жесткие правила никуда не годятся. Даже не уверен, что их реально кто-то использует до сих пор. Но это и не важно: нам такой подход нужен как стартовая точка, худший из существующий вариантов.

Теперь можно двигаться дальше.

Вероятностная модель

Следующая идея, которая приходит в голову, — ввести скоринговый коэффициент «похожести». Это число показывает, насколько записи схожи. Если мы знаем, как его найти, остается выбрать порог и выше него считать карточки дубликатами.

Все, что не проходит по коэффициенту «похожести» — не дубли
Все пары ниже скорингового порога мы признаем не-дублями

Выглядит логично, пока мы не сталкиваемся с ситуацией как на картинке ниже.

Опечатка в фамилии   совсем не то же самое, что смена порядка двух цифр в номере телефона

Изменение порядка цифр в номере телефона — вполне себе опечатка. Другая буква в фамилии — не факт. Речь может идти о совершенно другом человеке.

Вероятностный подход отлично учитывает количество отличий, но не обращает внимания на качество, контекст этих отличий. Поэтому мы не полагаемся на чистый скоринг при поиске дублей.

Когнитивный подход

Совместим идеи! Возьмем скоринговый коэффициент из вероятностного подхода и наложим на него бизнес-правила и контекст отличий. Правила выглядят примерно так.

При когнитивном подходе коэффициент «похожести» зависит от контекста различий

В зависимости от контекста отличий меняется итоговое значение «похожести» записей. Теперь можно разделить ситуации, которые при предыдущем подходе набирали одинаковое количество баллов.

Р-р-раз, и мы разделяем случаи с опечаткой в фамилии и с перепутанным порядком цифр в номере телефона

Если визуализировать такие правила, получим следующее.

Все намного сложнее и многообразнее, чем при жестких правилах и вероятностном подходе
Красные и желтые квадратики выше синей линии — ложные дубликаты. По вероятностной модели мы бы ошибочно посчитали такие карточки дублями. Обратная ситуация с зелеными квадратиками ниже линии

Такой идеей мы исправили слабые стороны и жесткого и вероятностного подходов:

  • не нужно учитывать тысячи мелких отличий, потому что они считаются автоматически на основе скорингового покомпонентного коэффициента;
  • бизнес-правила и контекст отличий мы учитываем с помощью жестких правил верхнего уровня. Их относительно немного.

Для четких правил нужен опыт

Для статьи мы взяли ситуацию, когда данных очень мало: только фамилия, имя и телефон. Если данных больше, правила становятся сложнее. Например, ниже — реальное правило поиска дубликатов в нашем «Едином клиенте».

Чем больше данных в карточках клиентов, тем сложнее правила

Таких правил сотни, мы копили их десятки лет и выделяли специфичные для разных сфер бизнеса. Мы постоянно анализируем и улучшаем правила, а все изменения покрываем автотестами. В результате при внедрении «Единого клиента» нужно лишь тонко подстроить проверенный набор правил под конкретного заказчика. Поэтому HFLabs дает быстрый результат.

Пара слов о конструкторах правил

Порой нам говорят: вся эта история с правилами очень сложная. А «Единый клиент» — дорогой, потому что вы продаете его вместе со своей экспертизой и опытом в виде этих самых правил.

Мол, существует другой класс систем: красивые конструкторы с визуальный интерфейсом. Можно взять такой конструктор и относительно быстро накидать покомпонентные правила поиска дубликатов. Никакой «Единый клиент» не понадобится.

Конструкторы выглядят прекрасно на картинках, но в жизни пользоваться ими сложно
Поклонники таких продуктов утверждают, что бизнес сможет самостоятельно настроить правила поиска дублей. Вот же, все наглядно

Спору нет, такая красота хороша на презентациях. Но в жизни этими красивыми стрелочками и фигурками придется рисовать те же самые сотни правил, которые у нас уже есть. Интерфейс не убережет от формализации правил и даже не облегчит задачу.

Наш опыт однозначно говорит: даже если конструктор очень красивый, бизнес не готов настраивать в нем сотни правил, тестировать их и поддерживать изменения. Это очень сложно.

Еще один «бонус» конструкторов — усложнение правил и настроек непропорционально сильно замедляет систему.

Продолжение цикла о теории CDI — «Что делать с гарантированными дублями».

В этой статье расскажем, откуда берутся дубли, чем они мешают бизнесу, и как избавиться от дубликатов, консолидировать клиентскую базу и держать ее под постоянным контролем.

Почему дубли вредят бизнесу

Пожалуй, все сталкивались с тем, что один и тот же клиент заведен в базах данных компании несколько раз. Причин этому множество, в том числе, любимый «человеческий фактор». Например, клиент авторизовался на сайте интернет-магазина, а потом позвонил в call-центр или обратился лично и менеджер повторно внес его данные.

Путаница в клиентской базе может обернуться большой проблемой для компании и вот почему:

  1. Ошибки в проведении маркетинговых кампаний, планировании продаж, закупок и т.д.
  2. Репутационные потери, возникающие, например, в следствие ошибочных рассылок и спама.
  3. Отток клиентов из-за того, что усилия на удержания не доходят до нужных адресатов.
  4. Лишние траты на коммуникации с клиентами.
  5. Отсутствие четкого представления о реальном объеме клиентской базы, т.к. зачастую дубли могут составлять десятки процентов от общего количества контрагентов.

Перечисленные последствия — малая часть проблем. Cо временем они усугубляются и разрастаются, как болезнь, становятся причиной все бОльших и бОльших убытков.

Что же такое дубли

В общем случае под дублями понимаются несколько записей в учетных системах, относящихся к одному клиенту. Типичный пример таких данных:

Карточки 1 и 4 являются полностью идентичными и относятся к одному клиенту, при этом карточка 3, вероятно, также относится к этому же клиенту, а различие обусловлено опечатками и пропусками при заполнении. А вот карточка 2 относится к совершенно другому клиенту и не является дублирующей. Таким образом, можно выделить полные и потенциальные дубли.

Основной задачей дедупликации является настройка таких алгоритмов поиска, которые с одной стороны, максимизируют количество записей, относящихся к одному клиенту, а с другой — минимизируют ложные срабатывания, т.е. попадания в группу дублей записей о другом клиенте.

Как с ними бороться

Большинство негативных последствий можно избежать, если «причесать» информацию, настроить и внедрить систему дедупликации данных.

Наиболее эффективный подход, используемый в решении Loginom Data Quality для устранения проблемы дублей, состоит из следующих шагов:

  1. Предварительная очистка и обогащение данных о клиентах.
  2. Подготовка стратегии поиска дублей — задание условий, при выполнении которых записи будут считаться совпадающими.
  3. Тестирование стратегии на реальных данных и ее корректировка при необходимости.
  4. Задание правил формирования «золотой» записи — записи о клиенте с максимально заполненными и актуальными атрибутами, такими как ФИО, телефоны, документы, дата рождения и т.д.

Расскажем подробнее о каждом шаге поиска дублированных записей.

Очистка клиентских данных

До начала дедупликации нужно оценить степень загрязненности карточек клиентов. Как правило, ситуация с качеством данных в CRM-системах сложная. Операторы вводят данные о контрагентах «как придется».

Одна из проблем — разные форматы атрибутов клиентов: ФИО, телефоны, e-mail, документы, адреса. Распространенная ситуация, когда ФИО записано в CRM-системах в разных последовательностях, например, Александров Иван Сергеевич и Иван Сергеевич Александров. Еще чаще не структурированы адресные данные, номера телефонов и документов.

Такие записи при автоматической проверке на полное совпадение будут определены как разные. В этих случаях для повышения эффективности поиска дублей все атрибуты приводятся к унифицированному стандарту, а адреса к формату ФИАС.

Другая проблема — опечатки:

— Ошибочный ввод символов, расположенных рядом на клавиатуре, например, вместо Федор пишут Ыедор или вместо 74 АА 397530 записано 74 АА 297530.

— Смешанные символы из разных алфавитов со схожим написанием, например, в написании номера водительского удостоверения 74 АА 397530 символ А может быть записан латиницей и такое написание не совпадет с написанием полностью на кириллице.

— Неверный язык при вводе букв, например, Иван будет записан как Bdfy.

Все эти типы ошибок учитываются в решении Loginom Data Quality для формирования «чистых» клиентских атрибутов, которые позже направляются на дедупликацию.

Методы и стратегии поиска дублей

В общем случае можно выделить два подхода для сравнения записей и поиска дублей — полное совпадение и нечеткое сравнение. Каждый из подходов имеет свои плюсы и минусы.

Проверка на полное совпадение является простой и быстрой, что особенно важно, когда клиентская база — десятки миллионов записей. Однако, для корректного решения задачи дедупликации недостаточно только точного совпадения клиентских атрибутов. Множество клиентских записей содержат опечатки и пропуски, поэтому точное сравнение не позволит найти все дубли, следовательно, их не получится очистить и стандартизировать.

Для улучшения качества дедупликации целесообразно применение нечеткого сравнения — сопоставления значений на основе метрик схожести, таких как расстояния Хемминга, Левенштейна, Дамерау-Левенштейна.

Такие методы позволяют найти кандидатов в дубли, которые невозможно обнаружить при помощи сравнения на полное совпадение, но расчет нечетких метрик схожести является ресурсоемким. Это приводит к снижению производительности на больших объемах данных, а также необходимости оптимизировать процедуру сравнения, что является нетривиальной задачей.

В решении Loginom Data Quality для поиска дублей используется комбинированный подход с использованием точного и нечеткого сравнения, который выражается в применений стратегий поиска — наборов условий сравнения различных клиентских атрибутов, при выполнении которых записи будут считаться дублями.

Рассмотрим примеры стратегий поиска дублей для сравнения следующих записей:

Видно, что в ФИО значения расходятся в один символ, поэтому использовать точное сравнение по данным атрибутам нельзя. В качестве метрики выберем расстояние редактирования. Если мы зададим его равным 1, то, казалось бы, найдем нужные дубли, но при этом записи 5 и 6 имеют разное имя и явно относятся к разным клиентам. Для этого нужно при сравнении записей учитывать длину строк.

Таким образом, получаем один из критериев сравнения — расстояние редактирования не более 1 и при этом, не более 25% от длины сравниваемых строк. Но и в этом случае могут возникнуть ошибки.

Так, в записи 2 может оказаться значение Трынов и строки 1 и 2 уже будут относятся к разными клиентам. Да и в целом, даже полное совпадение ФИО не дает основания считать записи дублями. Нужно вводить еще один критерий на точное совпадение, например, по дате рождения.

Здесь есть два варианта:

  1. Не обращать внимания на null и считать записи дублями. Подходит чаще при сравнении контактных данных: e-mail, номера телефонов.
  2. При наличии null в данных не считать записи дублями и отправлять на ручную проверку. Применимо к ключевым атрибутам — фамилия, имя, отчество и т.п. Например, в ситуации в таблице выше лучше использовать данный вариант.

Также, стоит обратить внимание на то, что некоторые дубли не всегда можно выявить автоматически. В этом случае используются более «мягкие» стратегии — наборы условий с менее жестким порогом совпадения. Результаты работы таких стратегий далее попадают на ручную обработку.

Подведем итоги

  1. Методы поиска дублей бывают точные и нечеткие.
  2. Для наиболее эффективного поиска дублей необходимо формировать стратегии, которые охватят все возможные варианты совпадений.
  3. Не все дубли можно выявить в автоматическом режиме, поэтому некоторые результаты поиска идут на ручную обработку.
  4. Для наибольшей эффективности поиска дублей, необходим индивидуальный подход к формированию стратегий.

Поиск и удаление дублей клиентов и контактных лиц

  • Механизм поиска и замены дублей клиентов и контактов
  • Поиск дублей клиентов
  • Поиск дублей контактных лиц
  • Удаление дублей клиентов и контактов

Своевременный контроль за клиентской базой, а также удаление дублей клиентов и контактных лиц является неотъемлемой задачей для поддержания актуальности наработанной базы. При этом важно, чтобы вся информация из объекта дубля полностью переносилась в объект оригинал, так как потеря контактной информации, интереса или активного взаимодействия ведет к финансовым и репутационным потерям.

Подробнее о контроле наличия дубликатов клиентов и контактных лиц можно прочитать в статье «Контроль наличия дубликатов клиентов и контактных лиц».

Механизм «Поиск и замена дублей клиентов и контактов» находится в разделе Клиенты → Сервис.

Поиск и замена дублей клиентов и контактов

Поиск и замена дублей клиентов и контактов

По умолчанию форма «Поиск и замена дублей клиентов и контактов» предзаполнена следующим образом: поиск дублей будет осуществляться по одинаковому наименованию клиентов, также будут выводиться сопоставленные дубли клиентов и контактов.

Предзаполнение формы «Поиск и замена дублей клиентов и контактов»

Предзаполнение формы «Поиск и замена дублей клиентов и контактов»

Важно!
Не рекомендуется отключать опции «Выводить сопоставленных клиентов»/«Выводить сопоставленные  контакты», т.к. может быть утеряна информация о ранее сопоставленных дублях.

Сопоставленными клиентами и контактами являются те объекты, которые пользователи предложили как дубли.

Также перейти к механизму «Поиск и замена дублей клиентов и контактов» можно из форм Клиенты и Контактные лица клиентов. Для этого на формах списков в меню «Еще» выбрать команду «Поиск и замена дублей».

Переход к механизму «Поиск и замена дублей» из формы Контактные лица клиентов

Переход к механизму «Поиск и замена дублей» из формы Контактные лица клиентов

При переходе к механизму «Поиск и замена дублей» из формы списка Клиенты по умолчанию механизм предзаполнен опцией «Выводить сопоставленных клиентов».

При переходе к механизму «Поиск и замена дублей» из формы списка Контактные лица клиентов по умолчанию механизм предзаполнен опцией «Выводить сопоставленные контакты».

Механизм «Поиск и замена дублей клиентов и контактов» позволяет искать дубли клиентов по следующим параметрам:

  • по наименованию;
  • по публичному наименованию;
  • по телефону;
  • по эл. почте.

По умолчанию поиск по параметрам «по наименованию» и «по публичному наименованию» осуществляется по полному совпадению слов. Это указано в настройке рядом с параметром «одинаковые».

Поиск дублей клиентов по полному совпадению слов

Поиск дублей клиентов по полному совпадению слов

Для того, чтобы найти дубли клиентов по похожему «наименованию»/«публичному наименованию» необходимо изменить настройку напротив нужного поля на «похожие».

Поиск дублей клиентов по полному похожим словам

Поиск дублей клиентов по полному похожим словам

При переключении настройки поиска по «похожим», становится доступна настройка уровня сходства слов. Настройка варьируется от поиска не отличающихся наименований до отличающихся значительно.

Настройка уровня сходства слов

Настройка уровня сходства слов

Поиск дублей клиентов по e-mail

Поиск дублей клиентов по e-mail

В настройках (Настройки) на форме «Поиск и замена дублей клиентов и контактов» можно выбрать те домены, которые будут игнорироваться при поиске дублей по эл. почте. По умолчанию настройка предзаполнена распространенными общедоступными доменными именами. Для изменения списка предзаполненных доменов необходимо нажать на гиперссылку с доменами и в открывшемся окне удалить уже имеющийся домен или добавить новый.

Настройка доменов для поиска дублей

Настройка доменов для поиска дублей

Устанавливая настройки для поиска дублей можно воспользоваться отбором для поиска и сравнением по реквизитам.

Отбор для поиска дублей

Отбор для поиска дублей

Чтобы осуществить отбор, необходимо нажать напротив поля «Отбор для поиска» на команду «Без условий». В открывшемся окне «Установка параметров проверки условий» с помощью команды «Добавить новый элемент» добавить новый отбор. После его заполнения, нажать кнопку «ОК».

Отбор для поиска дублей

Отбор для поиска

Для того, чтобы найти дубли клиентов с учетом сравнения реквизитов в карточке клиента, необходимо нажать напротив поля «Сравнивать по» на команду «Выберите реквизиты». В открывшемся окне выбрать требуемый реквизит, после закрыть окно, нажав на крестик.

Настройка «Сравнивать по»

Настройка «Сравнивать по»

Важно!
Функция «Сравнивать по» ищет дубли по И, если в остальных настройках поиска стоит поиск «Одинаковые». Функция «Сравнивать по» ищет дубли по ИЛИ, если в остальных настройках поиска стоит поиск «Похожие» (при этом настройка уровня сходства слов может оставаться в статусе «не отличается»).

Если по факту поиска дубли не были найдены, система выведет сообщение «Дубли не найдены».

Сообщение «Дубли не найдены»

Сообщение «Дубли не найдены»

Аналогично клиентам, осуществляется поиск дублей по контактам.

Настройка поиска дублей по контактам

Настройка поиска дублей по контактам

Важно!
При необходимости искать дубли контактных лиц по фамилии и имени, поиск настраивается следующим образом: поиск по фамилии, в настройке «Сравнивать по» требуется выбрать «Имя» (аналогично, если нужен поиск и по отчеству).

Поиск контактов по фамилии и имени

Поиск контактов по фамилии и имени

Результат поиска дублей отображается в правой части экрана.

Отображение найденных дублей

Отображение найденных дублей

Важно!
Контакты или клиенты, уже помеченные на удаление, будут отображаться зачеркнутыми.

К дублям, найденным системой автоматически, добавляется комментарий «Дубль найден автоматически». Напротив дублей, которые нашли пользователи, будет отображаться комментарий, который написал пользователь. Если пользователь не оставил комментарий, тогда поле останется пустым.

Для того, чтобы сопоставить найденные дубли, необходимо проверить их на корректность. Для этого требуется выбрать нужный дубль и открыть гиперссылку «Показать найденные ссылки». В открывшемся окне будет указана вся информация по выбранному объекту. На основании этих данных администратор принимает решение об удалении дубля.

Отображение найденных ссылок

Отображение найденных ссылок

Неверно найденные дубли можно удалить из списка. Для этого необходимо выбрать ошибочный дубль и выполнить команду Исключить. Чтобы изменить оригинал в ветке дублей, необходимо выбрать нужный контакт (или нужного клиента) и выполнить команду Отметить как оригинал. После того, как была произведена проверка найденных дублей, необходимо выбрать команду Сопоставить дубли.

Команды для коррекции списка найденных дублей

Команды для коррекции списка найденных дублей

Для удаления дублей необходимо отметить галочками в столбце «Заменить» те дубли, которые будут впоследствии удалены и нажать на кнопку «Перейти к удалению».

Заменить дубли

Заменить дубли

На форме удаления дублей также можно исключить те дубли, которые в дальнейшем будут удалены или помечены на удаление.

Форма удаления дублей

Форма удаления дублей

Чтобы пометить дубли на удаление, необходимо удостовериться, что снята галочка «Непосредственно удалять объекты». После чего все дубли, отмеченные как «Заменить», после нажатия на команду Пометить на удаление будут помечены на удаление.

Пометить на удаление

Пометить на удаление

Чтобы удалить дубли необходимо поставить галочку в поле «Непосредственно удалять объекты». И выполнить команду Удалить дубли.

Пометить на удаление

Удаление дублей

После осуществления операции удаления дублей или пометки их на удаление можно вернуться к окну поиска дублей. Для этого нажимаем на кнопку «Перейти к поиску».

Для просмотра помеченных на удаление дублей в окне поиска дублей выполняется команда Показать помеченные на удаление.

Просмотр дублей, помеченных на удаление

Просмотр дублей, помеченных на удаление

Помеченные на удаление объекты можно удалить либо с помощью команды Удаление помеченных объектов или выбрав команду Показать помеченные на удаление, возле необходимых дублей поставить галочку «Заменить», после чего — «Перейти к удалению», поставить галочку напротив поля «Непосредственно удалять объекты» и нажать на кнопку «Удалить дубли».

Вернуться к списку статей

17 октября 2022

Обновлено: 29.03.2023

537

Время чтения: 5 минут

Содержание

Бывает клиент заполняет форму на сайте, потом звонит в компанию, чтобы сделать заявку и еще пишет в мессенджеры. CRM, сммщик и менеджер сохраняют три контакта, хотя это один человек. Предпринимателю кажется: клиентов много и заявок тоже, а на самом деле — втрое меньше. В системе три сделки, а по факту одна и два дубля.

В этой статье расскажу, почему дубли в CRM — это плохо, как их убрать и как мы сделали 100% защиту от них в OkoCRM.

Попробуйте OkoCRM бесплатно

CRM-система, управление проектами и задачами, общение с клиентами и каналы продаж — всё внутри OkoCRM. 7 дней бесплатно.



На страницу OkoCRM

Что такое дубли и чем они опасны

Дубли — карточки контактов или сделок с одинаковыми данными. Из-за них возникает путаница в отделе продаж. Например, с одним клиентом общаются два менеджера. Или дважды отправляем письма одному и тому же человеку.

Если клиентская база огромная и дублей много, то компания потратит денег на рассылку, а продаж будет меньше, чем ожидается. Минус клиенты, минус деньги. Да и статистика в CRM не будет биться с реальными цифрами. По отчетам менеджеры — молодцы, а по деньгам в кассе не так радужно.

Скажу честно: я пыталась добавить дубли в OkoCRM, чтобы показать как они выглядят. Но у меня не получилось. Наши ребята смогли защитить систему от дублирования контактов так, что дубли нельзя создать физически. Как — расскажу в следующих разделах.

Чтобы показать, что такое дубли, я зарегистрировалась в другой известной CRM на букву А. Здесь не пришлось танцевать с бубном, дубли создаются в любом количестве и на любой вкус. Просто добавляешь несколько контактов с одинаковыми номерами телефонов, система дает это сделать. Вот что получается.

Три Анны с одинаковыми номерами телефона система пропустила. Можно ввести ФИО одинаково и по-разному, CRM создаст любой контакт.

Надеяться на защиту от повторов не стоит. Я выбрала поиск дублей в CRM и мои ожидания оправдались: большая и ракрученная система не нашла три одинаковых номера среди пяти контактов.

Как нет? А как же три одинаковых номера телефона? CRM-система их не заметила.

Теперь представьте, что в базе 20 000 человек, половина из них повторяются, а CRM их в упор не видит. Огорчение.

Как дубли обманывают ожидания предпринимателей

У нас был случай: пришел клиент, недовольный другой CRM-системой. Продаж было меньше, чем показывала CRM. Предприниматель захотел попробовать нашу систему. Мы начали переносить клиентскую базу в OkoCRM, а после переноса недосчитались 12 000 контактов. Это значило только одно: в базе было 12 000 дублей. 12 000, Карл!

Теперь понятно откуда они появляются. Если CRM сохраняет любые контакты и ей не важно сколько раз уже этот номер телефона или e-mail сохранен в базе, то повторяющихся контактов может быть даже миллион.

OkoCRM для малого бизнеса

Простая система для автоматизации продаж, проектов, клиентской базы и чатов с клиентами за адекватные деньги. Попробуйте, 7 дней бесплатно.



Больше про OkoCRM

Как работает защита от дублей контактов в OkoCRM

В OkoCRM нельзя создать новую карточку с телефоном или адресом электронной почты, если они уже внесены в клиентскую базу. Пытаюсь продублировать контакт Натальи Макаровой. Создаю карточку, ввожу ФИО и email → система говорит, что этот адрес уже использован.

OkoCRM не дает сохранить контакт. Если email уже есть в клиентской базе, появляется сообщение «поле уже занято».

То же самое с дубляжом телефонных номеров. Система распознает номера, которые записаны по-разному. Например, +79150000000, +89150000000 и 9150000000 — один и тот же номер. Но ни один из этих вариантов OkoCRM не пропустит, если в клиентской базе уже есть номер +79150000000. OkoCRM пресекает любую возможность добавить номер еще раз.

В OkoCRM нельзя создать новый контакт с номером телефона, который уже есть в базе. Даже если номер записан через +7 ввести и сохранить его через +8 не получится.

Еще OkoCRM при импорте базы из Excel проверяет дубли клиентов. Если находит, объединяет несколько контактов в один.

Когда появляются дубли. Все же повторные контакты могут появиться, но это не совсем дубли: карточки с небольшими отличиями контактных данных. Например, покупатель заполнил форму на сайте и специально изменил последние цифры: чтоб отдел продаж не названивал. А потом написал на вотсап и сотрудники сохранили его контакт с реальным номером.

Получается, имя одно, а телефоны разные. Там, где не настоящий телефон, скорее не дубль, а фейковый заказ, его можно удалить руками. А еще бывают клиенты-полные тески, поэтому на имя защита от дублей не срабатывает. Нам кажется это логично.

Как работает защита от дублей сделок в OkoCRM

В OkoCRM можно добавить карточку сделки двумя способами. Спойлер: один защищает от одинаковых сделок, второй — нет.

В карточках контакта. Чтобы создать сделку из карточки контакта, нужно открыть вкладку «Сделки». Здесь есть информация об уже существующих сделках, в таком случае повтора не будет. Сотрудникам не нужно следить, какие сделки уже есть.

В разделе «Сделки» в карточке контакта видно, что с Павлом уже работают.

В разделе «Сделки». Если создавать сделку в разделе, то система добавит новую карточку даже если сделка с этим клиентом уже есть.

Карточек сделки с Павлом две: первая и четвертая. Если на доске много карточек, сотрудники могут не заметить одинаковые.

Поэтому для защиты от повторов лучше добавлять сделки из карточек контактов. Так сотрудники смогут проверить, что с клиентом уже работает другой сотрудник. Или взять за правило и не создавать сделки вручную — пусть автоматизация создает их сама.

Попробуйте OkoCRM бесплатно

Простая система для автоматизации продаж и общения с клиентами, которую можно настроить под ваш бизнес.
Забирает рутину и превращает заявки в продажи.



Больше про OkoCRM

Как убрать дубли в CRM

Чтобы удалить повторы, нужно сделать две вещи.

Шаг 1. Найти дубли. Почти в каждой системе есть функция их поиска. В разделе «Контакты» или «Сделки» в настройках выбираем «Поиск дублей».

Справа в углу есть настройки. Кликаем и в выпадающем списке выбираем «Поиск дублей».

Шаг 2. Соединить или удалить. Объединение дублей в CRM помогает соединить одинаковые сделки или контакты. Вместо двух-трех одинаковых карточек оставим одну, а вся информация из них сохранится.

После поиска CRM показывает повторяющиеся сделки. Обычно где-то поблизости есть кнопка «Объединить».

CRM-система объединит одинаковые сделки и оставит только одну карточку.

Это не значит, что дубли больше не появятся. В других CRM защититься можно так: обратиться к интеграторам и настроить виджеты для автоматического поиска дублированных сделок и контактов. Или попросить менеджеров проверять базу перед тем, как добавить новый контакт или сделку. Это сложно и отнимает время.

Если не хотите настраивать интеграции и виджеты для защиты от дублей и танцевать с бубнами, велкам ту OkoCRM. Еще во время импорта из другой системы CRM найдет и удалит повторы. И больше не допустит их появления.

Подытожим

  1. Дубли — контакты или сделки с одинаковыми данными
  2. Чтобы избавиться от дублей в CRM нужно найти их через функцию поиска и объединить или удалить лишнее
  3. В OkoCRM 100% защита от дублирования: нельзя добавить контакт с email или номером телефона, которые уже есть в клиентской базе. OkoCRM не сохранит номер телефона даже если вводить его по-другому, например, не через +7, а через +8

Настроим OkoCRM под вас

Не грузим терминами. Делаем настройку как надо. Поможем внедрить OkoCRM, а вы удивитесь результатам.

«Поиск дублей»

Объединяет контакты клиентов
и реквизиты компаний, «размазанные»
по excel-файлам или базам данных.
Учитывает ошибки, опечатки и варианты написания.

  • Sergey Ivanov
  • 1982-03-16 00:00:00.000
  • 4992423036
  • сухонская, москва, 11 д
  • Иванов Сергей Иванович
  • мск сухонска 11/-89
  • 8(916) 823 3454
  • Сережа Иванов
  • 16 мар 82
  • моб 9168-233-454
  • serega.ivnv@mail.ru

Если адресов или телефонов несколько,
берем все. Одинаковые — объединяем

  • Иванов Сергей Иванович
  • 16.03.1982
  • +7 916 823-34-54
  • +7 499 242-30-36
  • 127642, г Москва, ул Сухонская, д 11, кв 89
  • serega.ivnv@mail.ru

Попробовать
бесплатно

Покажем первые 100 объединенных записей.
Дальше — 1 копейка за запись

Кому пригодится

Продавцам

Объединить клиентов из разных баз, чтобы не звонить одному человеку несколько раз.

Сравнить списки покупателей разных продуктов, и понять, чем клиент пользуется, а что можно
допродать.

Маркетологам

Собрать единый список клиентов для рассылки или загрузки в CRM.

Отделить заявки новых клиентов от заявок действующих. И по-разному строить коммуникацию
с людьми.

Производителям товаров и дистрибьюторам

Очистить от дублей список торговых точек, чтобы посчитать, сколько денег приносят магазины
и сколько
продукции туда отгружать.

Аналитикам

Объединить разрозненные списки покупателей и посчитать выгоду от каждого клиента.

Службам сбора задолженностей и безопасникам

Собрать из разнородных баз данных компании все контакты должника.

Сличить клиентов с черным списком. Например, с перечнями террористов или должников.

Event-специалистам

Выделить зарегистрировавшихся людей из списка приглашенных на событие.

Найти постоянных посетителей в списках участников разных мероприятий.

Безопасен для ваших клиентов

Строго чтим 152-ФЗ «О персональных данных».
Файлы храним не дольше суток,
затем автоматически удаляем.
Ничего не передаем
третьим лицам. Закреплено в оферте.

Как объединить записи

1.

Зарегистрируйтесь в «Дадате» или
войдите в аккаунт.

На странице «Поиска дублей» загрузите файлы с данными:

100 записей можно просмотреть бесплатно.
Дальше — 1 копейка за запись

2. «Дадата» обработает файлы и покажет статистику, чтобы вы решили, стоит ли платить за обработку:

С_сайта.xls

и еще 4 файла

Обработали и сравнили 
6970
записей

ФИО, компании, адреса, телефоны, email-адреса

Нашли:

одинаковых: 
43%

записей

их объединили автоматически

Итоговый файл: 
57% от
исходного

 Скачать
фрагмент


В итоговом файле

два листа: «до слияния» и «после слияния».
На первом похожие и одинаковые записи сгруппированы вместе.
На втором — одинаковые записи объединены.

3. Посмотрите фрагмент файла с результатами — это бесплатно.
Если все устраивает, оплатите обработку и скачайте итоговый документ в формате Excel.
Пример: Объединенные.xlsx

A B C D E F G
Вот что получилось после объединения одинаковых записей:
 
Статус ФИО Дата рождения Адрес Телефон Телефон Email
похожи Fedor ovchinnikov 10.12.1990 430000, г Самара info@gazprom.ru
похожи Овчинников Федор 12.10.1990 Самара Кирова 12 +7 846 993-22-63 info@gazprom.ru
уникальный Талалаев Денис Давыдович 630090, г Новосибирск, уд Пирогова, д 2 +7 383 330-32-44
объединен Ященко Ольга Павловна 03.03.2002 197110, г Санкт-Петербург, ул Петрозаводская, д 8, кв 212 зая +79211803489 457 07 25 olga.ya@yandex.ru
объединен Иванов Сергей Владимиров 16.03.1982 129346, г Москва, ул Норильская, д 17, кв 25 +7 916 823-34-54 +7 499 242-30-36 serega.ivnv@mail.ru

«Дадата» автоматически объединила одинаковые записи. А похожие, которые нельзя
схлопнуть без проверки, сгруппировала

Стоимость

«Поиск дублей» не входит в подписку на «Дадату».
До 100 записей объединим бесплатно.
Больше — по 1 копейке за запись.
Если сервис не найдет одинаковых клиентов или компаний — деньги не снимаем.

Понравилась статья? Поделить с друзьями:
  • Финансовый омбудсмен как найти
  • Как исправить речевые ошибки в сочинении егэ
  • Как найти копирование контактов
  • Как найти нод 255
  • Как составить заявление на трудоустройство