Нечёткое текстовое сопоставление

Когда записи в двух таблицах нужно сопоставить по текстовым полям, а эти поля имеют содержание, похожее по смыслу, но разное по написанию, начиная от простых опечаток и различных падежей до перестановки слов, аббревиатур или написания на разных языках, то применение алгоритмов автоматического сопоставления даёт хороший результат только для опечаток или слов с разными падежами. Любимый Fuzzy Lookup в Excel со старым добрым алгоритмом Левенштейна способен сделать только половину работы, а вторую половину записей не удастся сопоставить автоматически, ведь некоторые соответствия способны увидеть только посвященные в историю заполнения данными и создания этих таблиц.
Тогда я предлагаю своим клиентам инструмент для ПОЛУавтоматического сопоставления записей двух таблиц. А именно:
деладю форму с двумя списками (вверху, внизу), в каждый из которых отбираются наборы из нескольких похожих записей, а посвященный оператор выбирает по одной записи из каждого списка и именно эти две записи будут сопоставлены.
На обработку каждого соответствия и принятие решения у оператора будет уходить от 5 до 15 секунд. А на выходе получится табличка с на 100% безошибочно сопоставленными записями.
Приложить усилия, потратить время и “Вуаля”!

Нечёткое текстовое сопоставление изображение 1

Робота додана: 26.05.19

Вгору