Нечёткое текстовое сопоставление

Олександр Рябуха

Свободен

Автоматизирую сбор, хранение, интеграцию, очистку и обработку данных из множественных источников и сред средствами MS Access, SQL, VBA и других языков программирования.

Показать информацию

На сайте: 6210-й
Рейтинг: 203
Бeзопасные сделки: 0
Отзывы: +0 / 0 / -0
В избранных у 1

Специализации

Базы данных (82-й)

Местоположение

Киев

Возраст и опыт

Опыт: 10 лет
На сайте: 6 лет 6 месяцев
Заходил: 1 год назад

Контакты

Контакты видны только авторизованным пользователям

Навыки

sql access

Предыдущая работа Следующая работа

Нечёткое текстовое сопоставление

Когда записи в двух таблицах нужно сопоставить по текстовым полям, а эти поля имеют содержание, похожее по смыслу, но разное по написанию, начиная от простых опечаток и различных падежей до перестановки слов, аббревиатур или написания на разных языках, то применение алгоритмов автоматического сопоставления даёт хороший результат только для опечаток или слов с разными падежами. Любимый Fuzzy Lookup в Excel со старым добрым алгоритмом Левенштейна способен сделать только половину работы, а вторую половину записей не удастся сопоставить автоматически, ведь некоторые соответствия способны увидеть только посвященные в историю заполнения данными и создания этих таблиц.
Тогда я предлагаю своим клиентам инструмент для ПОЛУавтоматического сопоставления записей двух таблиц. А именно:
деладю форму с двумя списками (вверху, внизу), в каждый из которых отбираются наборы из нескольких похожих записей, а посвященный оператор выбирает по одной записи из каждого списка и именно эти две записи будут сопоставлены.
На обработку каждого соответствия и принятие решения у оператора будет уходить от 5 до 15 секунд. А на выходе получится табличка с на 100% безошибочно сопоставленными записями.
Приложить усилия, потратить время и “Вуаля”!

Работа добавлена: 26.05.19