Нечёткое текстовое сопоставление

Олександр Рябуха

Вільний

Автоматизирую сбор, хранение, интеграцию, очистку и обработку данных из множественных источников и сред средствами MS Access, SQL, VBA и других языков программирования.

Показати інформацію

На сайті: 6209-й
Рейтинг: 203
Безпечні угоди: 0
Відгуки: +0 / 0 / -0
В обраних у 1

Спеціалізації

Базы даних (82-й)

Місцезнаходження

Київ

Вік та досвід

Досвід: 10 років
На сайті: 6 років 6 місяців
Заходив: 1 рік тому

Контакти

Контакти видно тільки авторизованим користувачам

Навички

sql access

Попередня робота Наступна робота

Нечёткое текстовое сопоставление

Когда записи в двух таблицах нужно сопоставить по текстовым полям, а эти поля имеют содержание, похожее по смыслу, но разное по написанию, начиная от простых опечаток и различных падежей до перестановки слов, аббревиатур или написания на разных языках, то применение алгоритмов автоматического сопоставления даёт хороший результат только для опечаток или слов с разными падежами. Любимый Fuzzy Lookup в Excel со старым добрым алгоритмом Левенштейна способен сделать только половину работы, а вторую половину записей не удастся сопоставить автоматически, ведь некоторые соответствия способны увидеть только посвященные в историю заполнения данными и создания этих таблиц.
Тогда я предлагаю своим клиентам инструмент для ПОЛУавтоматического сопоставления записей двух таблиц. А именно:
деладю форму с двумя списками (вверху, внизу), в каждый из которых отбираются наборы из нескольких похожих записей, а посвященный оператор выбирает по одной записи из каждого списка и именно эти две записи будут сопоставлены.
На обработку каждого соответствия и принятие решения у оператора будет уходить от 5 до 15 секунд. А на выходе получится табличка с на 100% безошибочно сопоставленными записями.
Приложить усилия, потратить время и “Вуаля”!

Робота додана: 26.05.19