Correspondência Difusa (também chamada de Correspondência Aproximada de Strings) é uma técnica que ajuda a identificar dois elementos de texto, strings ou entradas que são aproximadamente semelhantes, mas não exatamente iguais.
Por que a correspondência difusa?
Correspondência difusa é uma técnica usada na tradução assistida por computador como um caso especial de ligação de registros. Ele funciona com correspondências que podem ser menos de 100% perfeitas ao encontrar correspondências entre segmentos de um texto e entradas em um banco de dados de traduções anteriores.
Como você usa uma correspondência difusa?
Selecione Usar correspondência difusa para realizar a mesclagem, selecione Opções de correspondência difusa e, em seguida, selecione uma das seguintes opções:
- Limite de semelhança Indica quão semelhantes dois valores precisam ser para corresponder. …
- Ignorar maiúsculas e minúsculas Indica se os valores de texto devem ser comparados de maneira sensível ou insensível a maiúsculas e minúsculas.
Como posso melhorar minha correspondência difusa?
Aqui estão algumas maneiras de usar a correspondência difusa para melhorar o resultado final:
- Perceba uma visão única do cliente.
- Trabalhe com dados limpos em que você pode confiar.
- Prepare Dados para Business Intelligence.
- Aprimore a precisão de seus dados para eficiência operacional.
- Enriqueça dados para insights mais profundos.
- Garantir melhor conformidade.
O que é correspondência difusa no MDM?
Uma estratégia de correspondência/pesquisa que usa correspondência probabilística, que leva em consideraçãovariações ortográficas, possíveis erros ortográficos e outras diferenças que podem tornar os registros correspondentes não idênticos. Se selecionado, o Informatica MDM Hub adiciona uma coluna especial (Fuzzy Match Key) ao objeto base.