Obecně o deduplikaci dat
|
V rámci direktmarketingové akce s jakýmkoli zaměřením není vhodné ani účelné oslovovat každého člena rodiny samostatně. A již vůbec ne jednu osobu několikrát, v různých variantách. Tyto nedostatky v provedení výběru zbytečně zvyšují finanční náklady akce. Odstranění těchto opakujících se adres (duplicit) se označuje jako deduplikace dat
K tomuto účelu slouží první z porovnávacích mechanizmů, individuální porovnávání dat. Při zjištění vícenásobného výskytu adresy je důležité ponechat tu nejsprávnější a nejúplnější adresu. Pro názornost uvádíme příklad individuální duplicity (multiplicity):
|
|
|
|

Ke zjištění členů rodiny a ponechání jen jednoho člena rodiny pro následný mailing slouží tzv. rodinné porovnávání dat. Je důležité definovat, která osoba z rodiny má zůstat pro následnou mailingovou akci (např. má být oslovena žena) Pro názornost uvádíme příklad rodinné duplicity:

Jak je z příkladů patrné, nejsprávnější je zde adresa uprostřed a zbylé adresy by měly být po porovnání z výběru odstraněny.
S obdobnou situací se setkáváme i při výběrech firem. Pro odstranění nadbytečných event. nesprávných záznamů lze použít poslední z porovnávacích mechanizmů, a to firemní porovnávání dat. Např. firma A&A spol. s r.o. může být uvedena současně jako A+A s.r.o. nebo A a A sro. To se stává v případech, kdy jsou firemní adresy získávány z několika různých zdrojových databází. V rámci úspor nákladů je třeba rozpoznat a odstranit tento vícenásobný výskyt jedné a téže firmy.
Pozor!
Záměrně byly použity v příkladech adresy, které nebyly zhomologovány. Námi vytvořený porovnávací mechanizmus použitý v aplikaci WorkDB si lehce poradí i s těmito adresami.
Porovnávání dat slouží také pro obohacení původní databáze informacemi z jiných zdrojů, případně nalezení jednotlivých rodinných příslušníků (členů rodiny) nebo vyloučení již obeslaných klientů, případně vytvoření databáze nových potencionálních zákazníků, které nejsou součástí zákaznické databáze. Porovnávací algoritmy nejsou nikterak jednoduché a hodně záleží na zkušenostech v daném oboru.
Při zpracování soutěží se často setkáváme se snahou respondentů poslat co nejvíce odpovědných lístků, aby zvýšili reálnou šanci na získání ceny. Zde se často setkáváme s geniální fantazií zájemců o ceny, kteří záměrně upravují nejen své identifikační ale i adresní údaje. Proto je potřeba použít speciálních algoritmů porovnávání pro odstranění duplicitních (redundantních) adres.
Porovnávání dat a odstranění duplicitních adres v rámci přípravy databáze pro rozesílku nemusí být prováděno jen nedokonalou (a trochu riskantní) optickou kontrolou. Lze je usnadnit a racionalizovat využitím vhodného programu, který data před porovnáním upraví do správného tvaru. Ve získaných adresách bývá mnoho nepřesností, dotazníky ze soutěží nejsou vždy vyplněny správně nebo čitelně, navíc i při přepisu dat do databáze mohou vznikat nechtěné překlepy a zkomoleniny. Tomu lze snadno zabránit, a to nejlépe již v průběhu zápisu. K tomuto účelu slouží námi vyvinutý software SoftWriter
Tím lze odstranit i skryté chyby, pouhým okem snadno přehlédnutelné. Pokud budou veškeré adresy zapsány ve správném tvaru, lze pak porovnání, odstranění duplicitních adres a následné výběry cílové skupiny provést strojově
| Napište si o další informace... |
|
|
|