Dumpen naar MS-Access: makkelijk om bedrijven eruit te hale?


#1

Hallo,

Als ik dump naar MS Access zie ik twee kolommen lastname en fullname, met bijvoorbeeld deze data:

lastname
Asteleyner Betonboringen W H A
Ab Financien BV
Aalderink
Aaldering

fullname
Asteleyner Betonboringen W H A
Ab Financien BV
Aalderink J
Aaldering G H F

Mag ik er van uit gaan dat wanneer lastname en fullname hetzelfde zijn, dit een bedrijfsvermelding is?

Bedankt!


#2

Nee, als ik met mijn pas nieuwe kolommen “voorletters” en “tussenvoegsel” check dan zie ik een ton?, een mud?, in ieder geval een kleine 100.000 identieke namen met voorletters en ev. een tussenvoegsel in last- en fullname.

Andersom ook niet, bijvoorbeeld:

lastname fullname Korenwinder Pensioen BV Korenwinder Pensioen BV J P Zwolse Dermatologen Zwolse Dermatologen Maatschap


#3

Hmpffff. Is er iemand met een routine om bedrijven en particulieren te scheiden? Ik heb zelf al een opzet gemaakt, bijvoorbeeld:

tel begint met 0800 of 0900 -> bedrijf

zit één van de onderstaande woorden in de naam -> bedrijf
"computer", “gemeente”, “verhuur”, " BV ",

maar dit wordt een lange lijst…

Bedankt


#4

Wat ik zou proberen:
de aanname is dat je wel met een bedrijf of instelling te maken hebt als een witte subscriber met zijn telefoon- of faxnummer in het roze gedeelte voorkomt

–link daarom veld ‘phonenumber’ in white_phonenumbers met z’n zusje in pink_phonenumbers
–produceer een lijst van unieke witte id’s

presto! witte subscribers met zo’n ‘id’ worden met een hoge graad van waarschijnlijkheid ook bedrijfsmatig vermeld in de Roze gids

aanvullende actie: bepaal welke witte subscribers een white_info-veld ‘value’ hebben met ‘lineno’, ‘recno’ en ‘type’ alle op "0"
op dat moment mag je ervan uitgaan dat ze betalen en dan zal het wel om een bedrijf (of instelling) gaan.

de eerste methode zal acht- of negenhonderdduizend records opleveren
de tweede zag ik vorige week: ik dacht tweehonderdvijftigduizend