Dubbele vermeldingen

======================
De Telefoongids voor Dummies.

[size=9](was:
http://forums.virtualconspiracy.com/foondump/viewtopic.php?p=469][u]FoonSearch 2004 (php versie)[/u
in “Foondump Gebruik”)[/size]

Dubbele vermeldingen in Foondump, mijn stelling is:
dat is niet alleen een kwestie van “Carthesiaanse vermenigvuldiging” over sleutels in andere tabellen, nee ze worden er vanwege Telefoongids Media opzettelijk ingebracht om te dienen als extra vermelding waaraan ook verdiend kan worden.

Vandaar dat Pianohandel Schumer in Hengelo in het echte telefoonboek behalve onder Schumer eventjes terugbladerend ook onder Piano te vinden is. Dit wordt gedaan om de trefkans bij het zoeken in de uitgave op papier te verhogen en uit gemakzucht, onkunde of louter gewin staat het daarom ook maar zo in de lijst op de CD en op het web.

Ook had ik uitgevonden dat Schumer met een andere zoekoptie nog een keer extra vermeld wordt als Piano- Orgel- en Muziekhandel Schumer. Hoe dat uitpakt in regionale telefoonboeken op papier weet ik even niet maar bij
www.telefoongids.nl][u]telefoongids.nl[/u
gebeurt dat op het moment dat je van stad naar regio omschakelt, op de CD een beetje onnozel als je niet op Woonplaats maar op Postcodegebied zoekt. Ik bedoel zo groot is een 4-positie-postcodegebied niet, dat je het regio zou willen noemen, maar het effect is er wel.

Om dit nog wat verder te onderbouwen maken we vandaag een excursie naar de beginjaren van de Javafoon, we ontdekken een klein verschil tussen editie ZM3.2004 en ZM4,2004, we proberen er achter te komen hoeveel dubbele vermeldingen er eigenlijk staan in ‘white’ en we gaan ook nog eens terug naar het onderwerp: waarom kan ik de voorletters en tussenvoegsels niet in een aparte kolom krijgen?
Na afloop:
http://www.schumer.nl/spelen/inhoud.htm][u]muziek[/u

Hoi Weerman,

waarom kan ik de voorletters en tussenvoegsels niet in een aparte kolom krijgen?

De fout die ik in het verleden maakte is dat een woningsinrichting record hetzelfde zou zijn als een persoonrecord.

De key van een woningsinrichtingrecord is fullname. Men kan daar van alles wat men maar wil in opnoemen. Alle telefoonboeken komen in de problemen om title en/of initialen van een woningsinrichtingrecord proberen te achterhalen. Ik kan mij wel voorstellen dat voor een groot gedeelte van de cdfoon 1 woningsinrichting overeenkomt met 1 persoon.

Wel weet je dat op een adres (“woninginrichting”) 1 of meerdere personen wonen.

Thawte gebruikt sofienummer om 1 persoon te identificeren.

De vriendelijke groet Jan Marco

Maar al te waar, ken je deze nog?

    http://www.infobel.com/netherlands/wp/search/result.asp?qcitycode=&qstreetcode=&qnacecode=&qcode=20567943&qlastName=overmeeren-bun&qcity=almere&qcitylist=Specificeer+de+plaatsnaam&Search.x=60&Search.y=12][u]OVERMEEREN-BUN WONINGINTICHTING A M VAN[/u]
Nu alleen nog maar bij Infobel want bijzonder is dat de boosdoeners zelf hun [url=http://www.telefoongids.nl/tginl.dll?action=white&type=search&resultsperpage=25&pagestart=1&name2=OVERMEEREN-BUN&name=&initials=&city=almere&citycode=&zipcode4=&street=&area=&areacode=&region=&subscription=&country=&catcode=&dcity=almere&dname=OVERMEEREN-BUN&dwhere=almere&partnerid=][u]fout[/u[/url] wel gecorrigeerd hebben.

Dat was natuurlijk een inkoppertje, maar ik maak een fout? De toevoegingen bij deze vermeldingen kloppen niet?

[code] seq id fullname voorletters tussenvoegsel titel townname

624248 615428 Alkema J M J M Arnhem
1826422 1789601 Alkema J M J M Enschede
2514677 2465058 Alkema J M J M Harlingen
4910763 4810842 Alkema J M J M Sexbierum
4957713 4856735 Alkema J M J M Sneek
5916457 5791064 Alkema J M J M Wijk bij Duurstede[/code]

Hoi Weerman,

tussenvoegsel is bij mij leeg.

titel = ‘ir’
“titel after name” = ‘ing’

De vriendelijke groet Jan Marco

Jan Marco, excuus, zo dus:

[code]seq id fullname voorletters tussenvoegsel titel townname

624248 615428 Alkema Ing J M J M Ing Arnhem
1826422 1789601 Alkema Ing J M J M Ing Enschede
2514677 2465058 Alkema Ing J M J M Ing Harlingen
4910763 4810842 Alkema Ing J M J M Ing Sexbierum
4957713 4856735 Alkema Ing J M J M Ing Sneek
5916457 5791064 Alkema Ing J M J M Ing Wijk bij Duurstede[/code]
Om het goed te maken heb ik het ook vast voor je doorgegeven bij
http://www.detelefoongids.nl/formulier/extraregels/stap2.asp][u]Telefoongids Media[/u
, ze hebben daar - als service en heel comfortabel - een online formulier voor; je krijgt dan alleen nog ter verificatie een brief.

Zoals
http://forums.virtualconspiracy.com/foondump/viewtopic.php?p=577#577][u]hier[/u
beschreven, deze personalia-gegevens komen van de CD-foongids uit najaar 2002. Was je toen nog niet afgestudeerd?

Hoi Weerman,

Jan Marco, excuus, zo dus:

Ik wilde alleen maar aangeven dat het niet zo gemakkelijk is om een Woningsinrichtingsrecord plat te slaan in een personrecord.

Was je toen nog niet afgestudeerd?

In 1990 ben in afgestudeerd op HTS-informatica te Groningen. Levert “ing” op achter je naam. Sommige mensen zetten het voor de naam…

In 1998 ben ik afgestudeerd op Universiteit twente (Technische bedrijfskunde) levert “ir” voor de naam op.

Als je het goed wil doen heb je titels voor de naam en titels achter je naam.

deze personalia-gegevens komen van de CD-foongids uit najaar 2002.

Ik heb er voor gekozen om geen titels in de cdfoon, bank correspondentie, etc op te nemen. Levert m.i. niets op behalve dat mensen gaan denken dat er wat (iets) te halen bij mij valt…

De vriendelijke groet Jan Marco

Maak je geen zorgen, ik kan het heel goed volgen. Alleen, adel verplicht. Krijgen wij dan ook een beter datamodel van je? Voor een moderne telefoongids dus?

http://www.google.nl/search?hl=nl&q=Woningsinrichtingsrecord&btnG=Google+zoeken&lr=][u]Woningsinrichtingsrecord[/u
werkt niet echt voor me. Klinkt meer als iets uit de tijd dat je je jas aandeed als je de telefoon hoorde - die in de onverwarmde gang hing omdat de Telefoondienst weigerde meer kabel te spijkeren. Is dat de vlag die de lading moet dekken? Doet geen recht aan het ‘many-to-many’-karakter van al die Gidsvermeldingen van intellingen en bedrijven. Hoe jaag je een veelkoppig monster, zoeen die zich achter zo’n nieuw 088-netnummer verstopt, je Woninginrichting in?

Ter illustratie hier wat extra cijfers uit mijn MD5-experiment met 3e kwartaal Wit:

[code]Kolom n_subscriber aflopend gesorteerd: (Warenklachtenlijn Voedsel en Waren Autoriteit)
id hashid n_subscriber n_info n_phonenumber vermelding
632 1910494 4916 15 2 L8NKR

Kolom n-info aflopend gesorteerd: (info Gemeente en Gem Instellingen Utrecht)
id hashid n_subscriber n_info n_phonenumber vermelding
5290775 583872 2 860 163 L8NKR

Kolom n_phonenumber aflopend gesorteerd: (Wooncentrum Almenum, Harlingen)
id hashid n_subscriber n_info n_phonenumber infovalue
2497338 3504404 1 516 169 PVR


n_subscriber: aantal identieke records voor een vermelding
n_info: aantal regels info bij een vermelding
n_phonenumber: aantal telefoonnummers voor een vermelding[/code]

Hoi Weerman, Bedankt voor jouw terugkoppeling —)

De timing is nu goed, want ik wil body gaan geven aan de online variant.

Maak je geen zorgen, ik kan het heel goed volgen. Alleen, adel verplicht.

Perfect --)

Krijgen wij dan ook een beter datamodel van je?

Ik zie het misschien anders dan jij. M.i. is foondump een erg goed database ontwerp voor de objecten waarvoor het gebruikt wordt. Het is geen zoek programma voor personen. Meer het zoeken van een naam van een woningsinrichtingrecord. (sorry voor de naamgeving)

Ik zie meer dat je naast foondump nieuwe objecten (databases) maakt die wel eenduidig zijn en een relatie met de Foondump databases hebben.

Voor een Person database zal ik even naar Van Dijks ontwerp kijken. Om een script te maken ga ik de oude cdfoon (2002) met van dijks programma dumpen in mysql. Hierna met de nieuwe foondump gegevens proberen te matchen. Is er een match dan proberen te kijken hoe het werkt. Ik denk aan tussen voegsels, titel voor/na naam, etc.

De bedoeling bij de online variant is dat mensen zelf hun gegevens toevoegen of dat anderen de gegevens aanvullen.

Voor een moderne telefoongids dus?

In een moderne telefoongids zou je koppelingen tussen verschillende databases moeten realiseren. Je kan bij voorbeeld van product naar bedrijf naar dichts bijzijnde verkooppunt kunnen gaan.

Is dat de vlag die de lading moet dekken?
Woningsinrichtingsrecord werkt niet echt voor me.

Wel een punt is om goede definities te maken van de zaken die je wilt benoemen. Mogelijk kunnen we bijvoorbeeld uit gemeentelijke belastingen een ander woord voor woningsinrichtingsrecord krijgen. Je hebt een huis/flat en daar moet voor betaald worden voor het totaal en elke bewoner moet het totaal onderling maar afrekenen. Is het huren van een kamer in een huis met een telefoonlijn een aparte record of niet.

In het programmatje waar ik nu mee bezig ben kan je configuratie items in mysql zetten. We zouden ook de definities ook in deze structuur kunnen onderbrengen. Straks in de MFC cliënt kan je deze info weer op het scherm toveren.

Doet geen recht aan het ‘many-to-many’-karakter van al die Gidsvermeldingen van instellingen en bedrijven.

Voor instellingen en bedrijven zouden we ook een record structuur kunnen ontwerpen. Bedrijven willen wel graag in een telefoonboek komen. Bij personen is het wel anders. Er is een soort paradox. Eigenlijk wil je dat je vrienden je gemakkelijk in het telefoonboek kunnen vinden en voor anderen wil je niet hebben dat ze je kunnen vinden. Ik denk aan bedrijven die via het telefoonboek je s’avonds opbellen om iets te verkopen.

Hoe jaag je een veelkoppig monster, zo een die zich achter zo’n nieuw 088-netnummer verstopt, je Woninginrichting in?

De vraag is of je een bedrijf in een woningsinrichtingrecord moet stoppen. Je kan m.i. wel tenminste vier objecten uit de huidige cdfoon informatie destilleren:

  1. woningsinrichting (huis, flat, etc) /*ruimte waarin mensen werken/leven */;

  2. bedrijf /* logisch eenheid die een bedrijf vormt. */;

  3. persoon /* natuurlijk persoon, die woont op bepaalde locaties en werkt bij 1 of meerdere bedrijven */;

  4. producten (huisarts, notaris, autodealer, bouwbedrijf, etc)

Bovenstaande objecten hebben relatie met elkaar. Een bepaalde locatie huisvest een bepaald bedrijf waar een aantal personen werken en dat weer bepaalde producten/diensten levert.

De vriendelijke groet Jan Marco

Bedoel je dan het schema van Foondump of het oorspronkelijke schema dat de grondslag is voor de CD-foongids?

Misschien is het een academische discussie aan het worden vanwege
http://forums.virtualconspiracy.com/foondump/viewtopic.php?p=596#596]de laatste ontwikkelingen
maar dat kan je toch niet volhouden zolang jij - zoals hier door die nieuwe CD - afgescheept wordt met een zoekresultaat waar jij ook over [u]klaagt[/u:

[code]CD-foongids

Naam Straat Nr. PC Plaats Telefoon Fax Internet

FunPrice Computers, Hoofdstraat 153 7311AV Apeldoorn 055-5790746 www.funprice.nl
FunPrice Computers, Hoofdstraat 153 7311AV Apeldoorn 055-5790746 055-5761799 www.funprice.nl
FunPrice Computers, Looierstraat 11 6811AT Arnhem 026-3831518 026-3510516 www.funprice.nl
FunPrice Computers, Looierstraat 11 6811AT Arnhem 026-3831518 026-3510516 www.funprice.nl
FunPrice Computers, Looierstraat 11 6811AT Arnhem 026-3831518 026-3510516 www.funprice.nl

©De Telefoongids BV[/code]

Hoi Weerman,

Bedoel je dan het schema van Foondump of het oorspronkelijke schema dat de grondslag is voor de CD-foongids?

Foondump volgt de cdfoon data. Het schema zal m.i. op de cd-foongids data lijken.

We normaliseren het bijvoorbeeld niet, want dat levert alleen maar vertraging op bij het opzoeken.

Misschien is het een academische discussie aan het worden vanwege de laatste ontwikkelingen maar dat kan je toch niet volhouden zolang jij - zoals hier door die nieuwe CD - afgescheept wordt met een zoekresultaat waar jij ook over klaagt:

Het probleem is m.i. niet zo gemakkelijk op te lossen. Mogelijk heeft de nieuwe cdfoon gids de oplossing voorhanden --)

Ik denk dat we beter een voorbeeld kunnen gaan uitwerken. Bijvoorbeeld funprice. Kunnen we direct de Kvk gegevens er bij gaan sprokkelen. Dus vanuit voorbeelden een datamodel ontwikkelen.

De vriendelijke groet Jan Marco