Dubbele vermeldingen

======================
De Telefoongids voor Dummies.

Dubbele vermeldingen in Foondump komen van de CD-foongids zelf. Waar of niet waar? Foondump kijkt tegenwoordig noodgedwongen door de bril van de CMG-search-engine op de CD-foon en wij kijken op onze beurt allen nog maar mee over de schouders van het Foondump-team, dan is het lastig om eenduidig vast te stellen hoe ontleed de gegevens in feite op de CD gezet zijn.

Eind 2002 was dat nog anders, met ‘cdfoon2csv’ kon je destijds CD-foondata in een keer leesbaar maken en toen beter dan nu kon je zien hoe de verschillende tabellen in elkaar zaten.

Daarom heb ik even gekeken hoe het toen met Schumer gedaan werd, tabel ‘PRNTNAME.B’ had hem toen ook zo:

44892122 Piano- Orgel- en Muziekhandel Schumer 52093104 Schumer Piano- Orgel- en Muziekhandel
De centrale “witte kruis-tabel” ‘W4P’ verwijst via de gevonden id’s naar de bijbehorende gegevens in de verschillende tabellen:

ID B_PRINTNAME B_STREET B_HOUSENUM B_POSTALCODE B_LOCALITY B_AREA B_PHONE B_MEMO B_NAMES 112434688 44892122 1394728 49085 5256762 13516 1198 3243527 12367400 0 112435040 44892122 1394728 49085 5256762 13516 1198 3243527 0 0 112435136 52093104 1394728 49085 5256762 13516 1198 3243527 0 0
Bijvoorbeeld, via index 3243527 wordt drie keer verwezen naar het record met ‘2455490’ - het huidige subscribernumber. Voor het netnummer ‘074’ moet je via index 1198 naar ‘AREA.B’ en wat tegenwoordig ‘INFO’ heet stond toen in ‘MEMO.B’, de index voor Schumer daarin is 12367400.

Waar het mij even om ging, hier is duidelijk te zien dat ze beide zoekingangen voor de papieren gids al opgenomen hebben.

======================
De Telefoongids voor Dummies.

In het fragment van tabel W4P hierboven is ook te zien hoe index een keer extra verwijst naar Piano- Orgel- en Muziekhandel Schumer via PRINTNAME-index 44892122. Op de 2002-CD werkt het inderdaad ook zo, dat record wordt als extra vermedling bij de resultaten getoond als men Postcodegebied ipv. Woonplaats aanvinkt.

Dit is dan het veronderstelde 'regio"-mechanisme wat mij betreft, maar hoe weet de CD-foon welk record het moet hebben om als extra regio-vermelding “bij te schakelen”? Jan Marco oppert: Postcode, plaats en straat hebben allemaal x,y coordinaten… Glasgerinkel, O.i.P. *).
Nee, ik moet op zoek naar een een of andere vlag of veld die informatie bevat zodat de CD-foon weet dat om een regio-vermelding gaat JUIST voor dezelfde abonnnee op een en het zelfde adres.

Kwam ik in de tabel INFO van editie ZM3.2004 niet de aanduiding “LV” en “PV” tegen? In de betrokken records, dus degene die ik voor regio-vermeldingen aanzie, staat ‘value’ steevast op “LV” met ‘lineno’, ‘recno’ en ‘type’ op “0”.
Is dat wat ik zocht, zijn dit “Lokale Vermelding” en “Provincie Vermelding”? Abonnee Schumer weer:

Tabel white_subscriber. 1840890 Piano- Orgel- en Muziekhandel Schumer 2739272 Piano- Orgel- en Muziekhandel Schumer 2742343 Schumer Piano- Orgel- en MuziekhandelVoor de drie vermeldingen van Schumer pakt het zo uit:

Tabel white_info. 1840890 0 0 0 LV 2739272 0 0 0 K4RR 2742343 0 0 0 LV
[size=9]*) Olifant in Porceleinkast[/size]

======================
De Telefoongids voor Dummies.

Ik leek op het spoor van regio aan, regio uit maar gek genoeg wordt dat opeens niet meer zo gedaan in uitgave ZM4.2004.
‘LV’ komt daar niet meer voor in tabel 'white_info". Op de CD is te zien dat de tabel ‘WL’ vergelijkbaar geslonken is, het ging om 600.000 gevallen.

Dit is de geheimtaal die Telefoongids Media nu hanteert in ‘white_info’:

infovalue CountOfinfovalue K4 25221 K4RR 8285 K8 9275 K8RR 3520 L8 44178 L8NKR 43201 L8NKRD 353 PV 96432 PVR 11095
Conclusie: die ‘LV’-aanduiding was het dus niet, die is er niet meer maar het werkt nog steeds:
–start de CD-foongids 4e kwartaal, ga naar wit, selecteer Woonplaats Hengelo ov, zoek naar Schumer: een vermelding met “Extra Info”, een vermelding zonder
–schakel om naar Postcodegebied 7556 en zoek weer naar Schumer: een vermelding met “Extra Info”, een vermelding zonder en een derde identieke vermelding zonder dat icoontje.
Op ZM3.2004 zie je daar vanwege ‘LV’ in ‘INFO’ drie icoontjes.

Terug naar af.

======================
De Telefoongids voor Dummies.

Meten is Weten, laten we eens kijken hoeveel er in het Witte deel staan.
Dit kan eventueel ook nog met een extra truukje, nog eens Schumer:

[code]Tabel white_subscriber.

Piano- Orgel- en Muziekhandel Schumer
Piano- Orgel- en Muziekhandel Schumer
Schumer Piano- Orgel- en Muziekhandel[/code]
Gaan we transformeren naar:

Muziekhandel Orgel- Piano- Schumer en Muziekhandel Orgel- Piano- Schumer en Muziekhandel Orgel- Piano- Schumer en
Software-matig eenvoudig te doen, alle woorden uit iedere ‘fullname’ zijn - al dan niet hoofdlettergevoelig, dat maakt niet uit - alfabetisch gesorteerd teruggezet in het veld.

Geef vervolgens samen met adres, postcode, plaats en telefoonnummer identieke MD5-hashes voor ieder record

3391281CD75CE9A94FAA575F6C23D208 3391281CD75CE9A94FAA575F6C23D208 3391281CD75CE9A94FAA575F6C23D208
Toegepast op ‘white_subscriber’ van ZM3.2004, aantal records 6371623.

Na een MD5-wasbeurt staan er 5906676 unieke records in de testlijst. Hallo, 465.000 stuks minder.

Het aantal wordt nog kleiner, nl. 5893969 als ik het telefoonnummer uit de vergelijking haal, d.w.z. records tellen al dubbel als naam, adres, huisnummer, postcode en woonplaats overeenkomen.

======================
De Telefoongids voor Dummies.

Op CD-foon 2002 stond ook de tabel NAMES.B met daarin, toen nog wel, separate kolommen voor voorletters, tussenvoegsel en verschillende soorten titels. Want Register-accountant (ra), baron en prof of mr zijn nog eens een keer gescheiden van elkaar opgenomen, wat een weelde.

Nou lijkt het in ICT-tijd gemeten lang geleden maar we praten over najaar 2002, hoe vaak veranderen de voorletters van een abonnee nou, kan die tabel misschien nog steeds zijn diensten bewijzen?

Niet “zogezegd, zo gedaan”, het was nog een hele klus om het ding zo van formaat te veranderen dat ik hem naast de huidige ‘subscriber’ kon houden. Ik moest daar PRNTNAME en W4P bij betrekken om te kunnen bepalen welke personalia bij welke volledige naam moesten komen.

Helemaal niet verkeerd, gelinkt over de naam in PRNTNAME kreeg 75 procent van de huidige kolom last- of fullnames zomaar zijn afzonderlijke detail-gegevens terug. De resterende nog onbehandelde namen bestaan voor een belangrijk deel uit (firma-)namen zonder initialen en tussenvoegsels.
En ik heb nog steeds dat scriptje
http://forums.virtualconspiracy.com/foondump/viewtopic.php?p=331#331
, met die code zou je nog kunnen proberen het residue thuis te brengen.

Inderdaad!! De LV, PV etc codes worden door de CDFoonGids geinterpreteerd.

app.com.kpn.cdfoon.app.search.info.InfoLayoutStore:

layoutStore = new Hashtable(); layoutStore.put("GV", new InfoLayout(0, "black", false, null, "left")); layoutStore.put("EV", new InfoLayout(0, "black", false, null, "left")); layoutStore.put("IV", new InfoLayout(0, "black", false, null, "left")); layoutStore.put("PVB", new InfoLayout(1, "blue", false, null, "left")); layoutStore.put("PV", new InfoLayout(1, "black", false, null, "left")); layoutStore.put("PVR", new InfoLayout(1, "red", false, null, "left")); layoutStore.put("SPV", new InfoLayout(2, "black", false, null, "left")); layoutStore.put("SPVR", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("SPVR", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("K4", new InfoLayout(2, "black", true, Color.black, "left")); layoutStore.put("K4C", new InfoLayout(2, "blue", true, Color.red, "left")); layoutStore.put("K4R", new InfoLayout(2, "red", true, Color.black, "left")); layoutStore.put("K4RR", new InfoLayout(2, "red", true, Color.red, "left")); layoutStore.put("K8", new InfoLayout(2, "black", true, Color.black, "left")); layoutStore.put("K8C", new InfoLayout(2, "blue", true, Color.red, "left")); layoutStore.put("K8R", new InfoLayout(2, "red", true, Color.black, "left")); layoutStore.put("K8RR", new InfoLayout(2, "red", true, Color.red, "left")); layoutStore.put("L8", new InfoLayout(2, "black", true, Color.black, "right")); layoutStore.put("L8C", new InfoLayout(2, "black", true, Color.red, "right")); layoutStore.put("L8LR", new InfoLayout(2, "black", true, Color.black, "right")); layoutStore.put("L8NR", new InfoLayout(2, "red", true, Color.black, "right")); layoutStore.put("L8NLR", new InfoLayout(2, "red", true, Color.black, "right")); layoutStore.put("L8NKR", new InfoLayout(2, "red", true, Color.red, "right")); layoutStore.put("L8NKRD", new InfoLayout(2, "red", true, Color.red, "center")); layoutStore.put("L8FC", new InfoLayout(2, "blue", true, Color.red, "right")); layoutStore.put("L8RC", new InfoLayout(2, "blue", true, Color.red, "right")); layoutStore.put("L8AD", new InfoLayout(2, "blue", true, Color.blue, "right")); layoutStore.put("LV", new InfoLayout(2, "red", true, Color.black, "center")); layoutStore.put("LVE", new InfoLayout(2, "red", true, Color.black, "center")); layoutStore.put("LVNR", new InfoLayout(2, "red", true, Color.black, "center")); layoutStore.put("LVENR", new InfoLayout(2, "red", true, Color.black, "center")); layoutStore.put("LVLR", new InfoLayout(2, "red", true, Color.black, "center")); layoutStore.put("LVELR", new InfoLayout(2, "red", true, Color.black, "center")); layoutStore.put("LVNLR", new InfoLayout(2, "red", true, Color.black, "center")); layoutStore.put("LVENLR", new InfoLayout(2, "red", true, Color.black, "center")); layoutStore.put("LVC", new InfoLayout(2, "blue", true, Color.red, "center")); layoutStore.put("LVEC", new InfoLayout(2, "blue", true, Color.red, "center")); layoutStore.put("LVFC", new InfoLayout(2, "blue", true, Color.red, "center")); layoutStore.put("LVEFC", new InfoLayout(2, "blue", true, Color.red, "center")); layoutStore.put("LVRC", new InfoLayout(2, "blue", true, Color.red, "right")); layoutStore.put("LVERC", new InfoLayout(2, "blue", true, Color.red, "right")); layoutStore.put("A2C", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("A3C", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("A4C", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("A5C", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("A6C", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("A7C", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("A8C", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("A9C", new InfoLayout(2, "red", false, null, "left")); layoutStore.put("IPAGE", new InfoLayout(2, "black", true, Color.black, "left")); layoutStore.put("ICARD", new InfoLayout(2, "black", true, Color.black, "left")); }

Zal van de week ook even in fs2004.php inbouwen dat deze eruit gefilterd worden.

Thanks Weerman!

Nu nog even verzinnen waar deze afkortingen allemaal voor staan…

Hierboven had ik al een gooi gedaan naar “LV” en “PV”.

Niet zo heel veel van die codes slaan aan bij INFO:

K4 2 black true black left K4RR 2 red true red left K8 2 black true black left K8RR 2 red true red left L8 2 black true black right L8NKR 2 red true red right L8NKRD 2 red true red center PV 1 black false null left PVR 1 red false null left
Hier kon ik wel een sample van trekken:

  • K4 Lasertherapie stoppen met roken PROSTOP http://www.telefoongids.nl/tginl.dll?action=white&type=detail&recordid=9dn4CmLv
  • K4RR Ambulance http://www.telefoongids.nl/tginl.dll?action=white&type=detail&recordid=EblJ0Ona Hengelo ov
  • K8 Belastingdienst http://www.telefoongids.nl/tginl.dll?action=white&type=detail&recordid=cdN4Cbv9
  • K8RR Brandweer http://www.telefoongids.nl/tginl.dll?action=white&type=detail&recordid=VurkH8on Almelo
  • L8 ABN AMRO http://www.telefoongids.nl/tginl.dll?action=white&type=detail&recordid=5MMcXso7
  • L8NKR Agis Zorgverzekeringen http://www.telefoongids.nl/tginl.dll?action=white&type=detail&recordid=IhLNPCHu Amersfoort
  • L8NKRD Hartog Grasdrogerij BV http://www.telefoongids.nl/tginl.dll?action=white&type=detail&recordid=SG86PMja Lambertschaag
  • PV Cogas Energie http://www.telefoongids.nl/tginl.dll?action=white&type=detail&recordid=InV001RB Almelo
  • PVR Politie http://www.telefoongids.nl/tginl.dll?action=white&type=detail&recordid=EJcd0EMp
We kunnen helaas geen plaatjes meer op foondump.nl zetten om onze postings te illustreren dus ipv schermfotos maar een link naar de vergelijkbare internet-presentatie van de verschillende info-vormen.

Ik heb zo’n idee dat men een heel eind komt met determineren als je je het Adverteerders informatiepakket
http://over.detelefoongids.nl/corporate/show/id=40739
laat toesturen.

Ergens in de code heb ik teruggevonden dat wanneer de code met een L begint, de entry een logo bevat.

Ook heb ik het rijtje met betekenissen van het ‘type’ veld teruggevonden. De ‘rommel’ die we zagen (type 4) is het adverteerders-id, type 3 is de logo-bestandsnaam. Achter type 4 komt zo te zien altijd een type 0 met gek teken.

Onderstaande values zijn van ‘Gelders Glas’

+--------+--------+-------+------+---------------------------------------+ | id | lineno | recno | type | infovalue | +--------+--------+-------+------+---------------------------------------+ | 709910 | 0 | 0 | 4 | 12237689 | | 709910 | 0 | 1 | 0 | ♂ | | 709910 | 0 | 2 | 0 | L8RC | | 709910 | 0 | 3 | 3 | 5065697_041 | ...... etc

We nemen de value van type 4 en knutselen er de volgende link van:

http://da.detelefoongids.nl/12237689/

(da = Digitale Advertentie)

Bij sommige andere digitale advertenties kan je ook nog logo.gif achter deze URL zetten.

Ja wat ik eerder “binaire dienstmedeling” gedoopt had. Ok maar hou in de gaten dat jij nu in Roze kijkt en ik keek in Wit, daar zag ik geen “rommel”

In wit komen ook geen inforecords type ‘4’ voor…

In wit komen ook geen inforecords type ‘4’ voor…
Had je daarom die ‘DingBats’ achter 4 over het hoofd gezien toen je de Foondump voor Pink ging uitbreiden?

Nu begrijp ik ook onze spraakverwarring…
Omwille van de eenvoud had ik me tot Wit beperkt en ook alleen het staatje voor Witte info-code’s.

Ja voor Roze is het ietsjes diverser en hier komt “LV” inderdaad nog wel voor:

infovalue CountOfinfovalue IPAGE 728 K2ZZ 2 K4 1066 K4R 456 K4RZ 77 K4ZZ 11 K8 262 K8R 123 K8RZ 143 L8 902 L8AD 1 L8BRC3 78 L8FC 3 L8LR 2 L8NR 9 L8RC 600 L8ZZZ3 46 LV 105 LVBRC2 11 LVE 27 LVEFC 17 LVERC 242 LVRC 32 LVZZZ2 3 PV 778 PVAD 2859 PVADR 3926 PVADV 1532 PVADVR 116 PVR 132
Over de rommeldingetjes, die in jouw voorbeeld is Unicode Male Sign (Hex) = 2642.
Als ik het in Notepad plak, save en met Hedit weer open staat er ook FF FE 42 26.
FF FE is een signaal dat er Unicode aankomt
42 26 de Little Endian of Big Endian weergave hoe zat dat ook alweer, ik weet dat nooit.

[quote=“Weerman”]In wit komen ook geen inforecords type ‘4’ voor…
Had je daarom die ‘DingBats’ achter 4 over het hoofd gezien toen je de Foondump voor Pink ging uitbreiden?[/quote]
Ja, en de codes als LV etc komen pas sinds 1 of 2 gidsen voor.
En na het schrijven van de info code heb ik nooit meer naar de data gekeken :smiley: