Online (Gnutella) versus batch (Napster)


#1

Eigenlijk heb je twee methoden. Info vanuit een centralistisch punt (Napster model) en decentrale (gnutella model). Het Napster model zie ik www.detelefoongids.nl of batch foondumpen.

Als je heel principieel het Gnutella model (wat ik noem online foonsearch variant) zou uitvoeren gaat elke peer zijn eigen telefoonboek bijhouden. Een willekeurige peer kan dan iets opzoeken door bij buur-peerservers SQL vragen naar een bepaalde entry/entries te gaan stellen. Stel je hebt 10000 peers met elk gemiddeld 100 nummers dan heb je een telefoonboek van 100.000 actuele entries (records).

Echter het optimale model is m.i. een mix tussen Napster en Gnutella. Het Napster gedeelte bestaat uit een initiële dump (6 miljoen records) van de cdfoon en later in de tijd gezien entry updates vanuit batch foondump.

Het gnutella gedeelte bestaat uit dat de 10.000 eindgebruikers gemiddeld in het jaar 100 records wijzigen op de vigerende online database. Je hebt dan 6 miljoen records waarop 100.000 verbeteren per jaar plaatsvinden. Denk aan aanvullen van email account. Weg gooien van nep entries. Het inserten van bedrijventelefoonboeken, etc.

De mix zal m.i. veel actuelere/completere infomatie gaan bezitten als de tijd voortschrijdt —)

De vriendelijke groet Jan Marco