Data verrijking

Ik ben aan het puzzelen om de data te verrijken met een postcode boek, heeft meer detail info. Ik ben opzoek naar wijkcodes en wijknamen. Is hier ergens nog een exel sheet voor. Is er tevens ook een variant van foondump maar dan voor een postcode boek?

Hoi mtstorm,

Ja, Postcodepro.
Postcodepro van vorig jaar ben ik vergeten te kopen. Postcodepro van twee jaar geleden had andere structuur voor direct dumpen. Werkte wel via schermbesturingsdumpen. Postcodepro van drie jaar geleden heb ik wel ergens staan.

De vriendelijke groet Jan Marco

P.S. Ik zal volgende week postcode pro van dit jaar gaan bestellen.

Wijkcodes en wijknamen worden meegegeven aan “Kerncijfers postcodegebieden 2004” van het 2004pc6csvv2.zip
http://www.cbs.nl/nl-NL/menu/themas/nederland-regionaal/nederland-regionaal/cijfers/incidenteel/maatwerk/kerncijfers-postcodegebieden-2004.htm]CBS
. Je kan die lijst downloaden als CSV-bestand, [url=http://www.cbs.nl/NR/rdonlyres/DE099AF5-8C54-4412-84CA-FBF2D0A408A0/0/2004pc6csvv2.zip[/url] of bestellen op CD-rom:

[quote]Prijs: € 2,85 (incl. verzendkosten)
Kengetal: A-132CD
Productnummer: 3681705010[/quote]
Prijs: € 2,85 (incl. verzendkosten)?

Kijk, zo hoort het. Voor dat alles is immers al een keer betaald door de belastingbetalers. Maar nee, andere ‘derivaten’ zoals de telefoongids en de postcodetabel waar van overheidswege ook - eventueel kattebakkorrels
http://bag.vrom.nl/bag_com/c6d5c0840b9c7223e80207d9cb6d7f5d.php]indirect

Totaal 439.637 records en behalve een “Wijk-” en “Buurtcode” nog heel wat andere gegevens om deze of gene postcode mee te verrijken: Postcode 7523RS Gemeentecode 0153 Wijkcode 04 Buurtcode 04 Omgevingsadressendichtheid 1382 Stedelijkheid 3 Aantal inwoners 65 Mannen 35 Vrouwen 30 0 tot 15 jaar 12 15 tot 25 jaar 15 25 tot 45 jaar 32 45 tot 65 jaar 18 65 jaar en ouder 23 Niet-westerse allochtonen 4 Totaal particuliere huishoudens 45 Eenpersoonshuishoudens 70 Meerpersoonshuishoudens zonder kinderen 18 Meerpersoonshuishoudens met kinderen 11 Gemiddelde huishoudensgrootte 1,50 Woningvoorraad 40 Gemiddelde woningwaarde 57 Gemiddeld fiscaal maandinkomen 1400 Lage inkomens 47,5 Hoge inkomens x Uitkeringsontvangers 21,3 Zelfstandigen -
De cijfers hebben betrekking op steeds één 6-positie-postcode, iets te veel van het goede:[quote]Om redenen van betrouwbaarheid en geheimhouding zijn er op de cijfers beveiligingsprocedures toegepast.[/quote]
Voorbeeld van zo’n ingreep:[quote]De procentuele aandelen binnen populaties worden gegeven als de totale populatie uit ten minste 10 personen bestaat. Voor niet-westerse allochtonen is bovendien het procentuele aandeel in vijf klassen gegeven. De procentuele aandelen binnen huishoudens en de huishoudensgrootte worden alleen gegeven als er minimaal 5 huishoudens voorkomen. Door afronding kan het voorkomen dat de totalen niet geheel overeenstemmen met de som van de afzonderlijke getallen.[/quote]

Omdat het geld moet opbrengen proberen ze de postcodetabel zo goed mogelijk dichtgetimmerd te houden. Ook het Postcodeboek op CD-rom, tot dusver voor TPGPost geproduceerd door PerfectView, naast het Postcodeboek voor PerfectView zelf. Postcode.nl heeft nu ook iets dergelijks te koop
http://www.postcode.nl/index.php?goto=shop&ItemID=11438
, het uiterlijk en de werking van de demo lijkt identiek.

Het Postcodeboek op CD liep altijd een beetje achter. Wanneer is een postcodetabel up-to-date? Op de website van Qas kon je altijd even spieken
http://www.qas.com/uk/support/data-zone/test-address.asp
voor een recente mutatie:

    March 2006 Pierre de Coubertinlaan 7 1362 LA ALMERE
    December 2005 Alberdina Beerlinglaan 1 9766 PD EELDERWOLDE
Deze postcode komt daar niet vandaan maar is wel nieuw want voor adressen in de nieuwe wijk IJburg:
    Eva Besnyostraat 11 t/m 31 en 2 t/m 34 1087 KR AMSTERDAM
Met zo’n iets te nieuwe postcode kan de kwaliteit van andere aanbieders gecontroleerd worden, bijvoorbeeld de online-Postcode.nl
http://www.ns.nl/pages/index.html]Treinplanner
van de NS kan er nog niets mee, "ongeldige postcode". Bij TPGPost en [url=http://www.postcode.nl/index.php?action=search&goto=postcoderesult&address=1087+KR&search=++Zoek++[/url] die de brondata van Cendris betrekken komen de adressen voor “1087 KR” er al uit.

Ook leveranciers van bijvoorbeeld redelijk kostbare ‘gegeocodeerde’ postcodetabellen kunnen op dit moment “1087 KR” nog niet vinden, probeer bijvoorbeeld maar in het bestelformulier
http://gbkn-bestel.geodan.nl/basiskaartonline_viewer.asp
van de “Basiskaart-online” van het Kadaster

Als je zelf wat wil proberen, de CD-rom NS Planner Plus is misschien ook een mogelijkheid, daarop staan bestanden die geloof ik ook op de RailPocket
http://www.railpocket.com
-PDA’s voor de conducteurs gebruikt worden of werden. Beschik zelf niet over een recente versie maar mogelijk wordt nog steeds van dit soort bestanden gebruik gemaakt. Als voorbeeld “topopc.dbb”:

00000000 B1 91 0F 00 31 30 31 31 61 61 84 DC 01 00 40 72 ....1011aa....@r 00000010 07 00 BB 01 9D 26 31 30 31 31 61 61 01 DC 01 00 .....&1011aa.... 00000020 8F 72 07 00 BB 01 4A 27 31 30 31 31 61 61 29 DC .r....J'1011aa). 00000030 01 00 77 72 07 00 BB 01 85 27 31 30 31 31 61 61 ..wr.....'1011aa
Kan de moeite waard zijn want eenmaal geinstalleerd kon je deze database via internet regelmatig laten updaten, dacht om de 14 dagen.

Wil je alleen maar bij de data en geen gedoe, hier is een “driebandenstoot”
http://www.foondump.nl/forum/viewtopic.php?p=530#530
naar een bruikbaar postcodebestand. Hoe ze het doen doen ze het maar het is bijgewerkt t/m september 2006: 615851 records, de vorige stand in juli was: 615648.

Hoe je gebruik kan maken van de bovengenoemde buurt- en postcodedata van het CBS:

      [b]Woonbuurten van kandidaat-Kamerleden zijn geen afspiegeling van Nederland[/b]
De NRC www.nrc.nl heeft in de krant van vandaag de adressen van de ruim 670 mensen die zich kandidaat hebben gesteld voor de Tweede Kamer gecombineerd met deze gegevensbestanden: [quote][b]Openbare informatie[/b] ... Vervolgens zijn al hun adressen met behulp van een computerprogramma op een digitale landkaart gezet. Deze kaart met punten is daarna gecombineerd met een kaart van het Centraal Bureau voor de Statistiek (CBS) die gegevens over 2005 bevatte van alle buurten in Nederland – gemeenten zijn onderverdeeld in wijken, die op hun beurt uit buurten bestaan. De zeven kandidaten die in het buitenland wonen, zijn niet in het onderzoek betrokken. Voor de gegevens over inkomens is een ander CBS-bestand gebruikt: hier is niet vergeleken op buurtniveau, maar op de veel kleinere ‘zespositiepostcodegebieden’. Dit zijn die gebieden waar van één postcode de vier cijfers en twee letters dezelfde zijn. Meestal wonen daar maar enkele tientallen mensen.[/quote] Een van de gepubliceerde grafiekjes:
      [img]http://img356.imageshack.us/img356/4785/kandidaatkamerledencbsnf1.gif[/img]
Niet alles is wat het lijkt: [quote]... De kandidaten van de VVD – toch de partij die het meest met hoge inkomens wordt geassocieerd – wonen niet op de rijkste plekken. De postcodegebieden waar D66’ers wonen zijn welvarender: de mensen daar verdienen per maand 130 euro meer dan in de VVD-gebieden. Ook PvdA’ers zitten boven het VVD-gemiddelde. Aan de top staan de Partij voor Nederland, het CDA en de Partij voor de Dieren. Bij die laatste is dat vooral te danken aan het grote aantal lijstduwers, zoals Georgina Verbaan en Kees van Kooten, die op uitzonderlijk rijke plekken wonen.[/quote]

    Dataverrijking. Iemand zou die door de OP (original poster) gebruikte term kunnen associëren met geld verdienen aan het doorverkopen van databestanden omdat die vaak peperduur zijn.

    Neem als voorbeeld het “Actueel Hoogtebestand Nederland”, voor Waterschappen kennelijk onmisbaar, aan deze al dan niet openbare Excel-bladen van respectievelijk
    http://www.wve.nl/uploadedfiles/3.1.xls]“Vallei & Eem”
    en [i]“Hunze en Aa’s”[/i te zien:

    [code]VASTE ACTIVA STAAT I

    Omschrijving Loop tijd in mnd Aanschafprijs Cummulatieve afschrijving Boekwaarde per 1-1-2005
    Digitaal Hoogtebestand 60 110.422 36.580 73.842[/code]

    [code]Meerjareninvesteringsschema (MJI) 2004 - 2008

    omschrijving/ projectnaam investering 2006
    Hoogtebestand (AHN) update (Nieuw) 600.000[/code]
    Bij lange na nog niet het maximale bedrag dat je aan deze bestanden kan besteden. Aan de hand van de prijslijst
    http://www.ahn.nl/bestellen/prijzen.php
    van AHN kan je een beetje uitvogelen wat deze waterschappen besteld hebben.

    De hoge aanschafprijzen worden veroorzaakt door de enorme bedragen die met de opbouw van het bestand gemoeid zijn en liggen buiten het bereik van individuen die eventueel toegang tot die data zouden willen krijgen. Bijvoorbeeld leden van de Nederlandse Flightsimulator-gebruikersgroep die het destijds wel als basis van typisch Nederlandse ‘scenery’ hadden gewild om er daarna virtueel overheen te kunnen vliegen.

    Op de AHN-pagina’s zijn ook een aantal aansprekende voorbeelden te vinden van dit soort toepassingen, onder andere deze animatie waarin je een luchtfoto met behulp van de hoogtegegevens als het ware opgepompt ziet worden:

        http://www.ahn.nl/demo/ahn_metofzonder.mpg][img]http://www.ahn.nl/demo/ahn_metofzonder.jpg[/img
    Als doekje voor het bloeden wordt de eenvoudige belastingbetaler een vervangende opvraagmogelijkheid geboden: [quote][b]Hoe hoog woont u?[/b]

    Door het intikken van uw postcode kunt u een indicatie krijgen van de maaiveldhoogte van uw eigen omgeving. Deze hoogtemeter zoekt naar de dichtstbijzijnde hoogtemeting binnen een straal van 600 meter van uw postcode.

    De waarden zijn afgerond op decimeters en t.o.v. het Normaal Amsterdams Peil (NAP). De hoogten zijn afkomstig van het Actueel Hoogtebestand Nederland, voor zover dit gereed is, en het TOPhoogteMD (oudere hoogtemetingen aangevuld met NAP-punten). Afwijkingen groter dan 1 meter kunnen voorkomen (bijvoorbeeld bij nieuwbouwwijken). Aan de vermelde hoogten kunnen geen rechten worden ontleend.

    AHN - Actueel Hoogtebestand Nederland
    http://www.ahn.nl/hoogtetool/index.php
    [/quote]
    Bij Google zie je dat er veel gelinkt wordt naar deze "Hoe hoog"-pagina. Zo populair dat
    http://www.ahn.nl][i]“deze tijdelijk voor onderhoud buiten gebruik is geweest”[/i
    .

    Nu de pagina sinds kort weer beschikbaar is valt het op dat het resultaat voor een opgevraagde postcode, dus het peil in meter onder of boven N.A.P. niet te kopiëren is, want het antwoord, het aantal meters, wordt als plaatje naar de browser teruggestuurd. Misschien werd de pagina systematisch door onverlaten afgevraagd om bijvoorbeeld elke regel van de postcodetabel met een bijbehorende hoogte te “verrijken” en zo een z aan de x- en y-coordinaten te kunnen toevoegen.

    Is deze beveiligingsmaatregel afdoende? Nee. Het is een PHP-pagina, die pagina levert een .PNG-plaatje en zoekend op “text2img” of zelfs “txt2png” stuit je al snel op code die met een paar kleine aanpassingen identieke plaatjes genereert:

    [code]<?php

    header(“Content-type: image/png”);
    $string = $_GET[‘text’];
    $im = imagecreatefrompng(“button.png”);
    $red = imagecolorallocate($im, 204, 0, 0);
    $px = imagesx($im) - 50;
    // imagestring ( resource image, int font, int x, int y, string s, int col )
    imagestring($im, 3, $px, 3, $string, $red);
    imagepng($im);
    imagedestroy($im);

    ?> [/code]
    Bijvoorbeeld, voor postcode “7523RS” geeft de pagina als hoogte terug en een van de eigenschappen van het PNG-formaat

    is dat onder andere de data voor een zogenaamde ‘IDAT-chunk’ altijd afgesloten worden met 4 bytes CRC over die data, in zowel het plaatje dat van AHN komt als in het eigengemaakte plaatje staan die bytes op “2643B5FC”.

    Met andere woorden, als je bovenstaande routine met steeds een decimeter op laat lopen, voor alle waarden tussen -7 en +325 meter, zijnde het laagste en het hoogste punt in Nederland, dan komen daaruit evenzoveel plaatjes waarvan je alleen de CRC wegschrijft, samen met de waarde voor de hoogte natuurlijk. Op die manier hou je een tabel van een dikke 3000 regels over zonder die plaatjes zelf op te slaan:

    [...] BC5D9CFD;37,6 5AD82E85;37,7 0121B373;37,8 0E4CE452;37,9 2643B5FC;38,0 5119D828;38,1 AEDDEA83;38,2 AA582A81;38,3 0236BD97;38,4 29246A56;38,5 [...]
    Gewapend met dat tabelletje kan je vervolgens weer je opvraag bij AHN gaan doen:

    [code]pc = “7523RS”

    url = “http://www.ahn.nl/hoogtetool/hoogte_img.php?postcode=” & pc

    With New PocketHTTP.CoPocketHTTP
    With .GetResponse(url, vbNullString)
    buf = .Bytes
    p = 45 + buf(36) - 4
    For i = p To p + 3
    CRC = CRC & Hex(buf(i))
    Next
    End With
    End With[/code]
    Via de teruggewonnen CRC-waarde arriveer je in de tabel dan bij de hoogte voor postcode 7523RS, het aantal meters dat we al eerder terugkregen, 38,0, maar nu niet in de vorm van een .png-image maar puur als data in verwerkbare vorm.

    Die moeite had Rijkswaterstaat zich dus kunnen besparen.

    Wij ook: dezelfde opvraag, dus de hoogte in decimeters nauwkeurig voor een gegeven postcode, krijg je namelijk ook van een andere webpagina, langzaamvarendenstilstaandverkeer.nl
    http://www.langzaamvarendenstilstaandverkeer.nl
    , een pagina die misschien minder hinder ondervond van schermschrapers. Het thema daar is in eerste instantie “Droog of laag?”, verderop komt pas de achterliggende vraag “Waarom waterstof, waarom nu?” aan bod, TU-Delft in de bocht, die willen graag onderzoek doen. In ieder geval, met dezelfde postcode, 7523RS, krijg je ook dezelfde uitkomst, +38.0, maar die is daar wel gewoon te kopieren of uit de HTML-code van de pagina te ‘parsen’.

    Is “de dichtstbijzijnde hoogtemeting binnen een straal van 600 meter van uw postcode” met een nauwkeurigheid van steeds een decimeter goed genoeg of moet er teruggegrepen worden op de achterliggende data? Databestanden zijn verkrijgbaar in een ruwe versie of genormaliseerd naar een grid en van allebei zijn laseraltimetrie
    http://www.ahn.nl/bestandsformaten.php]samples
    te downloaden, “ongefilterde” en “gefilterde” [url=http://www.bn.fnt.hvu.nl/opleid/geodesie/geo-info/website/t/laser.html[/url]-data, die je vervolgens kan vergelijken met wat de vereenvoudigde opvraag via de genoemde webpagina presteert.

    In de
    http://www.ahn.nl/demo/prins.zip][i]“ruwe”[/i
    data zitten 200.000 duizend punten rond Prinsenbeek. Eentje daaruit gepikt zit volgens de lijst “geo_postalcoords” van Foondump het dichtste bij postcode 4839AP (zeg maar 150 meter verder):

    x en y AHN Prinsenbeek x en y Foondump pc z 107502,00 400048,87 107597 400155 4839AP 20,59
    Twintig meter en nog wat voor deze postcode, dezelfde postcode waarvoor de “hoogtetool”, dus de webpagina van AHN, geeft:

    [quote]+4.1
    http://www.ahn.nl/hoogtetool/hoogte_img.php?postcode=4839AP
    meter boven N.A.P.[/quote]
    De demo van de
    http://www.ahn.nl/demo/ahn_25.xyz][i]“bewerkte”[/i
    data bevat 15500 punten. Ahn: De gridbestanden zijn geinterpoleerd aan de hand van de originele, gefilterde laserpunten. Weer met vergelijking van coordinaten afkomstig van Foondump kom je uit bij postcode 6367JC (Kerkstraat 89 t/m 119 Voerendaal):

    x en y AHN Voerendaal x en y Foondump pc z 195002,27 317938,44 194812 318075 6367JC 195,37
    Peil is 195 meter, het gevonden punt en de postcode liggen hier iets dichter bij elkaar dan in het vorige voorbeeld, de webpagina komt met:

    [quote]+189.2
    http://www.ahn.nl/hoogtetool/hoogte_img.php?postcode=6367JC
    meter boven N.A.P.[/quote]
    Dat maakt een mens nieuwsgierig. Alas, een en ander overstijgt een doorsnee particulier budget … Onverwachte ontwikkeling, blijkens aankondigingen in het GeoInfo.nl-forum
    http://forum.geoinfo.nl/viewtopic.php?t=15
    heeft een professional uit het desbetreffende veld besloten een aantal van deze databestanden, waaronder het bewuste “hoogtebestand” als .torrents op ons los te laten:

    [quote]Dit is mijn eerst upload :wink:

    Deze package heeft de Actuele Hoogtekaart van Nederland in een 25*25 grid van 2000

    Als deze upload goed gaat, komt er nog meer kaartmateriaal zoals de bodemkaart, gemeentegrenzen en postcodegebieden.[/quote]
    Boven het betreffende forum-onderdeel waarin de man tot zijn wanhoopsdaad overgaat wordt ook een mini-onderzoekje gedaan. Eerst een stelling en vervolgens voorgebakken argumenten waaraan de bezoeker zijn stem kan geven:

    [quote]Geodata dat met belastinggeld is gemaakt, zoals bodemkaarten, AHN, provinciegrenzen, wegennet, etc. moet vrij verkrijgbaar zijn.

    • Jazeker, waarom zou je er twee keer voor betalen. In andere landen is het ook gratis of tegen een geringe vergoeding verkrijgbaar.
    • Nee hoor, oa. Alterra (bodemkaart) en Top. Dienst, Emmen (Top10) zijn commerciele partijen en moet ook hun brood verdienen.
    • Geen mening.
    [/quote] Honderd procent van de stemmers zegt "jazeker", weergegeven door een representatieve grafische balk van 8 centimeter. Totaal aantal stemmen: 4.

    Hierboven werd de door het AHN gegeven hoogte voor een punt uit het demobestand “Prinsenbeek” vergeleken met de hoogte die de AHN-webpagina “Hoe hoog woont u?” geeft voor een postcode min of meer in de buurt van dat gekozen punt. Dat ene nog niet “geinterpoleerde” punt leverde een behoorlijk verschil op. Omdat er voor heel veel punten gemeten wordt had ik beter niet vooraan uit de lijst kunnen kiezen maar een punt halverwege die lijst zodat er “rondom” dat punt naar een punt voor een postcode gezocht kan worden.

    Kan alsnog, kijken of het wat uitmaakt. Dit willekeurig gekozen coordinatenpaar

    108461,84  400140,52

    heeft volgens het “ruwe” hoogtebestand een hoogte van 5,71 meter boven NAP. Meteen even gekeken, uit dat sample van 200.000 punten blijken een dikke 40.000 andere punten binnen een straal van 600 meter van dit testpunt te liggen. Gemiddelde hoogte van al deze punten: 4,86 meter.

    Voordat we daar de dichtstbijzijnde postcode bij zoeken, even bij Googlemaps kijken met wat voor terrein we te maken hebben, dat kan bijv. via deze foto
    http://et10.org/gc/rd.php]“rd2wgs”
    -pagina waar je de rd-coordinaten kan laten omrekenen en je meteen wordt doorgelinkt naar een [url=http://maps.google.com/maps?q=51.5882415+4.7156555&t=h&ie=UTF8&om=0&z=17&ll=51.588242,4.715656&spn=0.004826,0.009903&iwloc=addr[/url] van ons testpunt:

        http://maps.google.com/maps?q=51.5882415+4.7156555&t=h&ie=UTF8&om=0&z=17&ll=51.588242,4.715656&spn=0.004826,0.009903&iwloc=addr][img]http://img104.imageshack.us/img104/9239/prinskh8.gif[/img
    De dichtstbijzijnde postcode kan weer via de bijbehorende x en y weer uit de met Foondump geexporteerde "geo_postalcoords_2006_4" gehaald worden: [code]pc rdx rdy 4839AR 108532 400203[/code] Die postcode - volgens http://www.postcode.nl/index.php?action=search&goto=postcoderesult&address=VAAREINDSEWEG+53]postcode.nl : [i]"Vaareindseweg 1 t/m 79 BREDA"[/i] - ligt 93 meter van ons testpunt verwijderd en voor die postcode geeft [url=http://www.ahn.nl/hoogtetool/index.php][i]"Hoe hoog woont u?"[/i[/url] terug: +3.9 meter.

    Toch weer een verschil, is het gewoon een “ongefilterd” punt met de door het Lidar-vliegtuigje gemeten hoogte van een kippenhok of een geparkeerde auto of doen we iets niet wat die webpagina wel doet? Bijvoorbeeld, middelen over een aantal punten? Het gemiddelde van alle punten in een straal de door de webpagina genoemde 600 meter was immers 4,86 meter?

    Ok, er bestaat nog een andere webpagina
    http://www.demis.nl/ois/main.htm
    waar scholieren een “overstromingsgevaar”-opdrachtje kunnen uitvoeren en die geeft voor de vier cijfers van dezelfde postcode, “4839”, 4,53 meter +NAP.

    Je kan in de interface daarvan met je muis een ‘pin’ op het getoonde kaartje verplaatsen en je moet inderdaad een flink stuk verder om de vermelde hoogte van waarde te laten veranderen. Zo kom je erachter dat die hoogte per buurtcode gegeven wordt, dezelfde buurtcode waar deze hele thread mee begonnen is. Je blijkt de opvraag dan anders te kunnen formuleren,
    http://www.demis.nl/ois/ois.asp?buurtcode=7580509][i]“www.demis.nl/ois/ois.asp?buurtcode=7580509”[/i
    , en dat levert dan alleen de gegevenskolom zonder kaartje:

    Gemeente: Breda Buurt: Liesbos De kans op overstroming is 1 keer per: 2000 jaar De overstromingsdiepte is dan: 0 m Gemiddelde maaiveldhoogte: 4.53 m+NAP Overstromingsdiepte in 2100: 0 m (Bij een verwachte zeespiegelrijzing van 0.55 m) Aantal inwoners: 840 Aantal woningen: 290

    (vervolg)

    En dit was niet de eerste keer dat zij zich dat hoogtebestand lieten ontfutselen, het roemruchte “Telezoek”

    toonde destijds ook een “hoogtemeting” bij de postcode - in de laatste kolom van een soort “Superfoongids” - totdat, aldus:

    [quote]… één van de oprichters van Telezoek, die niet met naam- en toenaam genoemd wil worden. De man is in het dagelijks leven programmeur. Telezoek blijkt feitelijk een uit de hand gelopen digitaal trapveldje van vier programmeurs die ‘eens lekker wilden stoeien’ met de scripttaal PHP en de databasetaal MySql.

    Ze verdeelden de miljoenen zoekvragen over meerdere pc’s in Nederland en in de VS. Op hoogtijdagen werd 700 Mb per dag verbruikt en dat bleek een dure grap. Een ander probleem: het ministerie van V en W had een vriendelijk, maar omineus mailtje gestuurd. Een ambtenaar vroeg zich af hoe Telezoek aan de hoogtemetingen van allerlei plaatsnamen was gekomen.

    Die gegevens waren toch beschermd? De woordvoerder van Telezoek denkt van niet, want de 60 MB aan geografische gegevens haalde hij zelf van de website van het ministerie. “Het staat er trouwens nog steeds op. Enfin, we doen Telezoek voor onze lol. Van tevoren hebben we tegen elkaar gezegd: op het moment dat er kritiek komt, stoppen we er mee. Dit lijkt ons een goed moment.”

    Voelspriet - 30 juli 2002
    http://www.voelspriet.nl/telezoek2.htm
    [/quote]

    [quote]Welkom op TreinVizier.NL (Testversie 1)

    http://www.treinvizier.nl][img]http://img19.imageshack.us/img19/2092/treinvizierfk4.gif[/img

    Actuele treinposities op de kaart
    TreinVizier laat je zien waar de passagierstreinen in Nederland zich op dit moment bevinden. Je kunt meer informatie over een trein opvragen door erop te klikken.

    Hoe weet TreinVizier de positie van de treinen?
    Hiervoor maken we gebruik van de dienstregeling van de treinen. Op basis van gepubliceerde vertrek- en aankomsttijden berekenen we waar een trein zich op elk moment waarschijnlijk bevindt. Alhoewel de echte positie tijdens een rit niet bekend is, geeft deze aanpak een redelijk accurate schatting.

    Hoe weet TreinVizier dat een trein is vertraagd?
    De NS publiceert op haar site voor een aantal stations de actuele/live vertrektijden. Voor die stations kunnen we alle vertragingen live meenemen in de positieberekening.

    TreinVizier.NL

    [/quote]
    TreinVizier.nl is gebouwd door Arjen Kruithof die met zijn inzending de tweede prijs won in de wedstrijd

    “Ben jij beter dan Microsoft?”.

    Dataverrijking!

    Zoals hij er zelf al bij schrijft, open het bij voorkeur in Firefox en er is nog wel wat aan bij te schaven, zie zojuist “Sprinter 4080 NS” komende van het Amstelstation de bekende bocht in Amsterdam-Oost negeren en naast de spoordijk, met “Speed: 118 km/h” dwars door de Transvaalbuurt naar station Muiderpoort rijden. 8)

    Data verarming …

    [quote]Wijken, buurten en postcodegebieden

    De lijst [probleemwijken] van minister Vogelaar telt veertig wijken. Maar wat zijn wijken nou precies?

    De wijken van VROM zijn in elk geval niet de wijken die het Centraal Bureau voor de Statistiek (CBS) hanteert. Het CBS heeft een duidelijke geografische hiërarchie gemaakt van Nederland, waarbij elk gebied is samengesteld uit een aantal kleinere. Een klein gebied kan nooit in twee grotere gebieden tegelijk liggen, zoals Turkije in Europa én Azië ligt.

    Binnen alle 443 Nederlandse gemeenten liggen wijken, die op hun beurt zijn opgebouwd uit buurten. Buurten zijn „het laagste regionaal niveau en zijn afgebakend vanuit bebouwingsoogpunt of sociaal-economische structuur”, zoals het CBS het omschrijft. „Wijken zijn optellingen van een of meer aaneengesloten buurten.”

    Deze CBS-indeling wordt door de ambtenaren van alle gemeenten gebruikt, en ook ministeries en de EU werken ermee. Maar omdat er behalve ambtenarentaal ook nog de taal van de gewone burger bestaat, kan er verwarring ontstaan over het begrip ‘wijk’. Een VROM-wijk is geen CBS-wijk.

    Neem bijvoorbeeld de Rotterdamse Zuidelijke Tuinsteden, volgens Vogelaar een van de veertig probleemwijken. Volgens een oudere publicatie van VROM worden hiermee Pendrecht, Zuidwijk, Lombardijen en Groot-IJsselmonde bedoeld, allemaal naoorlogse wijken met veel flatgebouwen van circa vier verdiepingen. Het blijken vier CBS-buurten te zijn die liggen in twee CBS-wijken, Charlois en IJsselmonde. De wijkgrenzen zijn ook deelgemeentegrenzen. Zo kan één wijk (Zuidelijke Tuinsteden) in de volksmond ook best twee wijken zijn (IJsselmonde en Charlois) of zelfs vier (de genoemde buurten).

    En dan zijn er nog de postcodegebieden. Elk Nederlands adres heeft een postcode van vier cijfers en twee letters. Sociaal-geografen werken vaak met zogeheten vierpositiepostcodegebieden (pc4). Dit zijn gebieden waar de vier cijfers van alle postcodes dezelfde zijn. Bedrijven die aan direct marketing doen, hebben heel veel gegevens opgeslagen volgens dit principe.

    Maar het probleem hierbij is dat deze gebieden niet precies passen in de CBSindeling. Zo vallen er twee pc4-gebieden binnen de CBS-buurt Pendrecht (3084 en 3086). Omgekeerd kan ook: twee of meer CBS-buurten die geheel of gedeeltelijk binnen één pc4-gebied liggen, zoals Katendrecht en de Afrikaanderwijk (beide in 3072). De vorig jaar gepubliceerde Kanskaart van Nederland van de Stuurgroep Experimenten Volkshuisvesting, over verloedering, was gebaseerd op het pc4-principe. De namen hierwaren vaak dezelfde als die van het CBS, maar toch waren het steeds nét iets andere gebieden.

    NRC - Wijken, buurten en postcodegebieden 23-3-2007
    www.nrc.nl
    [/quote]

      Over geodata-bestanden… (lang)

      Er is sprake van vrijgeven voor algemeen gebruik. Digitale bestanden met geo-gegevens waren altijd duur vanwege het “profijtbeginsel” maar het lijkt erop dat er wat begint te schuiven. Onder noemers als “Andere overheid” is men begonnen aan een ordelijke terugtocht.

      Ze voelen de hete adem van Google Maps in de nek, een van de “zonnekoningen” van Rijkswaterstaat, Raymond Feron, hoogste verantwoordelijke van het Agentschap Geo-Informatie van Rijkswaterstaat:

      [quote]Belastinggeld

      “Geo-ict helpt Rijkswaterstaat om zich te profileren naar het grote publiek”, zegt hij. “Dankzij Google Earth komt geo-informatie de huiskamer in.” Om burgers te stimuleren meer met geografische informatie te doen, speelt Rijkswaterstaat met de gedachte om het Nationaal Wegenbestand kosteloos ter beschikking te stellen. Dit omdat de kaarten worden gefinancierd uit belastinggeld. Feron vindt het dus onzin dat geïnteresseerden nog extra moeten betalen voor de kaarten die momenteel nog binnen Rijkswaterstaat worden gebruikt. “We willen ook luchtfoto’s, gemaakt in opdracht van de overheid, vrij beschikbaar stellen aan het publiek”, zo onthult Feron aan de deelnemers. De gedachte hierachter is dat volgens Feron iedere burger recht heeft op betrouwbare geografische gegevens. “Sommigen noemen deze vrije verstrekking marktverstoring. Ik ben van mening dat dit bijdraagt aan een transparante overheid.”

      In Perspectief - dertiende GIS Conferentie
      http://www.in-perspectief.nl/default2.asp?page=archief&art_id=71
      [/quote]
      Uit zijn presentatie de tekst van de sheet over een “Taskforce OnzeGeo.nl”:

      [quote]• Naar aanleiding van het Interdepartementale Geo-Informatie-beraad
      • Gestimuleerd door het succes van Google Earth en Géoportal
      • Op korte termijn zichtbare resultaten tonen
      • Beschikbaar voor alle burgers
      • Alle departementen leveren minimaal één dataset aan

      Geo-informatie: de weg naar het publiek

      [/quote]
      Dat OnzeGeo.nl
      www.onzegeo.nl
      moet een interactieve laag over Googlemaps gaan worden:

      In september 2007 wordt de definitieve versie van de website gelanceerd voor het grote publiek door het RGI, het innovatieprogramma Ruimte voor Geo-Informatie, waaraan het Ministerie van VROM een subsidie van 20 miljoen Euro verstrekte om ons - belasting betalende burgers - een eindweegs tegemoet te komen:

      [quote]Vijfentwintigduizend geodatasets liggen nu nog ongebruikt in overheidsgebouwen

      Klein en vol als het is, blijkt Nederland niet alleen rijk aan geo-informatie, maar ook bijzonder handig in het gebruik ervan. Net als TomTom bij de beursgang in 2005 bracht kaartenkennis ons land 400 jaar geleden roem en rijkdom: ‘Met de 180 navigatiekaarten in de Geheime Atlas van de VOC wist Nederland de Portugezen te verslaan en werd zo de overheersende koloniale macht in het zuidwesten van de Stille Oceaan.’

      Iedereen die mee wil werken aan de Nationale Geo-Informatie Infrastructuur is van harte welkom. Want we hebben niet alleen geo-informatie specialisten nodig. Uit een inter-nationale inventarisatie blijkt dat culturele, institutionele en juridische factoren minstens zo belangrijk zijn als de geo-informatie technologie zelf. En dus moeten we niet alleen technische standaarden ontwikkelen voor het uitwisselen van geo-informatie, maar ook oplossingen bedenken voor de spanning tussen openbaarheid van overheidsinformatie en de privacy van burgers. En moeten we businessmodellen ontwikkelen die acceptabel zijn voor zowel de belastingbetalende burger als de verzakelijkende overheid. Ook moeten we nu al consumenten, bedrijven en overheden betrekken bij het ontwikkelen van innovatieve diensten, zodat ze straks niet als onhandig of duur terzijde worden geschoven.

      Brochure RGI
      http://www.rgi.nl/downloads/files/Brochure%20RGI.pdf
      [/quote]
      Verder is er uitgebreid onderzoek gedaan:

      [quote]Belemmeringen in de toegankelijkheid van (overheids)-geoinformatie

      Er bestaat in Nederland een (nu nog scheve) verhouding tussen vraag en aanbod van geo-informatie. Deze scheve verhouding wordt niet veroorzaakt door een gebrek aan aanwezige informatie. Overheden, kennisinstituten en commerciële bedrijven beschikken over een uitgebreide schat aan geografische informatie van hoge kwaliteit. Het probleem is vooral dat het Geo-Informatie werkveld er niet in slaagt om vanuit de vraagstelling gebruikers en aanbieders te koppelen. Maatschappelijk en economisch heeft deze situatie ernstige negatieve gevolgen. Het kost veel geld om aan de juiste informatie te komen, processen worden vertraagd, de burger is niet goed geïnformeerd, plannen zijn onevenwichtig en urgente problemen komen moeizaam tot een oplossing.

      Eén van de barrières die moet worden overkomen, is de slechte toegankelijkheid van overheidsgeo-informatie. Overheidsinstanties hebben uitgebreide gegevensbestanden waarvan de meeste aangelegd en onderhouden worden voor het uitvoeren van hun wettelijke taken. Aan de andere kant heeft de private sector een grote, zij het nu nog vaak onuitgesproken, behoefte om deze bestaande gegevensbestanden te gebruiken voor aanvullende toepassingen. Echter, door de slechte toegankelijkheid van de databanken wordt dit ernstig beperkt. Dit schept niet alleen een probleem voor de private sector die toegevoegde waarden producten en/of diensten voor commerciële doeleinden wil ontwikkelen, ook de overheid verliest een kans om het rendement van hun investeringen in opgebouwde databanken te vergroten.

      Om dit probleem tegemoet te komen, moeten dus de barrières (zowel financieel als juridisch, technisch en organisatorisch) worden weggenomen Dit houdt dus onder meer in dat de toegankelijkheid van de gegevens transparant moet worden gemaakt. Op dit moment gebruiken alle aanbieders van geo-informatie allemaal hun eigen overeenkomsten met verstrekkingsvoorwaarden en tarieven, variërend van eenvoudig Nederlands tot moeilijk leesbare juridische taal. De verstrekkingsvoorwaarden van de verschillende aanbieders van gegevens zouden duidelijk en uniform moeten zijn. Daarnaast moet er ook een balans gevonden worden tussen de betaalbaarheid van de gegevens voor de afnemers enerzijds en een redelijk rendement op investeringen voor de aanbieders anderzijds.[/quote]
      Hetzelfde rapport nog over de kosten van het “Hoogtebestand” waar het eerder in deze thread ook over ging:

      [quote]AGI heeft eind 2005 de verstrekkingskosten verlaagd voor het AHN bestand. Maar zelfs dan zijn de verstrekkingskosten nog hoog, vooral voor de kleinere bedrijven.

      Als de overheid echt serieus is wat betreft de ontsluiting van overheidsinformatie dan moet die informatie ook betaalbaar zijn. Misschien ligt de toekomst wel in vrije toegang tot alle geo-informatie, maar dat brengt ook problemen met zich mee. Ten eerste is dat unfair voor de bedrijven die al flink geïnvesteerd hebben in dure geo-informatie. Ten tweede betekent dat een verlies van direct inkomen voor de betreffende overheidsinstanties waardoor hun financiering in gevaar zou kunnen komen. Weer aan de andere kant zou het vrijgeven van geo-informatie een impuls kunnen geven aan het ontwikkelen van innovatieve toepassingen door de private sector. Hierdoor zal de overheid ook weer meer inkomsten uit omzetbelasting, vennootschapbelasting en inkomstenbelasting genereren.

      Geolokketten - Vrijheid in verbondenheid - Rapport
      http://www.geoloketten.nl/jahia/webdav/site/geoloketten/users/loketadmin/public/Rapport_belemmeringen_overheidsdata.doc
      [/quote]
      Over een concreet voorstel, vrijgeven van het Nationaal Wegenbestand (NWB):

      [quote]Gratis geo-informatie van de overheid?

      Graag, voor een fietsroute zonder heuvels bijvoorbeeld.

      De vraag wat mensen en bedrijven doen als de overheid haar geo-informatie bestanden vrij beschikbaar stelt, blijkt erg afhankelijk te zijn van het soort bestand. Als bijvoorbeeld het Actueel Hoogte Bestand van Nederland door Rijkswaterstaat vrijgegeven wordt, zijn er verschillende partijen die mogelijkheden zien om met deze informatie nieuwe of verbeterde informatieproducten te maken. Het zou bijvoorbeeld veel gemakkelijker worden een autoroute te plannen met het laagste benzineverbruik, of een fietsroute zonder heuvels. Maar ook het maken van een virtuele werkelijkheid voor computerspelletjes komt daarmee een stap dichterbij: Sim-city in uw eigen wijk!

      Het vrijgeven van het Nationaal Wegenbestand (NWB) stuit op de nodige weerstand, vooral bij enkele grote leveranciers van geo-producten. Hun huidige route- en kaartproducten zouden concurrentie kunnen gaan ondervinden van de gratis overheidsdata, vooral in toepassingen waar met minder goede basisgegevens kan worden volstaan.

      Er wordt zeer wisselend gedacht over de vraag of vrije geo-informatie negatieve gevolgen heeft voor bijvoorbeeld veiligheid of terrorisme. Wel is men het erover eens dat de kwaliteit en betrouwbaarheid van de geo-informatie aan meer gevaren bloot worden gesteld, omdat een ieder “aan de haal kan gaan” met de gegevens.

      Resultaten Toekomstverkenning vrij beschikbare geo-informatie

      [/quote]
      Of vrije geo-informatie inderdaad negatieve gevolgen heeft, het parlement:

      [quote]Geachte voorzitter,

      De leden Roemer en Roefs hebben vragen gesteld over navigatiesystemen (Nationaal Wegen Bestand). Hierbij treft u de antwoorden aan.

      1. Is het waar dat het Nationaal Wegenbestand (NWB) vrijgegeven wordt? Kunt u dit toelichten?

      2. Ja. Rijkswaterstaat zal het NWB onder voorwaarden vrijgeven. Dit moet in het licht gezien worden van het programma “Andere Overheid” en het stelsel van Basisregistraties.Tot 1 januari 2009 wordt het NWB vrijgegeven zonder recht op hergebruik. Na deze datum wordt het NWB vrijgegeven zonder restricties. Met deze overgangstermijn wordt deels tegemoet gekomen aan de belangen van de gevestigde markt.

      […]

      1. Bent u ervan op de hoogte dat sinds het vrijgeven van het wegenbestand in de Verenigde Staten de kwaliteit hiervan achteruit is gegaan? Wat is uw mening hierover?

      2. Ja, ik ben op de hoogte van berichten die daar op wijzen. De situatie in de VS is echter niet vergelijkbaar met Nederland. In tegenstelling tot de VS staat het budget waaruit het NWB gefinancierd wordt niet onder druk. Het bijhouden van het NWB maakt deel uit van het primair proces van Rijkswaterstaat en is niet afhankelijk van de opbrengsten uit verkoop. De wegbeheerders in Nederland zullen de gegevens zelf blijven inwinnen; dat staat los van het vrijgeven van het NWB. Er is derhalve geen sprake van een mogelijk kwaliteitsverlies.

      Ministerie van Verkeer en Waterstaat - antwoorden op vragen Tweede Kamer (16 maart 2007)
      http://www.verkeerenwaterstaat.nl/Images/br.45905_tcm195-177968.pdf
      [/quote]
      Dat gaat zomaar niet, lobbyclub BGI - een aantal grote bedrijven
      http://www.geo-bedrijven.nl/leden.php
      die doen in geodata - hees vorig jaar de stormbal:

      [quote]Openbaarmaking Nationaal Wegenbestand

      Plv. Directeur-Generaal Rijkswaterstaat Kohsiek heeft onlangs per brief gereageerd op een door BGI ingediend verzoek om meer duidelijkheid te geven over de openbaarmaking van het Nationaal Wegenbestand (NWB). RWS is voornemens het NWB op korte termijn laagdrempelig beschikbaar te stellen.

      Het BGI juicht dit initiatief van harte toe, en is van mening dat een laagdrempelige toegankelijkheid van overheidsinformatie via toegevoegde waarde producten en services een grote impuls zal geven aan de Nederlandse economie in het algemeen, en de geo-informatiesector in het bijzonder. In de afgelopen decennia zijn, indertijd bij gebrek aan toegankelijke overheidsdata, door verschillende BGI-leden bestanden opgebouwd vergelijkbaar met het NWB. Het zonder meer vrijgeven van het NWB zal daarom de markt verstoren en reeds actieve aanbieders van deze informatie ernstig duperen. Dit kan niet de bedoeling zijn van nieuwe wetgeving en het vigerend BZK beleid rond optimale beschikbaarheid van overheidsinformatie.

      Het BGI heeft daarom aan RWS gevraagd om, voordat tot openbaarmaking wordt overgegaan, bedrijven in staat te stellen hun bedrijfsvoering aan deze nieuwe situatie aan te passen, om op die manier de schade beperkt te houden. Het BGI heeft voorgesteld een overgangstermijn te hanteren, en indien nodig, tot een zekere vorm van compensatie te komen. Rijkswaterstaat heeft op dit verzoek positief gereageerd en heeft een commissie ingesteld die de mogelijkheden voor een overgangstermijn gaat onderzoeken. In samenspraak met de bedrijven in de geo-informatiesector zal een consultatieronde gehouden worden, waarna komend najaar duidelijkheid zal worden gegeven over de openbaarmaking van het NWB en een overgangstermijn. Gedurende dit onderzoek zal niet tot openbaarmaking worden overgegaan.

      Brief aan Ministerie van Verkeer en Waterstaat van Stichting Bedrijvenplatform Geo-Informatie
      http://www.geo-bedrijven.nl/document.php?id=52
      [/quote]
      Tot dat tijdstip moet een belangstellend iemand het nog maar even doen met deze link
      http://www.rws-avv.nl/servlet/page?_pageid=116&_dad=portal30&_schema=PORTAL30&p_item_type=theme&p_theme_name=
      naar een “Proeflevering NWB-wegen” (idem bestanden met gegevens van vaar- en spoorwegen)