Uitleg warnings and geskippte records bij MySql


#1

Bij het dumpen naar CSV zijn er bij mij 5.811.315 vermeldingen gedumpt.
Hiervan zijn hetzelfde aantal “subscriber”-records aangemaakt. 3.130.919 “info”-records met 4 warnings. Eerste vraag wat zijn die warnings?.
Verder 226 “category”-records en 6.447.031 “phonenumber”=records waarvan er 49.043 zijn geskipped. Betekent dit dat er dubbele nummers al uit zijn gefilterd ?.
Ik heb tot nu toe alleen nog maar de “white” versie 2006 gedumpt maar alles loopt verder ok. Zijn dit de juiste gegevens of heeft iemand andere cijfers?.
Maar al met al “muchos gracias” voor alle moeite die jullie hebben gedaan. Mochten er mensen zijn die MsAccess als database willen gebruiken (ik raad het eigenlijk af) dan kun je misschien dit tooltje gebruiken. Hier kun je MyDbConverter van Sofguru.net
http://www.softguru.net/MyDBConverter/mydbconverterhome.htm
vinden.

Inmiddels ook de pink versie gedumpt. Voor de liefhebbers heeft dit bij mij het volgende resultaat opgeleverd.
subscriber 744.459 records, info 2.070.727 ( skipped 2 - warnings 14), category 1243 records en phonenumber 1.009.934 - (skipped 73.220)


#2

Hoi I_tietje,

De cdfoon heeft (vaak) veel dubbele records er in zitten. Het is veel eenvoudiger om een record te dupliceren dan om er een ingewikkeld structuur voor te bedenken. Stel iemand wil in X plaatsen in telefoonboek staan en niet in de rest, dan gewoon record in deze X plaatsen kopieren.

De keuze die je hebt bij het dumpen is deze dubbelen er eerst uit te filteren en dan aan de database aan te bieden of het database pakket het laten ‘ontdubbelen’ en daarbij krijg je een warning. Laatste is het snels en gemakkelijkst, dus deze methode is gekozen.

Wat ik ontzettend leuk van Foondump vind is dat het een erg mooi voorbeeld is om een database te gebruiken. Je leert met redelijke grote database hoe het werkt. Met honderd testrecords werkt alles snel, maar het wordt pas erg leuk als je 5 miljoen records hebt. Proefondervindelijk kom je er achter dat MsAccess toch zijn beperkingen heeft.

De vriendelijke groet Jan Marco


#3

De warnings zijn niet het gevolg van dubbele records (we voegen immers een eigen primary key toe) maar van vermeldingen met quotes of | symbolen erin. Die 4 regels zijn ongeldig CSV en worden niet goed geimporteerd.


#4

Als je Mysql 4.1.0 of beter hebt en met de hand importeert, kan je “SHOW WARNINGS” gebruiken om de details van de warnings/errors uit het vorige statement te bekijken.