Zoekhulp

Om te kunnen vinden wat u zoekt in deze historische teksten moet u waarschijnlijk anders zoeken dan u gewend bent. Hoewel het invullen van een woord of naam al enkele resultaten zal geven, houdt de ideale zoekopdracht rekening met twee factoren.

Bronnen van fouten

Ten eerste kunnen woorden in de oorspronkelijke documenten voorkomen met meerdere spellingsvarianten. Ook kunnen er synoniemen of afkortingen gebruikt worden. Dit geldt ook voor personen. Zo kunnen voornamen en achternamen kunnen meerdere varianten hebben (Jan vs. Johannes vs. Joes, Vermolen vs. Vermeulen), maar kan het ook zo zijn dat iemand soms wel een patroniem gebruikt, en soms niet.

Ten tweede kunnen woorden verkeerd worden gelezen bij het automatisch transcriberen van de tekst (Permolen vs. Vermolen). Dit gebeurt vaker als een tekst minder lijkt op de teksten die gebruikt zijn om het gebruikte model te leren lezen. Het is raadzaam "foute" varianten die u tegenkomt te noteren: dezelfde fout wordt vaak vaker gemaakt.

Bouwen van zoekopdrachten

Om alle teksten te vinden waarvan de transcriptie exact een woord bevat, kunt u dit woord gewoon invoeren: chocola zal alle teksten die chocola bevatten teruggeven. Wilt u liever chocola en koffij? Voer dan chocola koffij in. Moeten deze twee woorden direct na elkaar staan? "chocola koffij" is dan uw zoekopdracht.

Om rekening te houden met spellingsvarianten en transcriptiefouten kunt u wildcards gebruiken. Het gebruik van ? laat ruimte voor een onbekend teken in de transcriptie, het gebruik van * voor meerdere tekens. Zo matcht Verm?len met Vermolen en Vermalen, maar niet met Vermeulen. Verm*len matcht met alledrie. Het is echter wel belangrijk om te onthouden dat wildcards ook kunnnen matchen met spaties: zo kan Verm*len ook matchten met een tekst die "Vermoedelijk zullen ze chocola willen" bevat.

Ingewikkeldere zoekopdrachten kunnen het best worden weergeven in reguliere expressies. Oefening baart kunst: reguliere expressies zijn ingewikkeld, maar op den duur wordt u er handiger in, en kunt in ingewikkeldere concepten kwijt in uw zoekacties. Hieronder laten we zien hoe u met varianten van Aart Wouters kan matchen. Zoals u ziet hoeft u niet gelijk gebruik te maken van alle opties, en het ingewikkelder te maken dan nodig! Uw reguliere expressie testen kan hier. Om het iets makkelijker te maken, houden wij er geen rekening mee of een letter een hoofdletter of kleine letter is.

Reguliere expressieUitleg
/Aart Wouters/Zonder poespas zoeken we gewoon naar exacte matches. Matcht met "Aart Wouters".
/Aar[td] Wouters/De t zou ook een d kunnen zijn: geef aan dat we op deze plek een letter verwachten die of een t of een d is. Matcht met "Aart Wouters" en "Aard Wouters".
/Aar[td] Wout/Minder informatie genereert soms betere matches. Matcht met "Aart Wouters" en "Aard Wouters", maar ook met alle mogelijke varianten zoals "Aart Woutersz" of "Aard Woutz".
/Aar[td] W[oa][nu]t/In de oorspronkelijke tekst kan Wouters ook met een "a" geschreven zijn, en het is ons opgevallen dat de "u" soms voor een "n" wordt aangezien bij het automatisch transcriberen. Matcht met "Aart Wauters" en "Aard Wontz".
/\sAar[td] W[oa][nu]t/Sommige woorden eindigen op "aart", en dat zorgt voor zoekresultaten die wij niet willen zien. Door "\s" in te vullen, garanderen wij dat er een spatie voor de eerste A komt. Matcht met "Aart Wauters" en "Aard Wontz", maar niet langer met "Waard want".
/\sAar[td]\sW[oa][nu]t/Soms worden Aart en Wouters gescheiden door een ander soort witruimte dan een spatie. Door "\s" in te vullen, levert dat geen problemen meer op. Matcht met "Aart Wauters" en "Aard Wontz", ongeacht de witruimte.
/\sA[a-z0-9]{1,3}[td]\sW[oa][nu]t/De "ar" in Aert worden niet altijd even goed gelezen, en zijn soms "er". Door "[a-z0-9]{1,3}" neer te zetten, geven we aan dat er op deze plek tussen de 1 en 3 letters of cijfers moeten staan. Matcht met "Aart Wauters" en "Aexad Wontz".

Verdere tips

Gebruik filters: door op het pijltje naast het vergrootglas te klikken krijgt u de optie om te filteren op een plaats en tijdsperiode. Let wel op: de tijdsperiode is iets minder precies dan u gewend bent, omdat deze gelinkt is aan register, niet aan een akte zelf.

Gericht zoeken geeft u sneller resultaten: als er minder dan 5000 resultaten zijn, kunnen wij de resultaten sneller aan u presenteren. Dit scheelt mogelijk een hoop frustratie!

Kijk altijd naar de oorspronkelijke tekst: bij het automatisch lezen van een akte kunnen er problemen zijn ontstaan, zowel in het transcriberen van de akte als in de volgorde van de tekst (soms staat de tekst wat door elkaar).