ZOEKEN MET ZOEKMACHINES
naar informatieve teksten op internet

praktische tips en adviezen van Rob Nanninga

Homepage Skepsis


1. Gebruik Google of All the Web
2. Gebruik meerdere zoekwoorden tegelijk
3. Kies de meest relevante zoekresultaten
4. Gebruik de cache van Google of de Toolbar
5. Beoordeel de betrouwbaarheid van webpagina's
6. Kies effectieve zoekwoorden
7. Gebruik de mogelijkheden van je browser
8. Meer informatie over zoeken op Internet


 

1. Gebruik www.google.com  of  www.alltheweb.com/advanced


  Zoeken met Google gaat snel en levert meestal meer resultaten op dan andere zoekmachines. De supergrote database van Google is vooral nuttig wanneer je op zoek bent naar informatie die niet overal voor het oprapen ligt. Daar komt bij dat Google enkele extra mogelijkheden biedt die goed van pas komen.

Google gebruikt een systeem waarbij een webpagina hoger in de lijst met zoekresultaten wordt geplaatst naarmate meer websites naar deze pagina verwijzen. Dit vergroot de kans dat belangrijke webpagina's bovenaan komen te staan.

Gewoonlijk biedt Google meer dan je kunt lezen. Wanneer je weinig over het hoofd wilt ziet, kun je All the Web (ook bekend als Fast) als aanvullende zoekmachine gebruiken. Er bestaan ook Nederlandse zoekrobots zoals Ilse en Vindex, maar die zijn overbodig want met Google of All the Web kun je aanmerkelijk meer Nederlandstalige pagina's vinden.

Op de zoekpagina van Google kun je klikken op 'preferences'. Vervolgens kun je bij 'Number of Results' aangeven hoeveel zoekresultaten je op één pagina wilt zien. De standaardinstelling is 10, maar dat is nogal weinig waardoor je vaak naar een volgende pagina moet  doorklikken. Het is handiger om de lijst wat langer te maken (het maximum is 100).

Bij 'preferences' kun je desgewenst ook aangeven dat je alleen Nederlandse pagina's wilt vinden. Dat is echter niet nodig wanneer je een zoekwoord gebruikt dat alleen in het Nederlands voorkomt. (Eventueel kun je een zoekwoord toevoegen dat in vrijwel alle Nederlandse teksten voorkomt, bv het woord 'wordt'.)

Druk ten slotte op de knop 'Save Preferences' zodat Google je voorkeuren onthoudt (door middel van een cookie op je harde schijf). Wanneer je de instellingen vaak wilt veranderen, is het handiger om www.google.com/advanced_search te gebruiken.

Google biedt de mogelijkheid een apart zoekvenster aan je Internet Explorer toe te voegen: de Google Toolbar. Daarmee kun je op elk moment Google doorzoeken. In het onderstaande voorbeeld heb ik de Toolbar zo klein mogelijk gemaakt (door deze met de muis naar rechtsboven te schuiven) zodat je alleen het zoekvenster ziet. De overige opties (waarover later meer) zitten verborgen achter " >>" (rechts naast het Google zoekvenster).


 


2. Gebruik meerdere zoekwoorden tegelijk


De meeste mensen gebruiken slechts één zoekwoord tegelijk. Dat levert gewoonlijk een enorme hoeveelheid resultaten op, want Google verschaft alle pagina's waarop het gezochte woord te vinden is. Bovenaan de lijst staan meestal pagina's die een titel hebben waarin het zoekwoord voorkomt. Maar dat zijn niet altijd de beste of meest relevante pagina's.

Als voorbeeld heb ik even bij Google gezocht naar een Nederlandse tekst over parapsychologie. Dat leverde in totaal 723 treffers op. Bovenaan de lijst stond de pagina  Parapsychologie & Alternatieve Geneeswijzen. Maar wie daarop klikt, zal merken dat de betreffende website weinig met serieuze parapsychologie te maken heeft.

De zoekresultaten kunnen aanmerkelijk worden verbeterd door meer relevante zoekwoorden op te geven. Deze woorden kunnen achter elkaar en met een spatie ertussen in het zoekvenster worden getypt. Om wetenschappelijke teksten over parapsychologie te vinden kunnen we bijvoorbeeld het woord 'experimenten' toevoegen. Daarmee wordt het aantal treffers teruggebracht naar 92. Dit zijn alle pagina's waarop beide zoekwoorden te vinden zijn. 

A    130 resultaten

B      45 resultaten

In het bovenstaande voorbeeld A heb ik gezocht naar Nederlandse teksten waarin het woord 'parapsychologie' voorkomt en bovendien het woord 'experiment' of (OR) 'experimenten'. In het tweede voorbeeld B wordt gezocht naar pagina's waarop alle drie de woorden voorkomen. Dit levert slechts 45 zoekresultaten op, maar daaronder bevinden zich naar alle waarschijnlijk de meest diepgaande teksten. Want als je echt iets zinnigs over parapsychologie te vertellen hebt, dan kun je de woorden 'experiment' en 'experimenten' bijna niet vermijden. (Met de knop I'm Feeling Lucky ga je rechtstreeks naar de eerste pagina in de lijst van zoekresultaten, maar dat is niet aan te raden.)

Door een minteken voor een zoekwoord te plaatsen, kun je dit woord uitsluiten. Je vindt dan geen pagina's waarop dit woord voorkomt. Probeer het bijvoorbeeld eens met -aura. Aura's zijn populair in New Age-kringen, maar hebben meer met occultisme dan met parapsychologie te maken. Als ik deze zoekterm toevoeg, blijven er nog maar 35 resultaten over. Het is opvallend dat alle kritische teksten nu bovenaan staan.

Het is ook mogelijk om te zoeken naar een specifieke reeks woorden door deze woorden tussen aanhalingstekens te plaatsen, bijvoorbeeld "parapsychologisch onderzoek" of  "tijdschrift voor parapsychologie". Het is niet nodig om titels of namen met een hoofdletter te schrijven, want daar let Google niet op.

Google's Advanced Search biedt vier aparte velden om de zoekwoorden in te voeren:


  • In het bovenste veld zet je de woorden die in ieder geval in de tekst moeten voorkomen.
  • In het tweede veld kun je naar een bepaalde woordenreeks zoeken.
  • In het derde veld kunnen je enkele woorden invullen waarvan er minstens één op de gezochte pagina moet staan.
  • In het vierde veld kun je woorden plaatsen die niet in de tekst mogen voorkomen.


Het is niet altijd eenvoudig om effectieve zoekwoorden te bedenken. Ik kom daar later nog op terug.


3. Kies de meest relevante zoekresultaten


zoek11.jpg (9774 bytes)

Omdat je meestal niet alle gevonden webpagina's kunt bekijken, zul je een keuze moeten maken op basis van de informatie die Google verschaft.

Google laat onder meer korte fragmenten uit de tekst zien waarin de gebruikte zoekwoorden voorkomen. Hierboven zijn dat de woorden 'tenhaeff' en 'parapsychologie'. Zo kun je enigszins beoordelen in welke context de woorden worden gebruikt en in hoeverre de tekst relevant zou kunnen zijn. In het onderste voorbeeld zie je dat de zoekwoorden zijn gevonden in een verwijzing naar een boek, dat tussen haakjes staat (zonder jaartal en uitgever). Dit kan erop duiden dat de tekst verder weinig informatie over Tenhaeff bevat.

De titels van de pagina's kunnen eveneens nuttige aanwijzingen verschaffen. Zo wekt de titel 'New Age' niet de indruk dat het over serieuze parapsychologie gaat. De titel 'Gerard Croiset' is daarentegen wat onduidelijk, behalve wanneer je weet dat Croiset een bekende paragnost was die vaak met Tenhaeff samenwerkte.

zoek10.jpg (8474 bytes)

Ook het adres van de pagina, dat groen is gekleurd, biedt waardevolle informatie. In het bovenstaande voorbeeld kun je zien dat de New Age-pagina toebehoort aan een abonnee van Planet Internet. Als je een tilde (golflijntje: ~) in het adres ziet staan of als je de woorden 'members' of 'users' tegenkomt, heb je waarschijnlijk te maken met persoonlijke webpagina's en niet met een website van een officiële organisatie of instelling.

Achter het adres staat hoeveel kilobytes de pagina in beslag neemt (exclusief de plaatjes). Informatieve teksten zijn gewoonlijk minimaal 10K. Kortere pagina's bevatten soms links naar een reeks relevante teksten (al kunnen die met Google ook rechtstreeks worden gevonden). Bij erg lange pagina's loop je het risico dat ze veel irrelevante informatie bevatten.

In eerste instantie laat Google niet meer dan twee pagina's van elke website zien, waarbij de onderste pagina naar rechts inspringt. Daardoor krijg je geen lange lijsten van pagina's die allemaal op dezelfde site staan. Als een site meer relevante pagina's bevat, dan zie je onderaan een extra link met de woorden 'More results from ...' Deze link levert in het onderstaande voorbeeld tien pagina's van Skepsis op waarin de woorden 'parapsychologie', 'experiment' en 'experimenten' voorkomen.

zoek6.jpg (20922 bytes)

Met de nodige oefening en door trial and error kun je geleidelijk beter en sneller leren beslissen welke pagina's relevant zijn, zodat je niet op alle links hoeft te klikken om het gewenste resultaat te vinden. Wanneer het niet goed lukt, kun je als alternatief All the Web gebruiken, dat de zoekresultaten op een andere manier presenteert:


All the Web toont de eerste zinnen van de tekst of de korte omschrijving die de publicist voor dit doel in een speciale metatag heeft geplaatst. Dit biedt in het bovenstaande voorbeeld meer duidelijkheid dan Google. Het belangrijkste nadeel is dat je zoekwoorden dikwijls niet in de omschrijving staan zodat je niet meteen kunt zien hoe en waar ze in de tekst worden gebruikt. Dat is vooral lastig wanneer je naar specifieke informatie zoekt die niet overal in de tekst te vinden is. In andere gevallen kan All the Web echter de voorkeur verdienen.


4. Gebruik de cache van Google of de Toolbar




Google maakt een kopie van alle webpagina's die in het systeem zijn opgenomen. Je kunt in plaats van de originele pagina ook deze kopie opvragen. Klik dan niet op de titel van de pagina maar op het woord Cached dat er een paar regels onder staat. Het gebruik van de cache heeft drie voordelen.
  1. Alle zoekwoorden die op de betreffende webpagina voorkomen worden met kleuren gemarkeerd, zodat je snel en gemakkelijk de relevante passages in de tekst kunt vinden zonder alles door te lezen.
  2. Je kunt er vrij zeker van zijn dat de pagina nog beschikbaar is, ook wanneer hij inmiddels van de oorspronkelijke site is verwijderd.
  3. Je kunt de pagina vaak sneller uit de cache van Google halen dan van een andere site.

De cache heeft ook een nadeel. Het is mogelijk dat de betreffende pagina onlangs is gewijzigd of aangevuld zodat Google niet beschikt over de meest recente versie. Wanneer je een interessante pagina uit de cache hebt gehaald, kun je voor de zekerheid nagaan hoe het origineel eruit ziet door op de link te klikken die bovenaan deze pagina staat.

De Google Toolbar biedt de mogelijkheid om de zoekwoorden ook op de originele pagina met kleuren te markeren. Gebruik daarvoor de knop 'Highlight'. Je hoeft de pagina dan niet uit de cache te halen.



5. Beoordeel de betrouwbaarheid van webpagina's


Iedereen kan teksten op Internet zetten, zodat de kwaliteit ver uiteen loopt. Als een tekst eerder in gedrukte vorm is verschenen, wordt deze oorspronkelijke bron bijna altijd vermeld. Zulke gedrukte teksten zijn doorgaans van betere kwaliteit dan teksten die uitsluitend op Internet worden gepubliceerd en niet zijn gecontroleerd door een redactie.

Het is belangrijk om te weten waar de auteur zijn of haar informatie vandaan heeft gehaald. Zijn de beweringen goed onderbouwd? Als er geen controleerbare (literatuur)verwijzingen in de tekst staan, is dat een reden voor wantrouwen. Uiteraard is het ook nuttig om te weten of de auteur deskundig is. Eventueel kun je via een zoekmachine meer informatie over de auteur verzamelen. Soms is het niet duidelijk wie de tekst geschreven heeft. Zulke anonieme teksten hebben meestal de minste waarde.

In de URL's van Britse Universiteiten zie je gewoonlijk .ac (academic) staan, terwijl Amerikaanse onderwijsinstellingen de code .edu gebruiken; .gov duidt op een overheidsinstelling, .org op een non-profit organisatie en .com op een commerciële onderneming.

Het kan nuttig zijn om even na te gaan op wat voor website de pagina staat. Als het adres van een webpagina (de URL) bijvoorbeeld www.planet.nl/~wmt/newage.htm is, dan kun je het laatste deel (de bestandsnaam) verwijderen door de cursor achter de URL te plaatsen en meermaals op Backspace te drukken. Druk vervolgens op Enter. Je komt dan terecht op de beginpagina van de website (www.planet.nl/~wmt/ ). Via deze homepage kun je meestal achterhalen wat het doel van de site is en door wie hij is opgezet (maar niet in dit geval).

Organisaties gebruiken vaak hun naam als servernaam, bijvoorbeeld www.skepsis.nl. Maar wie is nou eigenlijk de voorzitter van Skepsis? Die informatie staat wel op de site, maar de pagina is moeilijk te vinden. Met www.google.com/advanced_search is zo'n probleem snel opgelost, want daar kun je binnen een site zoeken op trefwoorden. De Google Toolbar heeft hiervoor een aparte knop waarmee je nog sneller een site kunt doorzoeken. Ook met het standaard zoekvenster van Google kun je binnen een site zoeken. Toets bijvoorbeeld voorzitter site:www.skepsis.nl  in om alle pagina's te vinden waarop het woord 'voorzitter' voorkomt. Je kunt ook meerdere zoektermen gebruiken, bijvoorbeeld:

zoek4.jpg (4529 bytes)

Veel organisaties (waaronder Skepsis) hebben overigens zelf al een zoekmachine op hun site geplaatst. Het voordeel daarvan is dat de database gewoonlijk regelmatig wordt bijgewerkt zodat je geen recente pagina's over het hoofd ziet.

Het is mogelijk om met Google na te gaan welke pagina's naar een bepaalde site verwijzen. Zoek bijvoorbeeld naar link:www.skepsis.nl en je ziet een overzicht van alle (bij Google bekende) links naar de homepage van Skepsis.

Het kan ook nuttig zijn om even te kijken bij de links die op de betreffende website staan. Veel sites hebben een aparte pagina met links naar verwante of aanbevolen sites en pagina's. Als je eenmaal een informatieve website te pakken hebt, dan kun je vaak via de links nog meer bruikbare informatie vinden.


6. Kies effectieve zoekwoorden


Om relevante teksten te vinden moet je proberen enkele woorden te raden die waarschijnlijk vaak in combinatie met elkaar op de gezochte webpagina's voorkomen. Dat moeten bij voorkeur geen woorden zijn die ook op talloze irrelevante pagina's staan.

De keuze van de meest kenmerkende en specifieke woorden is gemakkelijker naarmate je meer over het onderwerp weet. Als je nog weinig weet, kun je proberen om via algemene termen eerst een tekst te vinden die relevant is. Vervolgens kun je uit die tekst meestal betere zoekwoorden halen, bijvoorbeeld vakjargon, waarmee je meer soortgelijke teksten kunt vinden.

Let in het bijzonder op namen van gezaghebbende deskundigen die worden genoemd of op titels van belangrijke boeken of artikelen. Die kunnen heel nuttig zijn om meer pagina's met betrouwbare informatie te vinden. Namen of titels kunnen tussen aanhalingstekens als zoekwoorden worden gebruikt. Google negeert veelvoorkomende Engelse woorden zoals 'in' en 'of'. Als je die niet wilt uitsluiten moet je er een plusteken voor zetten (+in).

Bovenaan de zoekpagina zie je hoeveel resultaten Google heeft gevonden. Wanneer dat er erg veel zijn, kun je de verzameling links beperken door onderaan de pagina te klikken op Search within results. Vervolgens kun je binnen de verzameling een nieuw zoekwoord opgeven. Uiteraard is het ook mogelijk om dit woord meteen achter de andere zoekwoorden in het zoekvenster te typen. Hoe meer relevante zoekwoorden je kunt bedenken, des te beter worden de resultaten.

Google biedt als enige de mogelijkheid om ook zogenoemde pdf-bestanden te vinden. Vooral officiële rapporten en studies, nieuwsbrieven en andere teksten die eerder in druk zijn verschenen, worden soms in pdf-formaat op het web gezet. Je ziet dan voor de link de aanduiding [PDF] staan. Het is mogelijk om uitsluitend naar pdf-bestanden te zoeken door de zoekterm filetype:pdf toe te voegen.

Om zoveel mogelijk relevante teksten te vinden, moet je meerdere combinaties van zoekwoorden proberen. Hieronder staan (in alfabetische volgorde) enkele nuttige zoekwoorden voor kritische artikelen over controversiële onderwerpen, die je in combinatie met elkaar en met andere zoekwoorden kunt gebruiken.
 

 

  • bias biased
  • claims
  • controversial
  • controlled (trial)
  • credulous
  • criteria
  • critic critics criticism critique
  • deception
  • disagreement disagrees
  • double-blind
  • error errors
  • evaluation
  • evidence evidential
  • experiment experiments experimental
  • fallacy
  • false
  • falsifiable
  • faults
  • fraud fraudulent
  • groundless
  • illogical
  • implausible implausibility
  • inconsistent inconsistencies
  • irrelevant
  • journal
  • lacks
  • misinterpret misinterpreted
  • misleading misled
  • mistaken
  • myth mythical
  • nonsignificant
  • opponent opponents
  • placebo placebo-controlled
  • post hoc reasoning
  • pseudoscientific pseudoscience
  • published
  • randomized
  • rebuttal
  • repeatability
  • replicable replicability
  • reproducible
  • research
  • results
  • scientific
  • self-proclaimed
  • skeptic skeptical
  • statistical
  • subjective
  • trial trials
  • unfounded
  • university
  • unsubstantial unsubstantiated
  • untrustworthy
  • unverified
  • verify verifiable


7. Gebruik de mogelijkheden van je browser


Als je op de startknop van je browser drukt (op het huisje), ga je naar een webpagina die je zelf kunt instellen (bij de IE via Extra > Internet-opties > Algemeen, en bij Netscape via Bewerken > Voorkeuren). Door ww.alltheweb.com/advanced of www.google.com/advanced_search als startpagina te kiezen, kun je het zoekscherm altijd snel oproepen.

Wanneer je een van de zoekresultaten aanklikt, wordt de gekozen pagina in hetzelfde venster geopend. Om terug te gaan naar de lijst, moet je op de knop Vorige drukken of op de Backspace van je toetsenbord. Het is ook mogelijk om de gekozen pagina in een nieuw venster te openen. Houd in dat geval de Shift-toets ingedrukt terwijl je op een link klikt.

De werkbalk van de Internet Explorer kan op je eigen voorkeuren worden afgestemd. Klik bijvoorbeeld met de rechter muisknop op een browserknop en kies de optie 'aanpassen'. Je krijgt dan de mogelijkheid om knoppen te verwijderen of toe te voegen. Je kunt ook de tekstlabels verwijderen (dat scheelt ruimte), de knoppen kleiner maken of van positie veranderen. Het adresvenster kan desgewenst met de muis worden versleept naar een andere plek en het kan ook kleiner worden gemaakt.

Een van de knoppen op de werkbalk heet Zoeken. Daarmee kun je aan de linkerkant van het scherm een zoekvenster van msn openen. Gebruik het registerbestand google.reg om deze zoekmachine te vervangen door Google (zie: Make Google your default). Klik op google.reg en open het bestand om je windowsregister rechtstreeks te wijzigen. Google laat nu in het linker zoekvenster de titels van de gevonden webpagina's zien. Wil je de volledige resultaten in het hoofdvenster zien, gebruik dan google_rsearch.reg.

Veel browseropties kunnen door middel van sneltoetsen worden opgeroepen. Enkele mogelijkheden die te vinden zijn in het helpbestand van de Internet Explorer:

Druk op CTRL+F om in een webpagina naar een bepaald woord te zoeken.
Druk op CTRL+I om een pagina toe te voegen aan je lijst met favorieten.
Druk op CTRL+N om een nieuw venster te openen.
Druk op CTRL+W om een venster te sluiten.
Druk op CTRL+C om gemarkeerde tekst naar het klembord te kopiëren
Druk op CTRL+V om de gekopieerde tekst elders te plaatsen

Druk op CTRL+P om de webpagina te printen
Druk op F5 om een pagina opnieuw op te vragen.
Druk op F11 om

Druk op Home om terug te gaan naar het begin van een pagina.

Wanneer je op het web veel informatie wilt verzamelen over een bepaald onderwerp, maak dan eerst een nieuwe map waarin je de webpagina's kunt opslaan. Deze map kun je later in je browser openen door de lokatie in het adresvenster te typen (bijvoorbeeld  d:/internet/parapsychologie). Je ziet dan welke webpagina's in de map zitten en je kunt ze meteen openen. (De map kan worden gemaakt met de Windows Verkenner. Een webpagina  kan worden opgeslagen door in het menu Bestand te klikken op Opslaan als.)

Het is niet verkeerd om naast de Internet Explorer of Netscape Navigator nog een tweede browser te installeren: Opera. Deze browser is niet alleen snel en klein, maar biedt ook veel nieuwe mogelijkheden. Zo kun je in Opera een webpagina groter of kleiner maken door aan het muiswieltje te draaien terwijl je de Ctrl-toets ingedrukt houdt. Dat is handig om kleine letters beter leesbaar te maken. Het is ook mogelijk met een enkele druk op de G-toets de plaatjes uit te schakelen. Wil je terug naar de voorgaande webpagina, dan hoef je alleen de muis een stukje naar links te bewegen terwijl je de rechter muisknop kort ingedrukt houdt. Andere muisbewegingen kunnen onder meer een venster sluiten of een nieuw venster openen. Zo zijn er nog veel meer handige opties, die heel plezierig werken. Het enige nadeel is dat niet alle sites goed worden weergegeven. Bovendien bevat Opera een reclamebanner. Om die te verwijderen moet je $39 betalen (of een illegaal registratienummer gebruiken).

Aanvulling: inmiddels is er een beter alternatief dat geheel gratis is: de Avant browser. Die verenigt alle voordelen van IE en Opera en biedt daarnaast nog meer mogelijkheden. Het installatiebestand is niet veel groter dan 1Mb e


8. Meer informatie over Zoeken op Internet


www.zoekprof.nl
Zoekprof.nl helpt professionele internetgebruikers effectief zoeken.

www.kb.nl/coop/detective/
Een interactieve cursus om de kwaliteit van informatie op het internet te leren beoordelen.

www.notess.com/search/
Detailed analysis of Internet Search Engines, their features, databases, and strategies.

www.searchengineguide.com/searchengines.html
A categorized, searchable, directory of topical search engines.

www.brightplanet.com/deepcontent/tutorials/search/index.asp
Bright Planet's extensive search tutorial

www.websearch.about.com/
Up-to-date news and information about search engines and directories online, and how to get the most out of them.

www.lib.berkeley.edu/TeachingLib/Guides/Internet/
University of California Teaching Library guides, instruction courses, and tutorial for the Interne
t