Google laat vijf eeuwen boeken doorzoeken
Met Ngram Viewer
22 december 2010 | Andy StevensHet woord ‘spiderman’ duikt al in de jaren ’20 op in boeken, lang voor de superheld van Marvel zijn intrede maakte begin jaren ’60. En de term ‘smartphone’ werd al een eeuw voor de iPhone gebruikt en staat zwart op wit in boeken die dateren uit de jaren 1900.
Hoe we dat weten? Door een nieuwe tool die Google heeft voorgesteld: Ngram Viewer. Met dit gereedschap kun je het gebruik van een specifiek woord of een zin achterhalen door te zien hoe vaak het opduikt in boeken van de laatste vijf eeuwen.
Vijf miljoen boeken doorzoeken
De analyse van Ngram Viewer gebeurt uiteraard dankzij de gigantische hoeveelheid boeken die Google digitaliseert – meer dan 15 miljoen sinds het project begon in 2004. Volgens Google gebruikt Ngram zowat een derde van dat aantal: vijf miljoen boeken, of ongeveer vier procent van alle boeken die ooit gepubliceerd zijn.
Door de meer dan 500 miljard unieke woorden uit de boeken te halen, kan de tool een overzicht geven van de geschiedenis van bepaalde woorden, en hun populariteit door de jaren heen.
Verschillende talen
Ngram Viewer werkt eenvoudig. Als je een woord of een zinsnede (tot maximaal vijf woorden) ingeeft, krijg je een grafiek die aangeeft hoe vaak jouw term is voorgekomen het voorbije halve millennium. Standaard zoekt de tool in Engelstalige boeken, maar je kan dat specificeren (Amerikaans Engels, Brits Engels, Engelse fictie) of voor een andere taal kiezen (Chinees, Frans, Duits, Russisch of Spaans).
Net zoals bij Google Trends kun je verschillende zoektermen ingeven die je wilt vergelijken. Dat doe je door ze van elkaar te scheiden met een komma.
De Ngram Viewer kan je wel vertellen hoe vaak een woord voorkomt, maar het geeft weinig context. Het is mogelijk om de periode waarin de resultaten opduiken te verfijnen en een overzicht te krijgen van de boeken waarin je woord vermeld wordt. Met wat geluk kan je de gedigitaliseerde pagina’s bekijken en krijg je zo een zeker inzicht over waarom het woord daar staat.
Hulp van Harvard
Het project kreeg een duwtje in de rug door onderzoekers van Harvard, die Google de datasets bezorgden die nodig waren om de informatie te genereren. Science Magazine noemt het “een kwalitatieve analyse van cultuur met behulp van miljoenen gedigitaliseerde boeken”.
Ngram Viewer lijkt vooral nuttig voor onderzoekers en linguïsten, maar iedereen met affiniteit voor woorden, en voor de geschiedenis en de evolutie van taal zal er het nodige plezier aan beleven.
bron: ZDNet
Lees verder op ZDNet »
Google en Clooney bewaken Soedanese grens
Google lanceert eBooks
Koninklijke Bibliotheek komt naar Google Books
Fotografen in actie tegen Google Books
Moet het internet gearchiveerd worden?
Google digitaliseert oude Italiaanse boeken
Chinese schrijfster wil proces tegen Google
Google moet inbinden met boekproject
Google wil winst boekenverkoop delen
Externe links »
» Review Ubuntu 12.04 (Precise Pagolin)
reviews
Ubuntu kennen we als solide en bruikbaar linuxbesturingssysteem. Versie 12.04 heeft een nieuwe kernel en gebruikersinterface Unity is hier en daar bruikbaarder geworden.
» De technologie van het 9/11-monument
news
Meer dan twee miljoen mensen hebben de herdenkingsplek voor de ramp van 11 september bezocht. Velen gebruiken technologie om alles uit de ervaring te halen.
» Wel borstvoeding, geen tepels op Facebook
news
Een ontevreden Facebookwerknemer besliste onlangs de richtlijnen voor het verwijderen van content te lekken aan nieuwssite Gawker. Dat deed het nodige stof opwaaien.
Review: Diablo III
Game
Twintig jaar geleden redde een groepje naamloze helden de wereld. Nu is het aan een nieuwe generatie om de demonen terug richting de hel te sturen.








