0
Bewaar meld een fout Verstuur {T}print

Elf miljard pagina's doorzoeken op tekst

Internetarchief ontwikkelt alternatieve zoekfunctie

05 augustus 2004 | Lars Pasveer
Internetarchief ontwikkelt alternatieve zoekfunctie
ZDNet.nl
Maar liefst 11 miljard geïndexeerde pagina's uit het Internet Archive kunnen binnenkort woordelijk doorzocht worden. Het Recall-project maakt het mogelijk om de vanaf 1996 geïndexeerde pagina's op tekst te doorzoeken. Voorheen kon alleen op basis van de domeinnaam in het archief worden geneusd.

Recall is voorlopig nog in bèta, wat te merken is aan de responstijden van de zoekdienst. Ook heeft Internet Archive om serverbelasting te verminderen de bandbreedte van zoekopdrachten beperkt tot 1999-2002.

De zoekresultaten van Recall zijn weinig hoopgevend. De "Server Busy" meldingen zijn legio en de interface is zo kaal, dat onduidelijk is waarom geen van onze zoekopdrachten resultaten opleveren.

Een mogelijkheid om de sinds 1996 geïndexeerde pagina's op basis van trefwoorden te doorzoeken zou het Internet Archive een stuk krachtiger maken. Voorlopig is de dienst niet echt bruikbaar en kan de internetarcheoloog beter in combinatie met Google en de al bekende Wayback Machine zoeken.

Op dit moment bevat de Internet Archive ongeveer 100 terabyte aan data, op een totaal van 11 miljard geïndexeerde pagina's. De populaire zoekmachine Google bevat momenteel referenties naar 4 miljard webpagina's. Google laat weinig los over de exacte grootte van hun zoekindexen, maar er wordt aangenomen dat ook deze meerdere terabytes beslaan.

 

Lees meer artikels over : archive, archief, recall

bron: ZDNet

Zoek uw toekomstige Job! »

in de kijker »

» Bèta Windows 8 mist startknop

news

Uit gelekte screenshots blijkt dat Microsoft de startknop die al aanwezig is sinds Windows 95 uit de binnenkort te verschijnen bèta van Windows 8 heeft gehaald.

lees meer »

» 'iPad 3 wordt in maart gelanceerd'

news

De kans is groot dat de volgende iPad in de eerste week van maart al wordt voorgesteld.

lees meer »

» Op Facebook verlies je al jouw rechten

news

Wie zichzelf als particulier, bedrijf of zelfstandige promoot via Facebook, stuit op zeer strikte voorwaarden. De site bezit alles en mag je voor het minste buitengooien.

lees meer »

Review: Never Dead

Game

"Schiet me maar aan flarden, ik raap me wel terug bijeen!", Huh? Innovatie is leuk, maar een hoofdrolspeler die zijn eigen lichaam verzamelt, is nieuw. Brengt Never Dead nog meer nieuwigheden of blijft het hier bij?

lees meer »

wedstrijden »

Win 2x Trust Vintori Wireless Speaker!

Win 2x Trust Vintori Wireless Speaker!

Doe mee »

Win 25x Ad-Aware Pro Internet Security!

Win 25x Ad-Aware Pro Internet Security!

Doe mee »

Smartphones

Populaire Tags op ZDNet »


Poll »

Beschikt u in uw organisatie over een datacenter (of serverruimte)?

Ja, in ons bedrijf zelf
Neen, wij gebruiken een extern datacenter
Wij gebruiken zowel een eigen datacenter als een extern
  
Win 2x Trust Vintori Wireless Speaker!

Win 2x Trust Vintori Wireless Speaker!

Doe mee »

Win 25x Ad-Aware Pro Internet Security!

Win 25x Ad-Aware Pro Internet Security!

Doe mee »