Non, mais attendez, je sais que l'index est distribué, forcément. Mais, pour moi, distribuer l'index c'est dire que la "solution" à telle requête se trouve sur un noeud précis (ou plusieurs pour être tranquille, mais en entier à chaque fois). Donc, il faut, à un moment donné, lier à une requête une liste complète d'urls. C'est ça qui me pose le plus question en fait parce que quand je réclame la solution à une requête, le serveur qui me répond doit trouver le bon noeud et celui-ci doit me retourner un début de liste et être capable de me fournir la liste entière.
De plus, les urls possibles risquent d'être dupliquées à travers le réseau... ou pas, je vais y réfléchir...
@ArkSet: comme le dit Haleth, et à mon avis, Google utilise un cluster (plusieurs répartis à travers le monde, mais tu n'en interroges qu'un seul à la fois). Et ça c'est tout de même vachement plus costaud qu'un réseau PaP, y a rien à dire.
@Haleth: Google lui-même ne parse qu'une partie du web, le tout est de tenter de parser la "plus intéressante" en premier pour faire de bons retours à l'utilisateur. Et pourquoi tu penses que c'est voué à l'échec sinon ?
Enfin, pour le réseau PaP la duplication n'est pas du tout infinie, ça serait stupide, elle est répartie le moins possible, au contraire...