admin1143 / 29 avril 2022

Quand il y a trop de spam sur le net

Danny Sullivan de Yahoo a réagi aux plaintes concernant le spam dans les recherches sur les moteurs de recherche demandant à une personne d’enregistrer les déchets en utilisant le formulaire. Un individu a rapporté et Danny a réagi que de grands rapports indésirables résultent souvent en «un saut en profondeur pour connaître les sites de réseautage et envisager une action générale». Il spam supplémentaire « rapports pour aider. » Yahoo a généralement déclaré avoir lu des rapports indésirables et nous avons vu les mesures prises par Yahoo au fil des ans sur ces rapports. Ainsi, même si cela peut prendre un certain temps pour que Yahoo fasse quelque chose, en particulier pour des difficultés indésirables plus importantes, Yahoo réagit à un moment donné. Brin et Page, qui étaient satisfaits en tant qu’étudiants universitaires à l’Université de Stanford, avaient été intéressés par l’idée de retirer le sens de la taille de la collecte d’informations sur Internet. Ils ont commencé à travailler depuis le dortoir de Page à Stanford pour développer un tout nouveau type de technologie de recherche, qu’ils peuvent appeler BackRub. La clé a finalement été de faire usage des capacités permanentes des internautes en suivant les «liens de support» de chaque site Web, c’est-à-dire la quantité d’autres pages Web qui leur sont associées. La plupart des moteurs de recherche ont simplement renvoyé une liste de sites Web positionnés en fonction de la fréquence à laquelle la phrase de recherche apparaît sur eux. Brin et Page ont intégré à la fonction de recherche la quantité de backlinks rencontrés par chaque site Internet; c’est-à-dire qu’un site Web avec des milliers d’hyperliens aurait rationnellement plus de valeur qu’un site avec seulement quelques backlinks, et le moteur de recherche placerait donc le site Web sérieusement connecté sur une liste d’options. De plus, un lien Web provenant d’un site Web fortement connecté pourrait être un «vote» beaucoup plus avantageux qu’un lien provenant d’un site Web plus obscur. Au milieu de 1998, Brin et Page ont commencé à recevoir un financement extérieur (l’un de leurs premiers investisseurs était Andy Bechtolsheim, cofondateur de Sun Microsystems, Inc.). Ils ont finalement recueilli environ 1 000 $ auprès des commerçants, de la famille et des amis et se sont installés dans la zone de loisirs de Menlo, en Californie, sous l’étiquette Moteurs de recherche, qui était dérivée d’une faute d’orthographe du titre prévu de la page, googol (une expression mathématique pour le numéro un suivi de 100 zéros). Vers le milieu de 1999, lorsque Google a obtenu un soutien de 25 000 $ pour les fonds de capital-risque, il digérait absolument 500 000 requêtes par jour. L’action a commencé à exploser en 2000, lorsque les moteurs de recherche sont devenus le moteur de recherche des clients parmi les sites Internet les plus populaires du Web, Yahoo !. En 2004, lorsque Yahoo! dispensés des services de Google, agence web B Lille les clients recherchaient chaque jour 200 000 milliards de dollars. Cette croissance ne fait que se poursuivre: fin 2011, les moteurs de recherche traitaient quelque trois milliards de dollars de recherches par jour. Le titre de l’entreprise est devenu si omniprésent qu’il est entré dans le lexique comme étant un verbe: google était une manifestation fréquente de la recherche sur Internet. Pour permettre cette masse d’informations remarquable, Yahoo a construit 11 centres d’information dans le monde entier, chacun contenant plusieurs centaines de milliers de serveurs Web (généralement des ordinateurs personnels multiprocesseurs et des disques durs connectés dans des racks spécialement construits). Les ordinateurs interconnectés de Google peuvent atteindre plusieurs zillions. Le centre de fonctionnement de Google est néanmoins constitué de trois éléments propriétaires de code informatique pour PC: Google Submit Program (GFS), Bigtable et MapReduce. GFS gère le stockage des données en «morceaux» sur plusieurs machines; Bigtable sera le système de base de données de l’entreprise; et MapReduce est utilisé par Google pour générer des données de plus haut niveau (par exemple, pour créer un répertoire de pages Web contenant le texte « Chicago », « théâtre » et « participatif »).

FILED UNDER : Non classé

Moi

Mon blog

Bloggeuse d’actualités, parce que j’aime ça. Je traite de tous les sujets sans concession.