http://googol.warriordudimanche.net
Ils sont malins, chez google ^^
De temps en temps, il faut revoir la regex qui parse la page de résultats d'une recherche récupérée via curl en php: en effet, il suffit d'un changement dans la structure de la page pour que la regex foire... normal.
En ce moment, les recherches d'images ne renvoient rien via googol: je me dis que ça doit être la regex...
Je regarde ce que mon script reçoit dans sa fonction parse_query: ce n'est en effet plus du tout la même structure qu'avant.
Problème, les adresses directes vers les images n'y sont pas !
Il me semble étrange qu'ils suppriment une donnée aussi vitale: je refais donc la recherche via mon navigateur et surprise: ce n'est pas DU TOUT la même page que celle reçue par Googol... hinhin
Google adapte donc ce qu'il envoie selon si c'est un user ou pas...
Gotcha me dis-je (car je suis polyglotte et sujet au soliloque ^^), je vais envoyer un faux user_agent, pour voir...
Twingo ! voilà que googol reçoit bien la page d'un utilisateur lambada.
Malin, google, hein ?! Ben c'est pas fini !
Quand on regarde le code de la page APRES HTMLSPECIALCHARS => c'est du pur JS ! ^^
Donc, en résumé: google reçoit la requête, la gère et renvoie un code js qui génère la page de planche d'images que vous voyez...
Non sans faire des reports par ci par là... bien entendu.
Du coup, parser le big shitload reçu, ça va être la fête à mon cul ^^
Je renonce pas notez, hein ?!