Si la programmation s'apparente à de la magie, le web scraping est assurément de la sorcellerie. En écrivant un simple programme automatisé, vous pouvez interroger des serveurs Web, effectuer des requêtes et les analyser pour en extraire les informations dont vous avez besoin. Cet ouvrage constitue un guide complet du web scraping, vous expliquant comment moissonner presque tous les types de données du Web actuel. La première partie du livre se concentre sur les mécanismes du web scraping : utilisation de Python pour demander des informations à un serveur Web, traitement de base de la réponse du serveur et interaction avec les sites de manière automatisée. La deuxième partie du livre explore une grande variété d'outils et d'applications plus spécifiques pour répondre à tous les scénarios de web scraping que vous êtes susceptible de rencontrer. Au programme de ce livre : - Analyser des pages HTML complexes. - Développer des moissonneurs avec le framework Scrapy. - Méthodes pour stocker les données récupérées. - Lire et extraire des données à partir de documents. - Nettoyer et normaliser des données mal formatées. - Lire et écrire en langage naturel. - Moissonner des formulaires et des écrans de connexion. - Récupérer des données à l'aide de JavaScript et d'API. - Utiliser et écrire des logiciels d'OCR. - Eviter les pièges du web scraping et contourner les bloqueurs de robots. - Utiliser des moissonneurs pour tester votre site Web.
Le informazioni nella sezione "Riassunto" possono far riferimento a edizioni diverse di questo titolo.
Ryan Mitchell est ingénieure logiciel senior chez Gerson Lehrman Group (GLG). Son expertiste en web scraping, sécurité Web et science des données lu vaut d'être consultée régulièrement sur ces sujets. Elle anime des ateliers et a participé à de nombreuses conférences comme Data Day et DEF CON. Elle enseigne la programmation Web et la science des données, tout en conseillant différentes institutions pour l'élaboration de leurs programmes universitaires.
Le informazioni nella sezione "Su questo libro" possono far riferimento a edizioni diverse di questo titolo.
EUR 9,55 per la spedizione da Svizzera a Italia
Destinazione, tempi e costiEUR 7,10 per la spedizione da Francia a Italia
Destinazione, tempi e costiDa: Gallix, Gif sur Yvette, Francia
Condizione: Neuf. Codice articolo 9782412096079
Quantità: 1 disponibili
Da: BOOKIT!, Genève, Svizzera
Condizione: Used: Like New. LIVRE A L?ETAT DE NEUF. EXPEDIE SOUS 3 JOURS OUVRES. NUMERO DE SUIVI COMMUNIQUE AVANT ENVOI, EMBALLAGE RENFORCE. EAN:9782412096079. Codice articolo SVALIVCN-9782412096079
Quantità: 1 disponibili
Da: Librairie La Canopee. Inc., Saint-Armand, QC, Canada
Condizione: NEW. Codice articolo 040825SOC54144
Quantità: 1 disponibili