La mayoría de estos datos son datos no estructurados en formato HTML que luego se convierten en datos estructurados en una hoja de cálculo o una base de datos para que se puedan utilizar en diversas aplicaciones.
Hay muchas formas diferentes de realizar raspado web para obtener datos de sitios web.
Estos incluyen el uso de servicios en línea, API particulares o incluso la creación de su código para web scraping desde cero. Muchos sitios web grandes como Google, Twitter, Facebook, StackOverflow, etc. tienen una API que te permiten acceder a sus datos en un formato estructurado.
Esta es la mejor opción, pero hay otros sitios que no permiten a los usuarios acceder a grandes cantidades de datos de forma estructurada o simplemente no son tan avanzados tecnológicamente.
En este caso debes apoyarte de librerías y lenguajes de programación para obtener la información.
Tutorial de Python Web Scraping. Use BeautifulSoup & Requests para raspar y rastrear el directorio de Craigslist con Python
Este curso se encuentra disponible de manera gratuita sin necesidad de ningún cupón, a través de la opción “GRATIS”.
Te recomendamos primero leer las diferencias entre un curso gratis y uno de pago para evitar malentendidos:
Cursos gratuitos
Cursos de pago
Para obtener el curso de manera gratuita da clic en el siguiente botón:
]]>