Si estás leyendo esto seguramente tienes una tienda online y necesitas obtener de forma automatizada el catálogo de algún proveedor.
Referencias, precios, fotografías… que luego podrás usar en tu ecommerce.
Puedes sacar esta información de forma automática mediante un bot o un scraper evitándote el proceso de ir descargando uno a uno los productos.
Generalmente los catálogos están organizados en categorías donde se suele mostrar un grupo de productos junto con un breve resumen y una fotografía.
Para este ejemplo he tomado un catálogo de joyería donde aparecen algunos anillos.
Es muy posible que en la categoría solo nos interese la dirección a la ficha de producto, ya que toda la información se encuentra dentro con más detalle.
Por tanto, en el primer muestreo de datos tendríamos algo similar a esto a nivel interno:
Una vez tenemos esta información, el programa accederá a cada una de las fichas de producto y seleccionará la información que necesitemos.
Vamos a suponer que quiero extraer de la web el nombre del producto, su referencia, la descripción larga, el color, precio y la imagen principal del producto.
Ejecutamos el scraper y en Excel aparecerá toda la información tabulada.
Y una vez el bot haya finalizado abriremos la carpeta de nuestro PC y verificamos que la extracción de imágenes también es correcta.
En este caso, las imágenes se han renombrado con la referencia del producto.