Web scraping con Cerewro: sin código ni extensiones
Cerewro usa la tool browser para navegar a cualquier página web, interactuar con ella y extraer datos estructurados en formato CSV, JSON o Excel. Todo con instrucciones en lenguaje natural.
Extraer datos de una tabla web
Ve a https://mipagina.com/precios, extrae la tabla de precios y guárdala en precios.csv
Flujo de scraping
- browser navega a la URL indicada
- get_page_text extrae el contenido legible de la página
- La IA identifica y estructura los datos relevantes
- write_file guarda los datos en el formato solicitado
Tipos de datos extractables
| Tipo | Ejemplo |
|---|---|
| Tablas HTML | Precios, rankings, catálogos |
| Listas | Noticias, productos, artículos |
| Formularios | Datos de contacto, metadatos |
| Texto estructurado | Especificaciones técnicas, FAQs |
Limitación: Las páginas que requieren login o que bloquean bots pueden no ser accesibles. Para portales internos, browser puede manejar el proceso de autenticación si se proporcionan las credenciales.