PrestoCast

Your voice, your podcast

Acceder Telegram WhatsApp iOS Android
Send a voice note
From Telegram, WhatsApp or the web.
It becomes a podcast
With an RSS feed ready to distribute.
Listen anywhere
From Apple Podcasts, Spotify or any app.

Learn more about PrestoCast

255 Podcast by Manel Molina

Manel Molina

@molinaig
66 episodes · 80 followers · 25 following

En este podcast hablaré sobre noticias, proyectos personales y cosas que vaya probando referentes a cacharreo (Self-Hosting, Docker, Linux...), Ciberseguridad, IA, Cloud,  SaaS y monetización en internet.

La Llagosta, España

Manel Molina

@molinaig
66 episodes · 80 followers · 25 following
La Llagosta, España

En este podcast hablaré sobre noticias, proyectos personales y cosas que vaya probando referentes a cacharreo (Self-Hosting, Docker, Linux...), Ciberseguridad, IA, Cloud,  SaaS y monetización en internet.

13. Web scrapping

2026-04-01

Description

Te cuento las formas que existen de extraer datos de forma automática de una página web.

Transcript

Bueno, pues hoy he encerrado un proyecto con un cliente, un proyecto en el que me pide hacer web scrapping, básicamente es automatizar la extracción de información de una página web y bueno, quería hablar de esto que habitualmente las formas que hay son directamente ir a la API si la página tiene, si la página no tiene pues si intentas emular directamente las peticiones contra el servidor y con el HTML que te devuelve pues lo vas limpiando, vas con alguna librería tipo Beautiful Show, vas limpiando el HTML y quedándote con el dato. Si tampoco puedes hacer esto Pues intentas controlar el navegador Con alguna librería como Selenium Y a partir de ahí vas sacando los datos Y hay una última forma Que yo no había hecho nunca Y quiero intentar Y es directamente creando una extensión para el navegador Para que se controle La navegación directamente desde esa extensión Y no desde Selenium Quiero ver qué tal y ya iré contando a ver cómo funciona
255 Podcast · Episode 13

Comments (0)

No comments yet. Be the first!
Explorar