html

Reconozco que de este planeta me gustan casi todas las cosas pero tengo debilidad por la música, lo que vamos a hacer es entrar en mi página de música favorita y vamos a ver que código tiene esta web:

https://mp3teca.com/

Introducimos la web en nuestro navegador y pulsamos “F12”  veremos que se despliega una ventana con la estructura de la web, es necesario tener conocimientos de este código HTML para saber dónde está cada elemento pero también os puedo enseñar un truco sencillo.

Busca un elemento en la web que te interese.

Haz click sobre el con el botón derecho.

En la última pestaña haz click en Inspeccionar.

Veréis que ocurre esto, os lleva directamente a las líneas de código donde se encuentra ese elemento, de ese modo podremos saber cómo codifico el editor la web, cada web es un mundo pero es cuestión de ponerse con ello.

html 1

Conocer el código es importante ya que podemos extraer todo el contenido de la web a nuestro programa de Python, pero hay mucho código y solo nos interesan algunas cosas por lo que tenemos que escavar para sacar lo que queremos.

Voy a hacer zoom en el elemento que inspeccione para ver como esta creado.

html 2

Vemos que todo está en un grupo (a), con subgrupo (href), este lo veréis en todas la webs, ya dentro, observamos que hay varios grupos y dentro de la categoría (span ) y subgrupo (id) tengo tres cosas que puedo extraer con facilidad que son :

titulo

artista

views

Si veis, después de estas categorías hay un texto solo y cierra el grupo (span), si extraigo esa descripción del subgrupo tendré el texto limpio que quiero, sin embargo, si extrajera (a) (href), obtendría códigos de la web difíciles de filtrar.

RECOMENDACION, no desesperéis si alguna web se os resiste, buscad otra que tenga la información, como os dije cada web es un mundo y hay algunas muy complejas, probad páginas del tiempo, tiendas online y lo que se os ocurra.