Volver a Curso
Curso Bases del Web Scraping con Python.
0% Completado
0/0 Steps
-
Antes de empezar el curso
0.- Grupos y foros -
1.- Bienvenida
-
Preparar ambiente de trabajo2.- Preparar ambiente de trabajo en Linux
-
3.- Preparar ambiente de trabajo en Windows
-
Curso Bases del Web Scraping con Python4.- ¿Qué es el Web Scraping?2 Temas
-
5.- Inspección de Sitios y Extracción2 Temas
-
6.- El archivo Robots.txt1 Tema
-
7.- Proyecto final8 Temas
-
7.1.- Inspección de Sitio
-
7.2.- Shell
-
7.3.- Startproject
-
7.4.- ¿Qué es el ítem?, creación de Ítem, uso de Item y creación de archivos
-
7.5.- Pipelines y BD(PostgreSQL)
-
7.6.- Conexión a BD, creación de Tabla y almacenamiento de Datos
-
7.7.- Instalación de PostgreSQL en Windows
-
7.8.- Instalar Postgresql en Linux
-
7.1.- Inspección de Sitio
-
8.- Proyecto extra - COVID 195 Temas
-
9.- Encuesta
Participantes 211
Lección Progreso
0% Completado
Ahora vamos a ejecutar la araña desde Python, para ellos vamos a crear un archivo llamado run, en el vamos a poner el siguiente código:
from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings
process = CrawlerProcess(get_project_settings())
process.crawl('covid')
process.start()
Este código está incluso en el siguiente Link Prácticas Comunes
Ahora desde nuestra termina, solo debemos ejecutarlo:
“python run.py”
Y con esto se ejecutará nuestra araña.
Y ¡¡¡PUM!!! con esto ejecutamos nuestra araña y nuestros datos se guardarán en nuestra base de datos