Инструкция по развертыванию парсера постов

Данная инструкция покажет, как развернуть парсер постов из Instagram на операционной системе Ubuntu Server 18.04 LTS. Все команды, вводятся в терминал операционной системы.

Для работы парсера потребуются следующее программное обеспечение:

1) python версии 3.6 или выше;

2) pip для работы установки пакетов python;

3) virtual environment - виртуальное окружение для python;

4) любая СУБД, в данной инструкции используется MariaDB 10.3.

 

Развертывание базы данных

Для того, чтобы парсер не загружал одни и те же посты используется специальное хранилище в виде базы данных. Для того чтобы развернуть базу данных требуется выполнить команду:

mysqldump -uroot -p instagram_db -r dump_instagram.sql

После развертывания базы данных можно приступить к настройке виртуального окружения.

 

Настройка виртуального окружения

Создайте каталог проекта и перейдите в него, используя команды:

mkdir /home/username/instaparser

cd /home/username/instaparser

Будет создан каталог “ instaparser ” в корне каталога пользователя, а затем произведён переход в него, далее все команды выполняются в этом каталоге.

Создайте экземпляр виртуального окружения, для этого потребуется ввести команду:

python3 -m venv insta

В каталоге проекта появится каталог виртуального окружения “insta”.

Далее скопируйте файлы проекта в каталог “ instaparser ”, например, командой:

cp /путь/до/папки/проекта/* /home/username/instaparser/

Активируйте виртуальное окружение командой:

source insta/bin/activate

Виртуальное окружение будет активировано, это будет отображено в терминале ввиде “(insta)” перед командами. После активации потребуется запустить установщик модулей парсера:

python3 pyInstagram/setup.py install

Будут распакованы модули парсера в виртуальное окружение, будут загружены модули, которых не хватает в окружении.

Парсер готов к работе, для его однократного запуска требуется запустить файл “ main.py ”:

python3 main.py

или использовать скрипт перезапуска:

sh restart.sh который будет запускать парсер каждые 10 минут.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: