Данная инструкция покажет, как развернуть парсер постов из Instagram на операционной системе Ubuntu Server 18.04 LTS. Все команды, вводятся в терминал операционной системы.
Для работы парсера потребуются следующее программное обеспечение:
1) python версии 3.6 или выше;
2) pip для работы установки пакетов python;
3) virtual environment - виртуальное окружение для python;
4) любая СУБД, в данной инструкции используется MariaDB 10.3.
Развертывание базы данных
Для того, чтобы парсер не загружал одни и те же посты используется специальное хранилище в виде базы данных. Для того чтобы развернуть базу данных требуется выполнить команду:
mysqldump -uroot -p instagram_db -r dump_instagram.sql
После развертывания базы данных можно приступить к настройке виртуального окружения.
Настройка виртуального окружения
Создайте каталог проекта и перейдите в него, используя команды:
mkdir /home/username/instaparser
cd /home/username/instaparser
Будет создан каталог “ instaparser ” в корне каталога пользователя, а затем произведён переход в него, далее все команды выполняются в этом каталоге.
|
|
Создайте экземпляр виртуального окружения, для этого потребуется ввести команду:
python3 -m venv insta
В каталоге проекта появится каталог виртуального окружения “insta”.
Далее скопируйте файлы проекта в каталог “ instaparser ”, например, командой:
cp /путь/до/папки/проекта/* /home/username/instaparser/
Активируйте виртуальное окружение командой:
source insta/bin/activate
Виртуальное окружение будет активировано, это будет отображено в терминале ввиде “(insta)” перед командами. После активации потребуется запустить установщик модулей парсера:
python3 pyInstagram/setup.py install
Будут распакованы модули парсера в виртуальное окружение, будут загружены модули, которых не хватает в окружении.
Парсер готов к работе, для его однократного запуска требуется запустить файл “ main.py ”:
python3 main.py
или использовать скрипт перезапуска:
sh restart.sh который будет запускать парсер каждые 10 минут.