Упражнение 17

Для упражнения я выбрал один из популярнейших в России web-сай­тов, на страницах которого данные более или менее похожи на табли­цы. Это сайт «Яndex».

ВНИМАНИЕ -----------------------------------------------------------------------------------

Для выполнения данного упражнения необходимо, чтобы ваш компьютер был под­ключен к сети Интернет.

1. Создайте новую книгу Excel.

2. Запустите web-браузер (Explorer или Netscape) и наберите в стро­ке адреса: www.yandex.ru.

3. На главной странице «Яndex» щелкните мышью на любой из кате­горий (например, «Компьютеры и связь»). После того как вы перей­дете на соответствующую страницу, временно оставьте браузер и вернитесь в Excel.

4. В Excel выберите команду Данные ► Внешние данные ► Создать Web-запрос. На экран будет выведено окно создания web-запроса.


Перейдите в web-браузер, скопируйте содержимое строки адреса (в нашем случае это https://www.yandex.ru/yaca/c4-0-0-0-0=0.html) и вставьте его в поле ввода адреса (рис. 8.18) нажатием клавиш Ctrl+V.

Рис. 8.18. Задание адреса источника данных

ПРИМЕЧАНИЕ —---------------------------------------------------------------------------

Конечно, методически правильнее было бы предложить вам щелкнуть на кнопке Об­зор Интернета и получить нужный адрес таким путем. Но эта кнопка надежно срабатывает только в том случае, когда браузером по умолчанию является Internet Explorer. Поскольку вы можете оказаться поклонником другого браузера, я предлагаю несколь­ко (на пару шагов) более длинный, но зато более надежный путь.

6. В окне Создание запроса Web кроме первой области, показанной на рис. 8.18, есть еще две группы переключателей — вторая и третья. Во второй группе установите переключатель только таблицы, а в треть­ей — не сохранять. После этого щелкните на кнопке ОК.

7. В следующем диалоговом окне, запрашивающем у вас, куда именно нужно поместить данные, установите переключатель Новый лист, и снова щелкните на кнопке ОК. В левой верхней ячейке таблицы появится строка https://www.yandex.ru/yaca/c4-0-0-0-0=0.html: получе­ние данных..., а в строке состояния Excel внизу окна закрутится зна­чок (в виде земного шара), сигнализирующий о том, что процесс идет.

8. После того как процесс получения данных завершится, вам на лист Excel будет выложена вся затребованная страница, каждая запись


которой окажется в ячейках листа (так же, как в CSS-таблице на web-странице). А что делать, чтобы получить в таблицу Excel толь­ко часть информации, содержащейся на странице? В web-запросе предусмотрен и такой режим.

9. После извлечения данных на лист Excel на экране появляется па­нель инструментов Внешние данные (рис. 8.19).

10. Щелкните на первом инструменте (это инструмент Изменить зап­рос). На экран вновь будет выведено уже знакомое вам окно на­стройки запроса. Установите во второй группе переключатель одна или несколько специальных таблиц на странице и введите номер таб­лицы 1 в расположенное ниже поле, затем щелкните на кнопке ОК. На лист Excel будут выведены данные, соответствующие пер­вой по порядку таблице в исходном коде web-страницы. Переби­рая таким образом таблицы, вы рано или поздно доберетесь до нужного вам фрагмента данных.



Чтобы вы не мучились долго, скажу сразу, что фрагмент данных, пред­ставленный на рис. 8.20, у меня был выведен после ввода в качестве номера таблицы числа 27. Этот фрагмент данных соответствует имен­но тому, что вы запрашивали у поисковой системы «Яndex» в каче­стве информации о сайтах из раздела «Компьютеры и связь».

Рис. 8.19. Панель внешних данных

Рис. 8.20. Данные, полученные с сайта «Яndex»


В случае, если вы будете извлекать данные со страниц, содержащих явно оформленные таблицы (вроде тех, что показаны на рис. 8.21), процесс извлечения пойдет куда легче.

Рис. 8.21. Табличные данные в окне браузера


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: