Для упражнения я выбрал один из популярнейших в России web-сайтов, на страницах которого данные более или менее похожи на таблицы. Это сайт «Яndex».
ВНИМАНИЕ -----------------------------------------------------------------------------------
Для выполнения данного упражнения необходимо, чтобы ваш компьютер был подключен к сети Интернет.
1. Создайте новую книгу Excel.
2. Запустите web-браузер (Explorer или Netscape) и наберите в строке адреса: www.yandex.ru.
3. На главной странице «Яndex» щелкните мышью на любой из категорий (например, «Компьютеры и связь»). После того как вы перейдете на соответствующую страницу, временно оставьте браузер и вернитесь в Excel.
4. В Excel выберите команду Данные ► Внешние данные ► Создать Web-запрос. На экран будет выведено окно создания web-запроса.
Перейдите в web-браузер, скопируйте содержимое строки адреса (в нашем случае это https://www.yandex.ru/yaca/c4-0-0-0-0=0.html) и вставьте его в поле ввода адреса (рис. 8.18) нажатием клавиш Ctrl+V.
Рис. 8.18. Задание адреса источника данных
ПРИМЕЧАНИЕ —---------------------------------------------------------------------------
|
|
Конечно, методически правильнее было бы предложить вам щелкнуть на кнопке Обзор Интернета и получить нужный адрес таким путем. Но эта кнопка надежно срабатывает только в том случае, когда браузером по умолчанию является Internet Explorer. Поскольку вы можете оказаться поклонником другого браузера, я предлагаю несколько (на пару шагов) более длинный, но зато более надежный путь.
6. В окне Создание запроса Web кроме первой области, показанной на рис. 8.18, есть еще две группы переключателей — вторая и третья. Во второй группе установите переключатель только таблицы, а в третьей — не сохранять. После этого щелкните на кнопке ОК.
7. В следующем диалоговом окне, запрашивающем у вас, куда именно нужно поместить данные, установите переключатель Новый лист, и снова щелкните на кнопке ОК. В левой верхней ячейке таблицы появится строка https://www.yandex.ru/yaca/c4-0-0-0-0=0.html: получение данных..., а в строке состояния Excel внизу окна закрутится значок (в виде земного шара), сигнализирующий о том, что процесс идет.
8. После того как процесс получения данных завершится, вам на лист Excel будет выложена вся затребованная страница, каждая запись
которой окажется в ячейках листа (так же, как в CSS-таблице на web-странице). А что делать, чтобы получить в таблицу Excel только часть информации, содержащейся на странице? В web-запросе предусмотрен и такой режим.
9. После извлечения данных на лист Excel на экране появляется панель инструментов Внешние данные (рис. 8.19).
10. Щелкните на первом инструменте (это инструмент Изменить запрос). На экран вновь будет выведено уже знакомое вам окно настройки запроса. Установите во второй группе переключатель одна или несколько специальных таблиц на странице и введите номер таблицы 1 в расположенное ниже поле, затем щелкните на кнопке ОК. На лист Excel будут выведены данные, соответствующие первой по порядку таблице в исходном коде web-страницы. Перебирая таким образом таблицы, вы рано или поздно доберетесь до нужного вам фрагмента данных.
|
|
Чтобы вы не мучились долго, скажу сразу, что фрагмент данных, представленный на рис. 8.20, у меня был выведен после ввода в качестве номера таблицы числа 27. Этот фрагмент данных соответствует именно тому, что вы запрашивали у поисковой системы «Яndex» в качестве информации о сайтах из раздела «Компьютеры и связь».
Рис. 8.19. Панель внешних данных
Рис. 8.20. Данные, полученные с сайта «Яndex»
В случае, если вы будете извлекать данные со страниц, содержащих явно оформленные таблицы (вроде тех, что показаны на рис. 8.21), процесс извлечения пойдет куда легче.
Рис. 8.21. Табличные данные в окне браузера