Интерфейсы инструмента в веб-приложении и настольном приложении отличаются и не имеют обратной совместимости. Задачи ETL, созданные в веб-приложении, могут некорректно отображаться в настольном приложении и наоборот.
Коннектор «Веб-страница» - объект, предназначенный для извлечения данных из файлов формата HTML. Файлы с данными могут находиться как на локальном диске, так и в сети (локальной или всемирной).
После добавления коннектора на рабочее пространство задачи ETL задайте базовые свойства и настройки импорта. Также можно отредактировать выход коннектора и задать параметры фильтрации данных.
На странице «Настройка импорта» указывается файл или адрес веб-страницы с импортируемыми данными и параметры, которые используются для определения диапазона с данными.
Данные на веб-странице должны располагаться в таблице.
Укажите адрес веб-страницы и при помощи переключателей в группе «Определение таблицы» задайте таблицу с данными:
По номеру. Укажите порядковый номер таблицы. Нумерация таблиц начинается с единицы;
По значению атрибута таблицы. Укажите один из атрибутов таблицы и его значение. В качестве атрибута можно указать любой html-тэг таблицы. Если в файле найдено несколько таблиц с заданным значением атрибута, то загрузка данных будет производиться из первой таблицы.
При установке флажка «Первая строка содержит заголовки» первая строка таблицы будет расценена как строка заголовков столбцов. Если же флажок не установлен, то первая строка таблицы будет расценена как строка данных.
Кнопка «Дополнительные настройки» позволяет задать дополнительные настройки, которые используются при идентификации данных.
Кнопка «Просмотр данных» предназначена для предварительного просмотра данных, отобранных по запросу. При предварительном просмотре данных будут выведены только первые сто строк источника.
Примечание. Ввиду имеющихся ограничений реализации источника не поддерживается распознавание и импорт из таблиц, загрузка которых происходит с помощью Ajax или таблицы используются во фреймах (Frame или IFrame).
На странице «Редактирование выхода» задаётся связь с объектом-приёмником, в который будут выгружаться данные при выполнении задачи ETL.
Примечание. Страница является общей для всех коннекторов и преобразователей данных, кроме преобразователей «Разделение» и «Алгоритм пользователя». Рассмотрим настройку списка полей и связи выхода на примере мастера редактирования источника данных «Репозиторий».
На странице доступны следующие настройки:
На странице «Фильтрация» задаётся условие, в соответствии с которым будут отбираться импортируемые данные.
Примечание. Страница является общей для всех коннекторов к источникам данных, кроме коннектора «Источник пользователя». Рассмотрим настройку фильтрации данных источника на примере мастера редактирования источника данных «Репозиторий».
Для формирования условия фильтрации нажмите кнопку «Обзор». Будет открыто окно редактора выражения. Для составления выражения доступны все поля источника. Импортированы будут те данные, которые удовлетворяют заданному условию.
См. также:
Начало работы с инструментом «Задача ETL» в веб-приложении | Коннекторы к исходным данным