Работа с источником данных Hive

Prognoz Platform позволяет пользователям в качестве источника данных использовать инфраструктуру Hive. Hive является системой манипулирования данными с использованием SQL-подобного языка запросов (HiveQL) и работает на базе распределенной системы хранения и обработки данных Hadoop.

Для начала работы с источником данных Hive выполните шаги, указанные ниже.

Шаг 1. Установка приложения

Для создания подключения к источнику данных Hive необходимо использовать соответствующий ODBC-драйвер.

В качестве ODBC-драйвера рекомендуется использовать драйвер Hortonworks Hive ODBC Driver. Загрузите дистрибутив и установите драйвер.

Важно. Разрядность устанавливаемого приложения должна совпадать с разрядностью Prognoz Platform 8.

Шаг 2. Настройка источника данных ODBC

Перед началом работы с Hive настройте источник данных:

  1. На клиентской станции откройте панель управления, затем перейдите в раздел «Администрирование > Источник данных ODBC».

  2. В открывшемся окне «Администрирование источников данных ODBC» перейдите на вкладку «Пользовательский DNS». Выполните команду «Добавить».

  3. В открывшемся окне «Создание нового источника данных» выберите «Hortonworks Hive ODBC Driver»:

  1. Откроется окно «Hortonworks Hive ODBC Driver DNS Setup»:

Задайте следующие настройки:

Шаг 3. Настройка базы данных в Prognoz Platform 8

Для настройки базы данных в Prognoz Platform 8:

  1. Создайте базу данных в репозитории.

  2. В свойствах базы данных укажите тип клиента СУБД - «OLE DB(ODBC HIVE)».

  3. В качестве названия сервера укажите имя созданного источника данных (Data Source Name).

  4. Выберите автоматическое подключение.

  5. Заполните поля «Имя пользователя»/«Пароль»: укажите имя и пароль пользователя, созданного в вашей конфигурации Hadoop/Hive.

Окно мастера создания базы данных после задания необходимых параметров имеет вид:

После выполнения указанных настроек созданное соединение можно использовать для подключения в репозиторий Prognoz Platform таблиц Hive и создания запросов на языке HiveQL.

См. также:

Страница «Свойства базы данных»