TIBCO Spotfire: анализ больших данных (Big Data Analytics)
Бесплатная версияИнтерактивная визуальная аналитика для Hadoop или любых других источников Больших Данных
Доступная работа с Big Data с помощью визуальной аналитики
Совершенствуйте бизнес-аналитику и решайте рутинные задачи, используя информацию, скрытую в Big Data, с помощью платформы TIBCO Spotfire. Это — единственная платформа, которая предоставляет бизнес-пользователям интуитивный, удобный пользовательский интерфейс, что позволяет использовать весь спектр аналитических технологий для Больших Данных без привлечения ИТ-специалистов или наличия специального образования.
Интерфейс Spotfire позволяет одинаково удобно работать как с небольшими наборами данных, так и с многотерабайтными кластерами больших данных: показаний датчиков, информации из социальных сетей, точек продаж или геолокационных источников. Пользователи с любыми уровнями знаний с легкостью работают с содержательными панелями управления и аналитическими рабочими процессами просто используя визуализации, которые являются графическим отображением объединения миллиардов точек данных.
Предиктивная аналитика – это обучение в процессе работы на основе совместного опыта компании для принятия более аргументированных решений. Используя Spotfire Predictive Analytics, вы можете находить новые рыночные тренды из информации, полученной в результате бизнес-аналитики и принимать меры для минимизации рисков, что позволит повысить качество управленческих решений.
Обзор
Подключение к Большим Данным для высокопроизводительной аналитики
Spotfire предлагает три основных типа аналитики с бесшовной интеграцией с Hadoop и другими крупными источниками данных:
- Визуализация данных по требованию (On-Demand Analytics): встроенные, настраиваемые пользователем коннекторы данных, которые упрощают сверхскоростную, интерактивную визуализацию данных
- Анализ в БД (In-Database Analytics): интеграция с платформой распределительных вычислений, которая позволяют делать вычисления данных любой сложности на основе больших данных.
- Анализ в оперативной памяти (In-Memory Analytics): интеграция с платформой статистического анализа, которая берет данные непосредственно из любого источника данных, включая традиционные и новые источники данных.
Вместе все эти методы интеграции представляют мощное сочетание визуального исследования и продвинутой аналитики.
Это позволяет бизнес-пользователям получить доступ, объединять и анализировать данные из любых источников данных с помощью мощных, удобных в использовании панелей управления и рабочих процессов.
Коннекторы больших данных
- Сертифицированные коннекторы данных Hadoop для Apache Hive, Apache Spark SQL, Cloudera Hive, Cloudera Impala, Databricks Cloud, Hortonworks, MapR Drill и Pivotal HAWQ
- Другие сертифицированные коннекторы больших данных включают Teradata, Teradata Aster и Netezza
- Коннекторы для исторических и текущих данных из таких источников, как OSI PI сенсорные датчики
In-Datasource распределенные вычисления
- Пользователи работают с дэшбордами с функционалом визуального выбора, которые обращаются к скриптам, используя встроенные возможности языка TERR,
- Скрипты TERR инициируют работу функционала распределенных вычислений во взаимодействии с Map/Reduce, H2O, SparkR, or Fuzzy Logix,
- Эти приложения в свою очередь обращаются к системам с высокой эффективностью как Hadoop или другие источники данных,
- TERR может быть развернут как движок расширенной аналитики в узлах Hadoop, которые управляются с помощью MapReduce или Spark. Язык TERR также можно использовать для узлов данных Teradata.
- Результаты визуализируются на Spotfire.
TERR для продвинутой аналитики
Объединяя весь функционал
Пример: Интерфейс Spotfire для конфигурации, запуска и визуализации результатов модели, которая определяет характеристики потерянных грузов. С помощью этого интерфейса бизнес-пользователи могут выполнять вычисления с использованием TERR и Н2О (фреймворк для распределенных вычислений), обращаясь к данным транзакций и отгрузок, хранящихся в кластерах Hadoop.
Аналитическое пространство для больших данных
Продвинутая и предиктивная аналитика
Пользователи используют дэшборды Spotfire c функционалом визуального выбора, чтобы запустить богатый набор расширенных возможностей, которые позволяют с легкостью делать прогнозы, создавать модели и оптимизировать их во время работы. Используя большие данные, анализ может быть проведен внутри источника данных (In-Datasource), возвращая только агрегированную информацию и результаты, необходимые для создания визуализаций на платформе Spotfire.
Машинное обучение
Доступен широкий набор инструментов машинного обучения в списке встроенных функций Spotfire, которые можно использовать с помощью одного нажатия. Статистики имеют доступ к программному коду, написанному на языке R и могут расширять используемый функционал. Функционалом машинного обучения можно делиться с другими пользователями для легкого повторного использования.
Доступны следующие методы машинного обучения для непрерывных категориальных переменных на Spotfire и на TERR:
- Линейная и логистическая регрессия
- Деревья принятия решений (Decision trees), алгоритм случайного леса (Random forest), градиентный бустинг машин (GBM)
- Обобщенные линейные (аддитивные) модели (Generalized Additive Models)
- Нейронные сети
Анализ контента
Spotfire обеспечивает аналитику и визуализацию данных, значительная часть которых не использовалась раннее – это неструктурированный текст, который хранится в таких источниках, как документы, отчеты, заметки CRM систем, логи сайтов, публикации в социальных сетях и многое другое.
Локационная аналитика
Многослойные карты высокого разрешения являются отличным способом визуализации больших данных. Богатый функционал Spotfire для работы с картами позволяет Вам создавать карты с таким количеством справочных и функциональных слоев, какое Вам необходимо. Spotfire также дает возможность использовать сложную аналитику во время работы с картами. В дополнение к географическим картам система создает карты для визуализации поведения пользователей, складов, производства, сырья и многих других показателей.
Событийная аналитика в режиме реального времени
TIBCO Streambase интегрирован со Spotfire для обеспечения потоковой аналитики в режиме реального времени. Streambase применяет информацию, полученную с платформы Spotfire для потоковой передачи данных в авторежиме, отправляя уведомления по множеству каналов, включая текстовые документы, электронную почту, базы данных или BPM системы.
Вы можете вести постоянный мониторинг в режиме реального времени и оповещать конечных потребителей информации (маркетологов, инженеров и др.) при обнаружении отклонений от нормативных показателей или новых трендов.
Основные возможности
Масштабируемые визуализации данных
Функционал визуализации больших данных Spotfire имеет возможность масштабирования для представления результатов анализа миллиардов строк данных.
Интуитивно понятный интерфейс
Визуальные панели управления (дэшборды) и аналитические рабочие процессы позволяют фиксировать и сохранять сложные прецедентные модели, что дает возможность бизнес-пользователям создавать визуализации, провести аналитику, выполнять вычисления и делиться полученными результатами.
Гибкая архитектура данных
Бесшовная интеграция продуктов компании TIBCO с платформой Spotfire позволяет использовать весь богатый функционал системы для доступа к данным любого объема, выполнять вычисления любого типа и эффективно визуализировать объединенные данные или детализации до уровня строк.
Гибкая платформа
Гибкая аналитическая платформа Spotfire обеспечивает для бизнес-аналитиков возможность проведения продвинутой аналитики и развертывания сложных аналитических процессов и приложений для анализа больших данных, что позволит действительно управлять всеми данными организации и извлекать важные знания для бизнеса.