Guia do usuário do Expert Analytics
Transcrição
Guia do usuário do Expert Analytics
PUBLIC SAP Predictive Analytics 2.0 2015-02-10 Guia do usuário do Expert Analytics Conteúdo 1 Recursos da documentação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2 Novo no Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 3 Sobre este guia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.1 Conteúdo do guia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.2 Público alvo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 4 Informações gerais de Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 5 Introdução ao Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 5.1 Princípios básicos de Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 5.2 Como iniciar Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 5.3 Compreendendo Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Visão de designer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Visão de resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 5.4 Utilizando Expert Analytics do início ao fim. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5.5 Configuração de características avançadas de Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 6 Adquirindo dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 6.1 Adquirir dados de uma fonte de dados para criar um conjunto de dados. . . . . . . . . . . . . . . . . . . . . . . . 17 Visualizando uma conexão de fonte de dados e seus documentos associados. . . . . . . . . . . . . . . . . 18 Adquirindo dados de uma pasta de trabalho do Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Aquisição de dados de um arquivo de texto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Adquirindo dados copiados para a área de transferência. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Adquirindo dados das visões do SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Aquisição de dados de universos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Adquirindo dados utilizando Consulta com SQL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Efetuando download de dados do banco de dados SAP BW. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Processamento de um conjunto de dados adquirido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Objetos ocultos da lista de objetos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Como editar o arquivo de sugestões de enriquecimento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 7 Preparando dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 7.1 Preparando dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Sala Preparar – visualização, limpeza e manipulação de dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Editando e filtrando dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46 Criação de medidas e hierarquias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Criando uma medida ou dimensão calculada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .55 2 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Conteúdo Trabalhando com múltiplos conjuntos de dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .71 8 Criando análises. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 8.1 Como criar uma análise. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Aplicação de componentes de pré-processamento em dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . .74 Como aplicar os algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 Opcional: Como armazenar os resultados da análise. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 8.2 Como executar a análise. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .77 8.3 Como salvar a análise. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 8.4 Como excluir uma análise do documento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 8.5 Como visualizar os resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 8.6 Exportação de uma análise como um procedimento armazenado. . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 9 Adicionando um componente personalizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 9.1 Personalizar componente R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Assistente de criação do componente R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Como criar um componente R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 9.2 Componente PAL personalizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Assistente de criação do componente PAL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Criando um componente da PAL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 10 Analisando dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 10.1 Como analisar os dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 10.2 Gráfico de matriz de dispersão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 10.3 Gráfico de resumo estatístico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 10.4 Coordenadas paralelas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 10.5 Árvore de decisão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 10.6 Gráfico de tendência. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 10.7 Gráfico de cluster. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 10.8 Gráfico de nuvem de tags Apriori. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 10.9 Matriz de confusão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 10.10 Gráfico de componente R customizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 11 Visualizando dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 11.1 Visualizando dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 Criando gráficos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 Classificando dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 Filtragem de dados do gráfico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Aplicação de formatação condicional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Dados hierárquicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Localizando medidas, dimensões e valores de dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Medidas associadas a dimensões. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Tipos de agregação suportados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 Guia do usuário do Expert Analytics Conteúdo PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 3 12 Criando histórias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 12.1 Histórias e dados visualizados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Elemento de página. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Criando uma história. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Como salvar uma história. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Modificando uma história. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .125 Como explorar uma visualização em uma história. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Como atualizar dados em uma página de infográfico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 13 Compartilhando dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 13.1 Como publicar no SAP Lumira Server. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .127 Como publicar histórias e conjuntos de dados no SAP Lumira Server. . . . . . . . . . . . . . . . . . . . . . .127 14 Trabalhando com modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 14.1 Como criar um modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 14.2 Como exportar um modelo como PMML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 14.3 Como exportar um modelo em um arquivo .spar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .130 14.4 Exportando um modelo do SAP HANA como procedimento armazenado. . . . . . . . . . . . . . . . . . . . . . 130 Removendo o procedimento armazenado e exportado do SAP HANA. . . . . . . . . . . . . . . . . . . . . . .131 14.5 Como importar um modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 14.6 Como excluir um modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 15 Propriedades do componente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 15.1 Algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 Regressão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 Valores atípicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 Série de tempo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 Árvores de decisão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 Rede neural. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 Clustering. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 Associação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .188 Classificação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 15.2 Componentes de preparação de dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 Fórmula. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 Amostra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 Definição de tipo de dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 Filtro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 Normalização. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 Categorização HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .216 Normalização HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 Partição HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 15.3 4 Gravadores de dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Conteúdo CSV Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 JDBC Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 HANA Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 15.4 Modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 Guia do usuário do Expert Analytics Conteúdo PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 5 1 Recursos da documentação A tabela a seguir fornece a lista de guias disponíveis para o SAP Predictive Analytics: Tabela 1: O que você quer fazer? Então vá para... Obter ajuda instantânea sobre como usar o Expert Analytics ou encontrar informações sobre uma função ou fluxo de tra balho. A Ajuda online está disponível no Expert Analytics, da seguinte forma: Obter ajuda instantânea sobre como usar o Automated Analytics ou encontrar informações sobre uma função ou fluxo de trabalho. ● Clique no ícone de Ajuda (?) em uma caixa de diálogo ou janela. ● Selecione o menu Ajuda Ajuda A Ajuda online está disponível no Automated Analytics, da se guinte forma: ● Pressione a tecla F1. ● Selecione o menu Ajuda Ajuda Obtenha a documentação completa sobre como usar o SAP Predictive Analytics (inglês). SAP Predictive Analytics Página inicial Obtenha a documentação sobre como usar o SAP Predictive Analytics em outro idioma. Página Todos os produtos SAP Nota . . Selecione um idioma, depois selecione SAP Predictive Analytics e a versão necessária pelas listas de opções. A documentação em idiomas, que não o inglês, só está dis ponível para certos guias. Obtenha as últimas informações sobre o suporte de software e banco de dados do SAP Predictive Analytics. 6 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Matriz de disponibilidade do produto SAP. Guia do usuário do Expert Analytics Recursos da documentação 2 Novo no Expert Analytics Uma lista dos novos recursos disponibilizados com o Expert Analytics e uma descrição de cada recurso. Os seguintes recursos novos do Expert Analytics estão disponíveis nessa versão do SAP Predictive Analytics: Tabela 2: Novo nesta versão Descrição Suporte offline do BW (Business Warehouse) Você pode conectar-se com um sistema BW (executado no SAP HANA ou qualquer outro banco de dados) e efetuar download dos dados para análise offline. Ambas as consultas InfoProviders e BEx com ou sem variáveis são suportadas. Novos algoritmos APL (Automated Predictive Library) online suportados Os seguintes algoritmos APL online são suportados e podem ser utilizados em análises: ● Algoritmo HANA de classificação automática Identifica o melhor modelo de classificação binária que prevê dados inesperados na categoria. Isso é feito sele cionando automaticamente um algoritmo de classifica ção e variáveis de entrada principais para gerar o melhor modelo. ● Algoritmo HANA de clustering automático Descobre segmentos nos dados com referência a uma variável de destino. Isso é feito selecionando automati camente um algoritmo de clustering e variáveis de en trada principais para gerar o melhor modelo. ● Algoritmo HANA de regressão automática Identifica o melhor modelo de regressão automatica mente que melhor explica as relações entre as variáveis de entrada independentes e variáveis de destino. Guia do usuário do Expert Analytics Novo no Expert Analytics PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 7 3 Sobre este guia 3.1 Conteúdo do guia Este guia contém as seguintes informações: ● Uma visão geral de Expert Analytics ● Como adquirir dados de várias fontes de dados ● Como executar operações de manipulação de dados, limpeza de dados e enriquecimento semântico na sala Preparação ● Informações sobre os vários algoritmos e componentes disponíveis no Expert Analytics ● Informações sobre como criar análises e modelos ● Informações sobre como analisar os dados usando técnicas de visualização preditiva ● Como criar quadros de síntese ● Como compartilhar gráficos e conjuntos de dados Nota Expert Analytics herda a funcionalidade de aquisição de dados e manipulação de dados do SAP Lumira. Portanto, para informações sobre fluxos de trabalho não abordados nesse guia, consulte o Guia do usuário do SAP Lumira disponível em: http://help.sap.com/lumira. Nota As informações sobre como instalar e configurar o aplicativo e como instalar R são cobertas no SAP Predictive AnalyticsGuia de instalação do Desktop. 3.2 Público alvo Este guia é destinado a profissionais especializados em análise de dados, usuários empresariais, estatísticos e cientistas de dados que queiram usar Expert Analytics para analisar e visualizar os dados usando algoritmos preditivos. Nota Para usar Expert Analytics, você precisa conhecer algoritmos de análise estatística e de mineração de dados e saber usá-los. 8 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Sobre este guia 4 Informações gerais de Expert Analytics Expert Analytics é um conjunto de ferramentas de análise estatística e de mineração de dados que permite a criação de modelos preditivos para identificar visões e relações ocultas nos dados, com base nos quais você pode prever eventos futuros. Expert Analytics é um conjunto de ferramentas do aplicativo SAP Predictive Analytics. Com Expert Analytics, você realiza várias análises de dados, inclusive previsão de série de tempo, detecção de valores atípicos, análise de tendência, análise de classificação, análise de segmentação e análise de afinidade. Permite que você analise os dados usando diferentes técnicas de visualização, como gráficos de matriz de dispersão, coordenadas paralelas, gráficos de cluster e árvores de decisão. Expert Analytics oferece uma ampla gama de algoritmos preditivos, suporta o uso de linguagem de análise estatística de fonte aberta R e oferece recursos de mineração de dados na memória (in-memory) para um processamento eficiente de análise de dados volumosos. Nota Expert Analytics herda a funcionalidade de aquisição de dados e manipulação de dados do SAP Lumira. SAP Lumira é uma ferramenta de manipulação e visualização de dados. Usando o SAP Lumira, você pode conectarse a várias fontes de dados, como arquivos planos, bancos de dados relacionais, bancos de dados na memória e universos do SAP BusinessObjects, além de operar com diferentes volumes de dados, de uma matriz de dados pequena em arquivo CSV até um conjunto bem volumoso de dados no SAP HANA. Guia do usuário do Expert Analytics Informações gerais de Expert Analytics PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 9 5 Introdução ao Expert Analytics 5.1 Princípios básicos de Expert Analytics Conceitos importantes relevantes ao utilizar Expert Analytics. Componente Componente é a unidade básica de processamento de Expert Analytics. Cada componente tem um ponto de conexão de entrada e/ou vários pontos de conexão de saída. Os pontos de conexão são utilizados para conectar componentes por meio de conectores. Quando você conecta os componentes, os dados são transmitidos dos componentes precedentes para seus componentes sucessores. Expert Analytics consiste dos seguintes componentes: ● Pré-processadores ● Algoritmos ● Gravadores de dados Você pode acessar os componentes da visão de designer da sala Prever. Depois de adicionar componentes ao editor de análise, o ícone de status de um componente permite identificar seu estado. Estes são os estados de um componente: ● Nenhum ícone de status: este estado é exibido quando você arrasta um componente até o editor de análise. Indica a necessidade de configurar o componente antes da execução da análise. ● (Configurado): este estado é exibido quando todas as propriedades necessárias do componente estão configuradas. ● (Sucesso): este estado é exibido após a execução bem sucedida da análise. ● (Falha): este estado é exibido se o componente causar falha na execução da análise. 10 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Introdução ao Expert Analytics Análise Análise consiste em uma série de componentes diferentes conectados em sequência específica por meio de conectores que definem a direção do fluxo de dados. Modelo Modelo é um componente reutilizável, criado treinando um algoritmo com os dados históricos. Modo de trabalho No banco de dados (In-DB) No banco de dados (In-DB) é um modo de execução de análise em que os dados são processados dentro do banco de dados SAP HANA usando recursos de mineração de dados. Neste modo, os dados jamais são processados fora do banco de dados, portanto, a velocidade de processamento é bem alta. Este modo pode ser usado para processar conjuntos de dados volumosos. O SAP HANA suporta mineração de dados no banco de dados por meio de integração R e da biblioteca do Predictive Analysis (PAL). Este tipo de análise também é referido como análise online. Nota Para informações sobre o dimensionamento do banco de dados SAP HANA para a execução da analise no banco de dados, consulte o SAP Note 1514966. Modo de trabalho No processo (In-Proc) No processo (In-Proc) é um modo de execução de análise em que os dados são processados, retirando-os do banco de dados e colocando-os em um espaço no processo preditivo. Nesse modo, você não pode utilizar os algoritmos do SAP HANA PAL para análise. Entretanto, você pode trabalhar com os algoritmos R e da SAP. Este tipo de análise também é denominado Out-DB ou análise offline. Nota Para informações sobre os requisitos de hardware necessários para a execução da análise no processo, consulte a matriz da disponibilidade de produto em Matriz de disponibilidade do produto SAP Guia do usuário do Expert Analytics Introdução ao Expert Analytics PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 11 5.2 Como iniciar Expert Analytics Para iniciar Expert Analytics, selecione Analytics Desktop 5.3 Start SAP Predictive Analytics All Programs SAP Business Intelligence SAP Predictive Expert Analytics . Compreendendo Expert Analytics Ao iniciar Expert Analytics, a página inicial é exibida. A página inicial contém informações para ajudá-lo a começar a trabalhar. Também exibe a opção Experimentar amostras . Essa opção permite experimentar as funções de Expert Analytics utilizando os conjuntos de dados da amostra. Você também pode visualizar os documentos de amostra de Expert Analytics no SAP Lumira utilizando a chave de licença de teste de SAP Predictive Analytics. Para iniciar a análise de dados utilizando Expert Analytics, você precisa executar as tarefas a seguir: ● Conecte-se à fonte de dados e adquira os dados para análise ● Preparar os dados para análise, aplicando funções de manipulação e limpeza de dados ● Analisar os dados, aplicando algoritmos de mineração de dados e de análise estatística ● Compartilhar conjuntos de dados e gráficos com colaboradores externos 5.3.1 Visão de designer A visão Designer na sala Previsão permite projetar e executar análises e criar modelos preditivos. 12 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Introdução ao Expert Analytics 5.3.2 Visão de resultados A visão Resultados na sala Previsão permite entender os dados e os resultados da análise usando várias técnicas de visualização e gráficos intuitivos. Guia do usuário do Expert Analytics Introdução ao Expert Analytics PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 13 5.4 Utilizando Expert Analytics do início ao fim Esta é uma visão geral do processo de construção de um gráfico baseado em um conjunto de dados. O processo não é linear, portanto você pode retroceder uma etapa para ajustar o gráfico ou os dados. Tabela 3: Etapas para trabalhar com seus dados Descrição Faça a conexão com a fonte de da dos. Se a fonte de dados for: 14 ● RDBMS: insira suas credenciais, conecte-se ao servidor do banco de dados e sele cione uma fonte de dados; por exemplo, se você estiver se conectando ao SAP HANA, selecione uma visualização e um cubo para construir um gráfico. ● Arquivo simples: selecione as colunas que devem ser adquiridas, recortadas ou exi bidas e ocultadas. ● Universo: insira suas credenciais do universo, conecte-se ao repositório Central Management Server e selecione um universo para construir seu gráfico. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Introdução ao Expert Analytics Etapas para trabalhar com seus dados Descrição Visualize e organize as colunas e as dimensões. Você pode visualizar os dados adquiridos como colunas ou facetas. Você pode organi zar a exibição de dados para facilitar a construção do gráfico desta forma: ● Analise os dados usando algoritmos preditivos. Crie filtros e oculte as colunas desnecessárias ● Crie medidas, hierarquias de tempo e hierarquias geográficas ● Limpe e organize os dados em colunas, usando várias ferramentas de manipulação ● Crie colunas com fórmulas, usando a ampla seleção de funções disponíveis Depois de adquiridos os dados relevantes na sala Preparar, alterne para a sala Previsão e crie uma análise para encontrar padrões nos dados e prever resultados futuros. Na sala Previsão, você pode fazer o seguinte: Salve a análise 5.5 ● Criar uma análise ● Construir modelos preditivos ● Visualizar os resultados da análise ● Exibir visualizações de modelo ● Construir gráficos Nomeie e salve a análise incluindo seus gráficos. As análises são salvas em um docu mento com o formato de arquivo .lums na pasta do aplicativo, em Documentos, no ca minho do seu perfil. Configuração de características avançadas de Expert Analytics Você pode configurar as características avançadas de Expert Analytics, como otimização de desempenho e habilitação de suporte de tipo de dados para algoritmos PAL utilizando o arquivo SAPPredictiveAnalysis.ini. 1. Feche o aplicativo SAP Predictive Analytics. 2. Navegue para <SAPPA_INST_DIR>\Desktop. 3. Abra o arquivo SAPPredictiveAnalysis.ini. 4. Defina os valores para os seguintes parâmetros como verdadeiros, para ativar a característica correspondente. Defina o valor como falso para desabilitar a característica. Tabela 4: Parâmetro Descrição Valor padrão -Dpa.batch.sql Este parâmetro otimiza o desempenho de Expert Analytics utilizando a execu ção em lote de SQLs. Verdadeiro Guia do usuário do Expert Analytics Introdução ao Expert Analytics PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 15 Parâmetro Descrição -Dpa.decimal.enabled Este parâmetro ativa o suporte de tipo Falso de dados decimal para algoritmos PAL. O suporte de tipos de dados decimal está disponível para SAP HANA 71 e superior. 5. Salve e feche o arquivo SAPPredictiveAnalysis.ini. 6. Reinicie SAP Predictive Analytics. 16 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Valor padrão Guia do usuário do Expert Analytics Introdução ao Expert Analytics 6 Adquirindo dados 6.1 Adquirir dados de uma fonte de dados para criar um conjunto de dados Você adquire dados ao copiá-los de uma fonte de dados para um conjunto de dados local. Ao adquirir dados, o aplicativo exibe uma visualização destes e analisa os dados e as colunas para determinar seu tipo. Os objetos que representam as colunas são propostos como dimensões ou medidas. Você pode manualmente ocultar alguns tipos de colunas, com base no nome de coluna e nas propriedades dos dados. Nota O número máximo de células que podem ser adquiridas é determinado pela capacidade de sua máquina. Você será avisado quando uma aquisição incluir 30 milhões de células para sistemas operacionais de 64 bits ou 15 milhões de células para sistemas operacionais de 32 bits. Dependendo de sua fonte de dados, os dados podem ser adaptados antes da aquisição para incluir ou remover colunas, dimensões, medidas ou variáveis e parâmetros de entrada. Algumas fontes de dados possuem opções adicionais, como formatação de dados, nomeação e recorte de colunas ou a especificação de prefixos de nome de colunas. Tabela 5: Fontes de dados disponíveis Fonte de dados Descrição Área de transferência Cria um conjunto de dados a partir de dados copiados na área de transferência Microsoft Excel Carrega uma planilha do Excel como um conjunto de dados Arquivo de texto Carrega um arquivo de texto (.csv ou .txt) como conjunto de dados SAP HANA Baixa dados do modo SAP HANA (Offline) Conecta com o modo SAP HANA (Online) Universo SAP BusinessObjects Baixa dados dos arquivos de universo SAP BusinessObjects (.unv e .unx) Consulta com SQL Executa Freehand SQL em um banco de dados para efetuar download de um conjunto de dados Após um conjunto de dados ser adquirido, você poderá adicionar e remover colunas, dimensões, medidas e variáveis nele. Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 17 Informações relacionadas Aquisição de dados de um arquivo de texto [página 21] Adquirindo dados das visões do SAP HANA [página 23] Adquirindo dados de uma pasta de trabalho do Excel [página 18] Adquirindo dados utilizando Consulta com SQL [página 30] Conexão a uma fonte de dados de universo [página 28] Processamento de um conjunto de dados adquirido [página 39] Objetos ocultos da lista de objetos [página 39] 6.1.1 Visualizando uma conexão de fonte de dados e seus documentos associados Você pode visualizar todas as conexões definidas para o aplicativo e os documentos associados a cada conexão, além de alterar a fonte de dados de destino para as conexões definidas localmente, na Página inicial. 1. Na Página inicial, selecione Conexões. Se houver um documento aberto na divisão Preparar ou Compartilhar, você precisará salvá-lo e fechá-lo antes de ir para a Página inical. O painel CONEXÕES é exibido à direita e lista todas as conexões de fonte de dados disponíveis. Selecione uma conexão para exibir uma lista de documentos associados a ela. O painel DOCUMENTOS PARA é exibido à direita do painel CONEXÕES e lista os documentos associados a cada conexão. 2. Selecione uma conexão local da lista para exibir sua fonte de dados de destino. Você pode selecionar outra fonte de dados caso necessário. 3. (Opcional) Para alterar a conexão da fonte de dados para um documento, realize as ações seguintes: a. Selecione a conexão a ser alterada. b. Selecione o documento para alterar a fonte de dados no painel DOCUMENTO PARA. c. Selecione uma nova fonte de dados para o documento no painel CONEXÔES e selecione Aplicar. 6.1.2 Adquirindo dados de uma pasta de trabalho do Excel 1. Na Página inicial, selecione Adquirir dados. 2. Na caixa de diálogo Novo conjunto de dados, selecione Microsoft Excel e depois Próximo. 3. Selecione um ou mais arquivos do Excel e depois Abrir. Os dados dos arquivos do Excel são visualizados na caixa de diálogo Novo conjunto de dados. 4. (Opcional) Modifique as opções do Excel para adquirir dados. 5. Selecione Criar. A divisão Visualizar é aberta para você começar a criar gráficos e analisar dados. Caso queira modificar o conjunto de dados primeiro, vá para a divisão Preparar. 18 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados 6.1.2.1 Novas opções de diálogo de conjunto de dados para Excel Você pode adquirir dados de uma ou várias pastas de trabalho do Microsoft Excel. Você escolhe quais linhas e colunas deseja adquirir. Você também pode adquirir dados a partir de tabelas cruzadas. Tabela 6: Novas opções de diálogo de conjunto de dados para Excel Opção Descrição Nome do conjunto de dados Digite um nome para o novo conjunto de dados. Arquivos Selecione as pastas de trabalho do Excel que serão a fonte de da dos para o novo conjunto de dados. Planilha Quando uma pasta de trabalho do Excel contém várias folhas de trabalho, selecione a folha de trabalho que deseja adquirir para o conjunto de dados. Acrescentar todas as folhas de trabalho Marque esta caixa de seleção para adicionar todas as folhas de tra balho na pasta de trabalho para o conjunto de dados. As colunas comuns são anexadas e as colunas diferentes são adicionadas como colunas novas. Configurar a primeira linha com os nomes das colunas Selecione essa caixa de seleção para definir os primeiros valores de coluna na folha de trabalho como nomes de coluna no conjunto de dados. Tipo de cabeçalho da tabela Selecione Tabela padrão (sem transformações) ou Tabela cruzada. Selecionar tudo Marque esta caixa de seleção para adicionar todas as colunas na folha de trabalho para o conjunto de dados. Exibir contagem de registro Selecione a caixa de seleção para exibir o número de colunas e o número de linhas no conjunto de dados. Opções avançadas Mostar colunas ocultas Marque essa caixa de seleção para exibir colunas de folha de traba Opções avançadas Mostar linhas ocultas Marque essa caixa de seleção para exibir linhas de folhas de traba Opções avançadas Detectar células mescladas Marque essa caixa de seleção para realçar células mescladas no Opções avançadas Seleção de intervalo Se a planilha contém um ou mais intervalos nomeados, selecione o lho ocultas como cabeçalho de coluna em conjunto de dados. lho ocultas no conjunto de dados. conjunto de dados. intervalo para aplicar as colunas adquiridas para o conjunto de da dos. Um conjunto de dados é limitado às colunas definidas no Inter valo. Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 19 Opção Descrição Opções avançadas Coluna Para tabelas de referência cruzada, especifique o número de colu Opções avançadas Linha Especifique o número de linhas a ser utilizado para o cabeçalho su 6.1.2.2 nas a ser utilizado no cabeçalho à esquerda. perior. Adquirindo dados de várias pastas de trabalho do Excel Ao adquirir dados de várias pastas de trabalho do Excel, o formato e o tipo de dados devem ser os mesmos em todas as pastas de trabalho. 1. Na Página inicial, selecione Adquirir dados. 2. Na caixa de diálogo Novo conjunto de dados, selecione Microsoft Excel e depois Próximo. 3. Selecione um ou mais arquivos do Excel e depois Abrir. Os dados dos arquivos do Excel são visualizados na caixa de diálogo Novo conjunto de dados. 4. (Opcional) Na caixa Nome do conjunto de dados, insira um nome para o conjunto de dados. 5. Ao lado de Arquivos, selecione Adicionar arquivos e localize e selecione a planilha Excel para dela adquirir dados. Você pode utilizar curingas para pesqusar um nome de planillha. Por predefinição, o primeiro aquivo no caminho é considerado o arquivo de referência ao qual os dados serão anexados de outras planilhas adquiridas. Por exemplo, insira C:\data\monthly updates\*.xls(x) para localizar todos os arquivos .xls(x) no caminho. 6. Na lista Folha de trabalho, selecione uma planilha. Essa folha de trabalho é a referência à qual os dados de outras folhas de trabalho serão anexados. A contagem de registros é atualizada para refletir o número de registros de todos os dados adquiridos. Uma coluna "Arquivo fonte" é adicionada ao conjunto de dados, listando cada nome de fonte de dados. Se você marcou o campo de seleção Anexar todas as folhas de trabalho, todas elas que estiverem na planilha Excel serão adicionadas ao conjunto de dados. Dados da folha de trabalho aparecerão no painel de pré-visualização da caixa de diálogo Novo conjunto de dados. 7. (Opcional) Para exibir linhas ou colunas ocultas da folha de trabalho no conjunto de dados, selecione Opções avançadas. 8. (Opcional) Para exibir colunas ocultas de folha de trabalho nos dados adquiridos, marque o campo de seleção Mostrar colunas ocultas, e insira o intervalo de coluna para exibir na listagem Seleção de intervalo. 9. (Opcional) Para exibir linhas ocultas de folha de trabalho nos dados adquiridos, marque o campo de seleção Mostrar linhas ocultas, e insira o intervalo de linha para exibir na listagem Seleção de intervalo. 10. Selecione Criar. Os dados são adquiridos e exibidos na divisão Preparar. 20 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados 6.1.3 Aquisição de dados de um arquivo de texto É possível adquirir dados de um ou mais arquivos de texto quando os dados estão armazenados com delimitadores ou em colunas de largura fixa. Um exemplo de um arquivo de texto que utiliza delimitadores é um arquivo de valores separados por vírgula (.csv). Um arquivo .csv armazena números e texto na forma de texto sem formatação. Cada registro consiste de campos que costumam estar separados por uma vírgula ou tabulação e os registros são separados por quebras de linha. Aqui temos um exemplo de um arquivo .csv, com dados separados por vírgulas: "Product","Country","Year","Quantity","Margin" "Skis","Italy","2013","1,297","1,929" "Computers","China","2014","609","10,659" Adquirir dados desse arquivo .csv resulta em cinco colunas no conjunto de dados: "Produto", "País", "Ano", "Quantidade" e "Margem". A coluna 2, neste exemplo, teria os valores "País", "Itália" e "China". Aqui está um exemplo de um arquivo de texto com os dados armazenados em colunas de largura fixa: Product Country Skis Italy Computers China Year 2013 2014 Quantity 1,297 609 Margin 1,929 10,659 Você pode adquirir dados de múltiplas fontes de dados. Os arquivos devem ter o mesmo formato e tipo de dados. Tabela 7: Opções da caixa de diálogo Novo conjunto de dados para arquivos de texto Opção Descrição Nome do conjunto de dados O nome do conjunto de dados Arquivos O arquivo ou arquivos que contêm os dados para o novo conjunto de dados. Você pode importar dados de um ou diversos arquivos. Para especificar vários arquivos, separe os caminhos de arquivos no campo Arquivo(s) com pontos e vírgulas, ou selecione Adicionar arquivos e escolha um ou mais arquivos para adicionar à seleção. Separador Escolha se os dados nos seus arquivos são separados por delimitadores ou se são inseri dos em colunas de largura fixa. Os delimitadores são símbolos, como vírgulas, tabs ou es paços, que separam campos na fonte de dados e que especificarão as colunas no conjunto de dados no SAP Lumira. Configurar a primeira linha com Marque essa caixa de seleção para definir a primeira linha de dados como os nomes de os nomes das colunas coluna no conjunto de dados. Desmarque essa caixa de seleção para utilizar o nome predefinido de colunas ("Coluna1," "Coluna2," e assim por diante). Opções avançadas Formato O formato para as colunas numéricas no conjunto de dados Formato O formato para as colunas de data no conjunto de dados de número Opções avançadas de data Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 21 Opção Descrição Opções avançadas Quebrar coluna Ao adquirir os dados armazenados como colunas de largura fixa, analise o arquivo de da dos e sugira larguras de coluna (em caracteres) para separar os dados em colunas no con junto de dados. Se as larguras sugeridas não forem adequadas, você pode alterar essas larguras digitando valores separados por vírgulas. Por exemplo, se os dados estiverem em três colunas e as larguras da coluna forem de 5, 10 e 15 caracteres, você digita 5,10,15 na caixa Quebrar coluna e seleciona Aplicar para visualizar o conjunto de dados resultante. Opções avançadas Recortar espaços iniciais Marque esse campo de seleção para remover valores iniciais e finais de números e texto no conjunto de dados, de modo que os cabeçalhos de coluna não apareçam em branco. Por exemplo, se uma entrada "Produto" tiver um espaço inicial (" Produto"), o espaço será removido e "Produto" (sem o espaço) aparecerá como o cabeçalho da coluna. 1. Na Página inicial, selecione Adquirir dados. 2. Na caixa de diálogo Novo conjunto de dados, selecione Texto e depois Próximo. 3. Selecione um ou mais arquivos e depois Abrir. Os dados dos arquivos são visualizados na caixa de diálogo Novo conjunto de dados. 4. (Opcional) Ajuste as opções do conjunto de dados na caixa de diálogo conforme necessário. 5. Selecione Criar. A divisão Visualizar é aberta e você pode começar a criar gráficos e analisar dados. Caso queira modificar o conjunto de dados primeiro, vá para a divisão Preparar. 6.1.4 Adquirindo dados copiados para a área de transferência Dados baseados em texto podem ser copiados para a área de transferência a partir de um arquivo baseado em texto (por exemplo, do Microsoft Excel) ou a partir de uma página da Web. Tabela 8: Opções da caixa de diálogo Novo conjunto de dados para dados copiados da área de transferência Opção Descrição Nome do conjunto de dados O nome do conjunto de dados Separador Escolha se os dados na área de transferência são separados por delimitadores ou se são inseridos em colunas de largura fixa. Os delimitadores são símbolos, como vírgulas, tabu lações ou espaços, que separam os campos na fonte de dados e especificarão as colunas no conjunto de dados no aplicativo. Configurar a primeira linha com Marque essa caixa de seleção para definir a primeira linha de dados como os nomes de os nomes das colunas coluna no conjunto de dados. Desmarque essa caixa de seleção para utilizar o nome predefinido de colunas ("Coluna1," "Coluna2," e assim por diante). 22 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados Opção Descrição Opções avançadas Formato O formato para as colunas numéricas no conjunto de dados Formato O formato para as colunas de data no conjunto de dados Quebrar Ao adquirir os dados armazenados como colunas de largura fixa, analise o arquivo de da de número Opções avançadas de data Opções avançadas coluna dos e sugira larguras de coluna (em caracteres) para separar os dados em colunas no con junto de dados. Se as larguras sugeridas não forem adequadas, você pode alterar essas larguras digitando valores separados por vírgulas. Por exemplo, se os dados estiverem em três colunas e as larguras da coluna forem de 5, 10 e 15 caracteres, você digita 5,10,15 na caixa Quebrar coluna e seleciona Aplicar para visualizar o conjunto de dados resultante. Opções avançadas Recortar espaços iniciais Marque esse campo de seleção para remover valores iniciais e finais de números e texto no conjunto de dados, de modo que os cabeçalhos de coluna não apareçam em branco. Por exemplo, se uma entrada "Produto" tiver um espaço inicial (" Produto"), o espaço será removido e "Produto" (sem o espaço) aparecerá como o cabeçalho da coluna. Nota O navegador Microsoft Internet Explorer (IE) apresenta um problema conhecido ao copiar texto para a área de transferência. Se esse problema ocorrer, utilize então um navegador suportado diferente. 1. Na Página inicial, selecione Adquirir dados. 2. Na caixa de diálogo Novo conjunto de dados, selecione Copiar da área de transferência e depois Próximo. 3. Copie o texto para a área de transferência. 4. No aplicativo, crie um documento. 5. Na caixa de diálogo Novo conjunto de dados, selecione Copiar da área de transferência e depois Próximo. 6. (Opcional) Selecione Recortar espaços para remover espaços iniciais e finais de números e textos no conjunto de dados. 7. (Opcional) Selecione Recortar linha para remover linhas vazias do conjunto de dados. 8. Selecione Continuar. Os dados dos arquivos são visualizados na caixa de diálogo Novo conjunto de dados. 9. (Opcional) Ajuste as opções do conjunto de dados na caixa de diálogo conforme necessário. 10. Selecione Criar. A divisão Visualizar é aberta e você pode começar a criar gráficos e analisar dados. Caso queira modificar o conjunto de dados primeiro, vá para a divisão Preparar. 6.1.5 Adquirindo dados das visões do SAP HANA Você pode adquirir dados da análise SAP HANA ou de visões de cálculo. Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 23 Dados no banco de dados SAP HANA são acessíveis em uma "visão" – um agrupamento virtual predefinido de colunas de tabelas que habilita o acesso a dados para uma necessidade de negócios específica. Visões são específicas de tipos de tabela incluídos e de tipos de cálculos que são aplicados a colunas. Por exemplo, a visão do atributo é criada em tabelas de dimensões, a visão analítica é criada em uma tabela de fatos e visões de atributos e a visão de cálculo executa uma função em colunas quando a visão for acessada. Você pode se conectar a visões SAP HANA de duas formas: ● Ao efetuar o download de dados do SAP HANA Os dados são copiados localmente e podem ser manipulados e editados antes de serem visualizados como gráficos. ● Ao visualizar dados no SAP HANA Dados são somente leitura (que você não consegue editar), mas você pode visualizar os gráficos. Depois de conectar à uma visão, os dados são apresentados como colunas, facetas, medidas, dimensões e hierarquias no aplicativo. Informações relacionadas Feitura de download de dados do SAP HANA [página 26] Como se conectar com o SAP HANA [página 25] Acessando dados do SAP BW por meio de visualizações do SAP HANA [página 27] Especificando valores para variáveis e parâmetros de entrada de string do SAP HANA [página 27] 6.1.5.1 Restrições para conexões com SAP HANA One Tabela 9: Restrições na conexão com a fonte de dados do SAP HANA One Restrição Descrição Apenas um nível está disponí Somente um atributo único por vez pode ser utilizado ao criar uma hierarquia geográfica. vel para hierarquias geográfi cas. Medidas com dimensões nu Medidas são detetadas a partir da visão analítica do SAP HANA. Elas devem ser criadas na méricas ou de string não po visão SAP HANA , antes que o aplicativo possa automaticamente adquirí-las. dem ser criadas. É impossível publicar conjun tos de dados no SAP HANA 24 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados Restrição Descrição Algumas funções não são su As seguintes funções do SAP HANA não recebem suporte: portadas. ● AddMonthToDate ● AddYearToDate ● LastDayOfMonth ● DayOfYear ● Week ● LastWord ● ExceptLastWord Algumas características não Quando uma visão analítica utilizar uma visão de cálculo (por exemplo, quando uma visão de estão disponíveis para visões atributo dentro de uma visão analítica tiver uma medida calculada ou uma ou mais colunas analíticas que utilizam uma vi calculadas): são de cálculo. 6.1.5.2 ● A visão de grade não está disponível na sala Preparar. ● As facetas não mostrarão valores quando uma medida for selecionada na sala Preparar. ● Não será possível ordenar uma medida na sala Visualizar. Como se conectar com o SAP HANA Ao se conectar com o SAP HANA, você pode ver dados e criar visualizações a partir do cubo SAP HANA. Você deve saber o nome do servidor, nome da porta, nome do usuário e senha do SAP HANA. Para obter mais informações, entre em contato com o administrador SAP HANA. 1. Na Página inicial, selecione Adquirir dados. 2. Na caixa de diálogo Novo conjunto de dados, selecione Conectar ao SAP HANA One e selecione Próximo. 3. Selecione o servidor para efetuar logon na lista Servidor. 4. Insira o número da porta para efetuar logon na caixa Instância/Porta. 5. Conecte-se com o servidor do SAP HANA: Opção Descrição Se conectar-se inserindo as credenciais Insira o nome de usuário e a senha e selecione Conectar. Se conectar-se pelo single sign-on (SSO) Marque o campo de seleção Autenticar por sistema operacional (SSO) e sele cione Conectar. 6. Selecione Seguinte. Um Novo conjunto de dados: A janela Visões do SAP HANA aparece, exibindo as visões SAP HANA disponíveis. 7. Expanda a visão SAP HANA que contém os dados para visualizar e escolha o cubo que contém os dados. 8. Escolha quais dados devem ser adquiridos: ○ Para adquirir dimensões e medidas específicos nos dados, selecione Próximo, selecione as dimensões e medidas e selecione OK. Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 25 ○ Para adquirir todos os dados, selecione Criar. A divisão Visualizar é aberta, e você pode começar a criar gráficos e analisar dados. Caso queira modificar o conjunto de dados primeiro, vá para a divisão Preparar. Informações relacionadas Especificando valores para variáveis e parâmetros de entrada de string do SAP HANA [página 27] Restrições para conexões com SAP HANA One [página 24] 6.1.5.3 Feitura de download de dados do SAP HANA É possível manipular dados e criar visualizações a partir de um cubo SAP HANA. Você deve saber o nome do servidor, nome da porta, nome do usuário e senha do SAP HANA. Para obter mais informações, entre em contato com o administrador SAP HANA. 1. Na Página inicial, selecione Adquirir dados. 2. Na caixa de diálogo Novo conjunto de dados, selecione Download from SAP HANA One e selecione Próximo. 3. Selecione o servidor para efetuar logon na lista Servidor. 4. Insira o número da porta para efetuar logon na caixa Instância/Porta. 5. Conecte-se com o servidor do SAP HANA: Opção Descrição Se conectar-se inserindo as credenciais Insira o nome de usuário e a senha e selecione Conectar. Se conectar-se pelo single sign-on (SSO) Marque o campo de seleção Autenticar por sistema operacional (SSO) e sele cione Conectar. 6. Selecione Seguinte. Um Novo conjunto de dados: A janela Visões do SAP HANA aparece, exibindo as visões SAP HANA disponíveis. 7. Expanda a visão SAP HANA que contém os dados para visualizar e escolha o cubo que contém os dados. 8. Escolha quais dados devem ser adquiridos: ○ Para adquirir dimensões e medidas específicos nos dados, selecione Próximo, selecione as dimensões e medidas e selecione OK. ○ Para adquirir todos os dados, selecione Criar. A divisão Visualizar é aberta, e você pode começar a criar gráficos e analisar dados. Caso queira modificar o conjunto de dados primeiro, vá para a divisão Preparar. 26 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados Informações relacionadas Adquirindo dados das visões do SAP HANA [página 23] Especificando valores para variáveis e parâmetros de entrada de string do SAP HANA [página 27] 6.1.5.4 Acessando dados do SAP BW por meio de visualizações do SAP HANA Você pode acessar dados SAP Business Warehouse (BW) disponíveis na visão de análise ou cálculo do SAP HANA. Em um SAP BW conectado ao sistema SAP HANA, você pode usar o modelador SAP HANA para importar modelos do SAP BW (por exemplo cubos otimizados SAP HANA, Data Store Objects (DSO) e instantâneos da consulta BW) como visões analíticas e de cálculo. Quando os modelos forem ativados, o aplicativo poderá consumi-los ao se conectar a um cubo SAP HANA. Para informações sobre a implementação de um SAP BW no sistema SAP HANA e sobre tornar dados disponíveis no SAP HANA, consulte as Perguntas mais frequentes: Documento BW em HANA emhttp:// www.experiencesaphana.com/community/solutions/net-weaver-bw/bwonhanafaq . Informações relacionadas Feitura de download de dados do SAP HANA [página 26] 6.1.5.5 Especificando valores para variáveis e parâmetros de entrada de string do SAP HANA É solicitado a você a inserção de um valor para uma variável do SAP HANA ou um parâmetro de entrada de string ao adquirir uma visão analítica no modo Download do SAP HANA e ao criar um documento em uma visão analítica no modo Conectar ao SAP HANA. Cada variável do SAP HANA define um filtro em uma dimensão de uma visão. Você insere um valor para cada dimensão antes que os dados sejam adquiridos e o valor é exibido como uma linha de faceta depois da aquisição. Você insere um valor para cada parâmetro de entrada do SAP HANA ao adquirir dados e o SAP Lumira transfere o valor a um cálculo, como uma fórmula para uma medida calculada. Ao inserir um valor para um parâmetro de entrada da string, você deve inserir uma declaração SQL, utilizando cotações únicas para indicar o início e término da string de declaração. Por exemplo, insira BUKRS='CALP' para pesquisar CALP. 1. Conecte com uma instância do SAP HANA no modo Download do SAP HANA ou no modo Conectar ao SAP HANA. 2. Escolha quais dados devem ser adquiridos: Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 27 ○ Para adquirir dados específicos, selecione uma visão analítica, selecione Visualizar e selecionar dados, selecione Selecionar, escolha os valores e medidas da dimensão e clique em Editar variáveis. Quando não houver variáveis nem parâmetros de entrada definidos na visão, o botão Processar variáveis não estará disponível. ○ Para adquirir todos os dados disponíveis na visão analítica, escolha a visão e selecione Criar. Uma caixa Variáveis HANA é exibida, listando as variáveis e os parâmetros de entradas definidos para a visão analítica. As variáveis recebem prefixo "VAR" e os parâmetros de entrada o prefixo "IP". 3. Escolha uma variável ou parâmetro de entrada. O valor da dimensão ou do parâmetro de entrada são exibidos no painel à direita. 4. Escolha um ou mais valores e selecione Adicionar. Para escolher vários valores individuais, pressione e segure Ctrl e selecione cada valor. Para escolher um intervalo de valores, pressione e segure Shift e selecione primeiro e no último valor no intervalo. Os valores selecionados são exibidos no painel inferior. 5. Selecione OK. 6. Se estiver adquirindo dados por meio de Visualizar e selecionar dados, selecione Criar para iniciar a aquisição de dados. Os dados são exibidos na divisão Preparar, e cada variável é exibida como uma faceta com os valores de prompt selecionados. O botão Variáveis aparece na parte superior da área de janela das facetas. Selecione botão para visualizar os valores escolhidos para as variáveis do SAP HANA. 6.1.6 Aquisição de dados de universos Você pode adquirir dados de arquivos de universo do SAP BusinessObjects. Arquivos do universo (.unx) para acessoSAP NetWeaver são criados com o SAP Information Design Tool que é instalado com a plataforma SAP BusinessObjects Business Intelligence. Para obter informações sobre a Ferramenta de design de informações, consulte http://help.sap.com/businessobject/product_guides/ sbo41/en/sbo41sp1_info_design_tool_en.pdf. Para informações sobre federação de dados, consultehttp://help.sap.com/businessobject/product_guides/ sbo41/en/sbo41_dfat_guide_en.pdf. Para uma lista completa de opções de acesso de universos e bancos de dados, consulte Product Availability Matrix disponível no SAP Service Marketplace emSAP Product Availability Matrix . 6.1.6.1 Conexão a uma fonte de dados de universo 1. Na Página inicial, selecione Adquirir dados. 2. Na caixa de diálogo Novo conjunto de dados, selecione Universo e depois Próximo. 3. No painel Credenciais do universo: a. 28 Nome ou endereço IP do servidor que hospeda o servidor central de gerenciamento (CMS). PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados Se você estiver se conectando a um CMS pertencente a outro domínio de rede, certifique-se de que o arquivo hosts localizado em C:\Windows\System32\drivers\etc contém a entrada de nome do host correspondente (por exemplo, x.x.x.x<NameOfMachineHostingCMS>). b. Insira o nome do usuário, senha e tipo de autenticação do CMS. c. Para usar o modo de autenticação do Windows AD a fim de se conectar ao CMS, anexe as entradas a seguir no arquivo SAPLumira.ini localizado em: <LumiraInstallDir>\SAPLumira\Desktop: -Djava.security.auth.login.config=<Path_to_bscLogin>\bscLogin.conf -Djava.security.krb5.conf=<Path_to_kbr5>\krb5.ini -Djava.security.auth.login.config=C:\Windows\bscLogin.conf -Djava.security.krb5.conf=C:\Windows\krb5.ini a. Selecione Conectar. Uma lista de universos disponíveis no CMS é exibida. 4. Escolha um universo e clique em Selecionar. 5. Escolha os objetos necessários na árvore do universo e selecione Adquirir. Antes de adquirir dados, você pode visualizá-los e aplicar filtros, por meio da opção Visualizar e selecionar dados. Se uma consulta contém contextos ou confirmações, você deve respondê-las antes de adquirir os dados. Ao criar uma consulta, você pode definir as seguintes propriedades de consulta: ○ Máximo de linhas recuperadas: A quantidade máxima de linhas que a consulta deve recuperar. ○ Tempo máximo de recuperação: O período máximo de tempo durante o qual uma consulta pode ser executada (em segundos). ○ Recuperar linhas duplicadas: Selecione para recuperar linhas duplicadas. A divisão Visualizar é aberta, e você pode começar a criar gráficos e analisar dados. Caso queira modificar um conjunto de dados primeiro, vá para a divisão Preparar. 6.1.6.2 Dicas para solução de problemas para conexões de dados de universo Você pode encontrar essas mensagens e possíveis causas ao trabalhar com a fonte de dados do universo. Tabela 10: Etapas para solução de problemas para conexões de dados de universo Mensagem Causa Não é possível estabelecer conexão com ● O CMS não responde. Servidor central de gerenciamento (CMS) ● Seu nome de usuário ou senha estão incorretos. ● O tipo de autenticação está incorreto. ● Ocorreu um problema de rede. Não é possível carregar o universo ● O universo está corrompido. selecionado. ● O CMS não responde. ● A conexão com o universo não foi configurada correta mente. Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 29 Mensagem Causa Não é possível validar a consulta. ● Há um problema com a conexão do banco de dados. ● Os tipos de dados não correspondem ao objeto. ● O resultado fornecido pelo servidor alcança o limite de terminado para o parâmetro de configuração Tamanho máximo do fluxo de caracteres (MB) do Web Intelligence Report Server. ● Um ou mais objetos do universo não estão configurados corretamente. A consulta não retorna nenhum conjunto de Uma consulta para o objeto não retornou dados. linha 6.1.7 Adquirindo dados utilizando Consulta com SQL Você pode criar seu próprio provedor de dados digitando manualmente o SQL para a fonte de dados de destino. Você pode especificar tabelas, colunas e funções usadas para adquirir dados. Para uma lista completa de middleware de banco de dados que a Consulta com SQL pode acessar, consulte oSAP Product Availability Matrix . Tabela 11: Drivers de middleware do banco de dados disponíveis Opção de middleware do Como obter o driver banco de dados Apache Drivers Amazon EMR e Apache Hive Simba estão incluídos com o SAP Lumira. Cloudera O driver Cloudera Impala Simba está incluído com o SAP Lumira. IBM DB2 Acesse a página de download de conectividade do IBM DB2 em https://www.ibm.com/ account/profile/us?page=reghelpdesk . Selecione o driver apropriado para o seu banco de dados, salve o arquivo de instalação comprimido em seu computador, extraia o arquivo com primido (db2jcc.jar) em um diretório local e execute o instalador em seu computador. Para versões anteriores a 9.5, você deve extrair db2cc.jar e db2jcc_license_cu.jar ao invés. Antes de poder efetuar o download de um driver, você deve registrar um endereço de e-mail de usuário reconhecido pela IBM como o nome do usuário. Se você não sabe qual versão do driver utilizar, ambos os drivers para a versão do DB2 10.1 [DB2 versão 10.1 FP0 (GA) e versão 10] são adequados para todas as versões do DB2 posteriores à 9.5. Para obter mais informações, entre em contato com o administrador do banco de dados. IBM Netezza 30 Consulte seu administrador Netezza. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados Opção de middleware do Como obter o driver banco de dados Microsoft SQL Server Acesse a página da central de downloads de drivers da Microsoft SQL Server 2005, 2008 e 2012 em http://www.microsoft.com/en-us/download/driver.aspx?q=driver . Selecione o driver apropriado para o seu banco de dados, salve o arquivo de instalação em seu computador e execute o instalador nele. Se não souber qual versão do driver deve ser usada, use o driver Microsoft JDBC 4.0 para SQL Server, que é adequado para todas as versões compatíveis do SQL Server. Se estiver insta lando o Microsoft JDBC 4.0 para SQL Server, o driver para um sistema operacional Windows é sqljdbc_4.0.2206.100_enu.exe. O arquivo de driver sqljdbc4.jar é extraído em \sqljdbc_4.0\enu\, dentro da pasta de extração especificada. Oracle Acesse a página de downloads de driver Oracle JDBC em http://www.oracle.com/technet work/database/features/jdbc/index-091264.html Antes de poder efetuar o download de um driver, você deve criar uma conta de usuário gra tuita. Se não souber qual versão do driver deve ser usada, use o driver ojdbc14.jar, que é adequado para qualquer versão do Oracle 10 e 11. Sybase O driver Sybase (jconn4.jar) está instalado por predefinição e você não precisa instalá-lo. Ele está localizado em \\<InstallDir>\Program Files\SAP Lumira\Desktop \plugins \com.businessobjects.connectionserver.standalone_3.1.3.v20120603 -0404\ConnectionServer\jdbc\drivers\IQ15. Teradata Acesse a página de download de conectividade da Teradata em http://downloads.tera data.com/download/connectivity/jdbc-driver . Selecione o driver apropriado para o seu banco de dados, salve o arquivo de instalação comprimido em seu computador, extraia o ar quivo comprimido em um diretório local e execute o instalador em seu computador. Antes de poder efetuar o download de um driver, você deve criar uma conta de usuário gra tuita. Se não souber qual versão do driver deve ser usada, use o driver Teradata JDBC Driver 14, que é adequado para todas as versões suportadas do Teradata. Para Windows, utilize TeraJDBC__indep_indep.14.00.00.14.zip. Assim que extraídos, os arquivos de driver são tdgssconfig.jar e terajdbc4.jar. Tabela 12: Drivers JDBC disponíveis para middleware do banco de dados típico Middleware do banco de dados Nome do arquivo do driver JDBC Oracle ojdbc14.jar Microsoft SQL Server sqljdbc4.jar Teradata terajdbc4.jar e tdgssconfig.jar Sybase jconn4.jar Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 31 Middleware do banco de dados Nome do arquivo do driver JDBC IBM DB2 db2jcc.jar ou db2cc.jar e db2jcc_license_cu.jar para versões anteriores a 9.5 IBM Netezza nzjdbc.jar Informações relacionadas Instalando drivers de acesso a dados [página 32] Conectando-se a uma fonte de dados Consulta com SQL [página 35] Propriedades de conexão de Consulta com SQL [página 34] 6.1.7.1 Instalando drivers de acesso a dados O driver de acesso a dados Sybase IQ 15 é instalado automaticamente com o aplicativo. Para outros bancos de dados, pode ser necessário instalar um driver de acesso a dados JDBC para o middleware do banco de dados, antes e utilizar a Consulta com SQL. ● Você precisa ter conhecimento sobre banco de dados e a linguagem SQL ● O servidor de acesso a dados correto precisa ser instalado para seu banco de dados middleware. O driver de acesso a dados é o software de um fornecedor de banco de dados que permite que um aplicativo cliente se conecte ao middleware e acesse os dados do banco de dados. Você copia o driver de acesso aos dados do site da Web de suporte do fornecedor de middleware para uma pasta local e então poderá selecionar o driver no aplicativo e se conectar ao banco de dados. Nota A instalação dos drivers de acesso a dados a partir dos sites dos fornecedores pode apresentar problemas devido à disponibilidade de diferentes versões do driver e diferentes formatos de arquivo. Se você não tiver conhecimento sobre sua versão de banco de dados ou seu site de fornecedor, entre em contato com o administrador do banco de dados. Siga essas etapas gerais para obter um driver de acesso de dados: 1. Efetue download do driver de acesso de dados (um arquivo .jar) pelo site do fornecedor do banco de dados e copie o arquivo e cole em uma pasta local. 2. Registre o caminho do driver selecionando o driver na aplicação. 3. Selecione a Consulta com fonte de dados SQL pela guia Drivers da SQL nas preferências da aplicação. Você pode selecionar um driver de SQL instalado ou instalar o driver necessário. 1. Selecione Arquivo Preferências Drivers da SQL Drivers . A página Instalação do driver lista os nomes de middlewares de banco de dados e o status dos drivers: ○ 32 Quando a marca de verificação estiver verde, o driver está instalado corretamente e você pode iniciar a utilização da Consulta com SQL. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados 2. ○ Quando a marca de verificação estiver vermelha, o driver não estará instalado para esse middleware e você deverá instalá-lo. ○ Quando a marca de seleção de status estiver amarela, o driver compatível estará disponível para middleware, mas o aplicativo precisará ser reiniciado antes de ser disponibilizado. Quando o software for reiniciado, você poderá utilizar a Consulta com SQL. Escolha uma fonte de dados e execute umas das seguintes ações: Opção Descrição Se o middleware da fonte de dados tem uma marca de verificação verde Selecione Próximo, insira as informações de conexão de middle ware e selecione Criar. O driver de acesso a dados está instalado. Você não precisa exe cutar as etapas restantes desta tarefa. Se o middleware da fonte de dados tem uma marca de verificação amarela Reinicie a aplicação, e repita a etapa 1. Se o middleware da fonte de dados tem uma marca de verificação vermelha Vá para a etapa 3. 3. Se o driver do middleware não estiver configurado, selecione o botão Instalar, selecione o driver do banco de dados e selecione Instalar drivers na parte superior da lista de bancos de dados. 4. Na caixa de seleção que é exibida, com base na disponibilidade local do middleware, execute uma das seguintes ações: Opção Descrição Se o arquivo .jar correto está dispo nível Vá para a etapa 6. Se o arquivo .jar correto não está dis Efetue o driver do site de suporte do fornecedor, instale o driver, selecione Cancelar para fechar a caixa de seleção do driver e então efetue download e ponível instale o arquivo .jar correto. Você deve acessar a página da web que lista os drivers de acesso de dados JDBC para o fornecedor do middleware. De acordo com o banco de dados, diferentes tipos de arquivos de driver estão disponíveis; geralmente, trata-se de um arquivo comprimido contendo drivers ou de um arquivo executável que instala os drivers automaticamente. Para o aplicativo, baixe apenas o arquivo comprimido. 5. Na página da Web de suporte do seu fornecedor, efetue o download do arquivo do driver JDBC (por exemplo, um arquivo .tar, .gz ou .zip) para a versão de seu middleware do banco de dados. 6. No seu computador, selecione a pasta que contém os arquivos extraídos do driver JDBC para o middleware de seu banco de dados. Há uma lista completa dos drivers JDBC suportados em Product Availability Matrix, disponível no site do SAP Service Marketplace em https://support.sap.com/pam . 7. Reinicie o aplicativo. A lista de drivers disponíveis de middleware do banco de dados é atualizada. Quando você usa Consulta com SQL para criar um documento no aplicativo, o middleware do banco de dados de destino é listado com uma marca de seleção verde, indicando que o driver está disponível para acessar o banco de dados. Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 33 6.1.7.2 Propriedades de conexão de Consulta com SQL É possível criar seu próprio provedor de dados, por meio da digitação manual dos comandos SQL relativos a uma fonte de dados de destino, para aquisição dos dados da tabela. Ao usar a consulta com SQL, você deve inserir as informações de conexão com o banco de dados de destino e pode especificar os parâmetros de conexão para otimizar a busca de dados. Tabela 13: Parâmetros de logon Parâmetros de logon Descrição Nome de usuário Senha Server (<host>:<port>) Nome e porta do servidor que hospeda o banco de dados Banco de dados Nome do banco de dados Tabela 14: Parâmetros de otimização Parâmetro avançado Descrição Modo de pool de conexões Se estiver usando um pool de conexões, empregue-o para manter ativa a conexão do modo pool de conexões. Tempo limite do pool Se o modo de pool de conexões estiver definido como Manter a conexão ativa por, trata-se da duração em minutos durante a qual a conexão permanecerá aberta. Tamanho da matriz de busca O número máximo de linhas permitidas em cada busca no banco de dados. Por exemplo, se você digitar 20 e a consulta retornar 100 linhas, a conexão tratará os dados em cinco buscas, cada uma com 20 linhas. Para desativar a matriz de busca, insira 1 como o tama nho da matriz de busca. Os dados são recuperados linha por linha. A desativação do tamanho da matriz de busca pode aumentar a eficiência da recuperação de dados, mas prejudicar a velocidade do servidor. Quanto maior o valor do tamanho da matriz de busca, mais rápida será a recuperação das linhas. No entanto, verifique se o sis tema cliente tem a memória adequada. Tamanho da matriz de ligação Tamanho da matriz de ligação antes da transmissão para o banco de dados. Em geral, quanto maior a matriz de ligação, maior será o número de linhas (n) carregadas em uma operação e o desempenho será otimizado. Tempo limite de login O número de minutos antes de a tentativa de conexão atingir o tempo limite e uma mensa gem ser exibida. Propriedades do driver JDBC Valores das propriedades do driver JDBC. É possível definir o valor de mais de uma propri edade. Eles devem ser separados por vírgulas. Por exemplo, o valor oracle.jdbc.defaultNChar=true,defaultNChar=true para as proprieda des do driver JDBC define as propriedades do driver oracle.jdbc.defaultNChar and defaultNChar. 34 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados 6.1.7.3 Editor de SQL para Consulta com SQL Use um editor de SQL para criar uma fonte de dados de Consulta com SQL baseada em um banco de dados conectado. O editor de SQL pode ser acessado pela opção de conexão Consulta com SQL quando um documento é criado. A aquisição de dados de tabelas do banco de dados só é permitida por meio da instrução SELECT do editor de SQL. Use essas opções do editor de SQL para selecionar tabelas para a fonte de dados: Tabela 15: Opções do editor de Descrição SQL Catálogo Contas disponíveis para o banco de dados conectado. Expanda os nós para ver as tabelas disponí veis. Clique duas vezes para adicionar uma tabela à consulta SQL. Consulta A consulta SELECT para buscar tabelas. (Somente SELECT é suportado.) Você pode adicionar no mes de tabelas ao clicar duas vezes na tabela existente no nó da conta, no painel à esquerda. Histórico de SQL Mantém um log das instruções SELECT usadas no painel de consulta. Clique em uma instrução para que ela seja incluída na consulta. Visualização dos dados Selecione essa opção para visualizar as tabelas adquiridas por SELECT. Selecionar tudo/nada Selecione todas ou nenhuma coluna, ou selecione colunas individuais para aquisição. Informações relacionadas Conectando-se a uma fonte de dados Consulta com SQL [página 35] 6.1.7.4 Conectando-se a uma fonte de dados Consulta com SQL Você pode se conectar diretamente a um banco de dados, para especificar os dados a adquirir e configurar parâmetros para a otimização da conexão com o banco de dados. ● Você precisa ter conhecimento sobre banco de dados e a linguagem SQL ● O servidor de acesso a dados correto precisa ser instalado para seu banco de dados middleware. O driver de acesso a dados é o software de um fornecedor de banco de dados que permite que um aplicativo cliente se conecte ao middleware e acesse os dados do banco de dados. Você copia o driver de acesso aos dados do site da Web de suporte do fornecedor de middleware para uma pasta local e então poderá selecionar o driver no aplicativo e se conectar ao banco de dados. Nota A instalação dos drivers de acesso a dados a partir dos sites dos fornecedores pode apresentar problemas devido à disponibilidade de diferentes versões do driver e diferentes formatos de arquivo. Se você não tiver Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 35 conhecimento sobre sua versão de banco de dados ou seu site de fornecedor, entre em contato com o administrador do banco de dados. É necessário instalar um driver de acesso a dados JDBC para o middleware do banco de dados antes de usar a Consulta com SQL. O driver de acesso a dados é um arquivo .jar que você baixa do site de um fornecedor de banco de dados e salva na pasta do driver no caminho de instalação do aplicativo. Consulte as informações relacionadas para saber como localizar e instalar o driver de acesso a dados correto para seu middleware de banco de dados. 1. Na Página inicial, selecione Adquirir dados. 2. Na caixa de diálogo Novo conjunto de dados, selecione Consulta com SQL e depois Próximo. Uma lista de middlewares do banco de dados será exibida. 3. ○ Quando uma marca de verificação verde aparecer próxima ao nome do middleware, o middleware será instalado e você poderá começar a utilizar a Consulta com SQL. ○ Quando uma marca de verificação vermelha aparecer próxima ao nome do middleware, o driver de acesso de dados para o middleware não será instalado; você deverá instalá-lo. Escolhe o middleware do banco de dados para o banco de dados de destino: Opção Descrição Se o middleware está disponível Selecione o middleware e depois Próximo. Se o middleware não está disponível Selecione Instalar e instale o middleware. 4. Insira suas credenciais de logon na aba Login e, se necessário, insira os parâmetros do driver na guia Avançado. 5. Selecione Criar. O editor SQL é aberto. 6. Digite o comando SQL para buscar as tabelas desejadas, visualize a consulta SQL e selecione Criar. A divisão Visualizar é exibida, e você pode começar a criar gráficos e analisar dados. Caso queira modificar o conjunto de dados primeiro, vá para a divisão Preparar. Informações relacionadas Propriedades de conexão de Consulta com SQL [página 34] Editor de SQL para Consulta com SQL [página 35] Instalando drivers de acesso a dados [página 32] 6.1.8 Efetuando download de dados do banco de dados SAP BW Você pode se conectar diretamente a sistemas SAP Business Warehouse (BW) usando a conectividade Business Intelligence Consumer Services (BICS). Isso permite que você efetue download de conjuntos de amostra de treinamento para determinação do modelo. 36 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados Você não só pode se conectar a InfoProviders SAP BW, como também pode executar BEx Queries e passar valores para variáveis definidas nas queries. Isso elimina a necessidade de efetuar download manualmente ou exportar dados do SAP BW para realizar previsões sobre os dados. Você pode visualizar uma síntese da arquitetura para a conexão offline BW aqui: Informações relacionadas Criando um conjunto de dados offline BW [página 37] 6.1.8.1 Criando um conjunto de dados offline BW Aprenda como se conectar a BEx Queries ou InfoProviders, selecionar dimensões e medidas e definir valores para variáveis (para BEx Queries). Isto permite que você restrinja o conjunto de treinamento para realizar previsões sobre os dados. Antes de poder conectar-se a um sistema SAP Business Warehouse (BW), ele precisa ser registrado pelo SAP GUI para Windows no mesmo computador. É recomendável testar a conectividade do sistema BW registrado pelo Logon da SAP antes de utilizá-lo em Expert Analytics. Consulte a documentação SAP GUI para Windows no Portal de ajuda SAP em http://help.sap.com para configurar um novo sistema. Para efetuar o download do SAP GUI for Windows, vá para o SAP Service Marketplace . Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 37 1. Para criar um novo conjunto de dados, primeiro, selecione uma fonte em Arquivo Novo . 2. No diálogo que é exibido, selecione a opção Efetuar download do SAP Business Warehouse e selecione Próximo. 3. Insira os detalhes da conexão BW, tais como ID do cliente, Idioma, Usuário e Senha e selecione Conectar. Nota A lista de servidores BW disponíveis é derivada do SAP Logon. 4. Selecione a BEx Query da lista de queries disponíveis e selecione Criar. Você pode pesquisar sua BEx Query ou InfoProvider usando as visões Funções ou InfoÁreas. Como alternativa, você pode pesquisar palavras-chave na caixa Encontrar. 5. Insira valores para as variáveis obrigatórias da BEx Query. 6. Onde as queries tiverem variáveis de hierarquia definidas, você precisará selecionar uma hierarquia. 7. Selecione os valores dentro da hierarquia que foram filtrados com base no nó selecionado para a variável anterior e selecione OK. 8. Por fim, selecione dimensões e medidas considerando o caso de uso preditivo. O download dessas dimensões e medidas é efetuado quando você seleciona Criar. O conjunto de dados é adicionado na divisão Prever e você pode aplicar a ele algoritmos para gerar previsões. 6.1.8.2 BEx Recomendações de consulta Algumas recomendações e melhores práticas para usar BEx Queries ao efetuar download de dados do SAP Business Warehouse (BW) com Expert Analytics. Recomendação ● Durante a obtenção de dados, só será possível definir valores de filtro para as características das BEx Queries de base se elas forem especificadas como parâmetros de entrada durante a criação de BEx Queries. Também há a opção de selecionar um subconjunto de características e índices da BEx Query de base para relatórios durante a obtenção de dados. ● As hierarquias são niveladas durante a obtenção para garantir que os dados estejam no formato correto para o processamento preditivo de algoritmos. ● O Expert Analytics respeita as configurações de exibição para chave e texto de características na BEx Query de base. Como resultado, é importante garantir que suas BEx Queries sejam configuradas de maneira que os usuários possam ampliar as descrições para os valores de dimensão. ● Informações de moeda e unidade para índices estão disponíveis apenas na visualização de tabelas do Expert Analytics. Com base nisso, você pode oferecer aos usuários a opção de selecionar uma unidade ou moeda usando as variáveis BEx como parte da BEx Query de base ou configurar a unidade ou moeda como um valor fixo na BEx Query. Também é altamente recomendável que a mesma unidade ou moeda seja configurada para todos os índices para evitar confusões. ● O Expert Analytics respeita as condições (Top N) definidas na BEx Query de base, mas os usuários não recebem nenhuma informação sobre as condições configuradas. Como resultado, não recomendamos usar condições em queries previstas para uso com algoritmos preditivos. ● Fatores de escalamento não são respeitados no Expert Analytics. Todo fator de escalamento aplicado será removido na obtenção de dados e o valor real do índice será exibido. 38 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados ● Recomendamos que você evite queries com cálculos de lista e supressão de zeros ao usar BEx Queries com Expert Analytics. Isso não é claro para o usuário durante a obtenção de dados e, deste modo, pode levar a resultados inesperados. ● Por padrão, BEx Queries omitem valores de dados mestre sem registros. Se tais itens forem necessários durante o processamento de algoritmos, certifique-se de que as configurações adequadas sejam efetuadas na query. 6.1.9 Processamento de um conjunto de dados adquirido Após um conjunto de dados ter sido adquirido, você pode processá-lo. Você poderá processar essas informações nos conjuntos de dados adquiridos: ● Adicione novas colunas que foram removidas da fonte de dados no ato da aquisição original ● Remover colunas incluídas na fonte de dados original. ● Alterar valores selecionados para variáveis e parâmetros de entrada do SAP HANA. 1. Abra um conjunto de dados que já tenha sido adquirido na aplicação. 2. Selecionar 3. Execute uma ou várias das seguintes ações: 4. Dados Editar fonte de dados . ○ Marque um campo de seleção de nome de coluna para adicionar uma nova coluna. ○ Desmarque uma caixa de seleção de nome de coluna, para remover uma coluna. ○ Marque ou desmarque as opções para adicionar ou remover dimensões e medidas. ○ Para modificar variáveis e parâmetros de entrada do SAP HANA, selecione Editar variáveis, insira ou exclua valores para variáveis ou parâmetros de entrada e selecione OK. Selecione OK. O conjunto de dados é atualizado com as colunas, medidas, variáveis ou dimensões adicionadas ou removidas. 6.1.10 Objetos ocultos da lista de objetos Utilize o arquivo de sugestões de enriquecimento para impedir que as colunas específicas sejam propostas como medidas no aplicativo quando os dados são adquiridos. Para impedir que colunas específicas sejam propostas como medidas quando os dados são adquiridos, o aplicativo usa o arquivo enrichment_suggestions.<VersionNumber>.txt para identificar colunas que não devem ser propostas como medidas. A primeira vez que criar um documento, o arquivo é salvo em seu diretório @user.home/.sapvi (por exemplo C:\Users\<YourUserName>\.sapvi). Por padrão, os nomes da coluna no arquivo de sugestões de enriquecimento estão em inglês. No entanto, você pode definir nomes em outros idiomas, especificar nomes de colunas a ocultar da lista de objetos e impedir que objetos sejam considerados objetos geográficos ou de tempo. O enriquecimento será processado se você selecionar a detecção automática de enriquecimentos nas preferências do aplicativo. Ao atualizar o aplicativo, uma nova versão do arquivo de sugestões de enriquecimento é salva, sem substituir o arquivo original. Você pode usar o arquivo original como referência para modificar o novo arquivo de sugestões. O aplicativo utilizará o nome do arquivo que corresponde à versão instalada do aplicativo. Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 39 6.1.11 Como editar o arquivo de sugestões de enriquecimento Edite o arquivo de sugestões de enriquecimento para identificar quais objetos não devem ser propostos como medidas ou atributos de tempo ou geográficos no painel Medidas e dimensões. É possível definir quantas regras forem necessárias no arquivo enrichment_suggestions.<VersionNumber>.txt. Para cada regra, você deve declarar quatro propriedades. A sintaxe é Java regex e os metadados não diferenciam maiúsculas de minúsculas. Tabela 16: Propriedades necessárias para cada regra no arquivo de sugestões de enriquecimento Propriedade necessária Descrição objectName Modelo correspondente no nome do objeto (cabeçalho da coluna). Qualquer ca ractere pode ser utilizado. Quando .*DAY.* é utilizado, qualquer objeto com a string DAY é incluído na regra (SEGUNDA-FEIRA, TERÇA-FEIRA, etc.). dataType Lista de tipos de dados. Tipos de dados reconhecidos são: ● integer ● biginteger ● double ● string ● date ● boolean Qualquer nome da coluna, com qualquer tipo de dados, será considerados para exclusão pelo painel de propostas. Se nenhuma propriedade dataType foi de clarada, todos os tipos de dados são considerados. enrichment Impede que os objetos sejam exibidos. Os valores MEASURE ou TIME (objetos de hierarquia de tempo) ou GEO (objetos de hierarquia geográfica). rule Padroniza para hide. Não modifique esse valor. O seguinte exemplo exibe o arquivo de enriquecimentos padrão: { "version":"1.0", "policies":{ }, "suggestionRules":[ { "objectName":"(?i).*year.*|.*month.*|.*quarter.* |.*week|.*day|.*semester.*|.*hour|.*minute|.*second", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*zip.*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*_id\\d*", 40 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adquirindo dados } "dataTypes":["integer", "biginteger", "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*key.*", "dataTypes":["integer", "biginteger", "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*zip.*", "dataTypes":["integer", "biginteger", "enrichment":"TIME", "rule":"hide" }, { "objectName":"(?i).*_id\\d*", "dataTypes":["integer", "biginteger", "enrichment":"TIME", "rule":"hide" }, { "objectName":"(?i).*key.*", "dataTypes":["integer", "biginteger", "enrichment":"TIME", "rule":"hide" } ] "double"], "double"], "double"], "double"], "double"], 1. Abra o arquivo enrichment_suggestions.<VersionNumber>.txt em um editor de texto. 2. Em cada objeto, defina os tipos de dados e enriquecimento, e defina outras propriedades, conforme necessário. Você deve manter "rule" definido como "hide". 3. Salve o arquivo com o mesmo nome. Guia do usuário do Expert Analytics Adquirindo dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 41 7 Preparando dados 7.1 Preparando dados Quando os dados são adquiridos pela primeira vez pelo aplicativo, são dados brutos formatados normalmente de maneira inconsistente e não são facilmente interpretados pelos usuários empresariais. Muitas vezes é necessário preparar os dados antes de criar os gráficos para visualizá-los, a fim de que eles tenham boa aparência e possam ser compreendidos. A preparação de dados pode ser realizada na visualização Grade ou Facetas, utilizando o painel Ferramentas de manipulação à direita da área Preparar. As tarefas de edição podem ser aplicadas a todos os valores de uma coluna ou somente aos valores selecionados. Informações relacionadas Editando e filtrando dados [página 46] Como converter dados em outro tipo [página 50] Criando uma ou hierarquia de tempo ou geográfica [página 51] Criando uma medida a partir de uma coluna ou dimensão [página 54] Como adicionar um conjunto de dados [página 71] Alternando para outro conjunto de dados [página 72] Mesclar conjuntos de dados (JOIN) [página 72] 7.1.1 Sala Preparar – visualização, limpeza e manipulação de dados Antes de criar gráficos, utilize as ferramentas na sala Preparar para visualizar e preparar dados. A sala Preparar exibe os dados para a fonte de dados conectada e é dividida em três áreas. 42 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Tabela 17: Partes da divisão Preparar Gráfico de área Painel Dados Descrição Esta área central exibe os dados em linhas e colunas (visão em Grade) ou em facetas (visão Facetas). É aqui onde você pode visualizar dados e aplicar as seguintes ferramentas (quando disponíveis) a va lores da coluna: ● Alterar agregação ● Classificar ● Filtro ● Exibir formatação ● Converter em número ● Converter em data ● Converter em texto ● Criar uma medida ● Criar uma hierarquia de tempo ● Criar uma hierarquia geográfica ● Criar uma hierarquia customizada ● Renomear ● Remover ● Consolidar a coluna ● Ocultar a coluna ● Esticar para conteúdo ● Criar dimensão calculada ● Duplicar Painel Medidas e O painel localizado à esquerda da área de dados lista as medidas e dimensões que o aplicativo detec dimensões tou nos dados. Utilize as ferramentas no painel Medidas e dimensões para definir ou processar medi das e para criar hierarquias temporais e geográficas. Painel Ferramentas de Um painel localizado no lado direito da área de dados, no qual você pode processar texto e converter manipulação valores em uma célula ou coluna de dados, criar novas colunas com fórmulas e renomear, duplicar e remover colunas. Informações relacionadas Painel Medidas e dimensões [página 44] Painel Dados [página 44] Painel Ferramentas de manipulação [página 45] Preparando dados [página 42] Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 43 7.1.1.1 Painel Medidas e dimensões O painel Medidas e dimensões está localizado à esquerda do Painel central. Ele lista medidas, dimensões, hierarquias e dimensões inferidas no conjunto de dados. Tabela 18: Objetos no painel Medidas e dimensões Objeto do painel Medidas Descrição e dimensões Medida Uma mapeamento nos dados agregados em uma coluna ou um cálculo. As medidas são usadas para obter o resultado calculado quando colunas são combinadas. Por exemplo, a medida "Re ceita de vendas" representa a coluna de mesmo nome que contém o valor somado das vendas. As medidas são detectadas e listadas automaticamente. Hierarquia Referencia mais de uma coluna relacionada em um conjunto de dados e as colunas têm relações hierárquicas. Por exemplo, um objeto "Tempo" pode incluir colunas de "Ano", "Trimestre" e "Mês" organizadas em uma estrutura hierárquica sob o objeto superior "Tempo". Atributo Mapeamento das colunas de um conjunto de dados Dimensão inferida Uma ou mais colunas criadas com base em dados de tempo ou geográficos disponíveis para o aplicativo (para oferecer suporta a uma hierarquia) Informações relacionadas Preparando dados [página 42] Criando uma ou hierarquia de tempo ou geográfica [página 51] Criando medidas [página 54] Criação de medidas e hierarquias [página 50] 7.1.1.2 Painel Dados O painel Dados é o painel central que exibie seus dados na divisão Preparar. Use o painel Dados para visualizar, organizar, processar e preparar os conjuntos de dados para visualizações. Tabela 19: Opções no topo do painel Dados Opção Descrição Lista Seleção de fontes de Lista as fontes de dados conectadas na sessão atual. Utilize essa ferramenta para alternar dados de um conjunto de dados para outro e para adicionar um novo conjunto de dados à sessão atual. Filtros de dados 44 Selecione para definir limites para filtrar os dados de uma coluna. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Opção Descrição Grade Selecione para apresentar dados em colunas e linhas. Todas as linhas são exibidas. Facetas Selecione para apresentar dados em colunas, apenas com valores exclusivos exibidos. Valo res repetidos permanecem ocultos. Utilizar facetas pode ser útil quando um conjunto de da dos inclui muitos valores repetidos. Mostrar/Ocultar colunas Selecione para exibir ou ocultar colunas em conjunto de dados. Cálculo Selecione para adicionar dimensões ou medidas calculadas. Combinar Selecione para mesclar ou anexar dados a um conjunto de dados. Você pode mesclar dados de vários conjuntos de dados no conjunto de dados atual, mas os dados devem ser compatí veis. É possível anexar outro conjunto de dados ao atual. Os dados em colunas comuns são anexos ao conjunto de dados atual, e os dados nas colunas únicas são adicionados como no vas colunas. Atualizar dados do documento Selecione para atualizar os conjuntos de dados utilizados no documento. Desfazer/Refazer Selecione para desfazer a última ação ou para repeti-la. Informações relacionadas Editando e filtrando dados [página 46] Filtrando dados em colunas e gráficos [página 49] Como adicionar um conjunto de dados [página 71] Mesclar conjuntos de dados (JOIN) [página 72] Alternando para outro conjunto de dados [página 72] Criando uma medida ou dimensão calculada [página 55] 7.1.1.3 Painel Ferramentas de manipulação O painel Ferramentas de manipulação, à direita da divisão Preparar, contém as ferramentas que permitem editar e formatar valores. Dependendo do tipo de dados da coluna selecionada você pode: ● Duplicar, renomear e remover colunas ● Criar dimensões calculadas ● Localizar, substituir e alterar valores de strings ● Preencher prefixos e sufixos ● Converter, remover e agrupar valores ● Editar strings de texto Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 45 7.1.2 Editando e filtrando dados Você usa o painel de Ferramentas de manipulação (localizado à direita do painel central) para processar e formatar os valores em uma coluna. O painel está disponível nas visões Grade e Facetas. Algumas das opções no painel Ferramentas de manipulação também são acessíveis clicando na seta no nome da coluna ou clicando com o botão direito do mouse no nome da coluna. Tabela 20: Ações de dados para colunas Ação de da Descrição dos Disponível no menu Disponível para do nome da coluna (ou no menu do con Caractere Data Número Sim Sim Sim texto) Criar uma Criar uma nova coluna. nova coluna Duplicar Criar uma coluna que seja uma cópia da coluna se Sim lecionada. Renomear Alterar um nome de coluna. Sim Sim Sim Sim Dividir Criar uma coluna com valores de cadeia exibidos Não Sim Não Não após um ponto de divisão definido. A divisão pode ser uma marca de pontuação (por exemplo, uma vírgula) ou uma cadeia de texto. Remover Remover uma coluna selecionada. Sim Sim Sim Sim Converter Alterar os valores da cadeia para letras maiúsculas Não Sim Não Não maiúsculas e ou minúsculas. Não Sim Não Não Não Sim Não Não Sim Não Não Sim Sim Sim Não Não Sim Sim Não Não minúsculas Substituir Encontrar uma cadeia e substituí-la por uma nova. Preenchiment Especificar um caractere como prefixo ou sufixo o de uma cadeia para um comprimento de caracte res definido. Converter em Inserir uma cópia de uma coluna com valores con texto vertidos em texto. Converter em Inserir uma cópia de uma coluna com valores con número vertidos em números. Converter em Selecionar um formato de data e validá-lo. Uma data cópia da coluna é inserida com os valores converti dos em datas. 46 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Ação de da Descrição Disponível no menu dos Disponível para do nome da coluna Caractere Data Número Não Sim Não Não Criar uma nova coluna na qual você possa criar no Não Sim Sim Sim Não Não Sim Sim Não Sim Não Não (ou no menu do con texto) Converter Selecionar Maiúsculas ou Minúsculas para alterar maiúsculas e o formato do texto. minúsculas Recortar Remova os caracteres que antecedem ou seguem uma marca de pontuação específica ou um carac tere. Agrupamento vos grupos de linhas (por exemplo, grupo 1, grupo 2 etc.) para organizar as linhas. Linhas que não es tejam em um grupo específico podem ser organi zadas em um grupo chamado "Outros" ou podem permanecer sem grupos. Criar Criar uma nova coluna para tipos de data e de nú dimensão mero que aplique a função aos valores. Por exem calculada plo, a função "Plano" pode ser aplicada à coluna "Margem" para criar uma nova coluna de valores de margem, arredondada para o número inferior mais próximo. Seleção Clique duas vezes na visão Grade ou clique duas interna da vezes lentamente na visão Facetas para selecionar célula um intervalo de caracteres ou uma palavra. Você pode realizar as seguintes ações nos caracteres ou na palavra: ● Remover ou substituir partes do texto ● Criar uma nova coluna com as mesmas linhas mas limpas (por exemplo, remover "resort" de valores) ● Mover o texto selecionado para o começo do valor da linha 1. Realize uma das seguintes ações: Opção Descrição Para processar todos os valores em uma única coluna Selecione o cabeçalho da coluna. Para processar todos os valores em diversas colunas Pressione Ctrl e selecione o cabeçalho de cada coluna. Para processar um valor individual Selecione uma célula. Para processar vários valores em uma coluna Pressione Ctrl e selecione ocada célula. Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 47 Opção Descrição Para processar um intervalo de caracteres ou uma pa (Apenas valores de caracteres) Clique duas vezes na visão lavra em uma célula (seleção interna da célula) Grade ou dê um lento clique duplo na visão Facetas e selecione um intervalo de caracteres ou uma palavra. 2. Abra o painel Ferramentas de manipulação à direita do painel Dados Os valores específicos da coluna são exibidos na caixa Valores, na parte superior do painel. É possível selecionar um ou mais valores para processamento nessa caixa ou inserir uma sequência de pesquisa na caixa Encontrar. As seleções feitas no painel do editor substituem as seleções de valor feitas diretamente em uma coluna. As ações de dados disponíveis para uma coluna dependem do tipo de dados da coluna e se a coluna, célula ou intervalo de caracteres dentro de uma célula está selecionada. 3. Selecione uma opção de processamento no painel Ferramentas de manipulação, modifique os valores conforme necessário e selecione Aplicar. 7.1.2.1 Usando o painel de filtro Você utiliza o painel de filtro para definir um filtro. O painel de filtro não suporta a linguagem de fórmulas do SAP Lumira ou expressões regulares (regex). Pode ser necessário adicionar uma medida ou dimensão calculada para criar um filtro mais complexo. Tabela 21: Opções no painel de filtro Opção Descrição Localizar Insira o valor para a pesquisa. Valores Selecione um ou mais valores nos quais será filtrada a coluna ou dimensão. Visualizar registros Selecione essa opção para exibir o número de ocorrências para cada valor da coluna. Manter apenas Selecione essa opção para incluir os valores selecionados na coluna ou dimensão. Ne nhum outro valor será exibido. Excluir valores Selecione essa opção para excluir os valores selecionados da coluna ou dimensão. To dos os outros valores são exibidos. 1. Para abrir o painel de filtro, selecione o ícone de dimensão ou medida e selecione Filtro. Opções em um cabeçalho de coluna ou para uma 2. No painel de filtro, selecione opções conforme necessário para dados baseados em texto. Para selecionar vários valores, pressione e segure Ctrl e selecione cada valor. 3. Selecione OK. Informações relacionadas Criando uma medida ou dimensão calculada [página 55] 48 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados 7.1.2.1.1 Filtrando dados em colunas e gráficos Um filtro é uma restrição imposta a um conjunto de dados para limitar os valores exibidos. Os filtros são exibidos na barra de filtros na parte superior do painel Dados. Você pode processar filtros diretamente a partir da barra de filtros. Tabela 22: Filtros na barra de filtros no painel Dados Escopo Descrição Filtro do conjunto de dados Você define um filtro em uma coluna. O filtro aplica-se aos dados na coluna e aos gráfi cos que utilizam os dados. Filtro de nível de visualização Você define um filtro em um gráfico. O filtro só se aplica ao gráfico; não é aplicado ao nível do conjunto de dados. Exemplo Se um gráfico mostra a receita para produtos vendidos entre 1995 e 2012, e você quer ver apenas as receitas dos anos de 2010 a 2012, crie um filtro com a dimensão Ano para limitar os valores exibidos referentes ao período. Informações relacionadas Filtrando dados em colunas e facetas [página 49] Usando o painel de filtro [página 48] Filtragem de dados do gráfico [página 111] 7.1.2.1.2 Filtrando dados em colunas e facetas Você pode criar um filtro em uma coluna ou faceta a partir do cabeçalho da coluna. O filtro aparece na barra de filtros acima da grade de dados. 1. Selecione o ícone de Grade para exibir as colunas de da fonte de dados. 2. Selecione o ícone de Opções em um cabeçalho de coluna e selecione Filtro. 3. Use as opções no painel de filtro para definir o filtro. Informações relacionadas Usando o painel de filtro [página 48] Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 49 7.1.2.2 Como converter dados em outro tipo Você pode converter dados de um tipo em outro. Por exemplo, você pode converter textos em números ou datas. 1. 2. Realize uma das seguintes ações: ○ No painel Medidas e dimensões, selecione o ícone de ○ No painel Dados, selecione a seta no cabeçalho de uma coluna de datas ou de números. Opções ao lado de uma dimensão. No diálogo de conversão de dados, escolha as opções conforme necessário e selecione OK. 7.1.2.3 Formatando números e datas Você pode escolher o formato de exibição para colunas de data e de número das divisões Preparar ou Visualizar. Por exemplo, números podem ser exibidos como porcentagens ou usar notação científica e números negativos pode ser exibidos em parênteses. 1. Na divisão Preparar, selecione o ícone de Opções ao lado de uma medida ou dimensão no painel Medidas e dimensões ou no cabeçalho de uma coluna de data ou de número no painel Dados e, então, selecione Exibir formatação. 2. No diálogo de formato de exibição, escolha as opções de formatação conforme necessário e selecione OK. 7.1.3 Criação de medidas e hierarquias Você pode enriquecer seus dados adicionando medidas e hierarquias temporais e de geografia. Medidas permitem uma fácil manipulação dos cálculos, e hierarquias permitem utilizar um agrupamento natural de colunas relacionadas. Ao adquirir dados, o SAP Lumira detecta hierarquias e medidas em potencial. Medidas detectadas são exibidas no painel Medidas e dimensões, e dimensões identificadas como hierarquias em potencial são marcadas com uma interrogação. Você pode selecionar o ícone Opções hierarquias. para uma dimensão para criar manualmente Informações relacionadas Criando uma ou hierarquia de tempo ou geográfica [página 51] Criando medidas [página 54] 50 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados 7.1.3.1 Criando uma ou hierarquia de tempo ou geográfica Hierarquias personalizadas, geográficas e de tempo enriquecem um conjunto de dados. Hieraquias de tempo e geográficas são detectadas automaticamente quando um conjunto de dados é obtido, mas você pode criar hierarquias a qualquer momento. As hierarquias de tempo podem ser criadas em colunas de data e de números. As hierarquias geográficas só podem ser criadas em colunas que contêm valores compatíveis com valores de dados de geografia no banco de dados NAVTEQ usado pelo aplicativo. Você usa menus contextuais dos cabeçalhos ou das dimensões da coluna para criar hierarquias. 1. Selecione o ícone Opções ao lado de uma dimensão e selecione Criar uma hierarquia geográfica Por nomes ou Criar uma hierarquia de tempo. Opções de enriquecimento da coluna ou dimensão são exibidas para a hierarquia. 2. Escolha quais as colunas para mapear a hierarquia: ○ Para hierarquias de tempo, selecione as colunas que serão mapeadas para os níveis Ano, Trimestre, Mês e Dia. ○ Para hierarquias geográficas, selecione as colunas a serem mapeadas para alguns ou todos os níveis País, Região, Sub-região e Cidade. Essas colunas são analisadas para verificar se elas contêm correspondências com o banco de dados interno de geografia usado pelo aplicativo. Selecione Colunas detectadas para exibir as colunas detectadas como possíveis correspondências em listas de opções para o nível. Se nenhuma coluna for detectada, as listas ficarão vazias. Selecione Todas as colunas para incluir todas as colunas em listas de opções para o nível. Para hierarquias de tempo, as novas colunas selecionadas como níveis são adicionadas automaticamente ao conjunto de dados, e a nova hierarquia de tempo é exibida na aba semântica Hierarquias. Para hierarquias geográficas, o diálogo Dados geográficos é exibido, mostrando colunas que corresponderam ao banco de dados interno em verde, colunas que possuem uma correspondência ambígua em laranja e colunas sem correspondência em vermelho. Para dimensões inferidas, as colunas são criadas para as hierarquias. 3. (Opcional para hierarquias geográficas) No diálogo Dados geográficos, para cada correspondência proposta, selecione a linha da proposta e selecione Escolher para aceitar a localização ou Não foi encontrado para remover a linha e selecione Confirmar. As novas colunas de geografia selecionadas como níveis são adicionadas automaticamente ao conjunto de dados, e a nova hierarquia geográfica é exibida no painel Medidas e dimensões. Você pode modificar os níveis correspondentes de uma hierarquia geográfica a qualquer momento. (Selecione o ícone de Opções ao lado do nome da hierarquia, selecione Processar reconciliação, altere as correspondências propostas para um nível e selecione Confirmar.) Informações relacionadas Criando uma hierarquia geográfica com dados de latitude e longitude [página 52] Criando uma hierarquia personalizada [página 53] Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 51 7.1.3.2 Criando uma hierarquia geográfica com dados de latitude e longitude Quando um conjunto de dados contém informações de latitude e longitude, você pode customizar a hierarquia geográfica para a utilização desses dados. O aplicativo cria uma medida para cada coluna durante a aquisição de dados. Os dados de latitude e longitude devem ser numéricos. Caso os dados não sejam numéricos, você deve converter os valores da coluna por meio de uma fórmula (por exemplo, ToNumber()). Se as colunas não são numéricas, você deve definir manualmente as dimensões numéricas convertidas como medidas. O aplicativo calcula automaticamente os níveis hierárquicos acima e abaixo de uma dimensão geográfica selecionada. Você pode aceitar os níveis calculados em sua hierarquia ou substituí-los com níveis que definiu com base nos dados de latitude e longitude. Nota O aplicativo não suporta a criação de hierarquias geográficas com dados de latitude e longitude de fontes de dados do SAP HANA. 1. Verifique se as medidas foram criadas para as colunas de latitude e longitude. Se as medidas foram criadas, vá para a etapa 4. 2. Se as medidas não foram criadas, converta as colunas de latitude e longitude em um tipo de dados numéricos: a. Selecione o ícone Opções no cabeçalho da dimensão ou coluna de latitude e selecione Criar dimensão calculada. O diálogo Nova dimensão calculada é exibido, com o nome da coluna já na fórmula (por exemplo, {column_1}). b. Clique duas vezes na função ToNumber(<param>) para inseri-la na fórmula. c. Mova o nome da coluna exibido na etapa b para a função ToNumber(). A fórmula completa deve ser ToNumber({column_1}). 3. 4. d. Insira um nome para a dimensão calculada e selecione OK. e. Repita as etapas de a a d para a coluna ou dimensão de longitude. Defina como medidas as novas dimensões numéricas de latitude e longitude: a. Clique no ícone Opções b. Selecione o ícone Opções Selecione o ícone Opções para a nova dimensão numérica de latitude e selecione Criar uma medida. para a nova dimensão numérica de longitude e selecione Criar uma medida. no cabeçalho da coluna ou dimensão de geografia a ser utilizada como a base da hierarquia e selecione Criar uma hierarquia geográfica Por latitude/longitude . O diálogo Dados geográficos é exibido. O painel Nome do nível lista os níveis de hierarquia calculados pelo aplicativo. A dimensão original é exibida em vermelho e os níveis hierárquicos calculados são exibidos em verde. Você pode aceitar a hierarquia proposta com base nos dados de latitude/longitude ou pode customizar os níveis da hierarquia. Selecione um nível para exibir as suas propriedades no painel da esquerda. 52 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Tabela 23: Propriedades de um nível calculado em uma hierarquia Nível da propriedade Descrição Categoria Definição do nível, ou calculado automaticamente com base nos dados de latitude/longitude ou definidos pelo usu ário (você seleciona a coluna na qual o nível será baseado) Para um nível definido pelo usuário, selecione a coluna a ser Coluna utilizada pelo nível. Para um nível definido pelo usuário, selecione os dados de Latitude latitude. Para um nível definido pelo usuário, selecione os dados de Longitude longitude. Tipo de nível O nome do nível na hierarquia 5. Para aceitar os níveis calculados propostos, selecione OK e vá para a etapa 7. 6. Para escolher as colunas nas quais os níveis serão baseados, para cada nível que desejar definir na hieraquia selecione Definido pelo usuário na lista Categoria e selecione propriedades para o nível em outras listas. Utilize as setas`à esquerda de um nível para movê-lo para cima ou para baixo na hierarquia. Adicione um nível na hierarquia ao selecionar Adicionar nível ou remova um nível selecionando o ícone X à esquerda do nível. 7. Selecione OK. A nova hierarquia geográfica é adicionada à categoria Hierarquias no painel semântico. Você pode alterar os níveis de uma hierarquia a qualquer momento. (Selecione o ícone Opções ao lado do nome da hieraquia, selecione Processar reconciliação, selecione a coluna na qual deve ser baseado o nível e selecione OK.) Informações relacionadas Criando uma ou hierarquia de tempo ou geográfica [página 51] Criando uma medida ou dimensão calculada [página 55] 7.1.3.3 Criando uma hierarquia personalizada Você pode criar uma hierarquia utilizando qualquer combinação das dimensões disponíveis. 1. Selecione o ícone Opções para a dimensão a ser usada como a base para a hierarquia. 2. Selecione Criar uma hierarquia customizada. O diálogo Criar hierarquia é exibido. As dimensões disponíveis no painel Medidas e dimensões são listadas no painel à esquerda. Você pode inserir uma cadeia de pesquisa para encontrar uma dimensão (por exemplo, as primeiras letras do nome da dimensão). 3. Adicione dimensões à hierarquia no painel direito. Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 53 Dica Clique duas vezes nas dimensões para movê-las entre os painéis. 4. (Opcional) Utilize as setas ao lado da lista de hierarquias para mover uma dimensão selecionada para cima ou para baixo na hierarquia. 5. Insira um nome para a hierarquia e selecione Criar. A nova hierarquia personalizada é exibida no painel Medidas e dimensões. Novas colunas são criadas para cada nível da nova hierarquia. 7.1.3.4 Criando medidas Medidas enriquecem conjuntos de dados. Você pode criá-las manualmente a qualquer momento diretamente de uma coluna ou dimensão ou utilizando a linguagem de fórmula para criar uma medida calculada, ou você pode permitir que o aplicativo as detecte automaticamente em tipos de dados de colunas numéricas quando um conjunto de dados é adquirido. Nota Ao usar a fonte de dados Conectar com o SAP HANA, não é possível criar uma medida com uma dimensão numérica ou de string. As medidas em fontes de dados Conectar com o SAP HANA são detectadas diretamente a partir da visualização analítica do SAP HANA. As medidas devem ser criadas na visualização do SAP HANA antes de serem adquiridas automaticamente no aplicativo. Informações relacionadas Criando uma medida a partir de uma coluna ou dimensão [página 54] Criando uma medida ou dimensão calculada [página 55] 7.1.3.4.1 Criando uma medida a partir de uma coluna ou dimensão Você pode criar uma medida a partir de quase qualquer coluna ou dimensão. No entanto, essas exceções se aplicam: ● Se o tipo de dados da coluna for Numérico, qualquer função agregada pode ser usada para a medida. ● Quando o tipo de dados da coluna for Data ou String, nem Soma nem Média podem ser utilizados. ● A agregação é realizada quando a medida é utilizada na visão Facetas. Ela não está disponível na visão Grade. 1. Selecione o ícone Opções em um cabeçalho de coluna ou dimensão que será utilizada como a base da medida e selecione Criar uma medida. Uma nova medida é criada na seção Medidas do painel Medidas e dimensões. 54 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados 2. Selecione o ícone Opções para a nova medida, selecione Alterar agregação e selecione uma das seguintes funções agregadas: Opção Descrição Soma Para retornar a soma de uma medida. Min Para retornar o menor valor em um conjunto de valores. Máx Para retornar o maior valor em um conjunto de valores Contagem (distinta) Para retornar o número de valores distintos em um conjunto de valores Contagem (todos) Para retornar o número de valores em um conjunto de valores Média Para retornar o valor médio de uma medida Nenhum Para permitir que uma dimensão numérica seja utilizada como medida, sem agregação Esse tipo de medida permite que cada valor seja visualizado em um gráfico, o que pode ser útil para certos tipos de gráficos. Por exemplo, para um gráfico de dispersão que exibe margens e valores de quantidades de venda, utilizar Nenhum exibe todos os pontos no gráfico de dispersão e mostra o al cance de valores individuais que não estariam aparentes com o uso de uma função agregada. Para ver a medida aplicada aos dados no conjunto de dados, alterne para a visão Facetas. Para ver as alterações em valores de dados causadas pela agregação, selecione uma medida. 7.1.4 Criando uma medida ou dimensão calculada Você pode criar medidas e dimensões calculadas utilizando a linguagem de fórmula do SAP Lumira. Os recursos a seguir são suportados pelo editor de fórmulas: ● Combinação de duas colunas do conjunto de dados ● Aplicação de funções a partir de conjuntos de funções predefinidas para manipulação de números, data e texto ● Utilização das cláusulas "if", "then" e "else" ● Utilziação do recurso de autoconclusão para melhorar a velocidade de processamento ● Utilização de um seletor de calendário para os parâmetros de data ● Copiar e colar texto e sintaxe para a definição da função 1. Selecione o botão Cálculo e selecione Nova dimensão calculada ou Nova medida calculada. Dica Alternativamente, crie uma medida ou dimensão calculada com o ícone Opções ao lado de uma medida ou dimensão, ou selecionando Criar dimensão calculada no painel Ferramentas de manipulação. 2. Insira um nome para a medida ou dimensão. 3. Clique duas vezes em medidas ou dimensões, e em funções, para adicioná-las à caixa de sintaxe Fórmula. 4. Insira os parâmetros da função e as informações correlatas, com base na tarefa da função. Você deve digitar os nomes das colunas usadas nessa fórmula. O recurso de autocompletar automático irá sugerir um nome de coluna após inserir a primeira letra. Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 55 5. Se você estiver inserindo informações de calendário, selecione o botão Selecionar data na parte inferior da lista de funções para usar o selecionador de data. 6. Clique em OK para aplicar a fórmula. Uma medida ou dimensão é criada. Exemplo Vamos supor que você deseja criar uma dimensão que multiplica os valores na coluna <margin_gross_percent> por 100, e arredonda até o próximo número inteiro. 1. Selecione o botão Cálculo e selecione Nova dimensão calculada. 2. No diálogo Nova dimensão calculada, clique duas vezes em um objeto da dimensão ou função para inserir a dimensão ou função na caixa Fórmula. Por exemplo, clique duas vezes em Ceil(num) . 3. Processe a fórmula e adicione outros objetos de dimensão, conforme necessário. Uma nova coluna com um nome da fórmula predefinido é criada. Por exemplo, adicione Ceil(margin_gross_percent )*100 na fórmula para criar uma coluna chamada Ceil(margin_gross_percent )*100. 4. Insira um nome para a nova dimensão calculada e selecione OK. A nova coluna é criada no painel Dados e é exibida no painel Medidas e dimensões. 7.1.4.1 Referência de funções Você pode definir quais funções serão disponibilizadas na barra de fórmulas. Tabela 24: Categorias de funções Categoria Descrição Agregação Agrega dados (por exemplo, somando ou tirando a média de Funções de agregação são implementadas na definição de um conjunto de valores) uma medida. Caractere Manipula as sequências de caracteres Data e hora Retorna os dados de data ou hora Numérico Retorna dados numéricos Lógico Retorna true ou false Diversos As funções não se enquadram em nenhuma outra categoria Informações relacionadas Criando uma medida a partir de uma coluna ou dimensão [página 54] Funções de caractere [página 57] Funções de data e hora [página 62] 56 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Funções numéricas [página 66] Funções lógicas [página 69] Funções diversas [página 70] 7.1.4.1.1 Funções de caractere Utilize uma função de caractere permite manipular strings de caracteres em uma fórmula. A entrada é uma coluna do conjunto de dados e as funções são aplicadas ao conteúdo da célula. Tabela 25: Funções de caractere Função <matchExpr> como <pattern> Sintaxe ● Utilização matchExpr: A expressão de string Utilize para determinar se uma string de caracteres corresponde a um padrão es para pesquisar ● pattern: A constante da string do pecificado. A pesquisa não diferencia le padrão a ser pesquisada para tras maiúsculas de minúsculas. O padrão pode incluir caracteres regula res e os seguintes caracteres especiais: ● "_" corresponde a um único carac tere ● "%" corresponde o zero a muitos caracteres Antes de poder utilizar um caractere es pecial como um caractere regular, você deve isolá-lo, utilizando uma barra inver tida ("\"). Nota "[", "^", "-" e "]" estão reserva dos para um uso futuro. Por exemplo: "Hiking is fun" like "H% is _un" retorna true Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 57 Função Concatenate(str1, str2) Sintaxe Utilização ● str1: primeira string Utilize para concatenar duas strings em ● str2: segunda string uma única string. O operador + também pode concatenar strings. Por exemplo: Concatenate("Mr", "Brown") retorna "MrBrown" Contain(whereStr, whatStr) ● ● whereStr: string em que uma Utilize para retornar ocorrências de uma pesquisa é conduzida string em outra string. A pesquisa não whatStr: substring que é o objeto diferencia letras maiúsculas de minúscu de pesquisa las. Por exemplo: Contain("Cats are grey", "aRe") retorna true ExceptFirstWord(str, sep) ● str: string de entrada Utilize para retornar uma cópia de uma ● sep: um separador string com a primeira palavra removida. Por exemplo: ExceptFirstWord("Level 3, Standford Street", ", ") retorna "Standford Street" ExceptLastWord(str, sep) ● str: string de entrada Utilize para retornar uma cópia de uma ● sep: um separador string com a última palavra removida. Por exemplo: ExceptLastWord("james.bro [email protected]", "@") retorna "james.brown" 58 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Função FirstWord(str, sep) Sintaxe Utilização ● str: string de entrada Utilize para retornar a primeira palavra ● sep: um separador da string. Por exemplo: FirstWord("Senior Developer", " ") retorna "Senior" LastWord(str, sep) ● str: string de entrada Utilize para retornar a última palavra da ● sep: um separador string. Por exemplo: LastWord("Red/Purple", "/") retorna "Purple" Length(str) Utilize para retornar o comprimento da str: string de entrada string. Por exemplo: Length("How long") retorna 8 LowerCase(str) Utilize para retornar uma cópia de uma str: string de entrada string, com todos os caracteres conver tidos em letras minúsculas. Por exemplo: LowerCase("GOOD JOB") retorna "good job" Lpad(str, length, pad) ● str: string de entrada Utilize para retornar a cópia de uma ● length: comprimento esperado string que foi preenchida com os primei ● pad: Sequência de caracteres a ser adicionada ros caracteres do comprimento total es pecificado. Por exemplo: Lpad("Incomplete field", 20, "#") retorna "####Incomplete field" Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 59 Função Sintaxe Utilização Replace(str, target, ● str: string de entrada Utilize para retornar uma string, com to replacement) ● target: String a ser substituída das as ocorrências de uma string especi ● replacement: Valor da string a ser inserido ficada substituída por outra string espe cificada. Por exemplo: Replace("Very good song", "o" , "u") retorna "Very guud sung" Rpad(str, length, pad) ● str: string de entrada Utilize para retornar a cópia de uma ● length: comprimento esperado string que foi preenchida com os últimos ● pad: Sequência de caracteres a ser adicionada caracteres do comprimento total especi ficado. Por exemplo: Rpad("Incomplete field", 20, "#") retorna "Incomplete field####" SubString(str, start) ● ● str: String a partir da qual uma Utilize para retornar uma substring da substring é calculada string. start: Posição inicial na substring Por exemplo: de entrada SubString("Wong", 3) retorna "ng" SubString(str, start, ● str: String a partir da qual uma Utilize para retornar uma substring da substring é calculada string. ● start: Posição inicial na substring Por exemplo: length) de entrada ● length: Comprimento da sub string a retornar ToText(param) param: O parâmetro a ser convertido SubString("Wong", 2, 2) retorna "on" Utilize para converter um parâmetro em uma string. Todos os parâmetros são válidos e números são truncados a zero casas decimais. 60 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Função Trim(str, toTrim) Sintaxe Utilização ● str: string de entrada Utilize para retornar uma cópia da string ● toTrim: Caractere a ser removido com repetições à esquerda e à direita de um caractere removido. Esta função di ferencia letras maiúsculas e minúsculas. Por exemplo: Trim("Aurora", "a") retorna "Auror" TrimLeft(str, toTrim) ● str: string de entrada Utilize para retornar uma cópia da string ● toTrim: Caractere a ser removido com ocorrência à esquerda de um ca ractere removido. Esta função diferencia letras maiúsculas e minúsculas. Por exemplo: TrimLeft("Above", "A") retorna "bove" TrimRight(str, toTrim) ● str: string de entrada Utilize para retornar uma cópia da string ● toTrim: Caractere a ser removido com ocorrência à direita de um carac tere removido. Esta função diferencia le tras maiúsculas e minúsculas. Por exemplo: TrimRight("Laura", "a") retorna "Laur" UpperCase(str) str: string de entrada Utilize para retornar uma cópia de uma string, com todos os caracteres conver tidos em letras maiúsculas. Por exemplo: UpperCase("Little Boy") retorna "LITTLE BOY" Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 61 Função Sintaxe Utilização ToDate(string, format) O formato da data é uma combinação Utilize para converter uma string de en dos tokens reservados a seguir, separa trada em uma data com um formato es dos delimitadores: pecificado no conjunto de dados, ● d ou dd: Dia do mês (1-31) ● M ou MM: Mês do ano (1-12) ● y ou yy: Ano abreviado sem o sé culo (00-99) yyyy: Ano com o século (1956, 2012, 2014 e assim por diante) Todas as outras sequências são consi deradas delimitadores. ● string: String de entrada a ser ● format: constante de string de quando as datas em uma coluna de uma fonte de dados original estão em for mato de string. Por exemplo: ToDate(Obj, 'yyyy/dd/MM') converte uma string no formato yyyy/dd/MM em uma data: convertida formato da data Tabela 26: Exemplo da função Trim(str, toTrim): Trim ({Name},"a") Nome String recortada Aurora Auror Auror Auror auror uror aurora uror uror uror Esta fórmula retorna "Auror": Trim("Aurora", "a"). 7.1.4.1.2 Funções de data e hora Funções de data e hora retornam os dados de data e hora. Note que você talvez precise converter o formato de seus dados de origem no aplicativo. 62 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Tabela 27: Funções de data e hora Função Sintaxe Utilização AddMonthToDate(#date#,perio ● #date#: data original Utilize para retornar uma data produzida ds) ● periods: Número de períodos a com a adição de um número específico serem adicionados de meses a uma data especificada. Por exemplo: AddMonthToDate(#2012-01-0 1#,1) retorna 2012-02-01 AddMonthToDate(#date#,perio ● #date#: data original Utilize para retornar uma data produzida ds) ● periods: Número de períodos a com a adição de um número específico serem adicionados de semanas a uma data especificada. Por exemplo: AddWeekToDate(#2012-01-01 #,1) retorna 08.01.12 AddYearToDate(#date#,period ● #date#: data original Utilize para retornar uma data produzida s) ● periods: Número de períodos a com a adição de um número específico serem adicionados de anos a uma data especificada. Utilize números negativos para remover um ano. Por exemplo: AddYearToDate(#2012-01-01 #,1) retorna 01.01.13 Utilize para retornar a data atual como a CurrentDate() data. Por exemplo: CurrentDate() retorna <CurrentDate> DateDiffInDays(#start#,#end ● #) ● #start#: Data de início do inter Utilize para retornar o número de dias valo entre duas datas. #end#: Data de término do inter Por exemplo: valo DateDiffInDays(#2012-03-2 3#,#2012-01-30#) retorna -53 Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 63 Função DateDiffInMonths(#start#,#e Sintaxe ● nd#) ● Utilização #start#: Data de início do inter Utilize para retornar o número de meses valo entre duas datas especificadas. #end#: Data de término do inter Por exemplo: valo DateDiffInMonths(#2013-02 -01#,#2014-01-01#) retorna 11 Day(#date#) #date#: uma data Utilize para retornar o dia do mês como um número de 1 a 31. Por exemplo: Day(#2012-03-23#) retorna 23 DayOfWeek(#date#) #date#: uma data Utilize para retornar o dia da semana como um número de 1 (domingo) à 7 (sábado). Por exemplo: DayOfWeek(#2012-03-23#) retorna 6 DayOfYear(#date#) #date#: uma data Utilize para retornar o dia do ano como um número. Por exemplo: DayOfYear(#2012-03-23#) retorna 83 LastDayOfMonth(#date#) #date#: uma data Utilize para retornar a data gerada pelo cálculo do último dia do mês de uma data especificada. Por exemplo: LastDayOfMonth(#2012-03-2 3#) retorna a data 2012-03-31 64 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Função Sintaxe Utilização LastDayOfWeek(#date#) #date#: uma data Utilize para retornar a data gerada pelo cálculo do último dia da semana de uma data especificada. Por exemplo: LastDayOfWeek(#2012-03-23 #) retorna a data 24.03.12 MakeDate(year,month,day) ● ● year: Número que representa um Utilize para retornar uma data que é cri ano ada a partir do ano, mês e dia especifica month: Número que representa um dos. mês ● Por exemplo: day: Número que representa um dia do mês MakeDate(2011,6,12) retorna a data 12.06.11 Month(#date#) #date#: uma data Utilize para retornar o mês do ano como um número de 1 a 12. Por exemplo: Month(#2012-03-23#) retorna 3 Quarter(#date#) #date#: uma data Utilize para retornar um número que re presenta o trimestre de uma data espe cificada. Por exemplo: Quarter(#2012-03-23#) retorna 1 Week(#date#) #date#: uma data Utilize para retornar um número que re presenta a semana de uma data especi ficada. Por exemplo: Week(#2012-03-23#) retorna 12 Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 65 Função Sintaxe Utilização Year(#date#) #date#: uma data Essa sintaxe retorna o ano de uma data especificada. Por exemplo: Year(#2012-03-23#) retorna 2012 7.1.4.1.3 Funções numéricas Utilize funções numéricas para retornar valores numéricos em uma fórmula. Tabela 28: Funções numéricas Função Sintaxe Utilização Ceil(num) num: um número Utilize para retornar o menor número in teiro maior que ou igual a um número especificado. Por exemplo: Ceil(14.2) retorna 15 Floor(num) num: um número Utilize para retornar o maior número in teiro não maior que um número especifi cado. Por exemplo: Floor(14.8) retorna 14 Log(num) num: um número Utilize para retornar o logaritmo natural de um número especificado. Por exemplo: Log(100) retorna 4,605 66 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Função Sintaxe Utilização Log10(num) num: um número Utilize para retornar o logaritmo de base 10 de um número especificado. Por exemplo: Log10(100) retorna 2 Mod(num, divisor) ● num: um número Utilize para retornar o restante da divi ● divisor: o divisor são de um número por outro número. Por exemplo: Mod(15,2) retorna 1 Power(num, exponent) ● num: um número Utilize para elevar um número a uma po ● exponent: o expoente tência. O operador ^ (circunflexo) pode ser utili zado no lugar desta função. Por exemplo: Power(2,3) retorna 8 Round(num, digits) ● num: um número Utilize para retornar um valor numérico, ● digits: O número de casas deci arredondado para um número especifi mais para arredondar cado de casas decimais. Por exemplo: Round(14.81, 1) retorna 14,8 Sign(num) num: um número Utilize para retornar -1 se um número es pecificado for negativo, 0 se tal número especificado for zero ou +1 se o número especificado for positivo. Por exemplo: Sign(-2) retorna -1 Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 67 Função ToText(num, digits) Sintaxe Utilização ● num: um número Utilize para converter um número espe ● digits: número de casas deci cificado em uma string. O número é mais a usar. Este parâmetro é opci truncado para um número específico de onal, seu valor predefinido é 0. casas decimais. Por exemplo: ToText(12.1451, 2) retorna 12,14 Truncate(num, digits) ● num: um número Utilize para retornar um valor numérico, ● digits: Número de casas deci truncado em um número especificado mais a truncar de casas decimais. Por exemplo: Truncate(12.281, 1) retorna 12,200 Tabela 29: Exemplo da função ToText(num, digits): ToText({Temperatura},2) Temperatura Texto -2.01 -2.0 -1.06 -1.1 0.08 0.1 1.07 1.1 2.08 2.1 3.99 4.0 5.00 5.0 Esta fórmula retorna 12,14: ToText(12.1451, 2). Tabela 30: Exemplo da função Truncate(num, digits): Truncate({Temperatura},1) Temperatura Truncado -2.01 -2.00 -1.06 -1.00 0.08 0.00 1.07 1.00 2.08 2.00 3.99 3.90 5.00 5.00 Esta fórmula retorna 12,200: Truncate(12.281, 1). 68 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados 7.1.4.1.4 Funções lógicas Você pode usar funções lógicas em uma fórmula para retornar true or false. Tabela 31: Funções lógicas Função Sintaxe Utilização IsNotNull(obj) obj: Objeto do usuário (coluna) Utilize para retornar um valor booleano que indica se um campo fornecido não contém um valor nulo. Quando um campo contém um valor nulo, a função retorna false. Para todos os outros va lores, a função retorna true. IsNull(obj) obj: Objeto do usuário (coluna) Utilize para retornar um valor booleano que indica se um campo fornecido con tém um valor nulo. Quando um campo contém um valor nulo, a função retorna true. Para todos os outros valores, a função retorna false. <esquerdo> e <direito> ● left: Operador esquerdo Utilize para retornar a conjunção lógica ● right: Operador direito de suas entradas booleanas. Esta função retorna false: true and false. <esquerdo> ou <direito> ● left: Operador esquerdo Utilize para retornar a disjunção lógica ● right: Operador direito de suas entradas booleanas. Esta função retorna true: true or false. se <cond>, então <alt1> ● cond: Condição booleana para Utilize para escolher entre duas alterna teste tivas com base em uma condição boo ● alt1: Alternativa 1 leana. A segunda alternativa é opcional e ● alt2: Alternativa 2 ● testExpr: Expressão a ser tes Utilize para determinar se a primeira en tada trada corresponde a um valor na lista de candidateList: Lista de candi uma segunda entrada. datos correspondentes Por exemplo: senão <alt2> <testExpr> em <candidateList> ● avalia como null quando em falta. 3 in [2, 4, 6] retorna false Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 69 Função Sintaxe Utilização não<bool> bool: Uma booleana Utilize para negar uma entrada boo leana. Por exemplo: not false retorna true Tabela 32: Exemplo da função <left> e <right> Esquerda Direita Resultado de {Esquerdo} e {Direito} Verdadeiro Verdadeiro true Verdadeiro Falso false Falso Verdadeiro false Falso Falso false Esta função retorna false: true and false. Tabela 33: Exemplo da função <left> or <right> Esquerda Direita Resultado de {Esquerdo} ou {Direito} Verdadeiro Verdadeiro true Verdadeiro Falso true Falso Verdadeiro true Falso Falso false Esta função retorna true: true or false. 7.1.4.1.5 Funções diversas Essas funções podem ser utilizadas em uma fórmula, mas não se encaixam em uma categoria padrão de famílias de funções. 70 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Tabela 34: Funções diversas Função Sintaxe GroupValues(column, ● Utilização column: O objeto do usuário ao qual o agrupamento será aplicado ListOfValues, newValue) ● Por exemplo: ListOfValues: Lista de valores a serem agrupados ● Utilize para agrupar uma lista de valores. newValue: Valor que deve substi tuir os valores agrupados GroupValues(CountryColumn , ["USA", "India", "France"], "My Countries") retorna "My Countries" quando a coluna CountryColumn conter "USA", "India" ou "France" ToNumber(param) param: O parâmetro a ser convertido Utilize para converter um tipo de parâ metro em um valor numérico. Números são truncados a zero casas decimais. 7.1.5 Trabalhando com múltiplos conjuntos de dados Você pode adicionar um conjunto de dados aos conjuntos de dados disponíveis, mover entre os conjuntos de dados e mesclar ou anexar dois conjuntos de dados. Ao combinar conjuntos de dados, dois conjuntos de dados são mesclados utilizando um operador JOIN, e dois conjuntos de dados correspondidos são mesclados utilizando um operador UNION. Conjuntos de dados anexos são compatíveis e têm um número equivalente de colunas na tabela mesclada. Informações relacionadas Como adicionar um conjunto de dados [página 71] Alternando para outro conjunto de dados [página 72] Mesclar conjuntos de dados (JOIN) [página 72] Anexando conjuntos de dados (UNION) [página 73] Como remover um conjunto de dados [página 73] 7.1.5.1 Como adicionar um conjunto de dados Você pode abrir vários conjuntos de dados no mesmo documento e pode adicionar um conjunto de dados a um documento. 1. Na lista de conjuntos de dados no topo do painel Dados, selecione Adicionar conjunto de dados. 2. No diálogo Novo conjunto de dados, selecione uma fonte de dados no painel Selecionar uma fonte ou Todas as utilizadas recentemente e selecione Próximo. Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 71 3. Insira as informações de conexão para o conjunto de dados e selecione Criar. Os dados do conjunto de dados são obtidos pelo documento. 7.1.5.2 Alternando para outro conjunto de dados Você pode ter vários conjuntos de dados abertos em um documento ao mesmo tempo e alternar de um para o outro, o que é útil ao preparar uma fusão entre dois conjuntos de dados. Na lista de conjuntos de dados no topo do painel Dados, selecione o conjunto para o qual deseja alternar. O conjunto de dados selecionado passa a ser o conjunto ativo. 7.1.5.3 Mesclar conjuntos de dados (JOIN) Use o operador JOIN para fundir dois conjuntos de dados. ● O conjunto de dados a ser mesclado deve ter uma coluna de chave. ● Apenas colunas com o mesmo tipo de dados são levadas podem ser fundidas. ● O processo de fusão combina todas as colunas. As colunas no segundo conjunto de dados correspondem a uma coluna-chave no conjunto de dados original. O aplicativo sugere colunas correspondentes em potencial e a probabilidade de cada correspondência. Nota Quando um conjunto de dados tiver sido consolidado com outro conjunto de dados, os conjuntos de dados são uma unidade. Você não pode remover nenhum dos conjuntos de dados. 1. Selecione o ícone Combinar como. na barra do menu e selecione Mesclar. 2. No diálogo Mesclar dados, selecione a coluna-chave a ser utilizada como a coluna identificadora para a correspondência. 3. Realize uma das seguintes ações: Opção Descrição Se um conjunto de dados a ser mesclado já está dis ponível no documento Selecione o conjunto de dados na lista acima do painel direito. Se o conjunto de dados a ser mesclado não está aberto Selecione Adicionar novo conjunto de dados e selecione a fonte de dados a ser mesclada. As colunas que podem ser correspondidas, com base na coluna-chave do conjunto de dados original, estão listadas em Conjunto de dados de consulta. 4. Selecione Mesclar. As colunas no segundo conjunto de dados são adicionadas ao conjunto de dados original. 72 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Preparando dados Informações relacionadas Anexando conjuntos de dados (UNION) [página 73] 7.1.5.4 Anexando conjuntos de dados (UNION) Use o operador UNION para anexar dois conjuntos de dados. As duas tabelas na união devem conter um número equivalente de colunas e tipos de dados compatíveis. Apenas um conjunto de dados compatível com o conjunto de dados de destino pode ser anexado. Quando um conjunto de dados tiver sido fundido com outro conjunto de dados, eles se tornam uma unidade e você não pode separá-los. 1. Selecione o ícone Combinarna barra do menu e selecione Anexar. 2. No diálogo Anexar dados, realize uma das seguintes ações: Opção Descrição Se um conjunto de dados a ser anexado já estiver dis Selecione o conjunto de dados na lista acima do painel direito. ponível no documento Se o conjunto de dados a ser anexado não estiver aberto Selecione Adicionar novo conjunto de dados e selecione a fonte de dados a ser a obtida e anexada. Se o conjunto de dados a ser anexado for compatível com o conjunto de dados original, as colunas de dimensão serão listadas em Conjunto de dados de consulta no lado direito do painel. Uma amostra de valores distintos para cada dimensão selecionada é exibida na coluna Amostra de valores distintos. 3. Para selecionar uma dimensão de origem diferente para a união com a dimensão de destino correspondente, selecione outra dimensão na lista. Se a dimensão selecionada contiver um tipo de dados compatível, ela poderá ser anexada. Se uma mensagem A união não é possível for exibida em vermelho, significará que a dimensão selecionada não contém um tipo de dados compatível e você deve selecionar uma dimensão compatível. 4. Selecione Anexar. Os dois conjuntos de dados são combinados. O conjunto de dados combinado retém os nomes das colunas do conjunto de dados de destino. 7.1.5.5 Como remover um conjunto de dados Você poderá remover um conjunto de dados de um documentos se ele não tiver sido anexado ou fundido a outro conjunto de dados. 1. Na lista de conjuntos de dados no topo do painel Dados, selecione o conjunto de dados a ser removido. 2. Selecione o ícone Remover conjunto de dadosao lado do conjunto de dados. O conjunto de dados e quaisquer visualizações baseadas nele serão excluídos. Guia do usuário do Expert Analytics Preparando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 73 8 Criando análises 8.1 Como criar uma análise Você pode usar Expert Analytics para mineração de dados e análise estatística, executando os dados em uma série de componentes. As séries de componentes são conectadas entre si por meio de conectores, que definem a direção do fluxo de dados. Esse processo é denominado análise. Documentos são o ponto de partida para utilização de Expert Analytics. Você cria um novo documento para começar a analisar dados e criar novas análises. Você também pode abrir os documentos armazenados localmente, para visualizar ou modificar as análises e os conjuntos de dados existentes. Cada documento é um arquivo que contém: ● Parâmetros de conexão com a fonte de dados, se a fonte for RDBMS. ● Conjunto de dados: dados da coluna usados para criar gráficos. ● Análises e modelos, e seus resultados. ● Gráficos criados com base nos dados e salvos como visuais. Para criar uma análise, siga estes procedimentos: 1. Adquira dados de uma fonte de dados. 2. Opcional: Prepare os dados para análise (por exemplo, filtrando os dados). 3. Aplique os algoritmos. 4. Opcional: Armazene os resultados para uma análise posterior. Para adicionar diversas análises ao documento, selecione análise. (Adicionar análise) na barra de ferramentas de Informações relacionadas Preparando dados [página 42] Aplicação de componentes de pré-processamento em dados [página 74] Como aplicar os algoritmos [página 75] Opcional: Como armazenar os resultados da análise [página 77] 8.1.1 Aplicação de componentes de pré-processamento em dados Você pode aplica componentes de pré-processamento em seus dados, por exemplo, filtros, antes de executar uma análise. 74 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Criando análises Esta etapa é opcional. Em muitos casos, os dados brutos da fonte de dados podem não serem adequados para a análise. Para obter resultados precisos, talvez seja necessário preparar e processar os dados antes da análise. Você encontra funções de manipulação de dados na sala Preparação e as funções de preparação de dados na sala Previsão. Na divisão Preparar, você pode trabalhar em dados estáticos ou em dados brutos importados no Expert Analytics. Na sala Previsão, você pode trabalhar nos dados transitórios utilizando componentes do pré-processador. A preparação de dados consiste em verificação da precisão dos dados e de campos em falta, filtragem dos dados com base em valores de intervalo, amostragem de dados para investigação de um subconjunto de dados e manipulação de dados. Você pode processar os dados usando os componentes de preparação de dados. 1. Na divisão Prever, clique duas vezes no componente do pré-processador necessário na lista de componentes à direita. O componente do pré-processador de dados será adicionado ao editor de análise e uma conexão automática será criada para o componente de fonte de dados. 2. Pelo menu contextual do componente do pré-processador, selecione Configurar propriedades. 3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as propriedades do componente de pré-processador. 4. Selecione Concluído. 5. Para visualizar os resultados da análise, selecione (Executar análise). Informações relacionadas Componentes de preparação de dados [página 201] 8.1.2 Como aplicar os algoritmos Obtidos os dados relevantes para análise, você precisa aplicar os algoritmos apropriados para determinar os padrões nos dados. É uma tarefa desafiadora determinar o algoritmo apropriado para uma finalidade específica. Você pode usar uma combinação de inúmeros algoritmos para analisar os dados. Por exemplo, primeiro você pode usar algoritmos de série de tempo para amortecer os dados e depois usar algoritmos de regressão para encontrar tendências. A seguinte tabela contém informações dos algoritmos que devem ser selecionados para finalidades específicas: Finalidade Algoritmo Realizando previsões com base no tempo Algoritmos de série de tempo Prevendo variáveis contínuas com base em outras variáveis no conjunto de dados. Guia do usuário do Expert Analytics Criando análises ● Amortecimento exponencial individual ● Amortecimento exponencial duplo ● Amortecimento exponencial triplo Algoritmos de regressão PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 75 Finalidade Encontrando padrões frequentes de conjunto de itens em conjuntos volumosos de dados transacionais para gerar regras de associação Algoritmo ● Regressão linear ● Regressão exponencial ● Regressão geométrica ● Regressão logarítmica ● Regressão linear múltipla ● Regressão polinomial ● Regressão logística Algoritmos de associação ● Apriori ● AprioriLite Criando clusters de observações em grupos de conjuntos de itens similares Algoritmos de clustering Classificando e prevendo uma ou mais variáveis discretas com base em outras variáveis no conjunto de dados Árvores de decisão Detectando valores atípicos no conjunto de dados ● Valor médio K ● HANA C 4.5 ● R de árvore CNR ● CHAID Algoritmos de detecção de valor atípico ● Intervalo interquartil ● Valor atípico vizinho mais próximo ● Detecção de anomalia ● Teste de variância Prevendo, classificando e reconhecendo padrões estatísticos Algoritmos de rede neural ● R de rede neural NNet ● R de rede neural MONMLP Se você não localizou o algoritmo relevante, você pode criar seu próprio componente personalizado utilizando o script R em Expert Analytics e executar a análise em seus dados adquiridos. Para mais informações sobre como adicionar um componente personalizado, consulte: Assistente de criação do componente R [página 80] 1. Na divisão Prever, clique duas vezes no componente do algoritmo necessário na lista de componentes à direita. O componente de algoritmo será adicionado ao editor de análise e conectado ao componente anterior na análise. 2. Pelo menu contextual do componente do algoritmo, selecione Configurar propriedades. 3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as propriedades do componente de algoritmo. 4. Selecione Concluído. 5. Para visualizar os resultados da análise, selecione 76 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. (Executar análise). Guia do usuário do Expert Analytics Criando análises Informações relacionadas Algoritmos [página 133] 8.1.3 Opcional: Como armazenar os resultados da análise Você pode armazenar os resultados da análise em arquivos planos ou bancos de dados para uma análise posterior, usando componentes de gravação de dados. Apenas a visualização da tabela é armazenada no componente de gravação de dados. 1. Na divisão Prever, clique duas vezes no componente de gravação de dados necessário na lista de componentes à direita. O componente de gravação de dados será adicionado ao editor de análise e conectado ao componente anterior na análise. 2. Pelo menu contextual do componente da gravação de dados, selecione Configurar propriedades. 3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as propriedades do componente de gravação de dados. 4. Selecione Concluído. 5. Para visualizar os resultados da análise, selecione (Executar análise). Informações relacionadas Gravadores de dados [página 222] 8.2 Como executar a análise Quando você preparar seus dados e aplicar os algoritmos necessários, você poderá executar uma análise. ● Para executar a análise, selecione ● Se a sua análise for muito volumosa e complexa, você pode executá-la, componente por componente, e analisar os dados. Para executar uma parte da análise, selecione Executar até aqui pelo menu contextual do componente até onde quiser executar. Guia do usuário do Expert Analytics Criando análises (Executar análise) na barra de ferramentas do editor de análise. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 77 8.3 Como salvar a análise Depois de criada a análise, você pode salvá-la para reutilizar no futuro. No Expert Analytics, você precisa salvar o documento para salvar a análise que você criou. O documento salvo contém conjuntos de dados, análises, resultados e visualizações. O documento é salvo em formato de arquivo .lums. Para salvar a análise em um documento, siga estes procedimentos: 1. Selecione Arquivo Salvar . 2. Insira um nome para o documento. 3. Selecione Salvar. Se você criar várias análises com o mesmo conjunto de dados, todas serão salvas no mesmo documento. Você pode acessar todas as análises em um documento pela lista de opções Análise. 8.4 Como excluir uma análise do documento Você poderá excluir uma análise se ela não for mais necessária. Para excluir uma análise existente do documento, passe o cursor na imagem da análise na barra de análise, e selecione 8.5 Como visualizar os resultados Para visualizar os resultados dos componentes em uma análise, depois de executar a análise, alterne para a visualização de Resultados ou pelo menu contextual do componente, selecione Visualizar resultados. 8.6 Exportação de uma análise como um procedimento armazenado Você pode exportar uma análise do SAP HANA como um procedimento armazenado para o banco de dados do SAP HANA. Qualquer usuário do SAP HANA pode utilizar essa análise no SAP HANA Studio para análise subsequente. Antes de exportar uma análise como um procedimento armazenado no banco de dados do SAP HANA, certifiquese de que sua conta está definida no SAP HANA. 1. Criar uma análise. 2. Execute a análise. 78 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Criando análises 3. Selecione o último componente do algoritmo na análise e, a partir do menu do contexto, selecione Exportar como procedimento armazenado. 4. Selecione o nome do esquema. 5. Insira um nome para o procedimento. 6. Se você quiser sobregravar o procedimento existente pelo procedimento recém-criado, selecione a opção Sobregravar, se existir. 7. Opcional: Insira um nome para a visão. 8. Selecione Exportar. O procedimento exportado e os objetos a ele associados são exibidos no esquema selecionado no banco de dados SAP HANA. Os seguintes objetos são criados no banco de dados do SAP HANA no esquema selecionado: ● Procedimento com nome especificado. ● Se você decidiu criar uma visão, então uma visão de coluna com nome especificado. ● Um ou mais procedimentos para cada componente na cadeia de análise. ● Uma visão de coluna para cada componente na cadeia. ● Tipos de tabela necessários pelos algoritmos SAP HANA. ● Tabelas necessárias por esses algoritmos que podem conter parâmetros de entrada. Exemplo Consumindo o procedimento armazenado Dica O seguinte snippet de SQL mostra como você pode consumir o procedimento armazenado exportado: CREATE TABLE ResultTable like "TestProc_OUT_TYPE"; call "TEST80"."TestProc"(ResultTable) WITH OVERVIEW; select * from ResultTable ; TestProc_OUT_TYPE é o mesmo que o tipo de tabela que o TestProc espera como parâmetro de saída. Consumindo a visão de coluna Dica Há um recurso adicional disponível onde o usuário pode criar visões de coluna na parte superior do procedimento armazenado: Select * from VIEW_TESTPROC Informações relacionadas Exportando um modelo do SAP HANA como procedimento armazenado [página 130] Guia do usuário do Expert Analytics Criando análises PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 79 9 Adicionando um componente personalizado 9.1 Personalizar componente R Como um usuário especialista, você pode criar e adicionar um componente usando scripts R. O componente R recém-adicionado está classificado em Algoritmos Componentes R personalizados na lista de componentes à direita, dependendo do tipo de componente criado. Por exemplo, ele pode ser classificado como um algoritmo, um componente de pré-processador ou uma gravação de dados. Você pode utilizar componentes personalizados para realizar a análise no conjunto de dados adquiridos. O R é uma linguagem de programação de software e um ambiente para computação e gráficos estatísticos. Expert Analytics fornece um ambiente para uso de scripts R (em um formato de função R válido) e criação de um componente, que pode ser utilizado para análise da mesma maneira que qualquer outro componente existente. Ao criar um componente R, você pode fornecer um nome para o componente, que aparece na classificação, Alogritmos 9.1.1 Componentes R personalizados , na lista de componentes à direita. Assistente de criação do componente R Você pode especificar as propriedades para o componente R personalizado. Propriedades do assistente de criação do componente R Tabela 35: Geral Propriedade Descrição Nome do componente Insira um nome para o componente. Nota Você não pode renomear um componente personalizado existente. Tipo de componente Selecione o tipo de componente. Descrição do componente Insira uma descrição do componente, que aparecerá como a dica para o componente criado. 80 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adicionando um componente personalizado Tabela 36: Script Propriedade Descrição Carregar script R Clique para carregar um script R. Editor de scripts Copie e cole ou grave o script R na caixa de texto. Nome da função primária Selecione o nome da função que deseja executar. DataFrame de entrada Selecione o DataFrame de entrada pela lista de parâmetros. DataFrame de saída Insira um nome para a variável que deseja utilizar como Data Frame de saída. Nome da variável modelo Insira um nome para a variável que deseja utilizar como variá vel modelo. Exibir visualização Para exibir os resultados da execução do componente custo mizado em formato de gráfico, selecione essa opção. Exibir resumo Para exibir o resumo do algoritmo depois da execução do componente personalizado, selecione essa opção. Opção para salvar o modelo Para habilitar a opção Salvar como modelo para o compo nente personalizado, selecione essa caixa de seleção. Nota Se selecionar a Opção para salvar o modelo, o campo Nome da variável modelo será habilitado e Detalhes da função de pontuação de modelo aparecerá. Opção para exportar como PMML Para habilitar a opção Exportar como PMML para o compo nente personalizado, selecione essa caixa de seleção. Nota A caixa de seleção Opção para exportar como PMML só será habilitada, se selecionar a Opção para salvar o modelo. Nome da função de pontuação de modelo Selecione o nome da função de pontuação de modelo que de seja executar. Nota Os campos Função de pontuação de modelo só são visíveis se você selecionou a caixa de seleção Opção para salvar o modelo. DataFrame de entrada Selecione o DataFrame de entrada pela lista de parâmetros. DataFrame de saída Insira um nome para a variável que deseja utilizar como Data Frame de saída. Nome da variável do modelo de entrada Selecione o Nome da variável modelo de entrada pela lista de parâmetros. Guia do usuário do Expert Analytics Adicionando um componente personalizado PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 81 Tabela 37: Configurações Propriedade Descrição Função primária – Definição da tabela de saída Considere todas as colunas do componente anterior ou ne nhuma coluna. Selecione para incluir ou excluir respectivamente a coluna prevista do componente-pai na saída do componente perso nalizado. Tipo de dados Selecione o Tipo de dados para a coluna prevista do compo nente personalizado. Nome da nova coluna prevista Insira um nome para a coluna prevista, que é a coluna de sa ída do componente personalizado. Função primária – Definição da visualização de propriedade Parâmetros da função Parâmetros definidos. Nome de exibição da propriedade Insira um nome para a Coluna independente e a Coluna dependente, que aparecerão na visão de propriedade do com ponente personalizado. Tipo de controle Selecione o Tipo de controle para a Coluna independente e a Coluna dependente. Pontuação de modelo – Definição da tabela de saída Considere todas as colunas do componente anterior ou ne nhuma coluna. Selecione para incluir ou excluir respectivamente a coluna prevista do componente-pai na saída da pontuação do mo delo. Tipo de dados Selecione o Tipo de dados para a coluna prevista da pontua ção do modelo. Nome da nova coluna prevista Insira um nome para a coluna prevista, que é a coluna de sa ída da pontuação do modelo. Pontuação de modelo – Definição da visualização de propriedade Parâmetros da função Parâmetros definidos. Nome de exibição da propriedade Insira o nome da coluna, que aparece na visão de propriedade do modelo salvo. Tipo de controle Selecione o Tipo de controle para a Coluna independente e a Coluna dependente. Informações relacionadas Como criar um componente R [página 82] 9.1.2 Como criar um componente R Como criar um componente R personalizado para uso nas análises. Antes de criar o componente R, você deve certificar-se de que os seguintes requisitos são cumpridos: 82 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adicionando um componente personalizado ● O script R é gravado em um formato de função R válido. ● O script R é executado no console GUI do ambiente R. ● O script R tem pelo menos uma função principal. ● Os pacotes necessários para executar o script R devem ser instalados em seu computador ou no servidor SAP HANA. ● O script R gravado na análise No banco de dados devolve um DataFrame. A seguir estão as melhores práticas que deve considerar ao gravar o script R: ● O script R gravado na análise No processo devolve um DataFrame. ● A conversão do tipo de saída é recomendada, por exemplo, se uma coluna tem valores numéricos, mencionea como as.numeric(output) ● Para variáveis categóricas utilizadas no script R, especifique a variável utilizando o comando as.factor. 1. Na divisão Prever, na lista de componentes à direita, escolha Componente R . O assistente para Criar um novo componente R personalizado é exibido. 2. Na página Geral, insira as seguinte informações: a. Na caixa de texto Nome do componente, digite Meu componente. b. Na lista suspensa Tipo de componente, selecione Algoritmos. c. Na caixa de texto Descrição do componente, insira Componente R para regressão linear simples. 3. Selecione Próximo. A página Script é exibida. 4. Na página Script, selecione Carregar script para selecionar um arquivo para efetuar upload. Nota Você pode gravar ou copiar e colar o script R de amostra a seguir na caixa de texto. Nota Consulte os comentários no seguinte formato da função R para ajudá-lo a compreender e gravar seu próprio script R. #This is a sample script for a simple linear regression component. #The script should be written in a valid R function format. #Function name and variable name in R script can be user-defined, which are supported in R. #The following is the argument description for the primary function SLR: #InputDataFrame - Dataframe in R that contains the output of the parent component. #The following two parameters are fetched from the user from the property view: #IndepenentColumns - Column names that you want to use as independent variables for the component. #DependentColumn - Column name that you want to use as a dependent variable for the component. SLR<-function(InputDataFrame,IndepenentColumn,DependentColumn) { finalString<-paste(paste(DependentColumn,"~" ), IndepenentColumn); # Formatting the final string to #pass to "lm" function slr_model<-lm(finalString); # calling the "lm" function and storing the output model in "slr_model" Guia do usuário do Expert Analytics Adicionando um componente personalizado PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 83 #To get the predicted values for the training data set, call the "predict" function withthis model and #input dataframe, which is represented by "InputDataFrame". result<-predict(slr_model, InputDataFrame); # Storing the predicted values in the "result" variable. output<- cbind(InputDataFrame, result);#combining "InputDataFrame" and "result" to get the final table. plot(slr_model); #Plotting model visualization. # returnvalue - function must always return a list that contains results("out"), and model variable #("slrmodel"), if present. #The output variable stores the final result. #The model variable is used for model scoring. return (list(slrmodel=slr_model,out=output)) } #The following is the argument description for the model scoring function "SLRModelScoring": #MInputDataFrame - Dataframe in R that contains the output of the parent component. #MIndepenentColumns - Column names to be used as independent variables for the component. #Model - Model variable that is used for scoring. SLRModelScoring<-function (MInputDataFrame, MIndependentColumn, Model) { #Calling "predict" function to get the predictive value with "Model " and "MInputDataFrame". predicted<-predict (Model, data.frame(MInputDataFrame [, MIndependentColumn]), level=0.95); # returnvalue - function should always return a list that contains the result ("model result"), # The output variable stores the final result return(list(modelresult=predicted)) } Os dois exemplos abaixo mostram conversão de um script R em um formato de função R válido, reconhecido pelo Expert Analytics: Script R dataFrame<-read.csv("C:\\CSVs\ \Iris.csv") attach(dataFrame) set.seed(4321) kmeans_model<kmeans(data.frame(`SepalLength`,`Sepa lWidth`, `PetalLength`,`PetalWidth`), centers=5,iter.max=100,nstart=1,algor ithm= "Hartigan-Wong") kmeans_model$cluster dataFrame<read.csv("C:\\Datasets\\cnr\ \Iris.csv") attach(dataFrame) library(rpart) 84 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Formato da função R (reconhecido por Expert Analytics) kmeansfunction<function(dataFrame,independent, Clustersize,Iterations,algotype,numbe rofinitialdsets) { set.seed(4321) kmeans_model<kmeans(data.frame(dataFrame[,independ ent]), centers=Clustersize,iter.max=Iteratio ns, nstart=numberofinitialdsets, algorithm= algotype) output<- cbind(dataFrame, kmeans_model$cluster); boxplot(output); return (list(out=output)); } cnrFunction<function(dataFrame,IndependentColumns ,dep) { library(rpart); Guia do usuário do Expert Analytics Adicionando um componente personalizado Script R Formato da função R (reconhecido por Expert Analytics) cnr_model<-rpart (Species~PetalLength+PetalWidth +SepalLength+ SepalWidth, method="class") library(rpart) predict(cnr_model, dataFrame,type = c("class")) 5. 6. formattedString<paste(IndependentColumns, collapse = '+'); finalString<-paste(paste(dep, "~" ), formattedString); cnr_model<rpart(finalString, method="class"); output<- predict(cnr_model, dataFrame,type=c("class")); out<- cbind(dataFrame, output); return (list(result=out,modelcnr=cnr_model)) ; } cnrFunctionmodel<function(dataFrame,ind,modelcnr,type) { output<predict(modelcnr,data.frame(dataFram e[,ind]),type=type); out<- cbind(dataFrame, output); return (list(result=out)); Na seção Detalhes da função primária, insira as seguintes informações: a. Na lista suspensa Nome da função primária, selecione SLR. b. Na lista suspensa DataFrame de entrada, selecione InputDataFrame. c. Na caixa DataFrame de saída, digite out. d. Selecione a caixa de seleção Opção para salvar o modelo. O campo Nome da variável modelo é habilitado e os Detalhes da função de pontuação de modelo são exibidos. e. No campo Nome da variável modelo, digite slrmodel. f. Selecione as caixas de seleção Exibir resumo e Opção para exportar como PMML. Na seção Detalhes da função de pontuação de modelo, insira as seguintes informações: a. Em Nome da função de pontuação de modelo, selecione SLRModelScoring. b. Na lista suspensa DataFrame de entrada, selecione MInputDataFrame. c. No campo DataFrame de saída, digite modelresult. d. Na lista suspensa Nome da variável modelo de entrada, selecione Modelo. 7. Selecione Próximo. A página Configurações é exibida. 8. Na seção Definição da tabela de saída de Configurações da função primária, realize as seguintes subetapas: a. 9. Selecione Não considerar nenhuma. b. Na lista suspensa Tipo de dados, selecione Número inteiro. c. Na caixa Nome da nova coluna prevista, digite Coluna prevista. Na seção Definição da visão de propriedade, realize as seguintes subetapas: a. Em Nome de exibição da propriedade, na caixa Coluna independente, digite Coluna independente. b. Na lista suspensa Tipo de controle, selecione Seletor de colunas (único) como o tipo de controle para a Coluna independente. c. Em Nome de exibição da propriedade, na caixa Coluna independente, digite Coluna dependente. d. Na lista suspensa Tipo de controle, selecione Seletor de colunas (único) como o tipo de controle para a Coluna dependente. Guia do usuário do Expert Analytics Adicionando um componente personalizado PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 85 10. Na seção Definição da tabela de saída de Configurações da pontuação do modelo, selecione Considerar todas as colunas do componente anterior. 11. Na lista suspensa Tipo de dados, selecione Número inteiro. 12. Em Nome da nova coluna prevista, digite Coluna de saída. 13. Na seção Definição da visão de propriedade, realize as seguintes subetapas: a. Em Nome de exibição da propriedade, digite Coluna independente. b. Na lista suspensa Tipo de controle, selecione Seletor de colunas (único) como o tipo de controle para a Coluna independente. 14. Selecione Concluir. Dependendo do tipo de análise realizada, você pode criar um modelo assim como qualquer outro componente. Informações relacionadas Assistente de criação do componente R [página 80] Modelos [página 225] Como criar um modelo [página 129] 9.2 Componente PAL personalizado Como um usuário especialista, você pode criar um componente da Biblioteca do SAP HANA Predictive Analysis (PAL). Isso permite que outros usuários adicionem esses componentes PAL personalizados às análises deles. O componente PAL recém-adicionado é classificado em lista de componentes à direita. Algoritmos Componentes PAL personalizados na O componente PAL personalizado é criado usando algoritmos da Biblioteca do SAP HANA Predictive Analysis. Os algoritmos PAL a seguir são suportados no momento em Expert Analytics: Tabela 38: Algoritmos PAL Algoritmo Função correspondente Análise ABC ABC Clustering hierárquico aglomerado HCAGGLOMERATE ARIMA ARIMATRAIN Categorização BINNING Árvore de decisão C4.5 CREATEDT Regressão exponencial EXPREGRESSION Crescimento FP FPGROWTH K-Medoids KMEDOIDS Naive Bayes NBCTRAIN 86 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adicionando um componente personalizado Algoritmo Função correspondente Intervalo de escala SCALINGRANGE Nota Você tem a opção de salvar os componentes Árvore de decisão C4.5 e Regressão exponencial como modelos. Nota Para mais informações sobre os algoritmos PAL e os usos de cada algoritmo, consulte Referência da Bilioteca do SAP HANA Predictive Analysis (PAL) em http://help.sap.com/hana_platform 9.2.1 Assistente de criação do componente PAL Você pode especificar as propriedades do componente personalizado da Biblioteca do SAP HANA Predictive Analysis (PAL). Propriedades do Assistente de criação do componente PAL Tabela 39: Geral Propriedade Descrição Nome do componente Insira um nome para o componente. Nota Você não pode renomear um componente personalizado existente. Tipo de componente Selecione o tipo de componente. Nota Você não pode editar o tipo de componente. Descrição do componente Insira uma descrição do componente, que aparecerá como a dica para o componente criado. Tabela 40: Configurações da função Propriedade Descrição Área Nome da área da biblioteca. O padrão é AFLPAL. Guia do usuário do Expert Analytics Adicionando um componente personalizado PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 87 Propriedade Descrição Função Selecione uma das funções da lista de opções para definir os parâmetros da função: ● ABC ● HCAGGLOMERATE ● ARIMATRAIN ● BINNING ● CREATEDT ● EXPREGRESSION ● FPGROWTH ● KMEDOIDS ● NBCTRAIN ● SCALINGRANGE Parâmetros de entrada Nota Os parâmetros são dependentes da função selecionada. Nome do parâmetro Nota Os parâmetros são dependentes da função selecionada. Os nomes de parâmetros não são editáveis. Nome de exibição Insira um nome alternativo a ser mostrado para o parâmetro. Valor padrão Insira um valor padrão para o parâmetro. Dependendo do tipo de dados do parâmetro, pode ser um valor numérico ou de texto. Nota Os valores padrão não podem ser inseridos quando o parâ metro é dependente dos dados de entrada. Tipo de dados Parâmetros de inclusão Parâmetros de modelo Pode ser uma string, número inteiro ou duplo, dependendo do parâmetro. Os tipos de dados não são editáveis. ● Para parâmetros obrigatórios: Esse campo de seleção é marcado por padrão e não pode ser desmarcado. ● Para parâmetros obrigatórios: Esse campo de seleção é marcado por padrão, mas você pode desmarcá-lo para parâmetros que não deseja incluir no componente. Nota Os parâmetros de modelo só podem ser especificados para algumas funções. As propriedades são as mesmas dos parâmetros de entrada: Nome do parâmetro, Nome de exibição, Valor padrão,Tipo de dados e Parâmetro de inclu são. 88 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Adicionando um componente personalizado 9.2.2 Criando um componente da PAL Como criar um componente personalizado da biblioteca de análise preditiva SAP HANA (PAL) para usar em análises. Para criar um componente personalizado da PAL, você precisa estar conectado a uma fonte de dados SAP HANA. 1. Na divisão Prever, na lista de componentes à direita, escolha 2. Na página Geral, insira as seguinte informações: a. Insira um Nome de componente exclusivo. b. Selecione Tipo de componente. Componente PAL . O tipo está padronizado como Algoritmos. c. Insura uma Descrição de componente adicional. Essa descrição será exibida como uma dica quando você posicionar o ponteiro do mouse sobre o componente na lista de componentes à direita. 3. Escolha Avançar. A página Configurações da função será exibida. 4. Selecione uma Função na lista de seleção. Nota A Área é padronizada como AFLPAL. 5. Opcional: insira um Nome de exibição para um dos parâmetros listados. 6. Opcional: insira um Valor padrão para um dos parâmetros listados. Nota O valor padrão pode ser um número ou um texto, dependendo do Tipo de dados especificado para o parâmetro. O campo Valor padrão está desativado para os parâmetros que dependem dos dados de entrada. 7. Para parâmetros opcionais, você pode desmarcar o campo de seleção Incluir parâmetros. Nota O campo de seleção Incluir parâmetro não pode ser desmarcado para parâmetros obrigatórios. 8. 9. Para funções que incluem parâmetros de modelo, é possível especificar o seguinte para cada parâmetro: a. Nome de exibição b. Valor padrão c. Incluir parâmetro Clique em Concluir. O componente é listado em Algoritmos Componentes PAL personalizados na lista de componentes à direita. Ele pode ser adicionado a uma análise como qualquer outro componente. Você pode configurar o componente ao adicioná-lo a uma análise selecionando Configurar definições no menu de contexto. Caso precise fazer alterações nos detalhes do componente, é possível editá-lo. Guia do usuário do Expert Analytics Adicionando um componente personalizado PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 89 10 Analisando dados 10.1 Como analisar os dados Depois de executar a análise, o resultado de cada componente da análise é representado usando diferentes gráficos de visualização. Para analisar os dados, siga estes procedimentos: 1. Depois de executar a análise, mude para a visão de resultados selecionando o botão Resultados na barra de ferramentas. 2. Para visualizar um componente, selecione o componente necessário na análise da lista de componentes à direita. Por padrão, o resultado do componente é exibido no visão de Tabela. A seguinte tabela mostra resumidamente os componentes e respectivos gráficos de visualização suportados. Componentes Gráficos de visualização Fontes de dados e pré-processadores Gráfico de matriz de dispersão, gráfico de resumo estatístico, coordenadas paralelas Algoritmos de clustering Gráficos de representação de cluster e resumo de algoritmo Árvores de decisão Árvore de decisão, resumo do algoritmo, matriz de confusão Algoritmos de série de tempo Gráfico de tendência, resumo do algoritmo Algoritmos de regressão Gráfico de tendência, resumo do algoritmo Algoritmos de associação Gráfico de nuvem de tags Apriori, resumo do algoritmo A tabela a seguir resume os pontos de dados suportados para visualizações: Nota Se o conjunto de dados de entrada exceder o limite do ponto de dados de interatividade, os gráficos serão renderizados sem interatividade. Se o conjunto de dados de entrada exceder o limite do ponto de dados máximo, os dados acima do limite não serão exibidos no gráfico. Tabela 41: Gráficos Número máximo de pontos de dados suportados Com interatividade Sem interatividade Gráfico de tendência 4000 6000 Gráfico de matriz de dispersão 500 1000 Gráfico Coordenadas paralelas 60000 75000 90 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Analisando dados 10.2 Gráfico de matriz de dispersão Gráficos de matriz de dispersão são matrizes de gráficos (gráficos n*n, em que n é o número de atributos selecionados) usados para comparar os dados em diferentes dimensões. Por padrão, no máximo três atributos numéricos são selecionados para análise, começando do primeiro atributo dos dados de origem, para criar um gráfico de matriz 3*3. No entanto, você pode selecionar manualmente os atributos necessários em Medidas na seção Dados e atualizar a visualização selecionando Aplicar. Nota Você pode selecionar no máximo três atributos numéricos em Medida na seção Dados. 10.3 Gráfico de resumo estatístico O resumo estatístico contém informações resumidas de atributos numéricos da fonte de dados. Ele contém informações resumidas de contagem, valor mínimo, valor máximo, variação, desvio padrão, soma, média, intervalo e número de registros. Para as fontes de dados online HANA, os dois parâmetros adicionas, de assimetria e curtose, também são incluídos no resumo. Um gráfico em forma de histograma é criado para cada atributo. Guia do usuário do Expert Analytics Analisando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 91 10.4 Coordenadas paralelas Coordenadas paralelas são uma técnica de visualização de dados multidimensionais e padrões multivariáveis dos dados para análise. Neste gráfico, por padrão, os primeiros sete atributos estão representados como eixos paralelos espaçados verticalmente. Você pode selecionar manualmente os atributos necessários em Medidas e atualizar o gráfico selecionando Aplicar A etiqueta de cada eixo contém o nome do atributo, e os valores mínimo e máximo dos atributos. Cada observação é representada como uma série de pontos conectados ao longo dos eixos paralelos. Você pode selecionar a cor por opção para filtragem dos dados com base no valor da categoria. Nota Você pode selecionar no máximo sete atributos numéricos na seção Medidas. 92 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Analisando dados 10.5 Árvore de decisão Árvore de decisão é uma técnica de visualização que permite classificar as observações em grupos e prever eventos futuros com base no conjunto de regras de decisão. Esta apresentação será usada para análise da árvore de decisão. Nesta técnica, uma árvore de decisão binária é criada dividindo as observações em subgrupos menores até preencher os critérios de parada. O nó final indica os dados classificados. Você pode ampliar a árvore de decisão usando o botão de aproximação. Nota Não será possível criar árvores de decisão se houver mais de 32 valores de categoria para uma coluna dependente. Nota A aparência e o comportamento da árvore de decisão variam dependendo do fornecedor de algoritmos. Por exemplo, a árvore de decisão para o algoritmo R de árvore CNR é diferente da árvore de decisão para o algoritmo HANA C4.5. Cada nó da árvore de decisão representa a classificação dos dados naquele nível. Você pode visualizar o conteúdo do nó selecionando Guia do usuário do Expert Analytics Analisando dados em cada nó. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 93 10.6 Gráfico de tendência O gráfico de tendência é usado para visualizar a correlação entre as variáveis dependente e independente. No modo de tendência, você pode analisar o desempenho do algoritmo comparando as variáveis dependentes reais com valores previstos, onde variáveis dependentes são representadas em um gráfico de barras e os valores previstos em um gráfico de linhas. No modo de preenchimento, o algoritmo preenche os valores restantes e exibe a saída em um gráfico de linhas. Se o conjunto de dados for volumoso, o gráfico pode não ficar claro. Para visualizar melhor os dados, use o botão de seleção Intervalo localizado na base do gráfico para selecionar um intervalo de dados específico de um conjunto volumoso de dados. Os dados na área selecionada são exibidos no editor de visualização. 94 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Analisando dados Nota Nos gráficos de algoritmo Regressão linear múltipla (MLR), o atributo do eixo x é mencionado como ID de registro. 10.7 Gráfico de cluster Gráfico de cluster é uma técnica de visualização que utiliza diferentes gráficos para representar informações do cluster, como distribuição do cluster, densidade e distância do cluster, distribuição do recurso e representação do centro do cluster. Distribuição do cluster A distribuição do cluster é o número de observações em cada cluster e é representado por um gráfico de barras horizontais. No entanto, você também pode visualizar a distribuição do cluster em um gráfico de pizza ou um gráfico de barras verticais. Densidade e distância do cluster A distância entre clusters e a densidade de cada cluster são representadas por um gráfico de rede. Cada nó da rede representa um cluster e seu tamanho. A cor do nó representa a densidade. Distribuição de recurso A comparação entre a distribuição total de todos os clusters e a distribuição de cada cluster é representada por um histograma. Você pode selecionar a medida necessária em Medidas na seção Dados. Você pode visualizar a distribuição do recurso para cada cluster selecionando o número do cluster em Clusters na seção Dados. Representação do centro de cluster O algoritmo R de valor médio K computa os pontos centrais de cada recurso em cada cluster. A comparação entre cada ponto central e o cluster é representada pelo gráfico radial. Por padrão, o gráfico é exibido com dados normalizados. No modo normalizado, os dados serão representados no intervalo de 0 a 1. Entretanto, você pode desfazer a seleção da opção Normalizar resultado em Configurações. Guia do usuário do Expert Analytics Analisando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 95 10.8 Gráfico de nuvem de tags Apriori Um gráfico de nuvem de tags Apriori permite a você visualizar e encontrar os itens individuais frequentes, com base na regra de associação. Neste gráfico de visualização, as regras mais importantes são as mais fortes. A importância das regras varia de acordo com a segurança e com o valor de aumento. Quanto mais alto o valor de segurança, mais intensa a cor das regras e, quanto mais alto o valor de aumento, maior a fonte das regras. Você pode modificar valor do suporte, da confiança e do aumento ajustando os controles deslizantes de intervalo respectivos no painel Dados. 10.9 Matriz de confusão Uma matriz de confusão contém informações sobre a classificação real e prevista feita por um algoritmo, que permite a você visualizar a precisão. Você poderá visualizar o gráfico ao selecionar o método de saída Classificação e Tendência para o algoritmo CNR Tree. Ele é uma matriz n*n (onde n é o número de valores distintos presentes na coluna dependente selecionada para o algoritmo) que mapeia o número de ocorrências de cada valor previsto em relação ao valor real. As entradas na diagonal da matriz representam a previsão correta. As entradas fora da diagonal da matriz representam classificação incorreta. Quando você passar o cursor do mouse sobre uma classe, o valor verdadeiro previsto e a contagem real dos conjuntos de dados serão exibidos. A tabela de derivativos representa a eficiência (sensibilidade, especificidade, precisão, previsão negativa) do algoritmo. A utilização da opção Configurações possibilita a você analisar os dados em quantidade, percentual e em ambos os formatos. 96 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Analisando dados 10.10 Gráfico de componente R customizado Você pode exibir os resultados de uma análise do componente R customizado em formato de gráfico no modo online. O tipo de gráfico pode variar, dependendo do conjunto de dados e do que é gerado pelo algoritmo utilizado no componente R customizado. Nota A caixa de seleção Mostrar visualização deve ter sido marcada durante a criação do componente R customizado para exibir os resultados da análise em formato de gráfico. O script R para o componente deve conter chamadas para marcar os dados no gráfico. Informações relacionadas Assistente de criação do componente R [página 80] Guia do usuário do Expert Analytics Analisando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 97 11 Visualizando dados 11.1 Visualizando dados A sala Visualizar fornece ferramentas para a criação de gráficos. Estas são as principais áreas nas quais você pode interagir com a sala Visualizar: 98 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Visualizando dados Tabela 42: Legenda: Áreas na divisão Visualizar Número Área Descrição 1 Painel Medidas e dimensões Use esse painel para visualizar, organizar, selecionar e filtrar os dados em uma visualização. Os dados são agrupados em facetas que representam categorias de dados (por exemplo, nome, endereço e número de telefone do cliente). As facetas podem ser arrastadas diretamente para a Tela do gráfico ou para as prateleiras no Gerador de gráficos. Cada orientação fornece uma funcionalidade diferente: ● No layout Orientação horizontal ( ), os dados associ ados a cada dimensão são exibidos em uma coluna acima da Tela do gráfico. Você pode pesquisar por valo res de dados específicos dentro de uma dimensão, sele cionar múltiplos valores para incluir e excluir estes de uma visualização e visualizar as medidas associadas à uma dimensão. 2 Tela do gráfico Use essa área para criar, modificar e explorar uma visualiza ção. Um gráfico pode ser gerado arrastando medidas, di mensões ou cabeçalhos de faceta de duas maneiras: ● Crie um gráfico e arraste medidas, dimensões e cabe çalhos de faceta diretamente para a Tela do gráfico ou para prateleiras no Gerador de gráficos. ● Ajuste rapidamente o conteúdo ou a aparência de uma visualização com os botões da barra de ferramentas no canto superior direito da Tela do gráfico: ○ Organizar ( ): organiza os dados do gráfico por medida ○ Adicionar ou processar uma classificação por medida ( ): foca um gráfico em um determinado grupo dos maiores ou menores membros da di mensão ○ Limpar gráfico ( ): remove todas as dimensões e medidas de um gráfico e quaisquer filtros aplicados ao gráfico ○ ○ Atualizar ( ): atualiza os dados do gráfico Configurações ( ): define as propriedades do gráfico ○ Maximizar ( ): exibe a Tela do gráfico no modo de tela cheia Guia do usuário do Expert Analytics Visualizando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 99 Número Área Descrição 3 Ferramentas de visualização Use as ferramentas na parte superior do painel para alternar (O Gerador de gráficos é exibido no exem entre as abas Gerador de gráficos ( plo) relacionadas ( ● ) e Visualizações ). Use o Gerador de gráficos para alterar o tipo de gráfico e personalizar um gráfico. ● Use a aba Visualizações relacionadas para selecionar gráficos predefinidos que foram gerados automatica mente com base nas medidas e dimensões do conjunto de dados atual. ○ Adicione visualizações relacionadas à história atual e modifique-as. ○ Visualize todas as sugestões de gráfico selecio nando Exibir tudo. ○ Remova medidas ou dimensões que foram usadas para gerar uma visualização com o ícone Filtrar visualizações relacionadas ( ). Isso refina a lista de visualizações relacionadas disponíveis para você. 4 Selecionador de gráfico Use para selecionar o tipo de gráfico a ser utilizado para uma visualização. 5 Prateleiras Use para adicionar facetas a prateleiras em uma visualiza ção. Quando você arrasta uma faceta para uma prateleira, a Tela do gráfico é atualizada automaticamente. 6 Galeria de visualização Use para criar novas visualizações e fazer uma seleção entre as visualizações na história. ● Cie uma nova visualização selecionando o botão Criar nova visualização (+). ● Remova ou copie uma visualização selecionando o ícone Configurações ( ● ). Altere a ordem das visualizações na Galeria de visuali zação arrastando as visualizações na ordem que dese jar. Informações relacionadas Criando gráficos [página 101] Trabalhando com o Gerador de gráficos [página 103] 100 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Visualizando dados Propriedades do gráfico [página 105] 11.1.1 Criando gráficos Uma história pode conter um ou mais gráficos e você pode criá-los na Tela do gráfico ou usando o Gerador de gráficos. Todos os gráficos incluídos em uma história são acessíveis na Galeria de visualização abaixo da Tela do gráfico. 11.1.1.1 Tipos de gráfico Alguns tipos de dados são específicos a determinado tipo de gráfico. Tabela 43: Tipos de gráfico Tipo de análise Descrição Gráficos disponíveis Comparação Compara diferenças entre valores ou exibe uma ● Gráfico de barras comparação simples de divisões categóricas de ● Gráfico em colunas medidas. ● Gráfico em colunas com 2 eixos Y Por exemplo, use um gráfico de barras para compa ● Gráfico em colunas 3D ● Gráfico radial ● Gráfico de área ● Nuvem de tags ● Mapa de Calor ● Tabela Exibe a porcentagem das partes em um todo ou va ● Gráfico de pizza lores como índices para um todo. A legenda mostra ● Gráfico de rosca o percentual e os valores totais. ● Gráfico de pizza com pro rar as diferenças na receita de vendas entre países. Porcentagem fundidade Por exemplo, você pode usar um gráfico de pizza para verificar quem teve o melhor desempenho pro ● Vendas totais = $ 200, dos quais, Paulo responde por 10% ($ 20), David, 65% ($ 130) e Susan, 25% Gráfico em colunas sobre postas porcionalmente ao valor total das vendas: ● Árvore ● Gráfico em funil ($ 50) Guia do usuário do Expert Analytics Visualizando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 101 Tipo de análise Descrição Gráficos disponíveis Correlação Exibe a relação entre valores ou compara vários va ● Gráfico de dispersão lores da medida. ● Gráfico de matriz de dis Por exemplo, você pode visualizar a correlação en Tendência persão tre duas medidas e compreender o impacto da pri ● Gráfico de bolhas meira na segunda medida. ● Gráfico em rede ● Ponto numérico ● Árvore Exibe uma tendência nos valores dos dados (espe ● Gráfico de linha cialmente para dimensões baseadas em tempo, ● Gráfico em linhas com 2 como Ano) ou a progressão de seus dados e os pa drões possíveis. eixos Y ● nadas Por exemplo, é possível usar um gráfico de linha para visualizar tendências em termos da receita de Gráfico em linhas combi ● Gráfico em linhas combi nadas com 2 eixos Y venda de um produto ao longo dos anos. ● Gráfico em cascata ● Diagrama de caixa ● Gráfico de coordenadas paralelas Localização geográfica Mostra um mapa do objeto de país utilizado na aná ● lise e pode, opcionalmente, mostrar dados para di mensões (classificados por país no mapa) ou a dis lhas ● tribuição geográfica dos dados para um país. O con junto de dados que você utilizar deve conter os da 11.1.1.2 Gráfico coroplético geo gráfico ● dos geográficos. Para criar uma mapa geográfico, você precisa ter uma conta online do Esri ArcGis. Gráfico geográfico de bo Gráfico de pizza geográ fico ● Mapa geográfico Criando um gráfico diretamente na Tela do gráfico Você pode criar um gráfico de forma rápida arrastando medidas e dimensões para a Tela do gráfico, localizada na área central da divisão Visualizar. Todo gráfico precisa ter, pelo menos, uma medida. Quando você adiciona uma dimensão ao gráfico, os valores dela são calculados com base nas medidas do gráfico. 1. Na divisão Visualizar, selecione o ícone Gerador de gráficos 2. Selecione um tipo de gráfico nas listas do Gerador de gráficos. . O Gráfico de barras é o tipo de gráfico predefinido, mas você pode ser alterar o tipo de gráfico a qualquer momento. 3. Selecione uma medida e arraste-a para um eixo na Tela do gráfico. O texto no corpo do gráfico indica o eixo correto da medida. Uma marca de seleção é exibida quando você passa com a medida por cima de uma área onde ela pode ser solta. 102 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Visualizando dados 4. Selecione uma dimensão e arraste-a para a Tela do gráfico. O texto no corpo do gráfico indica o eixo correto da dimensão. Uma marca de seleção é exibida quando você passa com a dimensão por cima de uma área onde ela pode ser solta. 5. Adicione outras medidas e dimensões, conforme necessário. Por exemplo, se você selecionar Gráfico de colunas com 2 eixos Y, precisará adicionar uma medida ou dimensão aos eixos Y no lado esquerdo e no lado direito da Tela do gráfico. 6. Para filtrar os dados no gráfico, selecione o ícone Adicionar filtros selecione uma dimensão para ser usada como filtro. 7. Clique no botão de + na Galeria de visualização para adicionar o gráfico à história. na parte superior da Tela do gráfico e O gráfico está disponível na Galeria de visualização e na divisão Criar. Cada gráfico que você cria na divisão Visualizar é salvo automaticamente na sessão atual e disponibilizado na divisão Criar, mas não é salvo na história. Para acessar o gráfico na próxima vez que você abrir a história, salve a história. Informações relacionadas Filtragem de dados do gráfico [página 111] Como salvar uma história [página 125] Histórias e dados visualizados [página 119] 11.1.1.3 Trabalhando com o Gerador de gráficos Você pode usar o Gerador de gráficos para alterar o tipo de gráfico e personalizar um gráfico. O Gerador de gráficos tem três categorias de prateleira: medidas, dimensões e treliças. As prateleiras exibidas são determinadas pelo tipo de gráfico selecionado. As facetas podem ser arrastadas ou adicionadas às prateleiras exibidas. Tabela 44: Prateleiras para medidas Prateleira Descrição Eixo Um eixo de um gráfico. Pode haver várias prateleiras de eixo disponíveis. Por exemplo, quando você seleciona um Gráfico de barras com 2 eixos X, são exibidas as prateleiras Eixo X 1 e Eixo X 2. Gráfico de bolhas Representa três dimensões de dados Cor A cor de uma área em gráficos de mapa ou a cor de uma palavra em uma nuvem de tags Mapa de Calor Representa valores individuais como cores Gráfico de rede Um gráfico de fluxo que mostra a sequência na qual os elementos devem ser concluídos, com elementos e dependências correspondentes Guia do usuário do Expert Analytics Visualizando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 103 Prateleira Descrição Gráfico de coordenadas Visualiza a geometria de dimensão alta e analisa dados multivariados paralelas Setores de pizza As seções em um gráfico de pizza Profundidade da pizza A espessura de cada seção em um gráfico de pizza Gráfico radial Exibe dados multivariados como um gráfico bidimensional de três ou mais variáveis quantita tivas representadas em eixos com o mesmo ponto de partida Tabela Um conjunto de elementos de dados exibidos em colunas verticais (identificadas por nome) e linhas horizontais. A célula é a unidade na qual uma linha e uma coluna se cruzam. Nuvem de tags Uma representação gráfica das tags geradas pelo usuário que estão anexadas ao conteúdo online, geralmente, utilizando cor e tamanho de fonte para representar a importância ou fre quência das tags Árvore Uma estrutura de dados que simula uma estrutura hierárquica em árvore (com um valor raiz e subárvores de filhos) representada como um conjunto de nós conectados Mapa de árvore Representa grandes volumes de dados estruturados hierarquicamente (em árvore) Valor O valor primário usado em um gráfico de funil ou o número exibido em um gráfico de ponto numérico Peso A intensidade da cor em cada área de um gráfico de mapa ou o tamanho de uma palavra em uma nuvem de tags Por exemplo, se você criar uma nuvem de tags exibindo a receita em cada país e a receita for usada para determinar o peso da palavra, os nomes dos países com receita maior serão exibidos maiores do que os daqueles com receita menor. Tabela 45: Prateleiras para dimensões Prateleira Descrição Animação Adiciona uma animação ao gráfico. Quando você clica no botão de reprodução abaixo do grá fico, o gráfico circula pelos valores da dimensão adicionada a essa prateleira. Cor da área A cor usada para cada área em um gráfico de mapa Nome da área A etiqueta usada para cada área em um gráfico de mapa Peso da área O peso a ser dado a cada área em um gráfico de mapa Eixo Um eixo do gráfico. Pode haver várias prateleiras de eixo disponíveis. Por exemplo, se você selecionar um Gráfico de barras, será exibida a prateleira Eixo Y. Altura da bolha A altura de uma bolha em um gráfico de bolhas Largura da bolha A largura de uma bolha em um gráfico de bolhas 104 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Visualizando dados Prateleira Descrição Categoria Seções de dados em um gráfico de funil Cor As cores da legenda do gráfico. As cores são atualizadas no gráfico para corresponderem à legenda. Geografia Os dados geográficos em um gráfico geográfico Formato da legenda A forma de cada entrada na legenda e cada ponto de dados. Essa opção só se aplica a gráficos de dispersão. Link de rede Os nós em um gráfico de rede Dados de sobreposição Uma sobreposição de dados extra em um gráfico de pizza geográfico. Quando várias dimen sões são adicionadas, os gráficos de pizza são criados no mapa geográfico. Ramificações radiais Variáveis quantitativas representadas em eixos com o mesmo ponto de partida em um gráfico radial Subtotais de linha Adiciona um subtotal às linhas em uma tabela Nó de árvore Os nós em um gráfico de árvore Palavra O texto exibido em uma nuvem de tags Cor da palavra A cor do texto em uma nuvem de tags Peso da palavra O peso do texto em uma nuvem de tags É possível adicionar dimensões às treliças para criar gráficos adicionais a fim de comparação. Por exemplo, se você criar um gráfico de barras comparando a receita por região e adicionar um país à treliça, vários gráficos serão exibidos. Cada gráfico exibirá a receita por região para um país. Informações relacionadas Criando um gráfico com o Gerador de gráficos [página 106] Adicionar ou modificar um gráfico predefinido [página 107] 11.1.1.3.1 Propriedades do gráfico A configuração de propriedades para um gráfico pode aumentar sua usabilidade. Por exemplo, a adição de etiquetas e legendas pode aprimorar a análise visual dos dados. Para configurar as propriedades do gráfico, selecione o ícone Configurações Guia do usuário do Expert Analytics Visualizando dados acima da Tela do gráfico. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 105 Tabela 46: Propriedades do gráfico Propriedade Descrição Mostrar título Adiciona um título ao gráfico. Você pode editar o título a qualquer momento. Mostrar legenda Adiciona uma legenda que exibe uma cor diferente para cada medida em um gráfico. Para adicionar dimensões à legenda com cores diferentes, selecione Cor da legenda no Gerador de gráficos. Mostrar etiquetas de dados Exibe os valores de medida para cada dimensão em um gráfico Usar medidas como uma dimensão Define duas ou mais medidas como uma dimensão em um gráfico para mostrar como os dados são distribuídos entre várias medidas em um eixo só. Você deve adicionar, pelo menos, duas medidas a um gráfico antes de selecio nar essa opção. A medida é exibida como uma nova faceta de dimensão no Ge rador de gráficos. Definir escala do eixo Define os limites para os valores exibidos no eixo Y, como um intervalo ou auto maticamente como o maior valor de medida. Essa opção só se aplica a gráficos com medidas no eixo Y. 11.1.1.3.2 Criando um gráfico com o Gerador de gráficos O Gerador de gráficos lhe dá mais controle sobre a criação de gráficos do que a Tela do gráfico. O Gerador de gráficos está localizado no lado direito da sala Visualizar e exibe as opções para o tipo de gráfico selecionado. 1. Na divisão Visualizar ou Criar, selecione o ícone Gerador de gráficos 2. No Gerador de gráficos, selecione o tipo do gráfico a ser criado. . Gráfico de barras é o tipo de gráfico padrão. Você pode alterar o tipo de gráfico a qualquer momento. 3. Selecione uma prateleira vazia no Gerador de gráficos e selecione medidas e dimensões para o gráfico na lista exibida ou arraste uma faceta para uma prateleira vazia. Cada gráfico deve ter pelo menos uma medida. Quando você adiciona uma dimensão a um gráfico, os valores desta dimensão são calculados com base nas medidas do gráfico. 4. Adicione outras medidas e dimensões, conforme necessário. Por exemplo, se você selecionar Gráfico de colunas com 2 eixos Y, precisará adicionar uma medida ou dimensão aos eixos Y no lado esquerdo e no lado direito da Tela do gráfico. 5. Para filtrar os dados no gráfico, selecione o ícone Adicionar filtros selecione a dimensão a ser usada como filtro. 6. Selecione o ícone +na Galeria de visualização para adicionar o gráfico à história. O gráfico está disponível na Galeria de visualização e na divisão Criar. Cada gráfico que você cria na divisão Visualizar é salvo automaticamente na sessão atual e disponibilizado na divisão Criar. No entanto, ele não é salvo automaticamente na história. 7. Salve a história. Salvar a história garante que o gráfico estará disponível da próxima vez que abri-la. 106 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. na parte superior da Tela do gráfico e Guia do usuário do Expert Analytics Visualizando dados Informações relacionadas Filtragem de dados do gráfico [página 111] Como salvar uma história [página 125] Histórias e dados visualizados [página 119] Trabalhando com o Gerador de gráficos [página 103] 11.1.1.3.3 Adicionar ou modificar um gráfico predefinido A aba Visualizações relacionadas contém gráficos predefinidos sugeridos baseados nas medidas e dimensões em um conjunto de dados. Todo gráfico precisa ter, pelo menos, uma medida. Quando você adiciona uma dimensão a um gráfico, os valores desta dimensão são calculados a partir das medidas do gráfico. Você pode selecionar qualquer gráfico na aba Visualizações relacionadas para começar a visualizar imediatamente os dados e então modificar os dados para suas necessidades de informação. 1. Na sala Visualizar, abra a aba Visualizações relacionadas, selecione um gráfico predefinido e selecione o botão +na Galeria de visualização para adicionar o gráfico à história atual. Isso garante que o gráfico não será substituído por um gráfico predefinido mais tarde. 2. Selecione o ícone Visualizações relacionadas . 3. Na lista de sugestões de gráficos, selecione Mostrar tudo para exibir todas as sugestões de gráficos. 4. Selecione o gráfico a ser adicionado. O gráfico é exibido na Tela do gráfico, e suas facetas são carregadas no Gerador de gráficos. 5. Utilize o Gerador de gráficos para adicionar ou modificar dimensões e medidas: ○ Para adicionar medidas ou dimensões, selecione uma prateleira vazia no Gerador de gráficos e selecione medidas e dimensões para o seu gráfico na lista que é exibida. ○ Para adicionar uma faceta ao gráfico, arraste a faceta para uma prateleira vazia. ○ Posicione o ponteiro do mouse sobre a faceta e selecione o ícone Excluir arraste uma faceta para fora da prateleira para removê-la. para remover uma faceta, ou 6. Para filtrar os dados no gráfico, selecione o ícone Adicionar filtros selecione uma dimensão para ser usada como filtro. 7. Selecione o botão +na Galeria de visualização para adicionar o gráfico à história. O gráfico está disponível na Galeria de visualização e na divisão Criar. Cada gráfico que você cria na divisão Visualizar é salvo automaticamente na sessão atual e disponibilizado na divisão Criar. No entanto, ele não é salvo automaticamente na história. 8. Salve a história. Salvar a história garante que o gráfico estará disponível da próxima vez que abri-la. Guia do usuário do Expert Analytics Visualizando dados na parte superior da Tela do gráfico e PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 107 Informações relacionadas Filtragem de dados do gráfico [página 111] Como salvar uma história [página 125] Histórias e dados visualizados [página 119] Trabalhando com o Gerador de gráficos [página 103] 11.1.1.3.4 Adição de cálculo Você pode adicionar um ou mais cálculos à uma visualização. Os seguintes cálculos estão disponíveis: ● Soma acumulada ● Mínimo acumulado ● Máximo acumulado ● Contagem acumulada ● Contagem acumulada (valores vazios excluídos) ● Média acumulada ● Média acumulada (valores vazios excluídos) ● Média móvel ● Porcentagem 1. No Gerador de gráficos, selecione a medida na visualização à qual deverá ser adicionado um cálculo. 2. Selecione o ícone Opções 3. Selecione um cálculo na lista. e selecione Adicionar cálculo. A visualização será atualizada para incluir o cálculo e uma faceta que contém o cálculo é exibida no Gerador de gráficos. 11.1.1.3.5 Remoção de um cálculo 1. No Gerador de gráficos, selecione a faceta na medida que contém o cálculo a ser removido. 2. Selecione o ícone Excluir 11.1.1.3.6 . Renomeando um gráfico O título exibido acima de um gráfico é gerado automaticamente pelas medidas e dimensões adicionadas ao gráfico. Selecione o ícone Opções 108 ao lado do título, selecione Renomear e insira um novo título. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Visualizando dados Dica Clique duas vezes em um título para alterá-lo rapidamente. 11.1.1.3.6.1 Restaurando o título padrão de um gráfico Após a alteração do título de um gráfico, se necessário, você poderá restaurar o título original que foi gerado automaticamente a partir das medidas e dimensões no gráfico. Selecione o ícone Opções 11.1.2 ao lado do título e selecione Restaurar título predefinido. Classificando dados As medidas e dimensões podem ser classificadas em ordem crescente ou decrescente. 11.1.2.1 Ordenação por medida Antes de poder organizar por medida, se os dados do gráfico foram filtrados por classificação, a classificação deve ser removida. 1. Selecione uma medida no Gerador de gráficos. 2. Selecione o ícone Configurações decrescente. e selecione Classificação em ordem crescente ou Classificação em ordem Dica Selecione o ícone organizar ordem de classificação. na barra de ferramentas da Tela do gráfico para reverter rapidamente a Os dados do gráfico são classificados. 11.1.2.2 Ordenação de dimensões Quando o painel Medidas e dimensões é exibido em um layout horizontal, você pode selecionar quais dimensões são visíveis no painel. A ordenação das dimensões não interfere nos dados exibidos em uma visualização. 1. Selecione o ícone Orientação horizontal 2. Selecione a dimensão a ser organizada e selecione o ícone Opções Guia do usuário do Expert Analytics Visualizando dados no painel Medidas e dimensões. . PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 109 3. Escolha uma ordenação: ○ Para uma dimensão numérica, selecione Ordenar de menor para maior ou Ordenar de maior para menor. ○ Para uma dimensão alfanumérica, selecione Ordenar de A para Z ou Ordenar de Z para A. ○ Para uma dimensão de data ou hora, selecione Mostrar de mais antigo a mais recente ou Mostrar de mais recente a mais antigo. Os dados na coluna da dimensão são ordenados. 11.1.2.3 Organização de dimensões por ocorrência no painel Medidas e dimensões Você pode organizar dimensões visíveis no painel Medidas e dimensões pelo número de vezes que cada valor da dimensão ocorre em um conjunto de dados. A ordenação das dimensões não interfere nos dados exibidos em uma visualização. 1. Selecione o ícone Orientação horizontal 2. Exibir o número de ocorrências: no painel Medidas e dimensões. a. Posicione o ponteiro do mouse sobre a dimensão a ser filtrada. b. Selecione o ícone Opções e selecione Mostrar medida e Ocorrências. O número de ocorrências é exibido ao lado de cada valor da dimensão na coluna. 3. Organizar por ocorrência: a. Posicione o ponteiro do mouse sobre a dimensão que selecionou na etapa 2. b. Selecione o ícone Opções e selecione Ordenar por medida de menor para maior ou Ordenar por medida de maior para menor. Os dados na coluna da dimensão são ordenados por ocorrência. 11.1.2.4 Ordenação de dimensões por ocorrência na caixa de diálogo do filtro Na caixa de diálogo do filtro, você pode ordenar dimensões pelo número de vezes que cada dimensão ocorre no conjunto de dados. A ordenação das dimensões não interfere nos dados exibidos em uma visualização. A ordenação por ocorrência só está disponível para valores de dimensões distintos. Não há suporte para intervalo de valores na caixa de diálogo do filtro. 1. Selecione o ícone Adicionar filtros 2. Na lista exibida, selecione uma dimensão. 3. Selecione Visualizar # Ocorrências. O número de ocorrências aparece do lado de cada valor de dimensão e na lista de valores. 4. Posicione o ponteiro do mouse sobre um nome da dimensão e selecione o ícone Opções 110 . PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. . Guia do usuário do Expert Analytics Visualizando dados 5. Selecione Ordenar por ocorrências da menor para a maior ou Ordenar por ocorrências da maior para a menor. A lista de valores de dimensões é ordenada por ocorrência. Informações relacionadas Adição de filtros [página 111] Organização de dimensões por ocorrência no painel Medidas e dimensões [página 110] 11.1.3 Filtragem de dados do gráfico Ao filtrar dados em um gráficos, os filtros se aplicam aos dados exibidos no gráfico (e não ao conjunto de dados). ● Selecione o ícone Adicionar filtros ● Selecione pontos de dados em um gráfico para filtrá-los ou excluí-los ● Use o painel Medidas e dimensões para selecionar os dados a serem exibidos ● Exiba apenas os pontos de dados de classificação superior ou inferior 11.1.3.1 Adição de filtros Você pode adicionar filtros para valores discretos, de dados e numéricos em dimensões. 1. Na divisão Visualizar, selecione o ícone Adicionar filtros 2. Selecione uma dimensão na lista. acima da Tela do gráfico. Se uma dimensão inclui um ícone de hierarquia da dimensão todas as dimensões incluídas na hierarquia. , selecione para ampliar a lista e exibir Uma caixa de diálogo é exibida para o tipo da dimensão na qual está filtrando. Para valores discretos, uma lista de valores de dados é exibida na caixa do diálogo. Para valores de data e numéricos, um filtro de intervalo está disponível nela. 3. Execute uma das seguintes ações para selecionar valores de dados: Opção Descrição Para valores discretos Selecione um ou mais valores na lista. Quando você move o ponteiro do mouse sobre o nome da dimensão, um ícone localizar é exibido e você poderá pesquisar por uma dimensão. Para valores da data Utilize o filtro de intervalo para incluir todas as datas dentro de um intervalo específico, e escolha se quer excluir valores em branco. Guia do usuário do Expert Analytics Visualizando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 111 Opção Descrição Deslize as barras para aumentar ou diminuir o intervalo de data, insira as datas ou utilize o calendário para selecionar datas. Utilize o filtro de intervalo para incluir todos os números dentro de um intervalo específico, e escolha se quer excluir valores em branco. Para valores numéricos Deslize as barras para aumentar ou diminuir o intervalo de números, ou selecione a etiqueta de número e insira um valor. 4. Selecione OK. Um token de filtro listando os pontos de dados selecionados aparece acima do gráfico. Para remover um filtro, selecione o ícone Excluir 11.1.3.2 . Filtragem ou exclusão de pontos de dados em um gráfico Você pode excluir pontos de dados não relevantes ou filtrar pontos de dados para concentrar seu gráfico em um conjunto de dados específico. 1. Na Tela do gráfico, selecione os pontos de dados a serem excluídos ou filtrados. Dica Arraste para desenhar uma caixa ao redor de um grupo de ponto de dados a ser selecionado. 2. Na dica exibida, selecione Filtrar ou Excluir. Um token de filtro listando os pontos de dados selecionados aparece acima da Tela do gráfico. Para remover um filtro, selecione o filtro e selecione o ícone Excluir 11.1.3.3 . Filtragem de dados com o painel Medidas e dimensões 1. Selecione o ícone Orientação horizontal horizontal. 2. No painel Medidas e dimensões, selecione um ou mais pontos de dados na dimensão para a filtragem. 3. Selecione o ícone Opções 4. Dependendo do tipo de filtro a ser aplicado, selecione uma das seguintes opções: 112 para exibir o painel Medidas e dimensões em um layout . PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Visualizando dados Opção Descrição Limpar seleções Limpa todos os valores selecionados na dimensão Incluir inclui os valores selecionados no gráfico. Um token de filtro, com os valores selecionados, é exibido na barra do filtro. Excluir Exclui os valores selecionados do gráfico. Um token de filtro, com os valores selecionados, é exibido na barra do filtro em uma fonte tachada. Os dados no gráfico são filtrados. Para remover um filtro, selecione o ícone Excluir 11.1.3.4 no token do filtro. Filtragem de dados por classificação A filtragem de dados por classificação foca uma visualização em um número específico de pontos de dados com os valores mais altos ou mais baixos. 1. Na barra de ferramentas da Tela do gráfico medida.. , selecione Adicionar ou processar uma classificação por 2. No diálogo Classificação, selecione uma medida para a classificação. 3. Selecione Superior ou Inferior como o foco da classificação. 4. Escolha o número de resultados que serão exibidos. O valor predeterminado é 3. 5. Selecione (TODOS) para classificar os dados com base em todas as dimensões ou selecione uma dimensão na qual classificar os dados. Por exemplo, se um gráfico mostra Receita de vendas por país e Linha do produto, classificar os cinco pontos de dados superiores por País exibirá dados para cada linha do produto nos cinco países com a maior receita de vendas. 6. Selecione OK. O gráfico exibe os dados que fitrou. Para processar ou remover uma classificação, no Gerador de gráficos, selecione a medida à qual aplicou a classificação e selecione o ícone Opções 11.1.4 . Aplicação de formatação condicional A formatação condicional destacar pontos de dados importantes em uma tabela e ser utilizada para distinguir valores que correspondem a uma condição (como ser maior que um certo número ou estar dentro de um certo intervalo). Você pode definir várias regras de formatação condicional e gerenciá-las no diálogo Gerente de regras. Guia do usuário do Expert Analytics Visualizando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 113 Várias regras de formatação condicional ● Quando você cria várias regras de formatação condicional com base na mesma medida, as células podem corresponder às condições para várias regras. Quando isso acontece, todas as regras que se aplicam a uma célula (ou seja, regras ativas) são consideradas um conjunto. A formatação para o conjunto (de todas as regras ativas) será aplicada ou nenhuma formatação será aplicada, dependendo das prioridades da regra. ● Para cada célula em uma tabela, o conjunto de formatação para a regra ativa com maior prioridade é aplicado primeiro. A formatação para regras de menor prioridade também pode ser aplicada. No entanto, se dois conjuntos de formatação para regras ativas que modificam o mesmo atributo forem conflitantes, nenhuma formatação definida para a regra de prioridade inferior será aplicada à célula. ● Para cada célula em uma tabela, a formatação Negrito e Itálico pode ser aplicada apenas pela regra ativa de maior prioridade. Exemplo Em uma tabela com uma medida que mostra uma redução do estoque nos pontos de venda de sua empresa, você pode usar a formatação condicional para identificar lojas com taxas mais altas de redução. Uma regra de formatação condicional pode alterar a cor do plano de fundo da célula na coluna Redução para cada loja com uma redução maior do que um montante que especificar. Exemplo Uma célula possui condições para três regras de formatação condicional. A regra ativa de maior prioridade define a fonte como Times New Roman. A regra com a segunda maior prioridade define a cor do plano de fundo como vermelha. A regra final definiria a cor do plano de fundo como preta e a cor da fonte como branca, mas essa regra é ignorada pois está em conflito com a segunda regra. 11.1.4.1 Criação de uma regra de formatação condicional Por predefinição, novas regras de formatação condicional têm uma prioridade superior às regras mais antigas. Antes de poder definir uma regra de formatação condicional, uma medida deve ter sido adicionada à uma tabela. 1. Selecione o ícone Criar nova regra formatação condicional . 2. Na caixa de diálogo Editor de regra, insira um nome para a regra. Se você não inserir um nome para a regra, essa será nomeada automaticamente com base na condição que definiu. 3. Na lista Baseda em, escolha um medida. Essa medida determina os valores que são utilizados para a regra e a coluna na qual a formatação é exibida. 4. Selecione um operador e insira um ou mais valores para a condição. 5. Selecione Formatar, escolha a aparência das células que correspondem à condição e selecione OK. 6. Na caixa de diálogo Editor de regra, selecione OK. A regra de formatação condicional é aplicada à tabela. Caso necessário, você pode utilizar a caixa de diálogo Gerente de regras para alterar a prioridade das regras. 114 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Visualizando dados 11.1.4.2 Gerenciamento de regras de formatação condicionais Utilize o diálogo Gerente de regras para processar, adicionar ou remover, ativar ou desativar e definir a ordem de prioridade de regras. Antes de poder gerenciar regras de formatação condicional, uma medida deve ter sido adicionada à uma tabela. 1. Selecione a seta próxima ao ícone Criar nova regras de formatação condicional regras. A caixa de diálogo Gerente de regras é exibida. 2. Execute qualquer uma das seguintes ações para modificar as regras de formatação condicional para a tabela: 3. e selecione Gerenciar Opção Descrição Criar uma regra Selecione o ícone +. Excluir uma regra Selecione o ícone -. Modificar uma regra Selecione a regra na lista e selecione Processar regra. Desativar uma regra Desmarque a caixa de seleção na coluna Aplicado próxima ao nome da regra. Regras desativadas não são aplicadas à tabela, mas você poderá ativá-las novamente caso seja necessário. Alterar a prioridade de uma regra Selecione a regra e utilize os ícone de seta Alterar ordem da regra para movê-la para cima ou para baixo na lista. Selecione OK. 11.1.5 Dados hierárquicos O ícone Hierarquia da dimensão indica que uma hierarquia está associada a uma dimensão. Há diversas maneiras de localizar e interagir com dados hierárquicos. 11.1.5.1 Localizando dimensões em uma hierarquia Relacionamentos hierárquicos entre as dimensões são visíveis no painel Medidas e dimensões. Somente a faceta que contém o nível mais alto de uma hierarquia é exibido no painel Medidas e dimensões, mas você pode ampliar a faceta para ver níveis adicionais. Você pode adicionar uma dimensão em qualquer nível da hierarquia a um gráfico. Realize uma das seguintes ações: ○ Se o painel Medidas e dimensões estiver na orientação vertical, selecione o ícone +ao lado de uma dimensão para exibir todas as dimensões na hieraquia. ○ Se Medidas e dimensões estiver na orientação horizontal, procure dimensões exibidas uma ao lado das outras na hierarquia. Guia do usuário do Expert Analytics Visualizando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 115 11.1.5.2 Alteração do nível da hierarquia exibida no Gerador de gráficos Se uma dimensão que contém uma hierarquia estiver incluída em um gráfico, o nível exibido no gráfico poderá ser alterado no Gerador de gráficos. 1. Selecione uma faceta que contenha uma hierarquia. 2. Selecione o ícone de seta para baixo para escolher o nível da hierarquia. O gráfico exibe o nível selecionado e um filtro que reflete o nível da hieraquia é exibido acima da Tela do gráfico. 11.1.5.3 Pesquisar níveis inferiores de dados hierárquicos Se uma dimensão que contém uma hierarquia estiver incluída em um gráfico, você poderá pesquisar o nível inferior, um por um, por meio de dados na Tela do gráfico. 1. Selecione um ponto de dados no gráfico ou uma etiqueta de eixo. 2. Na dica exibida, selecione o ícone pesquisar níveis inferiores . O gráfico exibe os dados em um nível inferior na hierarquia. Um token de filtro é exibido acima do gráfico e a etiqueta de eixo atualiza para refletir a seleção. 11.1.5.4 Analisar rapidamente os dados hierárquicos Se você pesquisou o nível inferior de dados em um gráfico, você pode pesquisar níveis superiores, um a um, na Tela do gráfico. Selecione o ícone Analisar rapidamente de níveis inferiores. acima da Tela do gráfico ou remova os tokens criados pela pesquisa O gráfico exibe os dados selecionados. 11.1.6 Localizando medidas, dimensões e valores de dados Você pode pesquisar medidas e dimensões por nome e pesquisar valores de dimensão. O ícone localizar ● 116 encontra-se no painel Medidas e dimensões Quando o painel está em orientação vertical, você pode usar o ícone dimensões por nome. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. para pesquisar medidas e Guia do usuário do Expert Analytics Visualizando dados ● Quando o painel está em orientação horizontal, o ícone fica disponível quando o ponteiro está posicionado dentro da coluna, e você pode usá-lo para pesquisar cada dimensão por valores de dados específicos. Tabela 47: Operadores para pesquisas Operador suportado Descrição * Corresponda qualquer caractere nenhuma ou várias vezes. Por exemplo, digitar a*a retornará qualquer palavra que con tenha a letra "a" seguida por uma combinação de letras e ou tra letra "a". Corresponda qualquer caractere uma vez. ? Por exemplo, digitar a?a retornará qualquer palavra que con tenha a letra "a" seguida por qualquer letra individual e outra letra "a". Se uma dimensão contém etiquetas mapeadas, selecione o ícone Opções Procurar por etiqueta. , e selecione Procurar por chave ou Não é possível procurar cadeias de texto com os caracteres literais * e ?. O controle para localização está disponível para dimensões de textos e números inteiros. Ele não está disponível para dimensões de data, hora, marca de horário ou números quebrados. 11.1.7 Medidas associadas a dimensões Você deve exibir o painel Medidas e dimensões na orientação horizontal para visualizar os valores de medida associados a cada dimensão. Também é possível visualizar o número de vezes que cada valor de dimensão ocorre em um conjunto de dados. Exemplo Supondo que um conjunto de dados contenha uma medida chamada “Número de jogos ganhos” (calculada como soma) e uma dimensão chamada “Nome da equipe”. Você pode exibir o número total de jogos que cada equipe ganhou ao lado do nome de cada equipe no painel Medidas e dimensões. 11.1.7.1 1. Visualização de uma medida associada a uma dimensão Selecione o ícone Orientação horizontal horizontal. Guia do usuário do Expert Analytics Visualizando dados para exibir o painel Medidas e dimensões em um layout PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 117 2. Posicione o ponteiro do mouse sobre a dimensão do filtro e selecione o ícone Opções dimensão. 3. Selecione Mostrar medida e selecione a medida a ser visualizada. ao lado da Um valor de medida é exibido ao lado de cada valor na coluna de dimensão. 11.1.7.2 Visualização do número de ocorrências dos valores de dimensão Você pode visualizar o número de vezes que cada dimensão aparece no seu conjunto de dados. 1. Selecione o ícone Orientação horizontal horizontal. 2. Posicione o ponteiro do mouse sobre a dimensão do filtro e selecione o ícone Opções dimensão. 3. Selecione Exibir medida para exibir o painel Medidas e dimensões em um layout ao lado da Ocorrências . O número de ocorrências é exibido ao lado de cada valor de dimensão na coluna. Informações relacionadas Organização de dimensões por ocorrência no painel Medidas e dimensões [página 110] 11.1.8 Tipos de agregação suportados Os tipos de agregação suportados pelo SAP Lumira incluem soma, contagem, mínimo e máximo. Você não pode alterar o tipo de agregação de uma medida. No entanto, você pode adicionar medidas que representam cálculos, outras unidades de medida e valores de moeda mais complexos. 118 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Visualizando dados 12 Criando histórias 12.1 Histórias e dados visualizados Uma história é um documento de apresentação que usa visualizações, blocos de texto, imagens, elementos gráficos e controles de entrada para descrever dados. Uma história pode incluir diversas páginas e cada página pode ter seu próprio layout – quadro, infográfico ou relatório. Após obter os dados e criar uma história, a primeira etapa é escolher um layout para a primeira página da história. 12.1.1 Elemento de página Depois de escolher o layout de página de uma história, você pode formatar suas páginas na divisão Compor. Use a divisão Compor para criar e processar documentos em estilo de apresentação conhecidos como histórias. Histórias usam visualizações, blocos de texto, imagens, gráficos e controles de entrada para descrever seus dados. Elas podem incluir diversas páginas e cada página pode ser um quadro, infográfico ou relatório. Tabela 48: Elementos de CONFIGURAÇÕES DA PÁGINA no painel Configurações da página Layout da pá Elementos de página que podem ser adicionados gina Quadro CONFIGURAÇÕES DA PÁGINA ● Infográfico Título do quadro: Selecione o campo de seleção Mostrar título para exibir o título da página de quadro. ● Cor do plano de fundo: Selecione uma cor de fundo para a página de quadro. ● Imagem do plano de fundo: Adicionar uma imagem de plano de fundo à página do quadro. CONFIGURAÇÕES DA PÁGINA ● Tamanho: Selecione Padrão (4:3), Widescreen (16:9) ou Rolagem contínua. ● Cor do plano de fundo: Selecione uma cor de fundo para a página de infográfico. ● Propriedades da grade: Marque o campo de seleção Mostrar para exibir as linhas de grade na página de infográfico. ● Atualizar página: Selecione esta opção para atualizar as visualizações na página de infográfico. ● Atualizar página ao abrir: Selecione ATIVAR para atualizar a página de infográfico ou DESATIVAR para impedir a atualização da página quando ela for aberta. Relatório COR DO PLANO DE FUNDO: Selecione uma cor de fundo para a página de relatório. Guia do usuário do Expert Analytics Criando histórias PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 119 Tabela 49: Elementos de COR DA SEÇÃO no painel Configurações da página Elemento de página Elemento de formatação Cor do plano de COR DO PLANO DE FUNDO: Selecione uma cor de plano de fundo para a seção da página. fundo 120 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Criando histórias Tabela 50: Elementos de PROPRIEDADES DE VISUALIZAÇÃO no painel Configurações da página Elemento de página Elemento de formatação Visualizações PROPRIEDADES DE VISUALIZAÇÃO ● Geral: ○ Mostrar título do gráfico: Selecione esta opção para exibir o título do gráfico e formatá-lo. ○ Mostrar legenda: Selecione esta opção para exibir a legenda do gráfico e formatá-la. ○ Mostrar etiquetas de dados: Selecione esta opção para exibir os valores para cada dimensão em um gráfico. ○ Formatar etiquetas de dados: Selecione esta opção para formatar os valores para cada di mensão em um gráfico. ● Eixo X e Eixo Y: ○ Mostrar eixo: Selecione esta opção para exibir o eixo. ○ Mostrar título do eixo: Selecioneesta opção para exibir o título do eixo e formatá-lo. ○ Mostrar etiquetas de eixo: Selecioneesta opção para exibir as etiquetas do eixo e formatá-la. ● Gráficos de barra ● Coluna: Selecione uma forma de coluna e uma cor para o gráfico de linha. ● Elementos do gráfico de linha: ○ Área do gráfico: Selecione a cor de plano de fundo da área do gráfico. ○ Título do gráfico: Exibir o título do gráfico e formatá-lo. ○ Área de plotagem: Selecione a cor de plano de fundo da área de plotagem. ○ Legenda: Exibir uma legenda do gráfico, e exibir um título de legenda e formatá-lo. ○ Etiqueta de dados: Exibir etiquetas de dados ou pictogramas de etiqueta de dados. ○ Eixo horizontal: Exibir a linha do eixo e o registrador, exibir as etiquetas de eixo e formatá-las, e exibir os pictogramas de eixo. ○ Título do eixo horizontal: Exibir o título do eixo e formatá-lo. ○ Eixo vertical: Exibir a linha do eixo e o registrador, exibir as etiquetas de eixo e formatá-las, e ajustar a escala de valor do eixo. ○ ● Título do eixo vertical: Exibir o título do eixo e formatá-lo. ○ Marcador: Selecione e formate um pictograma para representar pontos de dados. ○ Linha: Definir a cor da linha, a espessura e o estilo. ○ Área de plotagem: Mostrar ou ocultar as linhas de grade. Elementos do diagrama em anel: ○ Área do gráfico: Modificar o tamanho do círculo interno da rosca. ○ Título do gráfico: Exibir o título do gráfico e formatá-lo. ○ Área de plotagem: Modificar a cor de plano de fundo da área de plotagem. ○ Legenda: Exibir uma legenda do gráfico, e exibir um título de legenda e formatá-lo. ○ Parte: Modificar a cor de uma parte da rosca (para chamar atenção para o ponto de dados). ○ Etiqueta de dados: Marque o campo de seleção Mostrar etiqueta de dados para exibir as eti quetas de dados e formatá-las. Guia do usuário do Expert Analytics Criando histórias PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 121 Elemento de página Elemento de formatação Texto PROPRIEDADES DO TEXTO Imagens ● Fonte: Selecione o estilo da fonte, o tamanho e a cor do texto. ● Cor do plano de fundo: Selecione a cor de plano de fundo para o texto. ● Alinhamento: Selecione a justificação de parágrafo para o texto. ● Listas: Adicionar listas com marcadores ou numeradas ao texto. ● Hyperlink: Adicionar, editar ou remover um hyperlink. ● Texto dinâmico: Adicionar, editar ou remover um texto dinâmico. PROPRIEDADES DA IMAGEM ● Modo de exibição: Selecione como controlar a escala da imagem. ○ Conter: A imagem inteira fica dentro do quadro, mantendo a proporção de aspecto ○ Cobrir: A imagem é dimensionada para cobrir ou preencher o quadro inteiro, mantendo a pro porção de aspecto. Algumas partes da imagem podem ser cortadas. ○ Expandido: A imagem inteira é expandida para preencher todo o quadro. ○ Panorâmica: A imagem é dimensionada para preencher a dimensão horizontal do quadro. A parte inferior da imagem pode ser cortada. Controles de entrada ● Cor do plano de fundo: Selecione uma cor de plano de fundo para a imagem. ● Ações da imagem: Adicionar, editar ou remover um hyperlink. MODO DE SELEÇÃO: Selecione Individual ou Multi (múltipla) para os filtros. (filtros) Pictogramas Formas PROPRIEDADES DO PICTOGRAMA ● Cor de preenchimento: Selecione a cor de preenchimento do pictograma. ● Cor da linha: Selecione a cor da linha para o pictograma. ● Ações do pictograma: Adicionar, editar ou remover um hyperlink. PROPRIEDADES DA FORMA ● Cor de preenchimento: Selecione a cor de preenchimento a forma. ● Cor da linha: Selecione a cor da linha para a forma. ● Largura da linha: Selecione a largura das linhas (em pixels) para uma forma. ● Ações da forma: Adicionar, editar ou remover um hyperlink. Tabela 51: AÇÕES no painel Configurações da página Ação Descrição Organizar itens Escolha onde os itens serão posicionados em relação a outros itens: Enviar em ordem inversa, Enviar para trás, Trazer à frente, ou Trazer para frente. Alinhamento Escolher como o item será alinhado: Alinhar à esquerda, Centralizar, Alinhar à direita,Alinhar acima, Alinhar no meio, ou Alinhar embaixo. 122 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Criando histórias Ação Descrição Outras ações Selecione Duplicar para copiar o item ou Expandir para expan dir o item na dimensão da janela. Tamanho e posição Selecione largura, altura, posição do eixo X, posição do eixo Y e ângulo do item. 12.1.2 Criando uma história Você pode usar quadros, infográficos e relatórios para criar histórias sobre dados. 1. Na divisão Compor, selecione Nova história. 2. Selecione Quadro, Infográfico ou Relatório como layout para a primeira página da história. As opções de modelo de página serão exibidas para o estilo que você selecionar. 3. Insira um nome para a história caso necessário e selecione Criar. Os elementos que podem ser adicionados à página são exibidos à esquerda da janela. Figuras já importadas são exibidas no grupo Figuras. 4. Arraste os elementos para a página conforme necessário: ○ Nos layouts de página Quadro e Relatório, adicione Controles de entrada – dimensões que você pode adicionar do Painel de conteúdo à página para filtrar os dados exibidos. Arraste uma dimensão para a página e selecione um ou mais valores. Os gráficos são atualizados com os valores aplicados pelo filtro. ○ Os layouts Infográfico são divididos em seções que você pode redimensionar, reposicionar ou excluir. ○ Nos layouts de página Quadro, você pode reposicionar um elemento arrastando o ícone em forma de diamante no canto superior direito do elemento. ○ Nos layouts de página Relatório, você pode redimensionar os itens (mas não reposicioná-los). Você pode usar a barra de rolagem da página para visualizar todos os elementos em uma tabela. Nota Os gráficos adicionados às páginas Quadro ou Relatório serão atualizados se forem modificados na divisão Visualizar. No entanto, gráficos adicionados a uma página de Infográfico não serão atualizados por modificações efetuadas na divisão Visualizar. 5. Para criar páginas adicionais, selecione Adicionar página e repita as etapas de 2 a 4. 6. Salve a história. Se você fechar o navegador sem gravar a história, seu trabalho será perdido. 12.1.2.1 Formatando uma história Uma história tem uma ou mais páginas, e cada página pode ter uma ou mais seções. Você pode formatar a aparência geral de cada página e de cada elemento usado na página, adicionando cor, formatação de texto, alinhamento de parágrafo, títulos de gráficos, etiquetas de eixo, legendas e formatação de forma e linha. Guia do usuário do Expert Analytics Criando histórias PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 123 1. Na divisão Compor, abra a página da história a ser formatada. O painel Configurações do quadro exibe as opções disponíveis para este tipo de página. 2. Selecione as opções de formatação de página conforme necessário. 3. Selecione um elemento na página. O painel Configurações do quadro exibe as opções disponíveis para este elemento. 4. Selecione as opções de formatação conforme necessário. 5. Salve a história. 12.1.2.2 Adição de texto dinâmico a uma história Em todos os layouts de página, você pode adicionar texto dinâmico baseado em medidas do conjunto de dados. O texto dinâmico é atualizado quando o conjunto de dados é atualizado. Você não pode criar um texto dinâmico com base em dimensões, você não pode adicionar um texto dinâmico e um hiperlink ao mesmo texto. 1. Na opção Criar, selecione a página para adicionar o texto dinâmico. 2. Selecione o elemento de texto e posicione o cursor onde deseja inserir o texto dinâmico – ou selecione o texto que deseja substituir pelo texto dinâmico. 3. No painel PROPRIEDADES DO TEXTO, selecione o ícone Adicionar ou processar texto dinâmico O diálogo Nova fórmula é exibido. 4. Digite um nome para a fórmula. 5. Clique duas vezes em medidas e funções para inseri-las na caixa de sintaxe Fórmula. 6. Insira os parâmetros da função e as informações correlatas, com base na tarefa da função. . Você deve digitar os nomes das colunas usadas nessa fórmula. Nomes das colunas que você sugeriu após começar a digitar. 7. Se estiver entrando informações de calendário e precisar selecionar datas, selecione o botão Selecionar uma data no canto inferior da lista de funções. 8. Clique em OK para aplicar a fórmula. O elemento de texto dinâmico é adiciona ao objeto de texto e será atualizado cada vez que o conjunto de dados for atualizado. 12.1.2.2.1 Modificação do texto dinâmico em uma história 1. Na opção Criar, selecione a página que contém o texto dinâmico para editar. 2. Selecione o texto dinâmico para processar. 3. No painel PROPRIEDADES DO TEXTO, selecione o ícone Adicionar ou processar texto dinâmico O diálogo Editor de fórmulas é exibido. 4. Modifique o texto na caixa Fórmula ou modifique as outras opções quando necessário e selecione OK. 124 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. . Guia do usuário do Expert Analytics Criando histórias 12.1.2.2.2 Remoção de texto dinâmico de uma história 1. Na opção Criar, selecione a página para remover o texto dinâmico. 2. Selecione o texto dinâmico para remover. 3. No painel PROPRIEDADES DO TEXTO, selecione o ícone Remover texto dinâmico. 12.1.3 Como salvar uma história 12.1.4 Modificando uma história Clique em Editar no canto superior direito da janela. A história é aberta na divisão Compor. Informações relacionadas Histórias e dados visualizados [página 119] 12.1.5 Como explorar uma visualização em uma história Você pode explorar as visualizações nas páginas dos quadros. Por exemplo, você pode pesquisar os níveis inferiores e superiores, filtrar valores e adicionar classificações. Você pode explorar uma visualização das seguintes formas: ● Pesquisar nível inferior em um valor e pesquisar nível superior ● Filtre um ou mais valores ● Adicione, altere ou remova uma classificação ● Aproxime a imagem e procure em gráficos geográficos ● Altere o título 1. Na divisão Visualização, selecione Explorar no canto superior direito de uma visualização. A visualização é aberta em uma nova janela. 2. Quando terminar de explorar a visualização, clique em Atualizar para salvar suas alterações no quadro. Guia do usuário do Expert Analytics Criando histórias PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 125 12.1.6 Como atualizar dados em uma página de infográfico Por padrão, os dados não são atualizados nos infográficos. No entanto, você pode atualizar manualmente os dados toda vez que abrir uma página de infográfico. Atualizar é útil para dados em tempo real, quando você precisa das informações mais recentes em um infográfico. Entretanto, atualizar os dados pode alterar a mensagem da narrativa de um infográfico porque ela altera os dados com que o infográfico foi criado. 1. Na divisão Criar, abra a página do infográfico para atualizar os dados. 2. Em CONFIGURAÇÕES DE PÁGINA, execute uma das seguintes ações: ○ Para atualizar a página manualmente, selecione o ícone Atualizar visualizações na página. ○ Para atualizar a página automaticamente, em Atualizar página ao abrir, selecione o botão ATIVADO. Um diálogo é exibido e indica que as visualizações serão atualizadas para utilizar os dados mais recentes, que podem alterar personalizações existentes. Os dados dessa página de infográfico serão atualizados toda vez que o infográfico for aberto. 126 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Criando histórias 13 Compartilhando dados 13.1 Como publicar no SAP Lumira Server O SAP Lumira Server é um aplicativo de análise visual de dados que fornece acesso web a informações armazenadas em um repositório SAP HANA. Você pode utilizar o SAP Lumira Server para compartilhar conjuntos de dados e históricos com base nas fontes de dados do SAP HANA que você criou da seguinte maneira: ● Conjuntos de dados podem ser publicados no SAP Lumira Server e então visualizados e processados pelos colaboradores de seu projeto. ● Históricos podem ser publicados no SAP Lumira Server e então visualizados pelos colaboradores de seu projeto. Os históricos não pode ser editados. O acesso de compartilhamento aos conjuntos de dados e histórias publicados é atribuído às funções (não a usuários individuais) e é atribuído a cada usuário uma função. (As funções são definidas no SAP HANA Studio.) Você decide quais funções têm acesso permitido aos conjuntos de dados e histórias publicados. Entretanto, só um status Visualizar pode ser atribuído a uma função porque as histórias publicadas não podem ser editadas. Para informações sobre funções e compartilhamento no SAP Lumira Server, consulte o Guia do usuário do SAP Lumira Server. Informações relacionadas Como publicar histórias e conjuntos de dados no SAP Lumira Server [página 127] 13.1.1 Como publicar histórias e conjuntos de dados no SAP Lumira Server As histórias publicadas são para apenas visualização. Para editar uma história que foi publicada no SAP Lumira Server, modifique a história primeiro e publique-a novamente. ● Insira o URL para SAP Lumira Server. Selecione Arquivo Preferências Rede e copie o URL do servidor na caixa de texto SAP Lumira Server. Você precisa ter as credenciais de sua conexão para o SAP Lumira Server. ● Revise as restrições de publicação: ○ O tipo de agregação Nenhum para uma medida não é suportado. ○ As visualizações que têm cálculos preditivos ou de previsão não são suportadas. ○ As seguintes fórmulas não podem ser publicadas corretamente no SAP Lumira Server: AddMonthToDate, AddYearToDate, LastDayOfMonth, DayOfYear, Week, LastWord e ExceptLastWord. Guia do usuário do Expert Analytics Compartilhando dados PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 127 1. Na divisão Compartilhar, realize uma das seguintes ações: Opção Descrição Para publicar um histórico Clique no link Histórias na parte superior do Painel central, depois, selecione história. Histórias gra vadas na divisão Compor são listadas no Painel central. Para publicar um conjunto de dados Selecione um conjunto de dados no painel Conjunto de dados. 2. Selecione o botão Publicar no SAP Lumira Server na barra de menu na parte superior. 3. Insira o nome da conta e a senha e selecione Conectar. 4. Selecione Seguinte. Se publicar novamente um história ou um conjunto de dados que já existe no SAP Lumira Server, uma mensagem o informará que a história ou o conjunto de dados já existe. Se você deseja criar uma cópia no servidor, você precisa criá-la no aplicativo e publicá-la separadamente. Caso contrário, a versão do servidor será sobregravada. 5. 6. 128 Realize uma das seguintes ações: Opção Descrição Para manter a versão publicada e criar uma cópia Selecione Não sobregravar na lista Detalhe e selecione Cancelar. Então, você poderá criar uma cópia no aplicativo e publicá-la. Para substituir a versão publicada por uma versão atualizada Selecione Sobregravar na lista Detalhe, selecione Verificar e selecione Publicar. Selecione Concluído. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Compartilhando dados 14 Trabalhando com modelos 14.1 Como criar um modelo Modelo é um componente reutilizável, criado treinando um algoritmo com os dados históricos e salvando a instância. Para criar um modelo, você precisa salvar o estado do algoritmo. Geralmente você cria modelos para: ● Compartilhar regras comerciais aplicáveis a dados similares ● Para prever dados despercebidos utilizando a instância treinada do algoritmo 1. Adquira os dados da fonte de dados solicitada. O componente de fonte de dados é adicionado à nova análise na divisão Prever. 2. Na divisão Prever, clique duas vezes no componente de algoritmo necessário. 3. Pelo menu de contexto do componente, selecione Definir configurações e defina as configurações do componente. 4. Escolha 5. Pelo menu de contexto do algoritmo, selecione Salvar como modelo. 6. Insira um nome e uma descrição para o modelo. 7. Se um modelo com o mesmo nome já existe, selecione a opção Sobregravar, se existir para sobregravar o modelo existente. 8. Selecione Salvar. 9. Selecione OK. (Executar análise). O modelo é criado e exibido na seção Modelos da lista de componentes à direita. Você pode usar este modelo apenas como qualquer outro componente para a criação de uma análise. Nota Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos de coluna independente usados durante a criação do modelo. 14.2 Como exportar um modelo como PMML Você pode exportar as informações do modelo em um arquivo local, no formato padrão da indústria Predictive Modeling Markup Language (PMML), e compartilhá-lo com outras aplicações compatíveis com PMML para analisar conjuntos de dados similares. Para exportar um modelo em formato PMML, siga estes procedimentos: Guia do usuário do Expert Analytics Trabalhando com modelos PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 129 1. Crie um modelo. 2. Na divisão Prever, na seção Modelos, clique duas vezes no modelo necessário. 3. Pelo menu contextual do modelo, selecione Exportar modelo. 4. Selecione Utilize esta opção para exportar modelos de dados para o arquivo Predictive Model Markup Language (*.pmml). 5. Selecione Exportar. 6. Insira um nome para o arquivo. 7. Selecione o tipo de arquivo desejado: PMML ou XML. 8. Selecione Salvar. 14.3 Como exportar um modelo em um arquivo .spar Você pode exportar um modelo em um arquivo .spar e compartilhá-lo com seus colegas. Para exportar um modelo, execute os seguintes procedimentos: 1. Crie um modelo. 2. Selecione o modelo que quer exportar e das ações do componentes, escolha Exportar modelo ou arraste o modelo para o editor de análise e do menu contextual, selecione Exportar modelo. 3. Selecione Utilize esta opção para exportar modelos ara um arquivo Expert Analytics Archive (.spar). 4. Selecione Exportar. 5. Insira um nome para o arquivo .spar. 6. Selecione Salvar. 7. Selecione OK. Para exportar vários modelos em um único arquivo .spar, selecione Selecione os modelos que quer exportar e escolha Exportar. Arquivo Exportar todos os modelos . 14.4 Exportando um modelo do SAP HANA como procedimento armazenado Você pode exportar um modelo do SAP HANA como um procedimento armazenado para o banco de dados do SAP HANA. Qualquer usuário do SAP HANA pode utilizar esses modelos para análise. ● Você deve ter um modelo criado e gravado na lista de componentes em Modelos. ● Antes de exportar o modelo do SAP HANA como um procedimento armazenado, garanta que a conta esteja definida no SAP HANA. 1. Na divisão Prever, na lista de componentes, escolha Modelos. 2. Selecione o modelo necessário e pela seção Ações do componente, selecione Exportar modelo. 3. Selecione Utilizar essa opção para exportar um modelo do SAP HANA como um procedimento armanzenado. 130 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Trabalhando com modelos 4. Selecione Exportar. 5. Selecione o esquema necessário em que você deseja que o procedimento apareça. 6. Especifique um nome para o procedimento. Nota Se quiser sobregravar o procedimento existente com o mesmo nome no esquema selecionado, selecione Sobregravar, se existir. 7. Selecione Exportar. O procedimento exportado e os objetos a ele associados (tabelas/tipos) são exibidos no esquema selecionado no banco de dados SAP HANA. Dica Você pode utilizar um procedimento armazenado fora de Expert Analytics. Execute o SQL a seguir para obter o resultado da pontuação: CREATE TABLE InputData like PAS00AMYWGCT0Y_ZE4LISJ2MWSCOREPROCEDURE_INPUT_TYPE ; Here insert the data that you would like to score on. Insert into InputData ……. CREATE TABLE ResultTable like PAS00AMYWGCT0Y_ZE4LISJ2MWSCOREPROCEDURE_OUTPUT_TYPE; call "ANALYTICS"."ScoreProcedure"(InputData,ResultTable) WITH OVERVIEW; select * from ResultTable; Informações relacionadas Como criar um modelo [página 129] 14.4.1 Removendo o procedimento armazenado e exportado do SAP HANA Você pode excluir o procedimento armazenado e exportado do SAP HANA usando o SAP HANA Studio. É necessário ter sua conta definida no SAP HANA. Para remover o procedimento armazenado e exportado do SAP HANA, realize as seguintes etapas: 1. No SAP HANA Studio, navegue até o procedimento que você exportou. Nota O procedimento exportado deve estar na pasta Procedure do esquema. 2. Clique com o botão direito do mouse no procedimento e selecione Abrir definição. A aba Definição é exibida. 3. Na guia Definição, selecione a guia Criar instrução. Guia do usuário do Expert Analytics Trabalhando com modelos PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 131 4. Na guia Criar instrução, copie os comentários SQL (comandos precedidos por dois hifens '--'). 5. Na guia Navegador, clique com o botão direito do mouse no procedimento e selecione Console SQL. A guia Console SQL é exibida. 6. Na aba Console SQL, cole os comentários SQL e escolha Executar, ou pressione a tecla F8. Nota Certifique-se de excluir os dois hifens (- -), que precedem os comentários SQL, antes de executá-los. 14.5 Como importar um modelo Você pode importar um modelo compartilhado por seu colega e usar para análise. Para importar um modelo, execute os seguintes procedimentos: 1. Na divisão Prever, na lista de componentes, escolha Importar modelo . 2. Escolha um arquivo .spar válido e escolha Abrir. 3. Selecione os modelos que quer importar e escolha Concluir. O modelo é importado e exibido na seção Modelos da lista de componentes. 14.6 Como excluir um modelo Recomendamos que você use esta opção com cautela porque a exclusão de um modelo pode inutilizar a análise que contenha a referência do modelo. Para excluir um modelo, siga estes procedimentos: 1. Na divisão Prever, na lista de componentes, escolha Modelos. 2. Selecione o modelo necessário e pelas ações do componente, selecione Excluir. 132 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Trabalhando com modelos 15 Propriedades do componente 15.1 Algoritmos Use algoritmos para executar a mineração de dados e análise estatística dos dados. Por exemplo, para determinar tendências e padrões com base nos dados. Expert Analytics fornece algoritmos incorporados, como de regressão, série de tempo e valor atípico. No entanto, também suporta árvore de decisão, valor médio k, rede neural, série de tempo e algoritmos de regressão pela biblioteca R de fonte aberta. Você também pode executar uma análise interna do banco de dados usando algoritmos da biblioteca do Predictive Analysis (Predictive Analysis Library - PAL) do SAP HANA. 15.1.1 Regressão 15.1.1.1 Algoritmo HANA de regressão exponencial As propriedades que podem ser configuradas no algoritmo HANA de regressão exponencial. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Determina como uma variável individual influencia outra variável usando a função exponencial. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 133 Propriedades do algoritmo HANA de regressão exponencial Tabela 52: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Colunas independentes Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Nome da coluna prevista Insira um nome para a coluna recém-adicionada que conte nha os valores previstos. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 1. 15.1.1.2 Algoritmo HANA de regressão geométrica As propriedades que podem ser configuradas no algoritmo HANA de regressão geométrica. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Determina como uma variável individual influencia outra variável usando a função geométrica. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. 134 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo HANA de regressão geométrica Tabela 53: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Colunas independentes Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Nome da coluna prevista Insira um nome para a coluna recém-adicionada que conte nha os valores previstos. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 1. 15.1.1.3 HANA de regressão linear múltipla As propriedades que podem ser configuradas no algoritmo HANA de regressão linear múltipla. Sintaxe Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis independentes. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 135 Propriedades do algoritmo HANA de regressão linear múltipla Tabela 54: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Colunas independentes Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 1. 15.1.1.4 Algoritmo HANA de regressão logarítmica As propriedades que podem ser configuradas no algoritmo HANA de regressão logarítmica. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo realiza análise de regressão logarítmica bi variável. Ele determina como uma variável individual influencia outra variável usando uma função logarítmica da Biblioteca do Predictive Analysis (PAL). Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. 136 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo HANA de regressão logarítmica Tabela 55: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 1. 15.1.1.5 Regressão polinomial HANA As propriedades que podem ser configuradas no algoritmo HANA de regressão polinomial. Sintaxe Use este algoritmo para encontrar a relação entre a variável independente e a variável dependente em uma linha curvilínea ajustada. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 137 Propriedades do algoritmo HANA de regressão polinomial Tabela 56: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Colunas independentes Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Grau do polinomial Insira o maior valor expoente de uma expressão polinomial. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 1. 15.1.1.6 HANA R de regressão linear múltipla As propriedades que podem ser configuradas no algoritmo HANA R de regressão linear múltipla. Sintaxe Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis independentes. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. 138 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo HANA R de regressão linear múltipla Tabela 57: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Colunas independentes Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Nível de confiança Insira o nível de confiança do algoritmo (a precisão das previ sões). O valor predeterminado é 0,95. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.1.7 Algoritmo HANA de regressão logística As propriedades que podem ser configuradas no algoritmo HANA de regressão logística. Sintaxe Use este algoritmo quando as variáveis independentes forem categóricas ou uma mistura de valores contínuo e categórico. Regressão logística é uma abordagem de previsão semelhante à regressão de mínimo quadrado comum (Ordinary Least Square - OLS). Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 139 Propriedades do algoritmo HANA de regressão logística Tabela 58: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. ● Preencher: preenche os valores em falta na coluna de destino. Colunas independentes Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Método de iteração Selecione o método de iteração. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Mostrar valores ajustados Selecione essa opção para visualizar os valores ajustados em uma nova coluna. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. Iteração máxima Insira o número máximo de iterações permitido para calcular o coeficiente do algoritmo. O valor predeterminado é 100. Limite de saída Insira o valor limite para a saída das iterações. O valor prede terminado é 0,00001. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 4. Valor de mapeamento para 0 Insira um valor para uma variável, que está mapeada para 0. Valor de mapeamento para 1 Insira um valor para uma variável, que está mapeada para 1. 15.1.1.8 Algoritmo HANA de regressão automática As propriedades que podem ser configuradas no algoritmo HANA de regressão automática. 140 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Sintaxe O algoritmo HANA de regressão automática utiliza uma técnica chamada Minimização do risco estrutural e cria um modelo polinomial. Esse algoritmo pode manipular um grande número de atributos de entrada em modo automatizado para localizar tendências em dados. O algoritmo fornece indicadores e gráficos para assegurar que a qualidade e robustez de modelos treinados possam ser acessados facilmente. O algoritmo HANA de regressão automática só está disponível no modo online (conectado ao SAP HANA). Há um algoritmo de regressão automática disponível no modo offline. Para mais informações sobre as funções utilizadas nos algoritmos automáticos online, consulte o Guia de referência de SAP Automated Predictive Library (APL) em http://help.sap.com/pa Propriedades do algoritmo HANA de regressão automática Tabela 59: Propriedades do algoritmo Propriedade Descrição Recursos Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.1.9 R de regressão exponencial As propriedades que podem ser configuradas no algoritmo R de regressão exponencial. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função exponencial da biblioteca de fonte aberta R. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 141 Propriedades do algoritmo R de regressão exponencial Tabela 60: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de entrada com a qual você deseja execu tar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Permitir único ajuste Um valor booleano - se definido como verdadeiro, os coefi cientes com alias serão ignorados na matriz de covariância de coeficiente. Se definido como falso, um modelo com coefi cientes com alias produzirá um erro. Um modelo com coeficientes com alias significa que a matriz quadrada x*x é única. Contrastes Selecione a lista de contrastes, que deseja usar para fatores que aparecem como variáveis no modelo. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.1.10 R de regressão geométrica As propriedades que podem ser configuradas no algoritmo R de regressão geométrica. 142 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função geométrica da biblioteca de fonte aberta R. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades do algoritmo R de regressão geométrica Tabela 61: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de entrada com a qual você deseja execu tar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Permitir único ajuste Um valor booleano - se definido como verdadeiro, os coefi cientes com alias serão ignorados na matriz de covariância de coeficiente. Se definido como falso, um modelo com coefi cientes com alias produzirá um erro. Um modelo com coeficientes com alias significa que a matriz quadrada x*x é única. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 143 Propriedade Descrição Contrastes Selecione a lista de contrastes, que deseja usar para fatores que aparecem como variáveis no modelo. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.1.11 R de regressão linear As propriedades que podem ser configuradas no algoritmo R de regressão linear. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a biblioteca R de fonte aberta. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades do algoritmo R de regressão linear Tabela 62: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de entrada com a qual você deseja execu tar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. 144 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedade Descrição Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Permitir único ajuste Um valor booleano - se definido como verdadeiro, os coefi cientes com alias serão ignorados na matriz de covariância de coeficiente. Se definido como falso, um modelo com coefi cientes com alias produzirá um erro. Um modelo com coeficientes com alias significa que a matriz quadrada x*x é única. Contrastes Selecione a lista de contrastes, que deseja usar para fatores que aparecem como variáveis no modelo. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.1.12 R de regressão logarítmica As propriedades que podem ser configuradas no algoritmo R de regressão logarítmica. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função logarítmica da biblioteca R de fonte aberta. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 145 Propriedades do algoritmo R de regressão logarítmica Tabela 63: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja exibir os dados de sa ída. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de origem de entrada com a qual você de seja executar a regressão. Coluna dependente Selecione a coluna de destino em que você deseja executar a regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. ● Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna depen dente. Permitir único ajuste Um valor booleano - se definido como verdadeiro, os coefi cientes com alias serão ignorados na matriz de covariância de coeficiente. Se definido como falso, um modelo com coefi cientes com alias produzirá um erro. Um modelo com coeficientes com alias significa que a matriz quadrada x*x é única. Contrastes Selecione a lista de contrastes a ser usada para fatores que aparecem como variáveis no modelo. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.1.13 R de regressão linear múltipla As propriedades que podem ser configuradas no algoritmo R de regressão linear múltipla. 146 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Sintaxe Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis independentes. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades do algoritmo R de regressão linear múltipla Tabela 64: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Colunas independentes Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contêm os valores em falta nas colunas independente ou depen dente. ● Manter: retém valores em falta. ● Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna depen dente. Nível de confiança Insira o nível de confiança do algoritmo. O valor predetermi nado é 0,95. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 147 15.1.1.14 Regressão exponencial As propriedades que podem ser configuradas no algoritmo de regressão exponencial. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função exponencial com a metodologia de mínimo quadrado. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades de regressão exponencial Tabela 65: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Modos possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de entrada com a qual você deseja execu tar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta nas colunas independente ou depen dente. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Nome da coluna prevista 148 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Insira um nome para a coluna recém-criada que contenha os valores previstos. Guia do usuário do Expert Analytics Propriedades do componente 15.1.1.15 Regressão geométrica As propriedades que podem ser configuradas no algoritmo de regressão geométrica. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função geométrica com a metodologia de mínimo quadrado. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades da regressão geométrica Tabela 66: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de entrada com a qual você deseja execu tar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente Nome da coluna prevista Guia do usuário do Expert Analytics Propriedades do componente Insira um nome para a coluna recém-criada que contenha os valores previstos. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 149 15.1.1.16 Regressão automática As propriedades que podem ser configuradas no algoritmo de regressão automática. Sintaxe O algoritmo de regressão automática utiliza uma técnica chamada Minimização do risco estrutural e cria um modelo polinomial. Esse algoritmo pode manipular um grande número de atributos de entrada em modo automatizado para localizar tendências em dados. O algoritmo fornece indicadores e gráficos para assegurar que a qualidade e robustez de modelos treinados possam ser acessados facilmente. Propriedades da regressão automática Tabela 67: Propriedades do algoritmo Propriedade Descrição Recursos Selecione as colunas de entrada com as quais você deseja executar a análise de regressão. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.1.17 Regressão linear As propriedades que podem ser configuradas no algoritmo de regressão linear. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável com a metodologia de mínimo quadrado. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. 150 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades da regressão linear Tabela 68: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de entrada com a qual você deseja execu tar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.1.18 Regressão logarítmica As propriedades que podem ser configuradas no algoritmo de regressão logarítmica. Sintaxe Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função logarítmica com a metodologia de mínimo quadrado. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 151 Propriedades da regressão logarítmica Tabela 69: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Preencher: preenche os valores em falta na coluna de destino. ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de entrada com a qual você deseja execu tar a análise de regressão. Coluna dependente Selecione a coluna de destino com a qual você deseja execu tar a análise de regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Nome da coluna prevista 15.1.2 Insira um nome para a coluna recém-criada que contenha os valores previstos. Valores atípicos 15.1.2.1 Algoritmo HANA de detecção de anormalidade As propriedades que podem ser configuradas no algoritmo HANA de detecção de anormalidade. Sintaxe Use este algoritmo para encontrar modelos nos dados que não estejam de acordo com o comportamento esperado. Nota A criação de modelos usando o algoritmo HANA de detecção de anormalidade não é suportada. 152 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo HANA de detecção de anormalidade Tabela 70: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Colunas independentes Selecione as colunas de origem de entrada. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Porcentagem de anomalias Insira o valor percentual que indica a proporção de anormali dades nos dados de origem. O valor predeterminado é 10. Método de detecção de anomalia Selecione o método de detecção de anomalia. ● Por distância a partir centro ● Por soma de distâncias a partir de todos os centros Iterações máximas Insira o número de iterações permitido para localização de clusters. O valor predeterminado é 100. Método de cálculo do centro Selecione o método a ser usado para cálculo inicial do centro do cluster. Tipo de normalização Selecione o tipo de normalização. Número de clusters Insira o número de grupos para clustering. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 1. Limite de saída Insira o valor limite para a saída das iterações. O valor prede terminado é 0,0001. Medida da distância Insira a medida para calcular a distância entre os registros e os centros do cluster. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores previstos. 15.1.2.2 Algoritmo HANA de teste de intervalo interquartil As propriedades que podem ser configuradas no algoritmo HANA do intervalo interquartil. Sintaxe Use este algoritmo para identificar valores atípicos com base na distribuição estatística entre o primeiro e terceiro quartis. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 153 Nota ● Os dados de entrada para o algoritmo de teste IQR (intervalo interquartil) deve ter pelo menos 4 linhas. ● A criação de modelos usando o algoritmo HANA de teste de intervalo interquartil não é suportada. Propriedades do algoritmo HANA de teste de intervalo interquartil Tabela 71: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspon dente é atípico. ● Remover valores atípicos: remove os valores atípicos dos dados de entrada. Coluna independente Selecione uma coluna de origem de entrada. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Coeficiente limitador Insira o desvio permitido para os valores do intervalo inter quartil. O valor predeterminado é 1,5. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores previstos. 15.1.2.3 Intervalo interquartil As propriedades que podem ser configuradas no algoritmo do intervalo interquartil . Sintaxe Use este algoritmo para identificar valores atípicos com base na distribuição estatística entre o primeiro e terceiro quartis. 154 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Nota ● Os dados de entrada para o algoritmo IQR (intervalo interquartil) deve ter pelo menos 4 linhas. ● A criação de modelos usando o algoritmo IQR (intervalo interquartil) não é suportada. Propriedades do algoritmo de intervalo interquartil Tabela 72: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspon dente é atípico. ● Remover valores atípicos: remove os valores atípicos dos dados de entrada. Recurso Selecione a coluna de entrada com a qual você deseja execu tar a análise. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Coeficiente limitador Insira o desvio permitido para os valores do intervalo inter quartil. O valor predeterminado é 1,5. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores previstos. 15.1.2.4 Valor atípico vizinho mais próximo As propriedades que podem ser configuradas no algoritmo do valor atípico vizinho mais próximo. Sintaxe Use este algoritmo para identificar valores atípicos com base no número de vizinhos (N) e na distância média dos valores comparados aos seus vizinhos N mais próximos. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 155 Nota A criação de modelos usando o valor atípico vizinho mais próximo não é suportada. Propriedades do valor atípico vizinho mais próximo Tabela 73: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspon dente é atípico. ● Remover valores atípicos: remove os valores atípicos dos dados de entrada. Recurso Selecione a coluna de entrada com a qual você deseja execu tar a análise. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Contagem da vizinhança Insira o número de vizinhos para determinar distâncias. O va lor predeterminado é 5. Número de valores atípicos Insira o número de valores atípicos que deseja remover. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores previstos. 15.1.2.5 Teste de variância HANA As propriedades que podem ser configuradas no algoritmo do teste de variância HANA. Sintaxe O teste de variância HANA identifica valores atípicos em um conjunto de dados numéricos. Os limites inferior e superior dos dados são calculados com base na média e no desvio padrão dos dados e no multiplicador especificado por você. 156 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente O multiplicador é um coeficiente do tipo duplo que o ajuda a testar se todos os valores de um vetor numérico estão no intervalo. Se um valor estiver fora do intervalo, ele sugere que o valor não passe no teste de variação, sendo marcado portanto como atípico. Nota A criação de modelos usando o algoritmo HANA de detecção de anormalidade não é suportada. Propriedades do teste de variância HANA Tabela 74: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. ● Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspon dente é atípico. ● Remover valores atípicos: remove os valores atípicos dos dados de entrada. Colunas independentes Selecione as colunas de origem de entrada. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Multiplicador Insira o valor do Multiplicador para decidir o intervalo do limite Inferior e Superior e identificar os valores atípicos. O valor predeterminado é 3,0. Nota O valor informado deve ser inteiro e positivo. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores previstos. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 157 15.1.3 Série de tempo 15.1.3.1 Algoritmo HANA de amortecimento exponencial único As propriedades que podem ser configuradas no algoritmo HANA de amortecimento exponencial individual. Sintaxe Use este algoritmo para amortecer os dados de origem. Nota A criação de modelos usando o algoritmo HANA de amortecimento exponencial único não é suportada. Propriedades de HANA de amortecimento exponencial único Tabela 75: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. ● Tendência: exibe os dados de origem junto com os valo res previstos para um conjunto de dados informado. ● Previsão: exibe os valores previstos para o período infor mado. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise de série de tempo. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ati vada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser considera das. O valor predeterminado é 1. Períodos a serem previstos Insira o número de períodos a serem previstos. Esse valor é usado apenas se o modo de saída é previsto. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. 158 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedade Descrição Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). Intervalo: 0-1. 15.1.3.2 Algoritmo HANA de amortecimento exponencial duplo As propriedades que podem ser configuradas no algoritmo HANA de amortecimento exponencial duplo. Sintaxe Use este algoritmo para amortecer os dados de origem. Nota A criação de modelos usando o algoritmo HANA de amortecimento exponencial duplo não é suportada. Propriedades do algoritmo HANA de amortecimento exponencial duplo Tabela 76: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. ● Tendência: exibe os dados de origem junto com os valo res previstos para um conjunto de dados informado. ● Previsão: exibe os valores previstos para o período infor mado. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise de série de tempo. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ati vada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser considera das. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 159 Propriedade Descrição Períodos a serem previstos Insira o número de períodos a serem previstos. Esse valor é usado apenas se o modo de saída é previsto. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). Intervalo: 0-1. Beta Insira uma constante de amortecimento para encontrar os pa râmetros de tendência. Intervalo: 0-1. 15.1.3.3 Algoritmo HANA de amortecimento exponencial triplo As propriedades que podem ser configuradas no algoritmo HANA de amortecimento exponencial triplo. Sintaxe Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados. Nota A criação de modelos usando o algoritmo HANA de amortecimento exponencial triplo não é suportada. 160 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades de HANA de amortecimento exponencial triplo Tabela 77: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. ● Tendência: exibe os dados de origem junto com os valo res previstos para um conjunto de dados informado. ● Previsão: exibe os valores previstos para o período infor mado. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise de série de tempo. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ati vada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser considera das. Períodos a serem previstos Insira o número de períodos a serem previstos. Esse valor é usado apenas se o modo de saída é previsto. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). Intervalo: 0-1. Beta Insira uma constante de amortecimento para encontrar os pa râmetros de tendência. Intervalo: 0-1. Gama Insira uma constante de amortecimento para encontrar os pa râmetros de tendência sazonal. Intervalo: 0-1. 15.1.3.4 HANA R de amortecimento exponencial triplo As propriedades que podem ser configuradas no algoritmo HANA R de amortecimento exponencial triplo. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 161 Sintaxe Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados. Propriedades do algoritmo R de amortecimento exponencial triplo Tabela 78: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. ● Tendência: exibe os dados de origem junto com os valo res previstos para um conjunto de dados informado. ● Previsão: exibe os valores previstos para o período infor mado. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise de série de tempo. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ati vada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser considera das. Períodos a serem previstos Insira o número de períodos a serem previstos. Esse valor é usado apenas se o modo de saída é previsto. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). Intervalo: 0-1. Beta Insira uma constante de amortecimento para encontrar os pa râmetros de tendência. Intervalo: 0-1. Gama Insira uma constante de amortecimento para encontrar os pa râmetros de tendência sazonal. Intervalo: 0-1. 162 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedade Descrição Sazonal Selecione o tipo de algoritmo de amortecimento exponencial HoltWinters. Nível de confiança Insira o nível de confiança do algoritmo. Nº de observações periódicas Insira o número de observações periódicas necessárias para iniciar o cálculo. Nível Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0.4. Tendência Insira o valor inicial para encontrar os parâmetros de tendên cia (b[0]) (b.start). Por exemplo: 0.4. Estação Insira os valores iniciais para encontrar os parâmetros sazo nais (s.start). O valor depende da coluna selecionada. Por exemplo, se você selecionar trimestre como período, deverá inserir quatro valores dobrados. Entradas do otimizador Insira os valores iniciais de alfa, beta e gama necessários para o otimizador. Por exemplo: 0.3, 0.1, 0.1. 15.1.3.5 R de amortecimento exponencial individual As propriedades que podem ser configuradas no algoritmo R de amortecimento exponencial individual. Sintaxe Use este algoritmo para amortecer os dados de origem. Nota A criação de modelos usando o algoritmo R de amortecimento exponencial único não é suportada. Propriedades do algoritmo R de amortecimento exponencial individual Tabela 79: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Variável de destino Guia do usuário do Expert Analytics Propriedades do componente ● Tendência: exibe os dados de origem junto com os valo res previstos para um conjunto de dados informado. ● Previsão: exibe os valores previstos para o período infor mado. Selecione a coluna de destino com a qual você deseja execu tar a análise de série de tempo. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 163 Propriedade Descrição Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ati vada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser considera das. Períodos a serem previstos Insira o número de períodos a serem previstos. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). O valor predetermi nado é 0,3. Intervalo: 0-1. Nível de confiança Insira o nível de confiança do algoritmo. Nº de observações periódicas Insira o número de observações periódicas necessárias para iniciar o cálculo. O valor predeterminado é 2. Nível Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0.4. 15.1.3.6 R de amortecimento exponencial duplo As propriedades que podem ser configuradas no algoritmo R de amortecimento exponencial duplo. Sintaxe Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados. Nota A criação de modelos usando o algoritmo R de amortecimento exponencial duplo não é suportada. 164 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo de amortecimento exponencial duplo Tabela 80: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. ● Tendência: exibe os dados de origem junto com os valo res previstos para um conjunto de dados informado. ● Previsão: exibe os valores previstos para o período infor mado. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise de série de tempo. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ati vada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser considera das. Períodos a serem previstos Insira o número de períodos a serem previstos. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). O valor predetermi nado é 0,3. Intervalo: 0-1. Beta Insira uma constante de amortecimento para localizar parâ metros de tendência. O valor padrão é 0.1. Intervalo: 0-1. Nível de confiança Insira o nível de confiança do algoritmo. Nº de observações periódicas Insira o número de observações periódicas necessárias para iniciar o cálculo. O valor predeterminado é 2. Nível Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0.4. Tendência Insira o valor inicial para encontrar os parâmetros de tendên cia (b[0]) (b.start). Por exemplo: 0.4. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 165 Propriedade Descrição Entradas do otimizador Insira os valores iniciais de alfa, beta e gama necessários para o otimizador. Por exemplo: 0.3, 0.1, 0.1. 15.1.3.7 R de amortecimento exponencial triplo As propriedades que podem ser configuradas no algoritmo R de amortecimento exponencial triplo. Sintaxe Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados. Nota A criação de modelos usando o algoritmo R de amortecimento exponencial triplo não é suportada. Propriedades do algoritmo R de amortecimento exponencial triplo Tabela 81: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. ● Tendência: exibe os dados de origem junto com os valo res previstos para um conjunto de dados informado. ● Previsão: exibe os valores previstos para o período infor mado. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise de série de tempo. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ati vada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser considera das. Períodos a serem previstos Insira o número de períodos a serem previstos. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. 166 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedade Descrição Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). O valor predetermi nado é 0,3. Intervalo: 0-1. Beta Insira uma constante de amortecimento para encontrar os pa râmetros de tendência. O valor predeterminado é 0,1. Inter valo: 0-1. Gama Insira uma constante de amortecimento para encontrar os pa râmetros de tendência sazonal. O valor predeterminado é 0,1. Sazonal Selecione o tipo de algoritmo de amortecimento exponencial HoltWinters. Nível de confiança Insira o nível de confiança do algoritmo. Nº de observações periódicas Insira o número de observações periódicas necessárias para iniciar o cálculo. O valor predeterminado é 2. Nível Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0.4. Tendência Insira o valor inicial para encontrar os parâmetros de tendên cia (b[0]) (b.start). Por exemplo: 0.4. Estação Insira os valores iniciais para encontrar os parâmetros sazo nais (s.start). O valor depende da coluna selecionada. Por exemplo, se você selecionar trimestre como período, deverá inserir quatro valores dobrados. Entradas do otimizador Insira os valores iniciais de alfa, beta e gama necessários para o otimizador. Por exemplo: 0.3, 0.1, 0.1. 15.1.3.8 Amortecimento exponencial triplo As propriedades que podem ser configuradas no algoritmo de amortecimento exponencial triplo. Sintaxe Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 167 Propriedades do logaritmo de amortecimento exponencial triplo Tabela 82: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. ● Tendência: exibe os dados de origem junto com os valo res previstos para um conjunto de dados informado. ● Previsão: exibe os valores previstos para o período infor mado. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise de série de tempo. Considerar coluna de datas Selecione esta opção para especificar se a coluna de datas deve ou não ser usada. Coluna de datas Insira o nome da coluna que contenha valores de data. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ati vada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser considera das. Períodos a serem previstos Insira o número de períodos a serem previstos. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). O valor predetermi nado é 0,3. Intervalo: 0-1. Beta Insira uma constante de amortecimento para encontrar os pa râmetros de tendência. O valor predeterminado é 0,1. Inter valo: 0-1. Gama Insira uma constante de amortecimento para encontrar os pa râmetros de tendência sazonal. O valor predeterminado é 0,1. Intervalo: 0-1. 168 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente 15.1.4 Árvores de decisão 15.1.4.1 HANA C 4.5 As propriedades que podem ser configuradas para o algoritmo HANA C 4.5. Sintaxe Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas com base em outra variáveis. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades do algoritmo HANA C 4.5 Tabela 83: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra à saída que contenha os valores previstos. ● Preenchimento: preenche os valores em falta na coluna de destino. Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise. Nota Ele só aceita coluna com tipo de dados inteiros. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 169 Propriedade Descrição Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Porcentagem de dados de entrada Insira o percentual de dados a ser considerado na análise. Divisão mínima Insira o número de registros, além do qual a divisão do nó fo lha não é permitida. O valor predeterminado é 0. Colunas Selecione as colunas independentes que contenham valores numéricos. Intervalos de posições Inserir intervalos de posições. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores previstos. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 1. 15.1.4.2 HANA R de árvore CNR As propriedades que podem ser configuradas para o algoritmo HANA R de árvore CNR. Sintaxe Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas com base em outra variáveis. No entanto, você pode usar este algoritmo para identificar tendências nos dados. Nota 170 ● O pacote "rpart" que faz parte do R 2.15 não processa nomes de coluna com espaço nem caracteres especiais. O pacote "rpart" suporta apenas formato de nome de coluna de entrada suportado pelo dataframe R. ● Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos nomes de coluna independente usados durante a criação do modelo. ● Nomes de coluna que contenham espaços ou qualquer outro caractere especial diferente de ponto (.) não são suportados. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo HANA R de árvore CNR Tabela 84: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra à saída que contenha os valores previstos. ● Preenchimento: preenche os valores em falta na coluna de destino. Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Tipo de algoritmo Selecione o tipo de análise que deseja que o algoritmo exe cute. Valores possíveis: ● Classificação: use este método se a variável dependente tiver valores de categoria. ● Regressão: use este método - se a variável dependente ti ver valores numéricos. Divisão mínima Insira um número mínimo de observações necessárias para divisão de um nó. O valor predeterminado é 10. Critérios de divisão Selecione os critérios de divisão do nó. Valores possíveis: ● Gini: impureza Gini ● Informações: ganho de informações. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. Parâmetro de complexidade Insira o parâmetro de complexidade que economiza o tempo de cálculo, evitando qualquer divisão que não melhore o ajuste. O valor predeterminado é 0,005. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 171 Propriedade Descrição Profundidade máxima Insira o nível máximo do nó na árvore final com o nó raiz com putado como nível 0. Nota Se a profundidade máxima for maior que 30, o algoritmo não produz os resultados esperados (em máquinas de 32 bits). Validação cruzada Insira o número de validações cruzadas. Um valor maior de validação cruzada aumenta o tempo de cálculo e produz re sultados mais precisos. Probabilidade prioritária Insira o vetor de probabilidades prioritárias. Utilizar substituto Selecione o substituto para usar no processo de repartição. Valores possíveis: ● Exibir apenas - uma observação com um valor em falta para a regra de divisão primária não será enviada aos ní veis inferiores da árvore. ● Utilizar substituto - use esta opção para dividir objetos sem a variável principal; se todos os substitutos estive rem em falta, a observação não será dividida. ● Interromper se estiver em falta – se todos os substitutos estiverem em falta, a observação será enviada na direção majoritária. Estilo de substituto Insira o estilo que controla a seleção do melhor substituto. Valores possíveis: ● Usar classificação correta total - o algoritmo usa o nú mero total de classificações corretas para encontrar uma variável substituta potencial. ● Usar percentual de casos que não estão em falta - o algo ritmo usa o percentual de casos que não estão em falta, classificados para encontrar um substituto potencial. Substituto máximo Insira o número máximo de substitutos a ser retido em cada nó de uma árvore. Mostrar probabilidade Selecione a caixa de seleção Mostrar probabilidade para obter a probabilidade de valores previstos durante a pontuação de um modelo de classificação. 15.1.4.3 HANA CHAID As propriedades que podem ser configuradas para o algoritmo HANA CHAID. 172 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Sintaxe CHAID significa detecção de interação automática de chi-quadrado. CHAID é um método de classificação para criação de árvores de decisões usando estatísticas chi-quadrado para identificar divisões ideais. Nota O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. HANA CHAID Propriedades Tabela 85: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo Valores possíveis: ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra à saída que contenha os valores previstos. ● Preenchimento: preenche os valores em falta na coluna de destino. Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise. Nota Ele só aceita coluna com tipo de dados inteiros. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Porcentagem de dados de entrada Insira o percentual de dados a ser considerado na análise. Divisão mínima Insira o número mínimo de registros de um nó, além do qual não será permitida a divisão do nó. O valor predeterminado é 0. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 173 Propriedade Descrição Profundidade máxima Insira a profundidade máxima da árvore. Nome da coluna Selecione o nome da coluna independente que contenha valo res numéricos. Inserir intervalos de posições Inserir intervalos de posições. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores previstos. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. 15.1.4.4 R de árvore CNR As propriedades que podem ser configuradas para o algoritmo R de árvore CNR. Sintaxe Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas com base em outra variáveis. No entanto, você pode usar este algoritmo para identificar tendências nos dados. Nota 174 ● O pacote "rpart" que faz parte do R 2.15 não processa nomes de coluna com espaço nem caracteres especiais. O pacote "rpart" suporta apenas formato de nome de coluna de entrada suportado pelo dataframe R. ● Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos nomes de coluna independente usados durante a criação do modelo. ● Nomes de coluna que contenham espaços ou qualquer outro caractere especial diferente de ponto (.) não são suportados. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo R de árvore CNR Tabela 86: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra à saída que contenha os valores previstos. ● Preenchimento: preenche os valores em falta na coluna de destino. Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Rpart: o algoritmo exclui todas as observações que não têm a coluna dependente. No entanto, ele retém as ob servações para as quais uma ou mais colunas indepen dentes estão em falta. ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. ● Parar: o algoritmo para a execução se um valor está em falta na coluna independente ou na coluna dependente. Tipo de algoritmo Selecione o tipo de análise que deseja que o algoritmo exe cute. Valores possíveis: ● Classificação: use este tipo - se a variável dependente ti ver valores de categoria. ● Regressão: use este tipo - se a variável dependente tiver valores numéricos. Divisão mínima Insira um número mínimo de observações necessárias para divisão de um nó. O valor predeterminado é 10. Critérios de divisão Selecione os critérios de divisão do nó. Valores possíveis: Guia do usuário do Expert Analytics Propriedades do componente ● Gini: impureza Gini ● Informações: ganho de informações. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 175 Propriedade Descrição Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. Parâmetro de complexidade Insira o parâmetro de complexidade que economiza o tempo de cálculo, evitando qualquer divisão que não melhore o ajuste. O valor predeterminado é 0,005. Profundidade máxima Insira o nível máximo do nó na árvore final com o nó raiz com putado como nível 0. Nota Se a profundidade máxima for maior que 30, o algoritmo não produz os resultados esperados (em máquinas de 32 bits). Validação cruzada Insira o número de validações cruzadas. Um valor maior de validação cruzada aumenta o tempo de cálculo e produz re sultados mais precisos. Probabilidade prioritária Insira o vetor de probabilidades prioritárias. Utilizar substituto Selecione o substituto para usar no processo de repartição. Valores possíveis: ● Exibir apenas - uma observação com um valor em falta para a regra de divisão primária não será enviada aos ní veis inferiores da árvore. ● Utilizar substituto - use esta opção para dividir objetos sem a variável principal; se todos os substitutos estive rem em falta, a observação não será dividida. ● Interromper se estiver em falta - se todos os substitutos estiverem em falta, a observação será enviada na direção majoritária. Estilo de substituto Insira o estilo que controla a seleção do melhor substituto. Valores possíveis: ● Usar classificação correta total - o algoritmo usa o nú mero total de classificações corretas para encontrar uma variável substituta potencial. ● Usar percentual de casos que não estão em falta - o algo ritmo usa o percentual de casos que não estão em falta, classificados para encontrar um substituto potencial. Substituto máximo Insira o número máximo de substitutos a ser retido em cada nó de uma árvore. Mostrar probabilidade Selecione a caixa de seleção Mostrar probabilidade para obter a probabilidade de valores previstos durante a pontuação de um modelo de classificação. 176 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente 15.1.5 Rede neural 15.1.5.1 R de rede neural MONMLP As propriedades que podem ser configuradas para o algoritmo R de rede neural MONMLP. Sintaxe Use este algoritmo para previsão, classificação e reconhecimento de padrão estatístico usando as funções da biblioteca R. Nota R não suporta armazenamento PMML para rede neural MONMLP. Propriedades do algoritmo R de rede neural MONMLP Tabela 87: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra à saída que contenha os valores previstos. ● Preenchimento: preenche os valores em falta na coluna de destino. Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise. Neurônios da camada1 oculta Insira o número de nós/neurônios na primeira camada oculta (hidden1). O valor predeterminado é 5. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Função de transferência de camada oculta Selecione a função de ativação a ser usada para a camada oculta (Th). Função de transferência de camada de saída Selecione a função de ativação a ser usada para a camada de saída (To). Derivativo de função de transferência de camada oculta Selecione o derivativo da função de ativação de camada oculta (Th.prime). Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 177 Propriedade Descrição Derivativo de função de transferência de camada de saída Selecione o derivativo da função de ativação de camada de saída (To.prime). Neurônios da camada2 oculta Insira o número de nós/neurônios na segunda camada oculta (hidden2). O valor predeterminado é 0. Iterações máximas Insira o número máximo de iterações para o algoritmo de oti mização (iter.max). O valor predeterminado é 5000. Colunas com monotonicidade Insira os índices de coluna à qual você deseja aplicar a restri ção de monotonicidade (monotone). Iterações de treinamento Insira o número de iterações de treinamento após as quais o cálculo da função de custos será interrompido (iter.stopped). Pesos iniciais Insira um vetor de peso inicial (init.weights). Exceções máximas Insira o número máximo de exceções para a rotina de otimiza ção (max.exceptions). Escalar coluna dependente Para escalar colunas dependentes até a média zero e variação unitária antes do ajuste, selecione Verdadeiro (scale.y) Agregação bootstrap necessária Para usar a agregação bootstrap, selecione Verdadeiro (bag). Testes para evitar mínimos locais Insira o número de testes repetidos para evitar mínimos locais (n.trials). Número de membros do conjunto Insira o número de membros do conjunto a serem ajustados (n.ensemble) 15.1.5.2 R de rede neural NNet As propriedades que podem ser configuradas para o algoritmo R de rede neural NNet. Sintaxe Use este algoritmo para previsão, classificação e reconhecimento de padrão estatístico usando as funções da biblioteca R. 178 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo R de rede neural NNet Tabela 88: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Valores possíveis: ● Tendência: prevê os valores da coluna dependente e adi ciona uma coluna extra à saída que contenha os valores previstos. ● Preenchimento: preenche os valores em falta na coluna de destino. Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: O algoritmo retém valores em falta. ● Parar: o algoritmo para se um valor estiver em falta na coluna independente ou na coluna dependente. Neurônios da camada oculta Insira o número de nós/neurônios na camada oculta. O valor predeterminado é 5. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Tipo de algoritmo Selecione o tipo de análise que deseja que o algoritmo exe cute. Ignorar camada oculta Para adicionar conexões skip-layer da entrada para a saída, selecione Verdadeiro. Saída linear Para obter uma saída linear, selecione Verdadeiro. Se você se lecionar o tipo de algoritmo Classificação, este valor deverá ser verdadeiro. Usar Softmax Selecione Verdadeiro para utilizar os ajustes "modelo de log li near" e "probabilidade condicional máxima". Linout, entropy, softmax e censored são mutuamente exclu dentes. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 179 Propriedade Descrição Usar entropia Para utilizar o ajuste de "probabilidade condicional máxima", selecione Verdadeiro. Por padrão, o algoritmo usa o método dos mínimos quadrados. Valores possíveis: ● Verdadeiro: use o ajuste "probabilidade condicional má xima". ● Falso: use o método dos mínimos quadrados. Usar Censored Para softmax, uma linha de (0,1,1) indica um exemplo das classes 2 e 3, mas para censored, indica um exemplo das classes 2 ou 3. Intervalo Insira pesos iniciais aleatórios [-rang, rang]. Defina este valor como 0,5 a menos que a entrada seja grande. Se a entrada for grande, escolha o intervalo usando a fórmula: rang * max(|x|) <= 1. Decaimento de peso Insira um valor usado para cálculo de novos pesos (weight de cay). Iterações máximas Insira o número máximo de iterações permitidas. Matriz hessiana necessária Para retornar uma medida hessiana no melhor conjunto de pesos, selecione Verdadeiro. Pesos máximos Insira o número máximo de pesos permitidos no cálculo. Não existe limite intrínseco no código, mas o aumento no nú mero de pesos pode permitir ajustes que serão bem lentos e demorados. Abstol Insira o valor que indica o ajuste perfeito (abstol). Reltol O algoritmo termina se o otimizador não puder reduzir os cri térios de ajuste pelo fator: 1 - reltol. Contrastes Insira a lista de contrastes a ser usada para fatores que apare cem como variáveis no modelo. 15.1.6 Clustering 15.1.6.1 HANA de valor médio K As propriedades que podem ser configuradas no algoritmo HANA de valor médio K. Sintaxe Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters. 180 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Nota ● Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o algoritmo HANA de valor médio K. No entanto, as observações em cada cluster permanecem iguais. ● A criação de modelos usando o algoritmo HANA de valor médio K não é suportada. Propriedades do algoritmo HANA de valor médio K Tabela 89: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Recursos Selecionar as colunas de entrada com as quais você deseje executar a análise. Colunas de categorias Selecionar as colunas de entrada, que você deseje considerar como colunas de categorias. Pesos de categorias Inserir os pesos de categorias. Calcular silhueta Selecionar essa opção para calcular valores de silhueta. Si lhueta significa a qualidade de clustering. O valor 1 de silhueta significa que o clustering é bom enquanto o valor 0 significa que o clustering é ruim. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contêm os valores em falta nas colunas independente ou depen dente. ● Manter: o algoritmo retém o registro que contenha valo res em falta durante o cálculo. Número de clusters Insira o número de grupos para clustering. O valor predeter minado é 5. Nome do cluster Insira um nome para a coluna recém criada que contenha o nome do cluster. Distância Insira um nome para a coluna recém-criada que contém a dis tância dos clusters de seus nomes de centroids. Iterações máximas Insira o número de iterações permitido para localização de clusters. O valor predeterminado é 100. Método de cálculo do centro Selecione o método a ser usado para cálculo inicial do centro do cluster. Medida da distância Insira o método para calcular a distância entre o item e o cen tro do cluster. Tipo de normalização Selecione o tipo de normalização. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 181 Propriedade Descrição Número de threads Insira o número de threads a ser usado na execução. O valor predeterminado é 1. Limite de saída Insira o valor limite para a saída das iterações. O valor prede terminado é 0,000000001. 15.1.6.2 HANA R de valor médio K As propriedades que podem ser configuradas no algoritmo HANA R de valor médio K. Sintaxe Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters. Nota ● Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o algoritmo HANA R de valor médio K. No entanto, as observações em cada cluster permanecem iguais. ● A criação de modelos usando o algoritmo HANA R de valor médio K não é suportada. Propriedades do HANA R de valor médio K Tabela 90: Propriedades do HANA R de valor médio K Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Número de clusters Insira o número de grupos para clustering. O valor predeter minado é 5. Nome do cluster Insira um nome para a coluna recém-criada que contenha os números do cluster. Iterações máximas Insira o número de iterações permitido para localização de clusters. O valor predeterminado é 100. Número de conjuntos iniciais de centro de cluster Insira o número de conjuntos iniciais aleatórios do centro de cluster para clustering (n inicial). O valor predeterminado é 1. 182 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedade Descrição Seed do centro de cluster inicial Insira um valor para selecionar aleatoriamente os centros de cluster iniciais pelos dados adquiridos. Tipo de algoritmo Selecione o tipo de algoritmo a ser usado para execução de clustering do HANA R de valores médios K. 15.1.6.3 Algoritmo HANA de clustering automático As propriedades que podem ser configuradas no algoritmo HANA de clustering automático. Sintaxe O algoritmo HANA de clustering automático é um algoritmo semissupervisionado ou destinado com design tal e otimizado para revelar segmentos que sejam relacionados a uma pergunta de negócios específica. Esse algoritmo descobre segmentos naturais ou comportamentos comuns em um conjunto de dados e fornece a descrição para cada segmento. Nota Ao utilizar o algoritmo HANA de clustering automático, é recomendável que você corte os valores antes de obter o conjunto de dados. Você pode encontrar a opção Cortar valores na seção Opções avançadas da caixa de diálogo "Novo conjunto de dados". O algoritmo HANA de clustering automático só está disponível no modo online (conectado ao SAP HANA). Há um algoritmo de clustering automático disponível no modo offline. Para mais informações sobre as funções utilizadas nos algoritmos automáticos online, consulte o Guia de referência de SAP Automated Predictive Library (APL) em http://help.sap.com/pa Propriedades do algoritmo HANA de clustering automático Tabela 91: Propriedades do algoritmo Propriedade Descrição Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise. Número mínimo de clusters Inserir o número mínimo de clusters que você deseja utilizar para clustering. Número máximo de clusters Inserir o número máximo de clusters que você deseja utilizar para clustering. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 183 Propriedade Descrição Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.6.4 Clustering automático As propriedades que podem ser configuradas no algoritmo de clustering automático. Sintaxe O clustering automático é um algoritmo semissupervisionado ou destinado com design tal e otimizado para revelar segmentos que sejam relacionados a uma pergunta de negócios específica. Esse algoritmo descobre segmentos naturais ou comportamentos comuns em um conjunto de dados e fornece a descrição para cada segmento. Nota Ao utilizar o algoritmo de clustering automático, é recomendável que você corte os valores antes de obter o conjunto de dados. Você pode encontrar a opção Cortar valores na seção Opções avançadas da caixa de diálogo "Novo conjunto de dados". Propriedades de clustering automático Tabela 92: Propriedades do algoritmo Propriedade Descrição Recursos Selecionar as colunas de entrada com as quais você deseje executar a análise. Variável de destino Selecionar a coluna de destino com a qual você deseja execu tar a análise. Número mínimo de clusters Inserir o número mínimo de clusters que você deseja utilizar para clustering. Número máximo de clusters Inserir o número máximo de clusters que você deseja utilizar para clustering. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.1.6.5 R de valor médio K As propriedades que podem ser configuradas no algoritmo R de valor médio K. 184 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Sintaxe Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters. Nota ● Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o algoritmo R de valor médio K. No entanto, as observações em cada cluster permanecem iguais. ● A criação de modelos usando o algoritmo R de valor médio K não é suportada. Propriedades do algoritmo R de valor médio K Tabela 93: Propriedades do algoritmo R de valor médio K Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Número de clusters Insira o número de grupos para clustering. Nome do cluster Insira um nome para a coluna recém criada que contenha o nome do cluster. Iterações máximas Insira o número de iterações permitido para localização de clusters. O valor predeterminado é 100. Número de conjuntos iniciais de centro de cluster Insira o número de conjuntos iniciais aleatórios de centros de cluster para clustering (n inicial). O valor predeterminado é 1. Seed do centro de cluster inicial Insira um valor para selecionar aleatoriamente os centros de cluster iniciais pelos dados adquiridos. Algoritmo Selecione o tipo de algoritmo a ser usado para execução de clustering de R de valores médios K. 15.1.6.6 Mapas de auto-organização HANA As propriedades que podem ser configuradas para o algoritmo Mapas de auto-organização HANA. Sintaxe Um mapa de auto-organização (SOM) ou mapa de recurso de auto-organização (SOFM) é um tipo de rede neural artificial com treinamento utilizando aprendizagem não supervisionada para produzir representação discreta com dimensão baixa (geralmente duas dimensões) do espaço da entrada das amostras de Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 185 treinamento, chamada mapa. Os mapas de auto-organização são diferentes de outras redes neurais artificiais no sentido de que usam uma função de vizinhança para preservar as propriedades topológicas do espaço de entrada. Isso torna os SOMs úteis para exibir visões de dimensão baixa de dados de dimensão alta, aparentando escalamento multidimensional. O modelo foi primeiramente descrito como uma rede neural artificial pelo professor finlandês Teuvo Kohonen, e algumas vezes é chamado de mapa Kohonen. Como a maioria das redes neurais artificiais, os SOMs funcionam de dois modos: treinamento e mapeamento. O treinamento cria o mapa usando exemplos de entrada. É um processo competitivo, também chamado quantização de vetor. O mapeamento automaticamente classifica um novo vetor de entrada. A abordagem SOM tem muitas aplicações como virtualização, clustering de documento da Web e reconhecimento de voz. Propriedades de mapas de auto-organização HANA Tabela 94: Propriedades do algoritmo Propriedade Descrição Altura do mapa Insira a altura do mapa. O valor predeterminado é 5. Largura do mapa Insira a largura do mapa. O valor predeterminado é 5. Alfa Insira um valor para a taxa de aprendizagem. O valor prede terminado é 0,5. Forma do mapa Selecione a forma do mapa. Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Calcular silhueta Selecionar essa opção para calcular valores de silhueta. Si lhueta significa a qualidade de clustering. O valor 1 de silhueta significa que o clustering é bom enquanto o valor 0 significa que o clustering é ruim. Nome do cluster Insira um nome para a nova coluna que contenha os números do cluster para o conjunto de dados informado. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém o registro que contenha valo res em falta durante o cálculo. 186 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedade Descrição Tipo de normalização Selecione o tipo de normalização. Tipos possíveis: ● Normalização não exigida ● Nova normalização de intervalo ● Normalização de pontuação zero Propagação aleatória Insira um número aleatório que deseja utilizar para executar o cálculo. Se você inserir -1, o algoritmo selecionará um número aleatório para cálculo. O valor predeterminado é -1. Iterações máximas Insira o número de iterações que você quer que o algoritmo use para localizar os clusters. O valor predeterminado é 100. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 2. 15.1.6.7 HANA DB Scan As propriedades que podem ser configuradas para o algoritmo HANA DB Scan. Sintaxe HANA DB Scan (Clustering espacial, baseado em densidade, de aplicações com ruído) é um algoritmo de clustering de dados baseado em densidade. Esse algoritmo localiza um número de clusters iniciando a partir da distribuição de densidade estimada de nós correspondentes. DB Scan necessita de dois parâmetros: raio de scan (eps) e o número mínimo de pontos necessários para formar um cluster (minPts). O algoritmo inicia por um ponto de partida arbitrário que não foi visitado. A vizinhança eps desse ponto é recuperada e se um número de pontos que ela contiver for igual ou superior a minPts, um cluster será iniciado. Caso contrário, o ponto será etiquetado como ruído. Esses dois parâmetros são muito importantes e costumam ser determinados pelo usuário. PAL fornece um método para determinar automaticamente esses dois parâmetros. Você pode optar por especificar os parâmetros ou deixar que o sistema os determine. Propriedades de HANA DB Scan Tabela 95: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecionar o modo pelo qual você deseja utilizar a saída desse algoritmo. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 187 Propriedade Descrição Definir parâmetros automaticamente Para ativar o algoritmo para determinar automaticamente os parâmetros de radio e pontos mínimos, selecionar Verda deiro, caso contrário selecionar Falso. Recursos Selecionar as colunas de entrada com as quais você deseje executar a análise. Calcular silhueta Selecionar essa opção para calcular valores de silhueta. Si lhueta significa a qualidade de clustering. O valor 1 de silhueta significa que o clustering é bom enquanto o valor 0 significa que o clustering é ruim. Nome do cluster Inserir um nome para a nova coluna que contenha os núme ros do cluster para o conjunto de dados (cluster) informado. Valores em falta Selecionar o método para manipulação dos valores em falta. Métodos possíveis: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta nas colunas independente ou depen dente. ● Manter: o algoritmo retém o registro que contenha valo res em falta durante o cálculo. Medida da distância Selecionar a opção para computação da distância entre itens e centro do cluster. Número de threads Inserir o número de threads que o algoritmo deva utilizar para execução. O valor predeterminado é 1. 15.1.7 Associação 15.1.7.1 HANA Apriori As propriedades que podem ser configuradas para o algoritmo HANA Apriori. Sintaxe Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados transacionais volumosos para gerar regras de associação. Este algoritmo é usado para identificar quais produtos e serviços os clientes tendem a adquirir simultaneamente. Analisando as tendências de compra dos clientes com a análise de associação, você pode prever o comportamento futuro. Por exemplo, a informação de que o cliente que compra sapatos tende mais a comprar meias ao mesmo tempo pode ser representada nesta regra de associação (com um suporte mínimo e uma confiança mínima): Sapatos=> Meias [suporte = 0.5, confiança = 0.1] Nota A criação de modelos usando o algoritmo Apriori HANA não é suportada. 188 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo HANA Apriori Tabela 96: Propriedades do algoritmo Propriedade Descrição Tipo de Apriori Selecione Apriori. Coluna do item Selecione as colunas que contenham os itens que você deseja aplicar ao algoritmo. Coluna de TransactionID Selecione a coluna que contenha os IDs de transação que você deseja aplicar ao algoritmo. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os valores em falta para pro cessamento. Suporte Insira um valor para o suporte mínimo de um item. O valor predeterminado é 0,1. Confiança Insira um valor para a confiança mínima de regras/associação O valor predeterminado é 0,8. Contagem máxima de item Insira o comprimento dos itens principais e dos itens depen dentes na saída. O valor predeterminado é 5. Número de threads Insira o número de threads com o qual o algoritmo deve exe cutar. O valor predeterminado é 1. 15.1.7.2 HANA AprioriLite As propriedades que podem ser configuradas para o algoritmo HANA AprioriLite. Sintaxe Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados transacionais volumosos para gerar regras de associação. Apriori Lite também suporta a amostragem no algoritmo. Nota ● Você pode usar o HANA AprioriLite das propriedades do algoritmo HANA Apriori selecionando AprioriLite como o Tipo a priori. ● A criação de modelos usando o algoritmo HANA AprioriLite não é suportada. ● Calcula apenas dois grandes conjuntos de itens. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 189 Propriedades do algoritmo HANA AprioriLite Tabela 97: Propriedades do algoritmo Propriedade Descrição Tipo de Apriori Clique em AprioriLite. Coluna do item Selecione as colunas que contenham os itens que você deseja aplicar ao algoritmo. Coluna de TransactionID Selecione a coluna que contenha os IDs de transação que você deseja aplicar ao algoritmo. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: o algoritmo retém os valores em falta para pro cessamento. Suporte Insira um valor para o suporte mínimo de um item. O valor predeterminado é 0,1. Confiança Insira um valor para a confiança mínima de regras/associação O valor predeterminado é 0,8. Amostragem necessária Selecione essa opção se deseja realizar uma amostra dos da dos. Porcentagem da amostragem Insira a porcentagem da amostragem. Recálculo necessário Selecione essa opção se deseja recalcular o suporte e con fiança em cada iteração. Número de threads Insira o número de threads a ser usado na execução. 15.1.7.3 HANA R apriori As propriedades que podem ser configuradas para o algoritmo HANA R Apriori. Sintaxe Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados transacionais volumosos para gerar regras de associação usando o pacote R "arules". Este algoritmo é usado para identificar quais produtos e serviços os clientes tendem a adquirir simultaneamente. Analisando as tendências de compra dos clientes com uma análise de associação, o comportamento futuro pode ser previsto. Por exemplo, a informação de que o cliente que compra sapatos tende mais a comprar meias ao mesmo tempo pode ser representada nesta regra de associação (com um suporte mínimo e uma confiança mínima): Sapatos=> Meias [suporte = 0.5, confiança = 0.1] 190 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades do algoritmo HANA R apriori Tabela 98: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Formato de entrada Selecione o formato dos dados de entrada. Colunas de item Selecione as colunas que contenham os itens que você deseja aplicar ao algoritmo. Coluna de TransactionID Selecione a coluna que contenha os IDs de transação que você deseja aplicar ao algoritmo. Suporte Insira um valor para o suporte mínimo de um item. Confiança Insira um valor para a confiança mínima de regras/associação Regras Insira um nome para a nova coluna que contenha as regras apriori para o conjunto de dados informado. Valores de suporte Insira um nome para a nova coluna que contenha o suporte para as regras correspondentes. Valores de confiança Insira um nome para a nova coluna que contenha valores de confiança para as regras correspondentes. Valores de aumento Insira um nome para a nova coluna que contenha valores de aumento para as regras correspondentes. ID da transação Insira um nome para a nova coluna que contenha o ID de tran sação. Itens Insira um nome para a nova coluna que contenha os nomes dos itens. Regras correspondentes Insira um nome para a nova coluna que contenha as regras correspondentes. Item(ns) LE Insira etiquetas separadas por vírgula para os itens que de vem aparecer à esquerda das regras ou dos conjuntos de itens. Item(ns) LD Insira etiquetas separadas por vírgula para os itens que de vem aparecer à direita das regras ou dos conjuntos de itens. Ambos os itens Insira etiquetas separadas por vírgula para os itens que de vem aparecer em ambos os lados das regras ou dos conjun tos de itens. Nenhum item Insira etiquetas separadas por vírgula para os itens que não precisam aparecer nas regras ou nos conjuntos de itens. Aparência padrão Insira a aparência padrão dos itens não mencionados explici tamente. Tipo de classificação Selecione a opção de classificação para classificar os itens por frequência. Filtrar critérios Insira um valor numérico indicando como filtrar os itens não usados das transações. O valor predeterminado é 0,1. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 191 Propriedade Descrição Utilizar estrutura em árvore Para organizar transações como árvore de prefixos, selecione Verdadeiro. Usar HeapSort Para usar heapsort em vez de quicksort para classificar as transações, selecione Verdadeiro. Otimizar memória Para minimizar o uso da memória em vez de maximizar a ve locidade, selecione Verdadeiro. Carregar transações na memória Para carregar transações na memória, selecione Verdadeiro. 15.1.7.4 R apriori As propriedades que podem ser configuradas para o algoritmo R Apriori. Sintaxe Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados transacionais volumosos para gerar regras de associação usando o pacote R "arules". Este algoritmo é usado para identificar quais produtos e serviços os clientes tendem a adquirir simultaneamente. Analisando as tendências de compra dos clientes com uma análise de associação, o comportamento futuro pode ser previsto. Por exemplo, a informação de que o cliente que compra sapatos tende mais a comprar meias ao mesmo tempo pode ser representada nesta regra de associação (com um suporte mínimo e uma confiança mínima): Sapatos=> Meias [suporte = 0,5, confiança = 0,1] Propriedades do algoritmo R apriori Tabela 99: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Formato de entrada Selecione o formato dos dados de entrada. Colunas de item Selecione as colunas que contenham os itens que você deseja aplicar ao algoritmo. Coluna de TransactionID Selecione a coluna que contenha os IDs de transação que você deseja aplicar ao algoritmo. Suporte Insira um valor para o suporte mínimo de um item. O valor predeterminado é 0,1. Confiança Insira um valor para a confiança mínima de regras/associação O valor predeterminado é 0,8. 192 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedade Descrição Regras Insira um nome para a nova coluna que contenha as regras apriori para o conjunto de dados informado. Valores de suporte Insira um nome para a nova coluna que contenha o suporte para as regras correspondentes. Valores de confiança Insira um nome para a nova coluna que contenha valores de confiança para as regras correspondentes. Valores de aumento Insira um nome para a nova coluna que contenha valores de aumento para as regras correspondentes. ID da transação Insira um nome para a nova coluna que contenha o ID de tran sação. Itens Insira um nome para a nova coluna que contenha os nomes dos itens. Regras correspondentes Insira um nome para a nova coluna que contenha as regras correspondentes. Item(ns) LE Insira etiquetas separadas por vírgula para os itens que de vem aparecer à esquerda das regras ou dos conjuntos de itens. Item(ns) LD Insira etiquetas separadas por vírgula para os itens que de vem aparecer à direita das regras ou dos conjuntos de itens. Ambos os itens Insira etiquetas separadas por vírgula para os itens que de vem aparecer em ambos os lados das regras ou dos conjun tos de itens. Nenhum item Insira etiquetas separadas por vírgula para os itens que não precisam aparecer nas regras ou nos conjuntos de itens. Aparência padrão Insira a aparência padrão dos itens não mencionados explici tamente. Tipo de classificação Selecione a opção de classificação para classificar os itens por frequência. Filtrar critérios Insira um valor numérico indicando como filtrar os itens não usados das transações. O valor predeterminado é 0,1. Utilizar estrutura em árvore Para organizar transações como árvore de prefixos, selecione Verdadeiro. Usar HeapSort Para usar heapsort em vez de quicksort para classificar as transações, selecione Verdadeiro. Otimizar memória Para minimizar o uso da memória em vez de maximizar a ve locidade, selecione Verdadeiro. Carregar transação na memória Para carregar transações na memória, selecione Verdadeiro. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 193 15.1.8 Classificação 15.1.8.1 HANA KNN As propriedades que podem ser configuradas para o algoritmo HANA KNN. Sintaxe Use este componente para classificar os objetos com base nos dados de amostra treinados. No KNN, os objetos são classificados pela maioria dos votos da vizinhança. Nota A criação de modelos usando o algoritmo HANA KNN não é suportada. Propriedades do algoritmo HANA KNN Tabela 100: Propriedades do algoritmo Propriedade Descrição Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Contagem da vizinhança Insira o número de vizinhos a ser considerado para determi nar distâncias. O valor predeterminado é 5. Tipo de votação Selecione o tipo de votação para o cálculo da contagem de vi zinhança. Valores em falta Selecione o método para manipulação dos valores em falta. ● Ignorar: o algoritmo ignora os registros que contêm valo res em falta nos recursos ou variáveis de destino. ● Manter: O algoritmo retém os valores em falta. Nome do esquema Insira o nome do esquema que contenha os dados treinados. Nome da tabela Insira o nome da tabela que contenha os dados treinados. Colunas independentes Insira as colunas de entrada que deseja considerar no treina mento dos dados. Coluna dependente Insira a coluna de saída que deseja considerar no treinamento dos dados. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores de classificação. Número de threads Insira o número de threads utilizando aquele que deseja que o algoritmo execute. O valor predeterminado é 1. 194 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente 15.1.8.2 Análise ABC HANA As propriedades que podem ser configuradas para o algoritmo Análise ABC HANA. Sintaxe Use esse algoritmo para classificar objetos (como clientes, empregados ou produtos) com base em uma medida específica (como receita ou lucro). Ele sugere que os estoques de uma organização não tem o valor igual. Portanto, os estoques podem ser agrupados em três categorias (A, B e C) por sua importância estimada. Itens "A" são muitos importantes para uma organização. Itens "B" são de importância média, ou seja, menos importantes que itens "A" e mais importes que itens "C". Itens "C" são o de menor importância. A seguir há um exemplo de classificação ABC: ● Itens "A" – 20% de contas de itens para 70% do valor de consumo anual de todos os itens. ● Itens "B" – 30% de contas de itens para 25% do valor de consumo anual de todos os itens. ● Itens "C" – 50% de contas de itens para 5% do valor de consumo anual de todos os itens. Propriedades da análise ABC HANA Tabela 101: Propriedades do algoritmo Propriedade Descrição Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contêm valo ● Manter: o algoritmo retém o registro que contenha valo res em falta nos recursos ou variáveis de destino. res em falta durante o cálculo. Detalhamento da porcentagem de A Insira a porcentagem de itens que deseja classificar no grupo A. O valor padrão é 40. O intervalo possível é 0-100%. Certifi que-se de que a soma das porcentagens dos itens nos grupos A, B e C seja igual a 100%. Detalhamento da porcentagem de B Insira a porcentagem de itens que deseja classificar no grupo B. O valor padrão é 30. O intervalo possível é 0-100%. Certifi que-se de que a soma das porcentagens dos itens nos grupos A, B e C seja igual a 100%. Detalhamento da porcentagem de C Insira a porcentagem de itens que deseja classificar no grupo C. O valor padrão é 30. O intervalo possível é 0-100%. Certifi que-se de que a soma das porcentagens dos itens nos grupos A, B e C seja igual a 100%. Número de threads Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 30. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 195 Propriedade Descrição Nome da coluna prevista Insira um nome para a coluna recém-adicionada que conte nha os valores previstos. 15.1.8.3 Análise de pontuação ponderada HANA As propriedades que podem ser configuradas para o algoritmo Análise de pontuação ponderada HANA. Sintaxe Uma tabela de pontuação ponderada é um método para avaliar alternativas quando a importância de cada critério for diferente. Em uma tabela de pontuação ponderada, é fornecida a cada alternativa uma pontuação em cada critério. Essas pontuações são então ponderadas pela importância de cada critério. Todas as pontuações ponderadas de uma alternativa são adicionadas juntas para calcular sua pontuação ponderada total. A alternativa com a pontuação total mais alta deve ser a melhor alternativa. Você pode utilizar as tabelas de pontuação ponderada para criar previsões sobre o comportamento futuro do cliente. Você primeiro deve criar um modelo com base nos dados históricos na aplicação de mineração de dados, e então aplicar o modelo aos novos dados para ter uma previsão. A previsão, ou seja, a saída do modelo, é chamada de uma pontuação. Você pode criar uma única pontuação para seus clientes considerando dimensões diferentes. Uma função definida pelas tabelas de pontuação ponderada é uma combinação linear de funções de uma variável. f(x1,…,xn) = w1× f 1(x1) + … + wn× f n(xn) Análise de pontuação ponderada HANA Tabela 102: Propriedades do algoritmo Propriedade Descrição Nome da coluna Selecione a coluna de entrada com a qual você deseja execu tar a análise. Tipo Selecione o tipo "Discreto" se a coluna selecionada tem dados categóricos ou selecione o tipo "Contínuo" se a coluna sele cionada tem dados numéricos. Pesos Insira os pesos para a coluna selecionada. O valor predetermi nado é 0,0. Chaves e pontuações Insira os valores para chaves e pontuações. Valores em falta Selecione o método para manipulação dos valores em falta. 196 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. ● Ignorar: o algoritmo ignora os registros que contêm valo res em falta nos recursos ou variáveis de destino. ● Manter: O algoritmo retém valores em falta. Guia do usuário do Expert Analytics Propriedades do componente Propriedade Descrição Número de threads Insira o número de threads com o qual o algoritmo deve exe cutar. O valor predeterminado é 1. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores previstos. 15.1.8.4 HANA Naive Bayes As propriedades que podem ser configuradas para o algoritmo HANA Naive Bayes. Sintaxe Niave Bayes é um algoritmo de classificação baseado no teorema de Bayes. Ele estima a probabilidade condicional de classe presumindo que os atributos são condicionalmente independentes entre si. Apesar de sua simplicidade, o Naive Bayes funciona muito bem em áreas como classificação de documentos e filtro de lixo eletrônico, e ele só requere uma pequena quantidade de dados de treinamento para estimar os parâmetros necessários para classificação. Propriedades do HANA Naive Bayes Tabela 103: Propriedades do algoritmo Propriedade Descrição Modo de saída Selecione o modo em que você deseja usar a saída deste algo ritmo. Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Variável de destino Selecione a coluna de destino com a qual você deseja execu tar a análise. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Amortecimento Laplace Insira a constante de amortecimento para observações de amortecimento. A constante de amortecimento deve ser um valor duplo maior que 0. Insira 0 para desativar o amorteci mento Laplace. Valores em falta Selecione o método para manipulação dos valores em falta. Número de threads Guia do usuário do Expert Analytics Propriedades do componente ● Ignorar: o algoritmo ignora os registros que contêm valo res em falta nos recursos ou variáveis de destino. ● Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo. Insira o número de threads que o algoritmo deve usar durante a execução. O valor predeterminado é 1. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 197 15.1.8.5 Algoritmo HANA de classificação automática As propriedades que podem ser configuradas no algoritmo HANA de classificação automática. Sintaxe O algoritmo HANA de classificação automática é utilizado para a classificação binária/categórica. Esse algoritmo detecta o tipo de modelo e algoritmo utilizado para adequar-se melhor com base na variável de destino selecionada. Ele também decide se a entrada deve ser contínua ou categórica e determina o binning mais apropriado para variáveis. Como resultado, você pode reduzir a preparação de dados e as atividades de teste de modelo que executar ao desenvolver um modelo preditivo. Além disso, ele também cria conjuntos de dados de treinamento e validação para avaliação de modelo. O algoritmo HANA de classificação automática só está disponível no modo online (conectado ao SAP HANA). Há um algoritmo de classificação automática disponível no modo offline. Para mais informações sobre as funções utilizadas nos algoritmos automáticos online, consulte o Guia de referência de SAP Automated Predictive Library (APL) em http://help.sap.com/pa Propriedades do algoritmo HANA de classificação automática Tabela 104: Propriedades do algoritmo Propriedade Descrição Recursos Selecione as colunas de entrada com as quais você deseja executar a análise. Variável de destino Selecione a coluna de destino na qual você deseja executar a análise. Nome da coluna prevista Insira um nome para uma nova coluna que contenha os valo res previstos. 15.1.8.6 Classificação automática As propriedades que podem ser configuradas no algoritmo de classificação automática. Sintaxe O algoritmo de classificação automática é utilizado para a classificação binária/categórica. Esse algoritmo detecta o tipo de modelo e algoritmo utilizado para adequar-se melhor com base na variável de destino selecionada. Ele também decide se a entrada deve ser contínua ou categórica e determina o binning mais apropriado para variáveis. Como resultado, você pode reduzir a preparação de dados e as atividades de teste de modelo que executar ao desenvolver um modelo preditivo. Além disso, ele também cria conjuntos de dados de treinamento e validação para avaliação de modelo. 198 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades da classificação automática Tabela 105: Propriedades do algoritmo Propriedade Descrição Recursos Selecionar as colunas de entrada com as quais você deseje executar a análise. Variável de destino Selecione a coluna de destino na qual você deseja executar a análise. Nome da coluna prevista Insira um nome para uma nova coluna que contenha os valo res previstos. 15.1.8.7 Máquina de vetores de suporte HANA As propriedades que podem ser configuradas para o algoritmo Máquina de vetores de suporte HANA. Sintaxe As máquinas de vetores de suporte (SVMs) se referem a uma família de modelos de aprendizagem supervisionada que utiliza o conceito de vetor de suporte. Em comparação com muitos outros modelos de aprendizagem supervisionada, as SVMs levam vantagem porque os modelos por elas produzidos podem ser lineares ou não lineares, sendo que os últimos são realizados por uma técnica chamada Kernel Trick (Truque de função kernel [de núcleo]). Como na maioria dos modelos supervisionados, há fase de treinamento e fase de testes para as SVMs. Na fase de treinamento, aprende-se sobre uma função f(x):->y onde f(∙) é uma função (pode ser não linear) mapeando uma amostra em um DESTINO. O conjunto de treinamento consiste em pares indicados por {xi, yi}, onde xindica uma amostra representada por vários atributos e y indica um DESTINO (informações supervisionadas). Na fase de testes, a função aprendida f(∙) é utilizada adicionalmente para mapear uma amostra com DESTINO desconhecido em um DESTINO previsto. Na implementação atual em PAL, as SVMs podem ser utilizadas para as três tarefas seguintes: ● Classificação de vetores de suporte (SVC) A classificação é uma das tarefas mais frequentes em muitos campos, inclusive aprendizagem por máquina, mineração de dados, visão computacional e análise de dados comerciais. Em comparação com classificadores lineares como regressão logística, a SVC está apta a produzir limite decisório não linear que leva a melhor precisão em alguns conjuntos de dados do mundo real. No cenário de classificação, f(∙) se refere à função de decisão e um DESTINO se refere à "etiqueta" representada por um número real. ● Regressão de vetores de suporte (SVR) SVR é um outro método para análise de regressão. Em comparação com métodos clássicos de regressão linear, como regressão de mínimos quadrados, a função de regressão em SVR pode ser não linear. No cenário de regressão, f(∙) se refere à função de regressão e um DESTINO se refere à "resposta" representada por um número real. ● Ranking de vetores de suporte Isso implementa um algoritmo de "aprendizagem de ranking" de pares que aprende sobre uma função a partir de vários conjuntos (distintos por ID da consulta) e amostras sob ranking. No cenário de ranking, f(∙) se refere à função de ranking e DESTINO se refere à pontuação, a partir da qual o ranking final é feito. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 199 Para ranking de pares, f(∙) é aprendida de modo que é considerada a relação de pares expressando o rank das amostras dentro de cada conjunto. Devido ao fato da não linearidade ser realizada via Kernel Trick, além dos conjuntos de dados os parâmetros e tipo de kernel devem também ser especificados. Propriedades da máquina de vetores de suporte HANA Tabela 106: Propriedades do algoritmo Propriedade Descrição Tipo de algoritmo Selecione o tipo de análise que o algoritmo deva executar. ● Classificação ● Regressão ● Ranking Modo de saída Selecione o modo pelo qual você deseja utilizar a saída desse algoritmo. Recursos Selecione as colunas de entrada com as quais você deseje executar a análise. Variável de destino Selecione a coluna de destino na qual você deseja executar a análise. ID da consulta Selecione uma coluna de ID da consulta para Ranking. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: ● Ignorar: o algoritmo ignora os registros que contêm os valores em falta nas colunas independente ou depen dente. ● Manter: o algoritmo retém o registro que contenha valo res em falta durante o cálculo. Tipo de kernel Selecione o tipo de kernel. Gama Insira o coeficiente gama para o kernel RBF. Margem máxima Insira um valor de substitutibilidade que você deseje conside rar entre o erro e a margem de treinamento. Grau Insira um grau para kernel polinomial. O valor predeterminado é 3. Coeficiente linear Insira um valor para coeficiente linear. Constante de coeficiente Insira um valor para constante de coeficiente. Validação cruzada Selecione essa opção para utilizar validação cruzada para cál culo. Tipo de normalização Selecione o tipo de normalização. 200 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedade Descrição Número de threads Insira o número de threads que o algoritmo deva utilizar para execução. O valor predeterminado é 1. Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos. 15.2 Componentes de preparação de dados Use os componentes de preparação de dados para preparar os dados para análise. Os componentes são opcionais. 15.2.1 Fórmula As propriedades que podem ser configuradas para o componente de preparação da fórmula. Sintaxe Use este componente para aplicar funções e operadores predefinidos aos dados. Todas as funções e expressões, exceto as funções de manipulação de dados, adicionam uma nova coluna com o resultado da fórmula. Nota Ao inserir uma string literal que contenha aspas simples, cada aspa dentro da string literal deve ser acompanhada de uma barra invertida. Por exemplo, insira 'Customer's' como 'Customer\'s'. Nota Ao inserir o nome de uma coluna que contenha colchetes, cada colchete dentro do nome da coluna deve ser acompanhada de uma barra invertida. Por exemplo, insira [Customer[Age]] como [Customer\[Age\]]. Propriedades da fórmula Tabela 107: Propriedades do componente de preparação de dados Propriedade Descrição Nome da fórmula Insira um nome para a nova coluna criada aplicando a fór mula. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 201 Propriedade Descrição Expressão Insira a fórmula que você deseja aplicar. Por exemplo, Ave rage([Age]). Exemplo Calculando a idade média dos funcionários Tabela Employee: Emp ID (ID do Emp Name (Nome DOB (Data de funcionário) do funcionário) nascimento) Age (Idade) Date of Joining Date of (Data de Confirmation (Data contratação) de confirmação) 1 Laura 11/11/1986 25 12/9/2005 27/11/2005 2 Desy 12/5/1981 30 24/6/2000 10/7/2000 3 Alex 30/5/1978 33 10/10/1998 24/12/1998 4 John 6/6/1979 32 2/12/1999 20/12/1999 Para calcular a idade média dos funcionários, siga estes procedimentos: 1. Arraste o componente Fórmula até o editor de análise. 2. Na visão de propriedades, insira um nome para a fórmula. Por exemplo, Average_Age. 3. No campo Expressão, insira a fórmula: AVERAGE([Age]) 4. Selecione Validar para validar a sintaxe da fórmula. 5. Selecione Concluído. Tabela de saída: Emp ID (ID do Emp Name DOB (Data de funcionário) (Nome do nascimento) Age (Idade) funcionário) Date of Joining Date of (Data de Confirmation Average_Age contratação) (Data de confirmação) 1 Laura 11/11/1986 25 12/9/2005 27/11/2005 30 2 Desy 12/5/1981 30 24/6/2000 10/7/2000 30 3 Alex 30/5/1978 33 10/10/1998 24/12/1998 30 4 John 6/6/1979 32 2/12/1999 20/12/1999 30 Funções suportadas Categoria Função (Função aplicada à tabela Descrição Employee) Data 202 DAYSBETWEEN PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Retorna o número de dias entre duas datas. Guia do usuário do Expert Analytics Propriedades do componente Categoria Função (Função aplicada à tabela Descrição Employee) CURRENTDATE Retorna a data atual do sistema. MONTHSBETWEEN Retorna o número de meses entre duas datas. Por exemplo, a nova coluna contém 2,0,2,0 quando a função MONTHSBETWEEN([Date of Joining], [Date of Confirmation]) é aplicada à tabela Employee. DAYNAME Retorna o nome do dia em formato de string. Por exemplo, a nova coluna contém Monday, Saturday, Saturday, Thursday quando a função DAYNAME([Date of Joining]) é aplicada à tabela Employee. DAYNUMBEROFMONTH Retorna o número do dia de um mês específico. Por exemplo, 12/11/1980 retorna 12. DAYNUMBEROFWEEK Retorna o número do dia de uma semana. Por exemplo, Sunday =1, Monday=2. DAYNUMBEROFYEAR Retorna o número do dia de um ano. Por exemplo, 1st Jan =1, 1st Feb=32, 3rd Feb=34. LASTDATEOFWEEK Retorna a data do último dia de uma semana. Por exemplo, 12/9/2005 retorna 17/9/2005 LASTDATEOFMONTH Retorna a data do último dia de um mês. Por exemplo, 12/9/2005 retorna 30/9/2005 MONTHNUMBEROFYEAR Retorna o número do mês de uma data. Por exemplo, Jan=1, Feb=2, Mar=3 WEEKNUMBEROFYEAR Retorna o número da semana de um ano. Por exemplo, 12/9/2005 retorna 38. QUARTERNUMBEROFDATE Retorna o número do trimestre de uma data. Por exemplo, 12/9/2005 retorna 3. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 203 Categoria Função (Função aplicada à tabela Descrição Employee) String CONCAT Concatena duas strings. Por exemplo, CONCAT('USA', 'Australia') retorna USAAustralia. INSTRING Retorna verdadeiro - se a string de pesquisa for encontrada na string de origem. Por exemplo, INSTRING('USA', 'US') retorna verdadeiro. SUBSTRING Retorna uma substring da string de origem. Por exemplo, SUBSTRING('USA', 1,2) retorna US. Matemática Manipulação de dados STRLEN Retorna o número de caracteres na string de origem. Por exemplo, STRLEN('Australia') retorna 9. MÁX Retorna o valor máximo de uma coluna. MÍN Retorna o valor mínimo de uma coluna. CONTAGEM Retorna o número de valores de uma coluna. SOMA Retorna a soma dos valores de uma coluna. AVERAGE Retorna a média dos valores de uma coluna. @REPLACE Executa a substituição de uma string no local. Por exemplo, @REPLACE([country],'USA', 'AMERICA') substitui USA por AMERICA na coluna de países. @BLANK Substitui os valores em branco por um valor específico. Por exemplo, @BLANK([country], 'USA') substitui todos os valores em branco por USA na coluna de países. @SELECT Seleciona linhas que satisfaçam a condição dada. Você pode usar qualquer operador condicional para especificar a condição. Por exemplo, @SELECT([country]=='USA') seleciona linhas cujo país seja igual a USA. 204 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Categoria Função (Função aplicada à tabela Descrição Employee) Expressão condicional IF(condição) THEN(expressão de string/expressão matemática/ expressão condicional) ELSE(expressão de string/expressão matemática/ expressão condicional) Verifica se a condição é cumprida e retorna um valor se 'verdadeiro' e outro valor se 'falso'. Por exemplo, IF([Date of Joining]>12/9/2005) THEN ('Funcionário contratado após 12/09/2005') ELSE ('Funcionário contratado em ou antes de 12/09/2005') Nota Expressões matemáticas contendo funções que retornem valor numérico não são suportadas. Por exemplo, a expressão DAYNUMBEROFMONTH(CURRENTDATE())+2 não é suportada porque DAYNUMBEROFMONTH retorna um valor numérico. Operadores matemáticos Use operadores matemáticos para criar fórmulas contendo colunas numéricas e/ou números. Por exemplo, a expressão [Age] + 1 adiciona uma nova coluna com os valores 26, 31, 34, 33. Operadores matemáticos Descrição + Operador de adição - Operador de subtração * Operador de multiplicação / Operador de divisão () Parêntesis ^ Operador de potência % Operador de módulo E Operador de exponencial Operadores condicionais Use os operadores condicionais para criar expressões IF THEN ELSE ou SELECT. Operadores condicionais Descrição == Igual a Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 205 Operadores condicionais Descrição != Diferente de < Menor que > Maior que <= Menor que ou igual a >= Maior que ou igual a Operadores lógicos Use operadores lógicos para comparar duas condições e retornar 'verdadeiro' ou 'falso'. Por exemplo, IF([Date of Joining]>12/9/2005 && [Age] >=25 ) THEN ('Verdadeiro') ELSE ('Falso') adiciona uma nova coluna com os valores Verdadeiro, Falso, Falso, Falso. Operadores lógicos Descrição && AND || OR 15.2.2 Amostra As propriedades que podem ser configuradas para o componente de preparação da amostra. Sintaxe Use este componente para selecionar um subconjunto de dados de conjuntos de dados volumosos. O componente Amostra suporta estes tipos de amostra: ● Primeiro N: seleciona o primeiro registro N do conjunto de dados. ● Último N: seleciona o último registro N do conjunto de dados. ● Cada Nth: seleciona todo n-ésimo registro do conjunto de dados, em que N representa um intervalo. Por exemplo, se N=2, o 2º, 4º, 6º e 8º registros são selecionados e assim por diante. ● Aleatório simples: seleciona aleatoriamente os registros de N tamanho ou N percentual de registros de um conjunto de dados. ● Aleatório sistemático: neste tipo de amostra, os intervalos ou os subgrupos numéricos de amostra são criados com base no tamanho do subgrupo numérico. O componente Amostra seleciona aleatoriamente o n-ésimo registro do primeiro subgrupo numérico e o n-ésimo registro de cada subgrupo numérico subsequente. 206 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Propriedades da amostra Tabela 108: Propriedades do componente de preparação de dados Propriedade Descrição Tipo de amostragem Selecione o tipo de amostragem. Limitar linhas por Selecione o método para limitação das linhas. Número de linhas Insira o número de linhas que deseja selecionar. Percentual de linhas Insira a porcentagem de linhas que deseja selecionar. Tamanho do subgrupo numérico Insira o tamanho do subgrupo numérico em que deseja sele cionar uma linha aleatória. Tamanho da etapa Insira o intervalo entre as linhas que deseja selecionar. Máximo de linhas Insira o número máximo de linhas que deseja selecionar. Exemplo Selecionando um subconjunto de dados de um conjunto de dados informado Emp ID (ID do funcionário) Emp Name (Nome do DOB (Data de nascimento) Age (Idade) funcionário) 1 Laura 11/11/1986 25 2 Desy 12/5/1981 30 3 Alex 30/5/1978 33 4 John 6/6/1979 32 5 Ted 4/7/1987 24 6 Tom 30/6/1970 41 7 Anna 24/6/1965 46 8 Valerie 6/7/1990 21 9 Mary 19/9/1985 26 10 Martin 21/11/1986 25 Resultados da amostra: 1. Primeiro N: para N=5 Emp ID (ID do funcionário) Emp Name (Nome do DOB (Data de nascimento) Age (Idade) funcionário) 2. 1 Laura 11/11/1986 25 2 Desy 12/5/1981 30 3 Alex 30/5/1978 33 4 John 6/6/1979 32 5 Ted 4/7/1987 24 Último N: para N=4 Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 207 Emp ID (ID do funcionário) Emp Name (Nome do DOB (Data de nascimento) Age (Idade) funcionário) 3. 7 Anna 24/6/1965 46 8 Valerie 6/7/1990 21 9 Mary 19/9/1985 26 10 Martin 21/11/1986 25 Emp Name (Nome do DOB (Data de nascimento) Age (Idade) Cada Nth: intervalo=3 Emp ID (ID do funcionário) funcionário) 4. 3 Alex 30/5/1978 33 6 Tom 30/6/1970 41 9 Mary 19/9/1985 26 DOB (Data de nascimento) Age (Idade) Aleatório simples: para número de linhas=2 Quaisquer duas linhas pode ser o resultado. Emp ID (ID do funcionário) Emp Name (Nome do funcionário) 5. 7 Anna 24/6/1965 46 8 Valerie 6/7/1990 21 Aleatório sistemático: tamanho do subgrupo numérico=4 Emp ID (ID do funcionário) Emp Name (Nome do DOB (Data de nascimento) Age (Idade) funcionário) 2 Desy 12/5/1981 30 6 Tom 30/6/1970 41 10 Martin 21/11/1986 25 Emp Name (Nome do DOB (Data de nascimento) Age (Idade) ou Emp ID (ID do funcionário) funcionário) 1 Laura 11/11/1986 25 5 Ted 4/7/1987 24 9 Mary 19/9/1985 26 15.2.3 Definição de tipo de dados As propriedades que podem ser configuradas para o componente de preparação da definição do tipo de dados. 208 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Sintaxe Use este componente para alterar o nome, o tipo de dados e o formato de data da coluna de origem. A definição do tipo de dados facilita a preparação dos dados para torná-los adequados para uma análise posterior. Por exemplo: ● Se o nome da coluna na fonte de dados for "des", isso pode não ficar claro durante a análise. Na análise, você pode alterar o nome da coluna para "Designação", para que o usuário final entenda facilmente. ● Se a data estiver armazenada no formato mmddaa (120201, sem qualquer separador de datas), o sistema pode interpretá-la como um valor inteiro. Usando o componente de definição de tipo de dados, você pode alterar o formato da data para qualquer formato válido, como mm/dd/aaaa ou dd/mm/aaaa e assim por diante. Para alterar o nome, o tipo de dados e o formato da data da coluna de origem, siga estes procedimentos: 1. Adicione na análise o componente de definição de tipo de dados. 2. Pelo menu contextual do componente, selecione Configurar propriedades. 3. Para alterar o nome da coluna, insira um nome do alias para a coluna de origem solicitada. 4. Para alterar o tipo de dados da coluna, selecione o tipo de dados solicitado para a coluna de origem. 5. Selecione Concluído. 15.2.4 Filtro As propriedades que podem ser configuradas para o componente de preparação do filtro. Sintaxe Use este componente para filtrar linhas e colunas com base em uma condição específica. Nota O componente de filtro no banco de dados não suporta funções e expressões avançadas. Nota Se você alterar a fonte de dados após configurar o componente de filtro, este ainda reterá os filtros de linha anteriormente definidos. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 209 Propriedades do filtro Tabela 109: Propriedades do componente de preparação de dados Propriedade Descrição Colunas selecionadas Selecione as colunas para análise. Condição de filtro Insira as condições de filtro. Exemplo Filtre a coluna "Store" da fonte de dados e aplique a condição "Profit >2000". Loja Receita bruta Lucro Land Mark 10000 1000 Spencer 20000 4500 Soch 25000 8000 1. Desmarque a coluna "Store" das colunas selecionadas. 2. No painel Filtro da linha, selecione a coluna Lucro. 3. Na opção Selecionar do intervalo, insira 2000 na caixa de texto De. A caixa de texto Até deve ficar em branco. 4. Selecione OK. 5. Selecione Salvar e fechar. 6. Execute a análise. Tabela de saída: Receita bruta Lucro 20000 4500 25000 8000 Sintaxe Nota O componente de filtro suporta apenas expressões que retornem resultado booleano. Por exemplo, na tabela Employee abaixo: Emp ID (ID do Emp Name (Nome DOB (Data de funcionário) do funcionário) nascimento) Age (Idade) Date of Joining Date of (Data de Confirmation (Data contratação) de confirmação) 1 Laura 11/11/1986 25 12/9/2005 27/11/2005 2 Desy 12/5/1981 30 24/6/2000 10/7/2000 3 Alex 30/5/1978 33 10/10/1998 24/10/1998 4 John 6/6/1979 32 2/12/1999 20/12/1999 210 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente ● A expressão DAYSBETWEEN([Date of Joining],[Date of Confirmation]) não é uma expressão de filtro válida porque retorna um valor numérico. A utilização correta da expressão DAYSBETWEEN no filtro é DAYSBETWEEN([Date of Joining],[Date of Confirmation]) == 14. Essa expressão seleciona as linhas onde o número de dias entre "Date of Joining" e "Date of Confirmation" é 14. Para a tabela de empregados, a terceira linha é selecionada. ● DAYNAME([Date of Joining]) == 'Saturday' seleciona a segunda e terceira linhas da tabela de funcionários. Nota Ao inserir uma string literal que contenha aspas simples, cada aspa dentro da string literal deve ser acompanhada de uma barra invertida. Por exemplo, insira 'Customer's' como 'Customer\'s'. Nota Ao inserir o nome de uma coluna que contenha colchetes, cada colchete dentro do nome da coluna deve ser acompanhada de uma barra invertida. Por exemplo, insira [Customer[Age]] como [Customer\[Age\]]. Funções suportadas Nota O componente de filtro não suporta funções de manipulação de dados. Categoria Função (Função aplicada à tabela Descrição Employee) Data DAYSBETWEEN Retorna o número de dias entre duas datas. CURRENTDATE Retorna a data atual do sistema. MONTHSBETWEEN Retorna o número de meses entre duas datas. Por exemplo, a nova coluna contém 2,0,2,0 quando a função MONTHSBETWEEN([Date of Joining], [Date of Confirmation]) é aplicada à tabela Employee. DAYNAME Retorna o nome do dia em formato de string. Por exemplo, a nova coluna contém Monday, Saturday, Saturday, Thursday quando a função DAYNAME([Date of Joining]) é aplicada à tabela Employee. DAYNUMBEROFMONTH Guia do usuário do Expert Analytics Propriedades do componente Retorna o número do dia de um mês específico. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 211 Categoria Função (Função aplicada à tabela Descrição Employee) Por exemplo, 12/11/1980 retorna 12. DAYNUMBEROFWEEK Retorna o número do dia de uma semana. Por exemplo, Sunday =1, Monday=2. DAYNUMBEROFYEAR Retorna o número do dia de um ano. Por exemplo, 1st Jan =1, 1st Feb=32, 3rd Feb=34. LASTDATEOFWEEK Retorna a data do último dia de uma semana. Por exemplo, 12/9/2005 retorna 17/9/2005 LASTDATEOFMONTH Retorna a data do último dia de um mês. Por exemplo, 12/9/2005 retorna 30/9/2005 MONTHNUMBEROFYEAR Retorna o número do mês de uma data. Por exemplo, Jan=1, Feb=2, Mar=3 WEEKNUMBEROFYEAR Retorna o número da semana de um ano. Por exemplo, 12/9/2005 retorna 38. QUARTERNUMBEROFDATE Retorna o número do trimestre de uma data. Por exemplo, 12/9/2005 retorna 3. String CONCAT Concatena duas strings. Por exemplo, CONCAT('USA', 'Australia') retorna USAAustralia. INSTRING Retorna verdadeiro - se a string de pesquisa for encontrada na string de origem. Por exemplo, INSTRING('USA', 'US') retorna verdadeiro. SUBSTRING Retorna uma substring da string de origem. Por exemplo, SUBSTRING('USA', 1,2) retorna US. Matemática 212 MÁX Retorna o valor máximo de uma coluna. MÍN Retorna o valor mínimo de uma coluna. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Categoria Função (Função aplicada à tabela Descrição Employee) Expressão condicional CONTAGEM Retorna o número de valores de uma coluna. SOMA Retorna a soma dos valores de uma coluna. AVERAGE Retorna a média dos valores de uma coluna. IF(condição) THEN(expressão de string/expressão matemática/ expressão condicional) ELSE(expressão de string/expressão matemática/ expressão condicional) Verifica se a condição é cumprida e retorna um valor se 'verdadeiro' e outro valor se 'falso'. Por exemplo, IF([Date of Joining]>12/9/2005) THEN ('Funcionário contratado após 12/09/2005') ELSE ('Funcionário contratado em ou antes de 12/09/2005') Nota Expressões matemáticas contendo funções que retornem valor numérico não são suportadas. Por exemplo, a expressão DAYNUMBEROFMONTH(CURRENTDATE())==2 não é suportada porque DAYNUMBEROFMONTH retorna um valor numérico. Operadores matemáticos Use operadores matemáticos para criar fórmulas contendo colunas numéricas e/ou números. Por exemplo, a expressão [Age] + 1 adiciona uma nova coluna com os valores 26, 31, 34, 33. Operadores matemáticos Descrição + Operador de adição - Operador de subtração * Operador de multiplicação / Operador de divisão () Parêntesis ^ Operador de potência % Operador de módulo E Operador de exponencial Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 213 Operadores condicionais Use os operadores condicionais para criar expressões IF THEN ELSE ou SELECT. Operadores condicionais Descrição == Igual a != Diferente de < Menor que > Maior que <= Menor que ou igual a >= Maior que ou igual a Operadores lógicos Use operadores lógicos para comparar duas condições e retornar 'verdadeiro' ou 'falso'. Por exemplo, IF([Date of Joining]>12/9/2005 && [Age] >=25 ) THEN ('Verdadeiro') ELSE ('Falso') adiciona uma nova coluna com os valores Verdadeiro, Falso, Falso, Falso. Operadores lógicos Descrição && AND || OR 15.2.5 Normalização As propriedades que podem ser configuradas para o componente de preparação de normalização. Sintaxe Use este componente para normalizar os dados de atributo. Atributos de valor maior tendem a ter peso maior. Tentativas da normalização de transformar os dados de um intervalo maior em um intervalo menor, por exemplo, [0,1], [-1,1]. Nota A normalização exibe apenas as colunas com valores numéricos. O componente de normalização suporta os seguintes métodos de normalização: ● 214 Normalização Mín–Máx: executa uma transformação linear nos valores dos dados originais, e escala cada valor para adequar-se em um intervalo específico. Enquanto realiza a normalização Mín-Máx você pode especificar o valor Novo máximo e o valor Novo mínimo. Esta normalização é útil para garantir que valores extremos sejam limitados a um intervalo fixo. PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Nota ○ ● O valor Novo máximo deve ser maior do que o valor Novo mínimo. Normalização pontuação Z: calculada com base na média e desvio padrão para cada atributo. Esta normalização é útil para determinar se um valor específico está acima ou abaixo da média, e por quanto. ● Normalização de escala decimal: A vírgula decimal do valor de cada atributo é movida de acordo com seu valor absoluto máximo. Propriedades da normalização Tabela 110: Propriedades do componente de preparação de dados Propriedade Descrição Selecionar uma coluna Selecione uma coluna que será normalizada. Tipo de normalização Selecione o tipo de normalização. Novo máximo Insira o valor para o novo máximo. O valor predeterminado é 1. Novo mínimo Insira o valor para o novo mínimo. O valor predeterminado é 0. Exemplo Normalizando o tempo gasto para cobrir certa distância. Tabela: Nome Distância (em metros) Tempo (em segundos) Laura 500 66 Desy 500 360 Alex 500 201 John 500 78 Ted 500 504 Para normalizar a coluna de tempo usando a normalização Mín-Máx, realize as seguintes etapas: 1. Na visão Prever, da Lista Componente, escolha a guia Preparação de dados. 2. Arraste o componente Normalização no editor de análise, ou clique duas vezes em Normalização. 3. Pelo menu contextual do componente de normalização, selecione Configurar propriedades. 4. Pela lista suspensa Selecionar uma coluna, selecione a coluna que deseja normalizar. Nota Você só pode selecionar colunas com valores numéricos. Por exemplo, Tempo (em segundos). Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 215 5. Na lista suspensa Método de normalização, selecione Mín-Máx. 6. Insira os valores de Novo máximo e Novo mínimo, nesse exemplo, os valores são 0 e 1 respectivamente. 7. Escolha Concluído, e selecione Executar. Tabela de saída: Nome Distância (em metros) Tempo (em segundos) Laura 500 0.05 Desy 500 0.30 Alex 500 0.17 John 500 0.06 Ted 500 0.42 Execute as mesmas etapas para normalização Pontuação Z e a normalização Escala decimal como mencionado na normalização Mín-Máx. Entretanto, no caso da normalização Pontuação Z e a normalização Escala decimal, você não precisa inserir os valores Novo máximo e Novo mínimo. Saída de normalização Pontuação Z: Tabela de saída: Nome Distância (em metros) Tempo (em segundos) Laura 500 -0.49 Desy 500 1.77 Alex 500 0.55 John 500 -0.40 Ted 500 2.88 Saída de normalização Escala decimal: Tabela de saída: Nome Distância (em metros) Tempo (em segundos) Laura 500 0.01 Desy 500 0.04 Alex 500 0.02 John 500 0.01 Ted 500 0.05 15.2.6 Categorização HANA As propriedades que podem ser configuradas para o componente de preparação da Categorização HANA. Sintaxe Categorização, também conhecida como discretização, amortece um valor de dados ordenados. Ela divide o intervalo de uma variável numérica em conjuntos de subintervalos denominados categorias, e substitui cada 216 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente valor por seu número de categoria. A categorização de dados antes da execução de certos algoritmos, como algoritmo de árvore de decisão, reduz a complexidade do modelo. Existem quatro métodos de categorização: ● Larguras iguais com base no número de categorias ● Larguras iguais com base na largura de categoria ● Profundidade igual ● Desvio da média E três métodos de amortecimento: ● Amortecimento por médias de categoria: cada valor em uma categoria é substituído pelo valor de categoria da média. ● Amortecimento por medianas de categorização: cada valor de categorização é substituído por uma mediana de categorização. ● Amortecimento por limites de categoria: os valores mínimo e máximo de uma determinada categoria são identificados como limites de categoria. Em seguida, cada valor de categoria é substituído pelo valor do limite mais próximo. Propriedades do componente Categorização HANA Tabela 111: Propriedades do componente de preparação de dados Propriedade Descrição Coluna independente Selecione a coluna de origem de entrada com a qual você de seja executar a categorização. Valores em falta Selecione o método para manipulação dos valores em falta. Possíveis métodos: ● Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou depen dente. ● Manter: retém valores em falta. Método de categorização Selecione o Método de categorização. Número de categorias Insira o número de categorias necessário. Método de amortecimento Selecione o Método de amortecimento. Nome da coluna categorizada Insira um nome para a nova coluna que contenha a posição no depósito. Nomes de colunas com valores amortecidos Insira o nome para a nova coluna que contenha valores amor tecidos. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 217 Exemplo Categorização de dados em um conjunto de dados Cidade Temperatura Amsterdã 6 Frankfurt 12 Guangzhou 13 Cidade do Cabo 15 Waldorf 10 Bangalore 23 Mumbai 24 Miami 30 Rio de Janeiro 32 Sydney 25 Dubai 38 Para categorizar a coluna Temperatura em larguras iguais com base no número de larguras e aplicar métodos de amortecimento pelas médias, realize as seguintes etapas: 1. Arraste o componente Categorização HANA até o editor de análise. 2. Clique duas vezes em Categorização HANA ou passe o mouse sobre Categorização HANA e selecione Configurar propriedades. 3. Na lista suspensa Coluna independente, selecione uma coluna, por exemplo, Temperatura. Nota Você só pode selecionar colunas que tenham valores com dígitos numéricos. 4. Na lista suspensa Valores em falta, selecione Ignorar. 5. Em Método de categorização, selecione Larguras iguais com base no número de categorias. 6. Em número de categorias, digite 4. 7. Selecione Amortecimento necessário. 8. Em Métodos de amortecimento, selecione Média de categoria. 9. Em Digitar nome para a coluna recém adicionada, em Nome da coluna categorizada, insira Categoria de temperatura. Nota Nomeie a coluna conforme a sua preferência ou a necessidade da análise. Esta coluna contém o valor categorizado. 10. Em Digitar nome para a coluna recém adicionada, em Nomes da coluna com valores amortecidos, insira Amortecimento de temperatura. 218 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente Nota Nomeie a coluna conforme a sua preferência ou a necessidade da análise. Esta coluna contém o valor amortecido. Tabela de saída: Cidade Temperatura Categoria de temperatura Amortecimento de temperatura Amsterdã 6 1 8.0 Frankfurt 12 2 13.33333 Guangzhou 13 2 13.33333 Cidade do Cabo 15 2 13.33333 Waldorf 10 1 8.0 Bangalore 23 3 25.5 Mumbai 24 3 25.5 Miami 30 3 25.5 Rio de Janeiro 32 4 35.0 Sydney 25 3 25.5 Dubai 38 4 35.0 15.2.7 Normalização HANA As propriedades que podem ser configuradas para o componente de preparação da Normalização HANA. Sintaxe Use este componente para normalizar os dados de atributo. A Normalização HANA escala os dados de atributo com grande valor para ficarem em um intervalo específico, como -1.0 a 1.0, ou 0.0 a 1.0. Você pode utilizar esse componente para análise No banco de dados. A normalização de dados é usada para classificar algoritmos envolvendo redes neurais ou medidas de distância, como classificação e clustering do vizinho mais próximo. Nota Se deseja que os dados processados substituam a coluna existente, selecione Substituir coluna. O componente de normalização suporta os seguintes métodos de normalização: ● Normalização Mín–Máx: executa uma transformação linear nos valores dos dados originais, e escala cada valor para adequar-se em um intervalo específico. Enquanto realiza a normalização Mín-Máx você pode especificar o valor Novo máximo e o valor Novo mínimo. Esta normalização é útil para garantir que valores extremos sejam limitados a um intervalo fixo. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 219 Nota ○ ● O valor Novo máximo deve ser maior do que o valor Novo mínimo. Normalização pontuação Z: calculada com base na média e no desvio padrão para cada atributo. Esta normalização é útil para determinar se um valor específico está acima ou abaixo da média, e por quanto. ● Normalização de escala decimal: A vírgula decimal dos valores de cada atributo é movida de acordo com seu valor absoluto máximo. Nota Selecione Substituir coluna, se quiser que os dados sejam normalizados para substituir os dados da coluna existente, na qual a normalização será executada. Exemplo Normalizando o tempo gasto para cobrir certa distância. Tabela: Nome Distância (em metros) Tempo (em segundos) Laura 500 66 Desy 500 360 Alex 500 201 John 500 78 Ted 500 504 Para normalizar a coluna de tempo usando a normalização Mín-Máx, realize as seguintes etapas: 1. Na visão Prever, da Lista Componente, escolha a guia Preparação de dados. 2. Arraste o componente Normalização no editor de análise, ou clique duas vezes em Normalização. 3. Clique duas vezes em Normalização HANA ou passe o ponteiro do mouse sobre Normalização HANA e selecione Configurar propriedades. 4. Selecione as colunas que serão normalizadas. Nota Você só pode selecionar colunas com valores numéricos. Por exemplo, Tempo (em segundos). 5. Na lista suspensa Tipo de normalização, selecione Mín-Máx. 6. Insira valores para o Novo máximo e o Novo mínimo. 7. Escolha Concluído, e selecione Executar. Tabela de saída: Nome Distância (em metros) Tempo (em segundos) Tempo (em segundos)_normalizado Laura 220 500 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 66 0.05 Guia do usuário do Expert Analytics Propriedades do componente Nome Distância (em metros) Tempo (em segundos) Tempo (em segundos)_normalizado Desy 500 360 0.30 Alex 500 201 0.17 John 500 78 0.06 Ted 500 504 0.42 Execute as mesmas etapas para normalização Pontuação Z e a normalização Escala decimal como mencionado na normalização Mín-Máx. Entretanto, no caso da normalização Pontuação Z e a normalização Escala decimal, você não precisa inserir os valores Novo máximo e Novo mínimo. Saída de normalização Pontuação Z: Tabela de saída: Nome Distância (em metros) Tempo (em segundos) Laura 500 -0.49 Desy 500 1.77 Alex 500 0.55 John 500 -0.40 Ted 500 2.88 Saída de normalização Escala decimal: Tabela de saída: Nome Distância (em metros) Tempo (em segundos) Laura 500 0.01 Desy 500 0.04 Alex 500 0.02 John 500 0.01 Ted 500 0.05 15.2.8 Partição HANA As propriedades que podem ser configuradas para o componente de preparação da Partição HANA. Sintaxe O componente da Partição HANA divide um conjunto de dados de entrada aleatoriamente em três subconjuntos disjuntos chamados de conjuntos de treinamento, teste e validação. A proporção de cada subconjunto é definida como um parâmetro. A união de três subconjuntos não precisa ser o conjunto de dados inicial completo. É possível particionar o conjunto de dados utilizando os métodos de partição a seguir: Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 221 ● Partição aleatória, que divide aleatoriamente todos os dados. ● Partição estratificada, que divide cada subcategoria aleatoriamente. No segundo caso, o conjunto de dados precisa ter pelo menos um atributo categórico (por exemplo, do tipo varchar). O conjunto de dados inicial é subdividido de acordo com os valores categóricos diferentes desse atributo. Cada subconjunto excluído mutuamente é dividido aleatoriamente para obter os subconjuntos de treinamento, teste e validação. Isso garante que todos os "valores categóricos" ou "strata" estejam presentes no subconjunto de amostra. Propriedades da Partição HANA Tabela 112: Propriedades do componente de preparação de dados Propriedade Descrição Método de partição Selecione o método para particionar dados em conjuntos de treinamento, teste e validação. ● Aleatório ● Estratificado Propagação aleatória Insira um número aleatório com o qual deseja executar o cál culo. Linhas de partição por Selecione o método para particionar linhas. ● Percentual de linhas ● Número de linhas Conjunto de treinamento Insira o número de linhas ou porcentagem de linhas para o conjunto de treinamento. Conjunto de teste Insira o número de linhas ou porcentagem de linhas para o conjunto de teste. Conjunto de validação Insira o número de linhas ou porcentagem de linhas para o conjunto de validação. Nome da coluna de partição Insira um nome para a nova coluna que contenha os valores particionados. Número de threads Inserir o número de threads que o algoritmo deva utilizar para execução. 15.3 Gravadores de dados Use gravadores de dados para armazenar os resultados da análise em arquivos planos ou bancos de dados para uma análise posterior. 222 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente 15.3.1 CSV Writer As propriedades que podem ser configuradas para o CSV Writer. Sintaxe Use este componente para gravar os dados em arquivos planos, como arquivos CSV, TEXT e DAT. Propriedades do CSV Writer Tabela 113: Propriedades do gravador de dados Propriedade Descrição Nome do arquivo Selecione o caminho de arquivo e insira um nome para ar quivo .csv, .dat ou .txt. Sobregravar, se existir Para sobregravar um arquivo existente, selecione esta opção. Separador de colunas Selecione um delimitador de colunas que separe os tokens de dados no arquivo. Inserir caractere de aspas duplas Selecione o caractere para substituição dos separadores de coluna ao gravar os dados. Incluir cabeçalhos de coluna Selecione esta opção para usar a primeira linha como cabeça lho da coluna. Codificação Selecione o método criptografado em texto para gravar os da dos. Separador de decimal Selecione o caractere para representação decimal em agru pamento de dígitos. Separador de agrupamento Selecione o caractere para o separador de milhares. Formato numérico Insira o formato numérico que você deseja aplicar aos dados numéricos. Formato de data e hora Selecione o formato de data que você deseja aplicar às datas. 15.3.2 JDBC Writer As propriedades que podem ser configuradas para o JDBC Writer. Sintaxe Use este componente para gravar os dados em bancos de dados relacionais, como MySQL, MS SQL Server, DB2, Oracle, SAP MaxDB e SAP HANA. Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 223 Propriedades do JDBC Writer Tabela 114: Propriedades do gravador de dados Propriedade Descrição Tipo de banco de dados Selecione o tipo de banco de dados. Caminho do driver do banco de dados Insira o local do caminho do driver do JDBC. Por exemplo, para gravar no banco de dados Oracle, você precisa especifi car o local do Oracle JDBC jar (C:\ojdbc6.jar) Nome da máquina do banco de dados Insira o nome da máquina em que o banco de dados está ins talado. Número da porta Insira o número da porta do banco de dados ou do serviço. Nome do banco de dados Insira o nome do banco de dados. Nome do usuário Insira o nome do usuário do banco de dados. Senha Insira a senha do usuário do banco de dados. Tipo da tabela Insira o tipo da tabela. Esta propriedade é aplicável durante a gravação em banco de dados SAP HANA. Nome da tabela Insira o nome da tabela. Sobregravar, se existir Selecione esta opção para sobregravar a tabela se ela já exis tir. 15.3.3 HANA Writer As propriedades que podem ser configuradas para o HANA Writer. Sintaxe Use este componente para gravar os dados nas tabelas de banco de dados SAP HANA. Componente HANA Writer Tabela 115: Propriedades do gravador de dados Propriedade Descrição Nome do esquema Selecione um esquema. Tipo da tabela Selecione o tipo da tabela no qual você deseja gravar os da dos. Nome da tabela Insira um nome para a tabela. Sobregravar, se existir Selecione esta opção para sobregravar a tabela se ela já exis tir. 224 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Propriedades do componente 15.4 Modelos Os modelos que você cria salvando o estado dos algoritmos ficam listados na seção Modelos na lista Componentes. Expert Analytics não contém modelos predefinidos. Portanto, a menos que você já tenha gravado um algoritmo configurado como um modelo, a seção Modelos fica vazia. Informações relacionadas Como criar um modelo [página 129] Guia do usuário do Expert Analytics Propriedades do componente PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 225 Avisos de isenção importantes e informações legais Amostras de codificação Qualquer codificação de software e/ou linhas/strings de códigos ("Código") incluídas nessa documentação são apenas exemplos e não estão destinadas a serem utilizadas em um ambiente de sistema de produção. O Código serve apenas para explicar e visualizar melhor a sintaxe e regras de criação de frases da codificação determinada. A SAP não garante a exatidão e integridade do Código fornecido aqui, e a SAP não está sujeita a erros ou danos causados pela utilização do Código, exceto se tais danos forem causados pela SAP intencionalmente ou fruto de negligência grosseira. Acessibilidade As informações contidas na documentação SAP representam a visão atual da SAP sobre os critérios de acessibilidade a partir da data de publicação; não são de maneira alguma diretrizes de vinculação sobre como garantir acessibilidade dos produtos de software. A SAP nega especificamente qualquer responsabilidade com respeito a esse documento. No entanto, esse aviso de isenção não se aplica em casos de negligência grosseira ou transgressão deliberada da SAP. Esse documento não resulta em nenhuma obrigação contratual direta ou indireta da SAP. Idioma neutro em relação ao sexo Na medida do possível, a documentação da SAP é neutra em relação ao sexo. Dependendo do contexto, o leitor será abordado diretamente com "você", ou um substantivo neutro (como "pessoa de vendas" ou "dias úteis") é utilizado. Entretanto, se ao se referir a ambos os sexos, a terceira pessoa do singular não puder ser evitada ou um substantivo neutro não existir, a SAP reservará o direito de utilizar a forma masculina do substantivo ou pronome. Isso garante que a documentação permaneça compreensível. Hyperlinks da Internet A documentação da SAP pode conter hyperlinks para a Internet. Esses hyperlinks servem como dica de onde localizar informações relacionadas. A SAP não garante a disponibilidade e exatidão dessas informações relacionadas ou a aptidão de servir a um propósito específico. A SAP não se responsabiliza por qualquer dano causado pela utilização dessas informações relacionadas a menos que tais danos sejam causados por negligência grosseira ou transgressão deliberada da SAP. Todos os links são categorizados para transparência (consulte: http://help.sap.com/disclaimer). 226 PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Guia do usuário do Expert Analytics Avisos de isenção importantes e informações legais Guia do usuário do Expert Analytics Avisos de isenção importantes e informações legais PUBLIC © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. 227 www.sap.com/contactsap © 2015 SAP SE ou empresa afiliada da SAP. Todos os direitos reservados. Nenhuma parte desta publicação pode ser reproduzida ou transmitida sob qualquer forma, ou para qualquer fim, sem a expressa permissão da SAP SE ou uma empresa afiliada da SAP. As informações aqui contidas poderão ser modificadas sem prévio aviso. Alguns produtos de software comercializados pela SAP SE e seus distribuidores contêm componentes de software de propriedade de outros fornecedores. As especificações nacionais dos produtos podem variar. Estes materiais são fornecidos pela SAP SE ou uma empresa afiliada da SAP apenas para fins informativos, sem representações ou garantias de qualquer tipo, e a SAP ou suas empresas afiliadas não se responsabiliza por erros ou omissões em relação aos materiais. As únicas garantias para os produtos ou das empresas afiliadas SAP são aquelas definidas nas declarações expressas de garantia que acompanham os respectivos produtos e serviços, se houver. O conteúdo deste documento não deve ser interpretado como constituição de garantia adicional. SAP e outros produtos e serviços da SAP aqui mencionados, bem como seus respectivos logotipos, são marcas ou marcas registradas da SAP SE (ou uma empresa afiliada SAP) na Alemanha e em outros países. Todos os outros nomes de produtos e serviços mencionados são marcas de suas respectivas empresas. Consulte http://www.sap.com/corporate-en/legal/copyright/ index.epx para informações e avisos adicionais relacionados a marcas.