Guia do usuário do SAP Predictive Analysis
Transcrição
Guia do usuário do SAP Predictive Analysis
Guia do usuário do SAP Predictive Analysis ■ SAP Predictive Analysis 1.0.8 2013-01-31 Copyright © 2012 SAP AG. Todos os direitos reservados. SAP, R/3, SAP NetWeaver, Duet, PartnerEdge, ByDesign, SAP BusinessObjects Explorer, StreamWork, SAP HANA e outros produtos e serviços da SAP aqui mencionados, bem como seus respectivos logotipos, são marcas comerciais ou marcas registradas pertencentes à SAP AG na Alemanha e em outros países. Business Objects e o logotipo da Business Objects, BusinessObjects, Crystal Reports, Crystal Decisions, Web Intelligence, Xcelsius e outros produtos e serviços da Business Objects aqui mencionados, bem como seus respectivos logotipos, são marcas comerciais ou marcas registradas pertencentes à Business Objects Software Ltd., uma empresa da SAP.Sybase e Adaptive Server, iAnywhere, Sybase 365, SQL Anywhere e outros produtos e serviços da Sybase aqui mencionados, bem como seus respectivos logotipos, são marcas comerciais ou marcas registradas pertencentes à Sybase, Inc., uma empresa da SAP. Crossgate, m@gic EDDY, B2B 360° e B2B 360° Services são marcas registradas pertencentes à Crossgate AG na Alemanha e em outros países. Crossgate é uma empresa da SAP. Todos os outros produtos e serviços aqui mencionados são marcas comerciais pertencentes às suas respectivas empresas. Os dados incluídos neste documento são meramente informativos. As especificações nacionais de produto podem variar de acordo com o País ou Região. Este material está sujeito a alterações promovidas pela SAP AG sem prévio aviso. Este material é fornecido pela SAP AG e suas empresas afiliadas ("Grupo SAP") apenas para fins informativos, sem declaração ou garantia de qualquer espécie, de forma que o Grupo SAP não se responsabiliza por omissões ou erros relativos ao mesmo. As únicas garantias para os produtos e serviços do Grupo SAP são aquelas definidas nas declarações expressas de garantia que acompanham os respectivos produtos e serviços. Nada nos termos deste documento deve ser interpretado como garantia adicional. 2013-01-31 Sumário 3 Capítulo 1 Sobre este guia.......................................................................................................................7 1.1 1.2 Conteúdo do guia.....................................................................................................................7 Capítulo 2 Visão geral do SAP Predictive Analysis..................................................................................9 Capítulo 3 Instalando o SAP Predictive Analysis...................................................................................11 3.1 3.2 3.3 3.4 3.4.1 3.4.2 3.5 Pré-requisitos de instalação...................................................................................................11 Capítulo 4 Instalação e configuração do ambiente R de fonte aberta....................................................15 4.1 4.2 Instalando o ambiente R-2.15.1 e os pacotes necessários.....................................................15 Capítulo 5 Introdução ao SAP Predictive Analysis.................................................................................17 5.1 5.2 5.3 5.3.1 5.3.2 5.4 Princípios básicos do SAP Predictive Analysis.......................................................................17 Capítulo 6 Criando análises...................................................................................................................23 6.1 6.1.1 6.1.2 Criando uma análise...............................................................................................................23 Público alvo..............................................................................................................................7 Para instalar o SAP Predictive Analysis usando o programa de instalação..............................11 Para desinstalar o SAP Predictive Analysis ...........................................................................12 Aspectos importantes a serem considerados no uso do SAP HANA.....................................12 Para configurar o _SYS_REPO para o usuário do SAP Predictive Analysis.............................13 Medidas OLAP suportadas ...................................................................................................13 Aspectos importantes a serem considerados no uso de universos do SAP BusinessObjects..13 Configurando o ambiente R....................................................................................................15 Iniciando o SAP Predictive Analysis........................................................................................18 Conhecendo o SAP Predictive Analysis.................................................................................18 Visão de designer..................................................................................................................19 Visão de resultados...............................................................................................................19 Usando o SAP Predictive Analysis do início ao fim.................................................................20 Adquirindo dados de uma fonte de dados..............................................................................23 Preparando os dados para análise..........................................................................................25 2013-01-31 Sumário 4 6.1.3 6.1.4 6.2 6.3 6.4 Aplicando algoritmos..............................................................................................................25 Capítulo 7 Analisando os dados.............................................................................................................31 7.1 7.1.1 7.1.2 7.1.3 7.1.4 7.1.5 7.1.6 7.1.7 Gráficos de visualização.........................................................................................................31 Capítulo 8 Trabalhando com modelos....................................................................................................37 8.1 8.2 8.3 8.4 8.5 8.6 Criando um modelo................................................................................................................37 Capítulo 9 Propriedades do componente...............................................................................................41 9.1 9.1.1 9.1.2 9.1.3 9.1.4 9.1.5 9.1.6 9.1.7 9.1.8 9.2 9.2.1 9.2.2 9.2.3 9.2.4 9.3 Algoritmos.............................................................................................................................41 Armazenando os resultados da análise...................................................................................27 Executando a análise..............................................................................................................28 Salvando a análise.................................................................................................................28 Visualizando os resultados.....................................................................................................29 Gráfico de matriz de dispersão...............................................................................................31 Gráfico de resumo estatístico................................................................................................32 Coordenadas paralelas...........................................................................................................33 Árvore de decisão..................................................................................................................33 Gráfico de regressão.............................................................................................................34 Gráfico de série de tempo......................................................................................................35 Gráfico de cluster...................................................................................................................36 Visualizando as informações do modelo.................................................................................38 Exportando um modelo como PMML.....................................................................................38 Exportando um modelo como arquivo .spar............................................................................38 Importando um modelo...........................................................................................................39 Excluindo um modelo.............................................................................................................39 Regressão.............................................................................................................................41 Valores atípicos.....................................................................................................................51 Série de tempo......................................................................................................................53 Árvores de decisão................................................................................................................59 Rede neural............................................................................................................................64 Clustering..............................................................................................................................68 Associação............................................................................................................................70 Classificação..........................................................................................................................74 Componentes de preparação de dados..................................................................................75 Fórmula..................................................................................................................................75 Amostra.................................................................................................................................80 Definição de tipo de dados.....................................................................................................83 Filtro......................................................................................................................................84 Gravadores de dados.............................................................................................................88 2013-01-31 Sumário 5 9.3.1 9.3.2 9.3.3 9.4 CSV Writer............................................................................................................................88 Apêndice A Mais informações..................................................................................................................91 JDBC Writer..........................................................................................................................89 HANA Writer..........................................................................................................................90 Modelos salvos......................................................................................................................90 2013-01-31 Sumário 6 2013-01-31 Sobre este guia Sobre este guia 1.1 Conteúdo do guia Este guia contém as seguintes informações: • Visão geral do SAP Predictive Analysis • Informações sobre como instalar e configurar o SAP Predictive Analysis • Informações sobre os vários algoritmos e componentes disponíveis no SAP Predictive Analysis • Informações sobre como criar análises e modelos • Informações sobre como analisar os dados usando técnicas de visualização de análise preditiva Este guia não aborda: • Como adquirir dados de várias fontes de dados • Como executar operações de manipulação de dados, limpeza de dados e enriquecimento semântico no painel de preparação • Como compartilhar gráficos e conjuntos de dados Observação: O SAP Predictive Analysis herda a funcionalidade de aquisição de dados e manipulação de dados do SAP Visual Intelligence. Portanto, para informações sobre fluxos de trabalho não abordados neste guia, consulte o Guia do usuário do SAP Visual Intelligence disponível em http://help.sap.com/vi. Recomendamos que você leia o Guia do usuário do SAP Visual Intelligence junto com o Guia do usuário do SAP Predictive Analysis para entender o fluxo de trabalho completo para análise de dados usando os algoritmos de análise preditiva. 1.2 Público alvo Este guia é destinado a profissionais especializados em análise de dados, analistas de negócios e designers de informação que queiram usar a aplicação SAP Predictive Analysis para analisar e visualizar os dados usando algoritmos preditivos. Observação: Para usar a aplicação SAP Predictive Analysis, você precisa conhecer algoritmos de análise estatística e de mineração de dados e saber usá-los. 7 2013-01-31 Sobre este guia 8 2013-01-31 Visão geral do SAP Predictive Analysis Visão geral do SAP Predictive Analysis O SAP Predictive Analysis é uma solução de análise estatística e de mineração de dados que permite a criação de modelos preditivos para identificar visões e relações ocultas nos dados, com base nos quais você pode prever eventos futuros. Com o SAP Predictive Analysis, você realiza várias análises de dados, inclusive previsão de série de tempo, detecção de valores atípicos, análise de tendência, análise de classificação, análise de segmentação e análise de afinidade. Com a aplicação, você analisa os dados usando diferentes técnicas de visualização, como gráficos de matriz de dispersão, coordenadas paralelas, gráficos de cluster e árvores de decisão. O SAP Predictive Analysis oferece uma ampla gama de algoritmos de análise preditiva, suporta o uso de linguagem de análise estatística de fonte aberta R e oferece recursos de mineração de dados na memória (in-memory) para um processamento eficiente de análise de dados volumosos. Observação: O SAP Predictive Analysis herda a funcionalidade de aquisição de dados e manipulação de dados do SAP Visual Intelligence. SAP Visual Intelligence é uma ferramenta de manipulação e visualização de dados. Usando o SAP Visual Intelligence, você pode conectar-se a várias fontes de dados, como arquivos planos, bancos de dados relacionais, bancos de dados na memória e universos do SAP BusinessObjects, além de operar com diferentes volumes de dados, de uma matriz de dados pequena em arquivo CSV até um conjunto bem volumoso de dados no SAP HANA, selecionar e limpar os dados e manipulá-los. 9 2013-01-31 Visão geral do SAP Predictive Analysis 10 2013-01-31 Instalando o SAP Predictive Analysis Instalando o SAP Predictive Analysis 3.1 Pré-requisitos de instalação Antes de instalar o SAP Predictive Analysis, verifique estes requisitos: • • • • • O sistema operacional Microsoft Windows 7 deve estar instalado na sua máquina. O SAP Predictive Analysis é compatível com máquinas de 32 e 64 bits. Se você já tiver o SAP Visual Intelligence instalado na sua máquina, desinstale-o antes de instalar o SAP Predictive Analysis. Você precisa de direitos de administrador para instalar o SAP Predictive Analysis no computador. É necessário espaço suficiente em disco para os seguintes recursos: Recurso Espaço necessário Unidade de hospedagem da pasta de dados da aplicação do usuário 2,5 GB Pasta temporária de usuário (\AppData\Local\Temp) 200 MB Unidade de hospedagem do diretório de instalação 500 MB Estas portas devem estar disponíveis: Porta Necessária para 6401 Banco de dados Sybase IQ Qualquer porta no intervalo de 4520-4539 Instalação do SAP Predictive Analysis Para uma lista detalhada dos ambientes suportados e dos requisitos de hardware, consulte Product Availability Matrix em:http://service.sap.com/pam 3.2 Para instalar o SAP Predictive Analysis usando o programa de instalação 1. Execute o arquivo setup.exe. A caixa de diálogo "Controle de conta de usuário" será exibida com uma mensagem de aviso. 2. Selecione Sim na solicitação de confirmação. 11 2013-01-31 Instalando o SAP Predictive Analysis 3. Especifique a pasta de destino de instalação do SAP Predictive Analysis. • Para aceitar o diretório de instalação padrão, selecione Avançar. • Para navegar até a pasta em que você deseja instalar o SAP Predictive Analysis, selecione Procurar. Selecione a pasta e, Avançar. A página do "Contrato de licenciamento" será exibida. 4. Leia o contrato de licenciamento e selecione Aceito o contrato de licenciamento, e selecione Avançar. 5. Para começar a instalação, selecione Avançar. A instalação será concluída quando a página "Concluir a instalação" for exibida. 6. Para sair da instalação, selecione Concluir. 3.3 Para desinstalar o SAP Predictive Analysis 1. Selecione Iniciar > Painel de Controle > Programas. 2. Selecione Desinstalar um programa. 3. Clique com o botão direito do mouse em SAP Predictive Analysis e selecione Desinstalar. O assistente do SAP Predictive Analysis Setup será exibido. 4. Na página Confirmar desinstalação, selecione Avançar. 5. Para completar a desinstalação, selecione Concluir. 3.4 Aspectos importantes a serem considerados no uso do SAP HANA Esta seção contém considerações e requisitos importantes para o uso do SAP Predictive Analysis com o banco de dados SAP HANA. Requisitos de segurança para publicação no SAP HANA Para que o usuário possa publicar conteúdo no SAP HANA, ele precisa de privilégios e funções específicos. Esses privilégios e funções também são necessários para recuperação de dados do SAP HANA. Use a aplicação SAP HANA Studio para atribuir privilégios e funções ao usuário. Para informações sobre como administrar o banco de dados SAP HANA e usar o SAP HANA Studio, consulte o SAP HANA Database – Administration Guide. Para informações sobre segurança do usuário, consulte o SAP HANA Security Guide (incluindo o SAP HANA Database Security). A conta de usuário usada para efetuar logon no sistema SAP HANA do SAP Predictive Analysis deve ser atribuída à função "MODELING" (no SAP HANA). Observação: Esta ação só pode ser executada por um usuário com privilégios ROLE_ADMIN no banco de dados SAP HANA. 12 2013-01-31 Instalando o SAP Predictive Analysis Quando um usuário do SAP Predictive Analysis efetua logon no sistema SAP HANA, a conta interna _SYS_REPO deve: • • Ter Privilégios SQL SELECT. Ter a opção Grantable to others selecionada no esquema do usuário (SAP Predictive Analysis). 3.4.1 Para configurar o _SYS_REPO para o usuário do SAP Predictive Analysis Se já houver uma conta definida para o usuário do SAP Predictive Analysis no sistema SAP HANA: 1. Da conexão com o sistema, na janela SAP HANA Studio Navigator, selecione Catalog > Authorization > Users. 2. Clique duas vezes na conta _SYS_REPO. 3. Na guia SQL Privileges, clique no ícone + , digite o nome do esquema do usuário, e selecione OK. 4. Escolha SELECT e a opção Yes correspondente em Grantable to others. 5. Escolha Deploy ou Save. Observação: O usuário também pode abrir um editor SQL no SAP HANA Studio e executar esta instrução SQL: GRANT SELECT ON SCHEMA <user_account_name> TO _SYS_REPO WITH GRANT OPTION 3.4.2 Medidas OLAP suportadas O SAP HANA suporta apenas as seguintes medidas de agregação nas fontes de dados OLAP • • • • SUM MIN MAX COUNT Se o seu conjunto de dados contiver uma agregação com base em uma medida não listada acima, a agregação será ignorada pelo SAP HANA durante a publicação e não fará parte do artefato final publicado. 3.5 Aspectos importantes a serem considerados no uso de universos do SAP BusinessObjects. 13 2013-01-31 Instalando o SAP Predictive Analysis • • Para adquirir dados de universos existentes na plataforma BI 4.0, é necessário que o Web Intelligence Server esteja em execução. Também é necessário que a plataforma Business Intelligence seja BI 4.0 SP2 nível de correção 14 ou superior. Observação: Você também pode adquirir dados de universos existentes em plataformas BI 4.0 SP3 e BI 4.0 SP4. 14 2013-01-31 Instalação e configuração do ambiente R de fonte aberta Instalação e configuração do ambiente R de fonte aberta 4.1 Instalando o ambiente R-2.15.1 e os pacotes necessários Para usar algoritmos R de fonte aberta na sua análise, você precisa instalar o ambiente R e configurá-lo com a aplicação SAP Predictive Analysis. O SAP Predictive Analysis oferece uma opção de instalação e configuração do R 2.15.1 e dos pacotes necessários da aplicação. Durante a instalação do ambiente R, você precisa estar conectado à Internet. Para instalar o ambiente R e os pacotes necessários, siga estes procedimentos: 1. Inicie a aplicação SAP Predictive Analysis. 2. No menu Arquivo, selecione Instalar e configurar ambiente R. 3. Selecione Instalar ambiente R 4. Leia o contrato de licenciamento do ambiente R de fonte aberta e as instruções, e selecione Concordo em instalar o ambiente R usando o script. 5. Selecione OK. Observação: Se você já tiver instalado o R 2.15.x, use este procedimento para instalar os pacotes R necessários. 4.2 Configurando o ambiente R Depois de instalado o R, você precisa configurar o ambiente R para ativar os algoritmos R na aplicação. Se você já tiver instalado o R-2.11.1 ou R-2.15.1 e os pacotes necessários, poderá ignorar a etapa de instalação e configurar diretamente o ambiente R. Observação: Antes de configurar o R-2.11.1, você precisa definir certas variáveis de ambiente. Por exemplo, se você tiver instalado o R em C:\Program Files\R\R-2.11.1, você precisa definir as variáveis de ambiente da seguinte forma: • R_HOME= C:\Program Files\R\R-2.11.1 • R_LIBS = C:\Program Files\R\R-2.11.1\library • Path = caminho existente; C:\Program Files\R\R-2.11.1\library\rJava\jri; C:\Program Files\R\R-2.11.1\bin 15 2013-01-31 Instalação e configuração do ambiente R de fonte aberta Para configurar o ambiente R, siga estes procedimentos: 1. Inicie a aplicação SAP Predictive Analysis. 2. No menu Arquivo, selecione Instalar e configurar ambiente R. 3. Na guia Configuração, selecione Ativar algoritmos R de fonte aberta. 4. Selecione Procurar para selecionar a pasta 5. Selecione OK. A caixa de diálogo "Controle de conta de usuário" será exibida com uma mensagem de aviso. 6. Selecione Sim na solicitação de confirmação. 16 2013-01-31 Introdução ao SAP Predictive Analysis Introdução ao SAP Predictive Analysis 5.1 Princípios básicos do SAP Predictive Analysis Componente Componente é a unidade básica de processamento do SAP Predictive Analysis. Cada componente contém âncoras de entrada e/ou saída (pontos de conexão). As âncoras são usadas para conectar componentes por meio de conectores. Quando você conecta os componentes, os dados são transmitidos dos componentes precedentes para seus componentes sucessores. O SAP Predictive Analysis contém estes componentes: • Preparação de dados • Algoritmos • Gravadores de dados Você pode acessar os componentes da visão de designer do painel de previsão. Depois de adicionar componentes ao editor de análise, o ícone de status de um componente permite identificar seu estado. Estes são os estados de um componente: • (Não configurado): este estado é exibido quando você arrasta um componente até o editor de análise. Indica a necessidade de configurar o componente antes da execução da análise. • (Configurado): este estado é exibido quando todas as propriedades necessárias do componente estão configuradas. • (Sucesso): este estado é exibido após a execução bem sucedida da análise. • (Falha): este estado é exibido se o componente causar falha na execução da análise. Análise Análise consiste em uma série de componentes diferentes conectados em sequência específica por meio de conectores que definem a direção do fluxo de dados. 17 2013-01-31 Introdução ao SAP Predictive Analysis Modelo Modelo é um componente reutilizável, criado treinando um algoritmo com os dados históricos. No banco de dados (In-DB) No banco de dados (in-DB) é um modo de execução de análise em que os dados são processados dentro do banco de dados usando recursos de mineração de dados. Neste modo, os dados jamais são processados fora do banco de dados, portanto, a velocidade de processamento é bem alta. Este modo pode ser usado para processar conjuntos de dados volumosos. O SAP HANA suporta mineração de dados no banco de dados por meio de integração R e da biblioteca de análise preditiva (PAL). No processo (In-Proc) No processo (in-Proc) é um modo de execução de análise em que os dados são processados, retirando-os do banco de dados e colocando-os em um espaço no processo de análise preditiva. Este tipo de análise também é denominado Out-DB (análise fora do banco de dados). 5.2 Iniciando o SAP Predictive Analysis Para iniciar o SAP Predictive Analysis, selecione Iniciar > Todos os Programas > SAP Business Intelligence > SAP Predictive Analysis > SAP Predictive Analysis. 5.3 Conhecendo o SAP Predictive Analysis Quando você inicia o SAP Predictive Analysis, a página inicial é exibida. A página inicial contém informações para ajudá-lo a começar a trabalhar com o SAP Predictive Analysis. Para começar a analisar os dados usando o SAP Predictive Analysis, primeiro você precisa conectar-se à fonte de dados e adquirir os dados para análise. Depois de adquiridos os dados, você pode realizar estas operações: • Preparar os dados para análise, aplicando funções de manipulação e limpeza de dados • Analisar os dados, aplicando algoritmos de mineração de dados e de análise estatística • Compartilhar conjuntos de dados e gráficos com colaboradores externos Observação: Este guia descreve como analisar os dados, aplicando algoritmos de mineração de dados e de análise estatística. Para informações sobre como adquirir os dados, preparar os dados e compartilhar conjuntos de dados, consulte o Guia do usuário do SAP Visual Intelligence disponível em http://help.sap.com/vi Depois de adquiridos os dados de uma fonte de dados, você precisa mudar para o painel de previsão para analisar os dados. 18 2013-01-31 Introdução ao SAP Predictive Analysis 5.3.1 Visão de designer A visão de designer permite projetar e executar análises e criar modelos preditivos. 5.3.2 Visão de resultados A visão de resultados permite entender os dados e os resultados da análise usando várias técnicas de visualização e gráficos intuitivos. 19 2013-01-31 Introdução ao SAP Predictive Analysis 5.4 Usando o SAP Predictive Analysis do início ao fim Esta é uma visão geral do processo de construção de um gráfico baseado em um conjunto de dados. O processo não é linear, portanto você pode retroceder uma etapa para ajustar o gráfico ou os dados. Etapas do trabalho com os seus dados Efetue a conexão à fonte de dados. Observação: Para informações sobre como conectar-se a sua fonte de dados, consulte a seção Conectando-se a sua fonte de dados do Guia do usuário do SAP Visual Intelligence. Visualize e organize as colunas e os atributos. Observação: Para informações sobre como visualizar colunas e atributos, consulte a seção Preparando os dados do Guia do usuário do SAP Visual Intelligence. 20 Descrição Se a fonte de dados for: • RDBMS: insira suas credenciais, conecte-se ao servidor do banco de dados e selecione uma fonte de dados; por exemplo, se você estiver se conectando ao SAP HANA, selecione uma visualização e um cubo para construir um gráfico. • Arquivo plano: escolha as colunas a serem adquiridas, cortadas ou exibidas e ocultas. • Universo: insira suas credenciais do universo, conecte-se ao repositório Central Management Server e selecione um universo para construir seu gráfico. Você pode visualizar os dados adquiridos como colunas ou facetas. Você pode organizar a exibição de dados para facilitar a construção do gráfico desta forma: • Crie filtros e oculte as colunas desnecessárias • Crie medidas, hierarquias de tempo e hierarquias geográficas • Limpe e organize os dados em colunas, usando várias ferramentas de manipulação • Crie colunas com fórmulas, usando a ampla seleção de funções disponíveis 2013-01-31 Introdução ao SAP Predictive Analysis Etapas do trabalho com os seus dados Descrição Depois de adquiridos os dados relevantes no painel de preparação, mude para o painel de previsão e crie uma análise para encontrar padrões nos dados e prever resultados futuros. Analise os dados usando algoritmos de análise preditiva. Observação: Este guia contém informações de como analisar os dados usando algoritmos de análise preditiva. No painel de previsão, você pode: • Criar uma análise • Construir modelos preditivos • Visualizar os resultados da análise • Exibir visualizações de modelo • Construir gráficos Observação: Para informações sobre como criar gráficos, consulte a seção Visualizando os dados do Guia do usuário do SAP Visual Intelligence. Salve a análise 21 Nomeie e salve a análise incluindo seus gráficos. A análise é salva e um documento com o formato de arquivo .SViD na pasta da aplicação, em Documentos, no caminho do seu perfil. 2013-01-31 Introdução ao SAP Predictive Analysis 22 2013-01-31 Criando análises Criando análises 6.1 Criando uma análise Você pode usar o SAP Predictive Analysis para mineração de dados e análise estatística, executando os dados em uma série de componentes. A série de componentes devem ser conectados entre si por meio de conectores, que definem a direção do fluxo de dados. Esse processo é denominado análise. Usando a análise, você pode ler os dados de uma fonte de dados; analisar os dados, aplicando funções de manipulação de dados, mineração de dados e algoritmos estatísticos; e armazenar os resultados da análise. Para criar uma análise, siga estes procedimentos: 1. Adquira dados de uma fonte de dados 2. (Opcional) Prepare os dados para análise (por exemplo, filtrando os dados) 3. Aplique os algoritmos 4. (Opcional) Armazene os resultados para uma análise posterior Tópicos relacionados • Adquirindo dados de uma fonte de dados • Preparando os dados para análise • Aplicando algoritmos • Armazenando os resultados da análise 6.1.1 Adquirindo dados de uma fonte de dados 1. Na página inicial, selecione o botão Novo documento no canto superior esquerdo. 2. Efetue a conexão com ou navegue até a sua fonte de dados. Você pode adquirir dados das seguintes fontes de dados: 23 2013-01-31 Criando análises Fonte de dados Descrição Arquivo CSV Você pode adquirir dados de um arquivo de dados com valores separados por vírgula e executar a análise no processo (in-proc) usando algoritmos SAP e R. Free hand SQL Você pode criar manualmente seu próprio provedor de dados inserindo sua própria linguagem de consulta estruturada (SQL - Structured Query Language) para uma fonte de dados de destino e executar a análise no processo (in-proc) usando algoritmos SAP e R. SAP HANA Offline Você pode adquirir dados de tabelas, visualizações e visões de análise do SAP HANA e executar a análise no processo (in-proc) usando algoritmos SAP e R. SAP HANA Online Você pode adquirir dados de tabelas, visualizações e visões de análise do SAP HANA e executar a análise no banco de dados (in-db) usando algoritmos HANA PAL. MS Excel Você pode adquirir dados de uma planilha do Microsoft Excel e executar a análise no processo (in-proc) usando algoritmos SAP e R. Universe 3.x Você pode adquirir dados de universos do SAP BusinessObjects existentes na plataforma XI 3.x e executar a análise no processo (in-proc) usando algoritmos SAP e R. Universe 4.x Você pode adquirir dados de universos do SAP BusinessObjects existentes na plataforma BI 4.x e executar a análise no processo (in-proc) usando algoritmos SAP e R. 3. Marque a opção Adquirir ou Selecionar conforme necessário. As colunas aparecem no painel de dados, os atributos e as medidas, à esquerda no painel Semântica. Você está pronto para começar a construir sua análise. No painel de previsão, o componente configurado de leitor de dados é adicionado ao editor de análise. Você pode executar a análise para ver os resultados do componente de leitor de dados. Observação: Para informações sobre como conectar-se a uma fonte de dados específica, consulte o Guia do usuário do SAP Visual Intelligence disponível em http://help.sap.com/vi. 24 2013-01-31 Criando análises 6.1.2 Preparando os dados para análise Esta etapa é opcional. Em muitos casos, os dados brutos da fonte de dados podem não serem adequados para a análise. Para obter resultados precisos, talvez seja necessário preparar e processar os dados antes da análise. Você encontra funções de manipulação de dados no painel de preparação e as funções de preparação de dados no painel de previsão. A preparação de dados consiste em verificação da precisão dos dados e de campos em falta, filtragem dos dados com base em valores de intervalo, amostragem de dados para investigação de um subconjunto de dados e manipulação de dados. Você pode processar os dados usando os componentes de preparação de dados. 1. No painel de previsão, clique duas vezes no componente de preparação de dados necessário na guia Preparação de dados. O componente de preparação de dados será adicionado ao editor de análise e uma conexão automática será criada para o componente de leitor de dados. 2. Clique no componente de preparação de dados com o botão direito do mouse e selecione Configurar propriedades. 3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as propriedades do componente de preparação de dados. 4. Selecione Salvar e fechar. 5. Para ver os resultados do componente de leitor de dados e do componente de preparação de dados, selecione . Tópicos relacionados • Componentes de preparação de dados 6.1.3 Aplicando algoritmos Obtidos os dados relevantes para análise, você precisa aplicar os algoritmos apropriados para determinar os padrões nos dados. É uma tarefa desafiadora determinar o algoritmo apropriado para uma finalidade específica. Você pode usar uma combinação de inúmeros algoritmos para analisar os dados. Por exemplo, primeiro você pode usar algoritmos de série de tempo para amortecer os dados e depois usar algoritmos de regressão para encontrar tendências. 25 2013-01-31 Criando análises A seguinte tabela contém informações dos algoritmos que devem ser selecionados para finalidades específicas: Realizando previsões com base no tempo Algoritmos de série de tempo • • • • Amortecimento exponencial triplo R de amortecimento exponencial individual R de amortecimento exponencial duplo R de amortecimento exponencial triplo Prevendo variáveis contínuas com base em outras Algoritmos de regressão variáveis no conjunto de dados. • Regressão linear • Regressão exponencial • Regressão geométrica • Regressão logarítmica • HANA de regressão linear múltipla • R de regressão linear • R de regressão exponencial • R de regressão geométrica • R de regressão logarítmica • R de regressão linear múltipla Encontrando padrões frequentes de conjunto de Algoritmos de associação itens em conjuntos volumosos de dados transa• HANA apriori cionais para gerar regras de associação • R apriori Criando clusters de observações em grupos de conjuntos de itens similares 26 Algoritmos de clustering • • HANA de valor médio K Valor médio K 2013-01-31 Criando análises Classificando e prevendo uma ou mais variáveis Árvores de decisão discretas com base em outras variáveis no conjun• HANA C 4.5 to de dados • R de árvore CNR Detectando valores atípicos no conjunto de dados Algoritmos de detecção de valor atípico • • Intervalo interquartil Valor atípico vizinho mais próximo Prevendo, classificando e reconhecendo padrões Algoritmos de rede neural estatísticos • R de rede neural NNet • R de rede neural MONMLP 1. No painel de previsão, clique duas vezes no componente de algoritmo necessário na guia Algoritmos. O componente de algoritmo será adicionado ao editor de análise e conectado ao componente anterior na análise. 2. Clique no componente de algoritmo com o botão direito do mouse e selecione Configurar propriedades. 3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as propriedades do componente de algoritmo. 4. Selecione Salvar e fechar. 5. Para ver os resultados do componente de leitor de dados, componente de preparação de dados e algoritmo, selecione . Tópicos relacionados • Algoritmos 6.1.4 Armazenando os resultados da análise Esta etapa é opcional. Você pode armazenar os resultados da análise em arquivos planos ou bancos de dados para uma análise posterior, usando componentes de gravação de dados. 1. No painel de previsão, clique duas vezes no componente de gravação de dados necessário na guia Gravadores de dados. O componente de gravação de dados será adicionado ao editor de análise e conectado ao componente anterior na análise. 27 2013-01-31 Criando análises 2. Clique no componente de gravação de dados com o botão direito do mouse e selecione Configurar propriedades. 3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as propriedades do componente de gravação de dados. 4. Selecione Salvar e fechar. 5. Para ver os resultados do componente de leitor de dados, componente de preparação de dados, algoritmo e componente de gravação de dados, selecione . Tópicos relacionados • Gravadores de dados 6.2 Executando a análise Para executar a análise, selecione na barra de ferramentas do editor de análise ou clique com o botão direito do mouse no último componente da análise, e selecione Executar análise. Se a sua análise for muito volumosa e complexa, você pode executá-la, componente por componente, e analisar os dados. Para executar parte da análise, selecione na barra de ferramentas do editor de análise ou clique com o botão direito do mouse na análise até a qual deseja executar e selecione Executar até aqui. 6.3 Salvando a análise Depois de criada a análise, você pode salvá-la para reutilizar no futuro. No SAP Predictive Analysis, você precisa salvar o documento para salvar a análise correspondente. O documento é salvo em formato de arquivo .SViD. O documento salvo contém o conjunto de dados (componente de leitor de dados) que você adquiriu da fonte de dados e a análise que você criou. Para salvar a análise em um documento, siga estes procedimentos: 1. Selecione Arquivo > Salvar. 2. Insira um nome para o documento. 3. Selecione Salvar. Se você criar várias análises com o mesmo conjunto de dados, todas serão salvas no mesmo documento. Você pode acessar todas as análise de um documento pela lista de opções Alterar. 28 2013-01-31 Criando análises Para adicionar uma nova análise ao documento, selecione na barra de ferramentas de análise. Para renomear a análise, selecione e insira um novo nome. Para excluir uma análise existente do documento, selecione . Observação: Os resultados de execução dos componentes não são salvos com as análises. Para ver os resultados do componente, você precisa executar novamente a análise. 6.4 Visualizando os resultados Para visualizar os resultados dos componentes em uma análise, após a execução da análise, clique com o botão direito do mouse no componente e selecione Visualizar resultados. A visão Resultados será exibida. 29 2013-01-31 Criando análises 30 2013-01-31 Analisando os dados Analisando os dados Depois da execução correta da análise, o resultado de cada componente da análise é representado usando diferentes gráficos de visualização. Para analisar os dados, siga estes procedimentos: 1. Depois de executar a análise, mude para a visão de resultados selecionando o botão Resultados na barra de ferramentas. 2. Do painel de seleção de componentes, selecione o componente necessário na análise para ver a visualização. Por padrão, o resultado do componente é exibido no painel de grade. Você pode mudar para o painel de gráficos para ver o resultado do componente no gráfico de visualização correspondente. Além disso, você pode construir seu próprio gráfico no painel de visualização. A seguinte tabela mostra resumidamente os componentes e respectivos gráficos de visualização suportados. Componentes Gráficos de visualização Leitores de dados e preparação de dados Gráfico de matriz de dispersão, gráfico de resumo estatístico e coordenadas paralelas Algoritmos de clustering Gráfico de cluster e resumo do algoritmo Árvores de decisão Árvore de decisão, resumo do algoritmo Algoritmos de série de tempo Gráfico de série de tempo, resumo do algoritmo Algoritmos de regressão Gráfico de regressão, resumo do algoritmo 7.1 Gráficos de visualização 7.1.1 Gráfico de matriz de dispersão 31 2013-01-31 Analisando os dados Gráficos de matriz de dispersão são matrizes de gráficos (gráficos n*n, em que n é o número de atributos selecionados) usados para comparar os dados em diferentes dimensões. Por padrão, no máximo quatro atributos contínuos são selecionados para análise, começando do primeiro atributo dos dados de origem, para criar um gráfico de matriz 4*4. No entanto, você pode selecionar manualmente os atributos necessários na opção Configurações e atualizar a visualização selecionando Aplicar Observação: Você pode selecionar no máximo quatro atributos contínuos na opção Configurações. 7.1.2 Gráfico de resumo estatístico O resumo estatístico contém informações resumidas de atributos contínuos da fonte de dados. Ele contém informações resumidas de contagem, valor mínimo, valor máximo, variação, desvio padrão, soma, média, intervalo e número de registros. Um gráfico em forma de histograma é criado para cada atributo. 32 2013-01-31 Analisando os dados 7.1.3 Coordenadas paralelas Coordenadas paralelas são uma técnica de visualização de dados multidimensionais e padrões multivariáveis dos dados para análise. Neste gráfico, por padrão, os primeiros cinco atributos estão representados como eixos paralelos espaçados verticalmente. Para escolher um subconjunto de atributos para visualização no gráfico, use a opção Configurações. A etiqueta de cada eixo contém o nome do atributo, e os valores mínimo e máximo dos atributos. Cada observação é representada como uma série de pontos conectados ao longo dos eixos paralelos. Você pode selecionar a cor por opção para filtragem dos dados com base no valor da categoria. Observação: Você pode selecionar no máximo sete atributos contínuos na opção Configurações. 7.1.4 Árvore de decisão Árvore de decisão é uma técnica de visualização que permite classificar as observações em grupos e prever eventos futuros com base no conjunto de regras de decisão. Esta apresentação será usada para análise da árvore de decisão. Nesta técnica, uma árvore de decisão binária é criada dividindo as observações em subgrupos menores até preencher os critérios de parada. O nó final indica os dados classificados. Você pode ampliar a árvore de decisão usando o botão de aproximação. Observação: • 33 A aplicação não cria árvores de decisão se houver mais de 32 valores de categoria para uma coluna dependente. 2013-01-31 Analisando os dados • A aparência e o comportamento da árvore de decisão variam dependendo do fornecedor de algoritmos. Por exemplo, a árvore de decisão para o algoritmo R de árvore CNR é diferente da árvore de decisão para o algoritmo HANA C4.5. Cada nó da árvore de decisão representa a classificação dos dados naquele nível. Você pode visualizar o conteúdo do nó selecionando em cada nó. 7.1.5 Gráfico de regressão O gráfico de regressão é usado para visualizar a correlação entre as variáveis dependente e independente. No modo tendência, você pode analisar o desempenho do algoritmo, comparando as variáveis dependentes reais com os valores previstos, com as variáveis dependentes representadas como gráfico de barras e os valores previstos representados como gráficos de linhas. No modo preenchimento, o algoritmo preenche os valores que faltam e o resultado é exibido em gráfico de linhas. 34 2013-01-31 Analisando os dados Se o conjunto de dados for volumoso, o gráfico pode não ficar claro. Para visualizar melhor os dados, use o botão de seleção Intervalo localizado na base do gráfico para selecionar um intervalo de dados específico de um conjunto volumoso de dados. Os dados na área selecionada são exibidos no editor de visualização. 7.1.6 Gráfico de série de tempo O gráfico de série de tempo permite visualizar os dados de série de tempo comparados com os valores ajustados ou previstos do algoritmo. Você pode usar o gráfico para visualizar os dados previstos ao longo de um período específico. No modo tendência, uma variável dependente é representada em gráfico de barras e os valores de tendência são representados em gráfico de linhas. No modo previsão, uma variável dependente é representada em gráfico de barras e os valores previstos são representados em gráfico de linhas. Se o conjunto de dados for volumoso, o gráfico pode não ficar claro. Para visualizar melhor os dados, use o botão de seleção Intervalo localizado na base do gráfico para selecionar um intervalo de dados específico de um conjunto volumoso de dados. Os dados na área selecionada são exibidos no editor de visualização. 35 2013-01-31 Analisando os dados 7.1.7 Gráfico de cluster Gráfico de cluster é uma técnica de visualização que utiliza diferentes gráficos para representar informações do cluster, como tamanho do cluster, densidade e distância do cluster, comparação variável do cluster e comparação do cluster. Observação: Se você utilizar o algoritmo HANA de valor médio K para observações de cluster, apenas informações de tamanho e comparação variável do cluster serão representadas graficamente. Tamanho do cluster Tamanho do cluster é o número de elementos em cada cluster e é representado por um gráfico de barras horizontais. No entanto, você também pode visualizar o tamanho do cluster em um gráfico de pizza ou um gráfico de barras verticais. Densidade e distância do cluster A distância entre clusters e a densidade de cada cluster são representadas por um gráfico de rede. Cada nó da rede representa um cluster e seu tamanho. A cor do nó representa a densidade. Você amplia o gráfico de rede selecionando . Comparação variável do cluster A comparação entre a distribuição total de todos os clusters e a distribuição de cada cluster é representada por um histograma. Você pode selecionar o atributo necessário do cluster em uma lista de opções variáveis e alterar o cluster usando o controle deslizante. Comparação do cluster O algoritmo R de valor médio K computa os pontos centrais de cada atributo de entrada em cada cluster. A comparação entre cada ponto central e o cluster é representada pelo gráfico radial. Você pode selecionar a opção Normalizar resultado para visualizar o gráfico com os dados normalizados. No modo normalizado, os dados são representados no intervalo de 0 a 1. 36 2013-01-31 Trabalhando com modelos Trabalhando com modelos Modelo é um componente reutilizável, criado treinando um algoritmo com os dados históricos e salvando a instância. Geralmente você cria modelos para: • Compartilhar regras comerciais aplicáveis a dados similares • Analisar rapidamente os resultados sem os dados históricos, usando a instância treinada do algoritmo 8.1 Criando um modelo Para criar um modelo, você precisa salvar o estado do algoritmo. 1. Adquira os dados da fonte de dados solicitada. O componente de fonte de dados será adicionado ao editor de análise no painel de previsão. 2. No painel de previsão, clique duas vezes no componente de algoritmo solicitado. 3. Clique no componente de algoritmo com o botão direito do mouse e selecione Configurar propriedades. 4. Configure as propriedades do algoritmo na caixa de diálogo. a. Insira os valores necessários para as propriedades do algoritmo. b. Em Informações do modelo, selecione Salvar o modelo. c. Insira um nome e uma descrição para o modelo. d. Se você quiser substituir o modelo existente por um novo, selecione Sobregravar, se existir. e. Selecione Salvar e fechar. 5. Selecione . O modelo será criado e exibido na guia Modelos salvos. Você pode usar este modelo apenas como qualquer outro componente para a criação de uma análise. Observação: Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos de coluna independente usados durante a criação do modelo. 37 2013-01-31 Trabalhando com modelos 8.2 Visualizando as informações do modelo As informações do modelo abrangem: • Detalhes da coluna, como quais foram as colunas usadas durante a geração do modelo • Resumo do algoritmo Esta informação é útil para os analistas de dados entenderem a estrutura do modelo. Para visualizar as informações do modelo, siga estes procedimentos: 1. No painel de previsão, na guia Modelos salvos, clique duas vezes no modelo desejado. A guia Modelos salvos só será exibida se os modelos já estiverem salvos no repositório. 2. Clique no modelo com o botão direito do mouse e selecione Visualizar informações do modelo. A visualização correspondente do algoritmo selecionado durante a geração do modelo será exibida. 8.3 Exportando um modelo como PMML Você pode exportar as informações do modelo em um arquivo local, no formato padrão da indústria Predictive Modeling Markup Language (PMML), e compartilhá-lo com outras aplicações compatíveis com PMML para analisar dados similares. Para exportar um modelo em formato PMML, siga estes procedimentos: 1. Crie um modelo. 2. No painel de previsão, na guia Modelos salvos, clique duas vezes no modelo desejado. 3. Clique com o botão direito do mouse no modelo e selecione Exportar como PMML. 4. Insira um nome para o arquivo. 5. Selecione o tipo de arquivo desejado: PMML ou XML. 6. Selecione Salvar. 8.4 Exportando um modelo como arquivo .spar Você pode exportar um modelo criado em um documento SVID para um arquivo .spar e usá-lo em outro documento SVID importando o arquivo. Para exportar um modelo, execute os seguintes procedimentos: 1. Crie um modelo. 38 2013-01-31 Trabalhando com modelos 2. Clique com o botão direito no modelo e escolha Exportar modelo. 3. Insira um nome para o arquivo .spar. 4. Selecione Salvar. 8.5 Importando um modelo Você pode reutilizar um modelo solicitado no documento SVID em outro documento SVID importando o arquivo do arquivo .spar. Para importar um modelo, execute os seguintes procedimentos: 1. Inicie o SAP Predictive Analysis. 2. No painel de Previsão escolhaImportar modelo. 3. Escolha um arquivo .spar válido e escolha Abrir. O modelo foi importado e exibido na guia Modelos salvos. 8.6 Excluindo um modelo Recomendamos que você use esta opção com cautela porque a exclusão de um modelo pode inutilizar a análise que contenha a referência do modelo. Para excluir um modelo, siga estes procedimentos: 1. No painel de previsão, selecione a guia Modelos salvos. 2. Clique com o botão direito no modelo solicitado e escolha Excluir. 39 2013-01-31 Trabalhando com modelos 40 2013-01-31 Propriedades do componente Propriedades do componente 9.1 Algoritmos Use algoritmos para executar a mineração de dados e análise estatística dos dados. Por exemplo, para determinar tendências e padrões com base nos dados. O SAP Predictive Analysis contém algoritmos incorporados, como de regressão, série de tempo e valor atípico. No entanto, a aplicação suporta inclusive algoritmos da biblioteca R de fonte aberta, como de árvore de decisão, valor médio k, rede neural, série de tempo e regressão. Você também pode executar uma análise interna do banco de dados usando algoritmos da biblioteca de análise preditiva (Predictive Analysis Library - PAL) do SAP HANA. 9.1.1 Regressão 9.1.1.1 Regressão exponencial Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função exponencial com a metodologia de mínimo quadrado. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades de regressão exponencial Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. 41 2013-01-31 Propriedades do componente Coluna independente Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que a regressão deve ser executada. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.1.2 Regressão geométrica Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função geométrica com a metodologia de mínimo quadrado. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades da regressão geométrica Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída contendo os valores previstos. 42 Coluna independente Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que a regressão deve ser executada. 2013-01-31 Propriedades do componente Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.1.3 HANA de regressão linear múltipla Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis independentes. Propriedades do algoritmo HANA de regressão linear múltipla Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. Colunas independentes Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que você deseja executar a regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Número de threads 43 Insira o número de threads a ser usado na execução. 2013-01-31 Propriedades do componente Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.1.4 Regressão linear Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável com a metodologia de mínimo quadrado. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades da regressão linear Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que você deseja executar a regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. 44 Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 2013-01-31 Propriedades do componente 9.1.1.5 Regressão logarítmica Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função logarítmica com a metodologia de mínimo quadrado. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades da regressão logarítmica Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que você deseja executar a regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.1.6 R de regressão exponencial 45 2013-01-31 Propriedades do componente Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função exponencial da biblioteca de fonte aberta R. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades do algoritmo R de regressão exponencial Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que você deseja executar a regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Permitir único ajuste Um valor booleano - se definido como verdadeiro, os coeficientes com alias serão ignorados na matriz de covariância de coeficiente. Se definido como falso, um modelo com coeficientes com alias produzirá um erro. Um modelo com coeficientes com alias significa que a matriz quadrada x*x é única. Contrastes Selecione a lista de contrastes a ser usada para fatores que aparecem como variáveis no modelo. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.1.7 R de regressão geométrica 46 2013-01-31 Propriedades do componente Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função geométrica da biblioteca de fonte aberta R. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades do algoritmo R de regressão geométrica Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que você deseja executar a regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Permitir único ajuste Um valor booleano - se definido como verdadeiro, os coeficientes com alias serão ignorados na matriz de covariância de coeficiente. Se definido como falso, um modelo com coeficientes com alias produzirá um erro. Um modelo com coeficientes com alias significa que a matriz quadrada x*x é única. Contrastes Selecione a lista de contrastes a ser usada para fatores que aparecem como variáveis no modelo. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.1.8 R de regressão linear 47 2013-01-31 Propriedades do componente Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a biblioteca R de fonte aberta. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades do algoritmo R de regressão linear Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que você deseja executar a regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Permitir único ajuste Um valor booleano - se definido como verdadeiro, os coeficientes com alias serão ignorados na matriz de covariância de coeficiente. Se definido como falso, um modelo com coeficientes com alias produzirá um erro. Um modelo com coeficientes com alias significa que a matriz quadrada x*x é única. Contrastes Selecione a lista de contrastes a ser usada para fatores que aparecem como variáveis no modelo. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.1.9 R de regressão logarítmica 48 2013-01-31 Propriedades do componente Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão de uma variável. Ele determina como uma variável individual influencia outra variável usando a função logarítmica da biblioteca R de fonte aberta. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades do algoritmo R de regressão logarítmica Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. Coluna independente Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que você deseja executar a regressão. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Permitir único ajuste Um valor booleano - se definido como verdadeiro, os coeficientes com alias serão ignorados na matriz de covariância de coeficiente. Se definido como falso, um modelo com coeficientes com alias produzirá um erro. Um modelo com coeficientes com alias significa que a matriz quadrada x*x é única. Contrastes Selecione a lista de contrastes a ser usada para fatores que aparecem como variáveis no modelo. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.1.10 R de regressão linear múltipla 49 2013-01-31 Propriedades do componente Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis independentes. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. Propriedades do algoritmo R de regressão linear múltipla Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. Colunas independentes Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que a regressão deve ser executada. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Nível de confiança Insira o nível de confiança do algoritmo (a precisão das previsões). Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.1.11 HANA R de regressão linear múltipla Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis independentes. Observação: O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das colunas usado durante a construção do modelo. 50 2013-01-31 Propriedades do componente Propriedades do algoritmo HANA R de regressão linear múltipla Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Preencher: preenche os valores em falta na coluna de destino. • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. Colunas independentes Selecione a coluna de origem de entrada com a qual você deseja executar a regressão. Coluna dependente Selecione a coluna de destino em que a regressão deve ser executada. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo remove registros que contenham valores ausentes nas colunas independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Nível de confiança Insira o nível de confiança do algoritmo (a precisão das previsões). Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. 9.1.2 Valores atípicos 9.1.2.1 Intervalo interquartil Use este algoritmo para identificar valores atípicos com base na distribuição estatística entre o primeiro e terceiro quartis. Observação: Os dados de entrada para o algoritmo IQR devem ser de no mínimo 4 linhas. 51 2013-01-31 Propriedades do componente Propriedades do algoritmo de intervalo interquartil Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspondente é atípico. • Remover valores atípicos: remove os valores atípicos dos dados de entrada. Coluna independente Selecione a coluna de origem de entrada. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Coeficiente limitador Insira o desvio permitido para os valores do intervalo interquartil. 9.1.2.2 Valor atípico vizinho mais próximo Use este algoritmo para identificar valores atípicos com base no número de vizinhos (N) e na distância média dos valores comparados aos seus vizinhos N mais próximos. Propriedades do valor atípico vizinho mais próximo Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Exibir valores atípicos: adiciona uma coluna booleana aos dados de entrada, especificando se o valor correspondente é atípico. • Remover valores atípicos: remove os valores atípicos dos dados de entrada. Coluna independente 52 Selecione a coluna de origem de entrada. 2013-01-31 Propriedades do componente Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Contagem da vizinhança Insira o desvio permitido para os valores do intervalo interquartil. Número de valores atípicos Insira o número de valores atípicos a ser removido. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores previstos. 9.1.3 Série de tempo 9.1.3.1 Amortecimento exponencial triplo Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados. Propriedades do logaritmo de amortecimento exponencial triplo Modo de saída Selecione o modo em que você deseja exibir a saída. • Tendência: exibe os dados de origem junto com os valores previstos para um conjunto de dados informado. • Previsão: exibe os valores previstos para o período informado. Coluna dependente Selecione a coluna de entrada a ser prevista. Considerar coluna de datas Selecione esta opção para especificar se a coluna de datas deve ou não ser usada. 53 Coluna de datas Insira o nome da coluna que contenha valores de data. Valores em falta Selecione o método para lidar com as entradas em falta. • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. 2013-01-31 Propriedades do componente Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ativada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser consideradas. Períodos a serem previstos Insira o número de períodos a serem previstos. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). Intervalo: 0-1 Beta Insira uma constante de amortecimento para encontrar os parâmetros de tendência. Intervalo: 0-1 Gama Insira uma constante de amortecimento para encontrar os parâmetros de tendência sazonal. Intervalo: 0-1 9.1.3.2 R de amortecimento exponencial duplo Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados. Propriedades do algoritmo de amortecimento exponencial duplo 54 Modo de saída Selecione o modo em que você deseja exibir a saída. • Tendência: exibe os dados de origem junto com os valores previstos para um conjunto de dados informado. • Previsão: exibe os valores previstos para o período informado. Coluna dependente Selecione a coluna de entrada a ser prevista. 2013-01-31 Propriedades do componente Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ativada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser consideradas. Períodos a serem previstos Insira o número de períodos a serem previstos. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). Intervalo: 0-1 Beta Insira uma constante de amortecimento para encontrar os parâmetros de tendência. Intervalo: 0-1 Nível de confiança Insira o nível de confiança do algoritmo (a precisão das previsões). Número de observações periódicas Insira o número de observações periódicas necessárias para iniciar o cálculo. Nível Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0,4 Tendência Insira o valor inicial para encontrar os parâmetros de tendência (b[0]) (b.start). Por exemplo: 0,4 Entradas otimizadoras Insira os valores iniciais de alfa, beta e gama necessários para o otimizador. Por exemplo: 0,3, 0,1, 0,1 9.1.3.3 R de amortecimento exponencial individual Use este algoritmo para amortecer os dados de origem. 55 2013-01-31 Propriedades do componente Propriedades do algoritmo R de amortecimento exponencial individual Modo de saída Selecione o modo em que você deseja exibir a saída. • Tendência: exibe os dados de origem junto com os valores previstos para um conjunto de dados informado. • Previsão: exibe os valores previstos para o período informado. Coluna dependente Selecione a coluna de entrada a ser prevista. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ativada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser consideradas. Períodos a serem previstos Insira o número de períodos a serem previstos. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). Intervalo: 0-1 Nível de confiança Insira o nível de confiança do algoritmo (a precisão das previsões). Número de observações periódicas Insira o número de observações periódicas necessárias para iniciar o cálculo. Nível Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0,4 9.1.3.4 R de amortecimento exponencial triplo Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados. 56 2013-01-31 Propriedades do componente Propriedades do algoritmo R de amortecimento exponencial triplo Modo de saída Selecione o modo em que você deseja exibir a saída. • Tendência: exibe os dados de origem junto com os valores previstos para um conjunto de dados informado. • Previsão: exibe os valores previstos para o período informado. Coluna dependente Selecione a coluna de entrada a ser prevista. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ativada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser consideradas. Períodos a serem previstos Insira o número de períodos a serem previstos. 57 Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). Intervalo: 0-1 Beta Insira uma constante de amortecimento para encontrar os parâmetros de tendência. Intervalo: 0-1 Gama Insira uma constante de amortecimento para encontrar os parâmetros de tendência sazonal. Sazonal Selecione o tipo de algoritmo de amortecimento exponencial HoltWinters. Nível de confiança Insira o nível de confiança do algoritmo (a precisão das previsões). Número de observações periódicas Insira o número de observações periódicas necessárias para iniciar o cálculo. Nível Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0,4 Tendência Insira o valor inicial para encontrar os parâmetros de tendência (b[0]) (b.start). Por exemplo: 0,4 2013-01-31 Propriedades do componente Estação Insira os valores iniciais para encontrar os parâmetros sazonais (s.start). O valor depende da coluna selecionada. Por exemplo, se você selecionar trimestre como período, deverá inserir quatro valores dobrados. Entradas otimizadoras Insira os valores iniciais de alfa, beta e gama necessários para o otimizador. Por exemplo: 0,3, 0,1, 0,1 9.1.3.5 HANA R de amortecimento exponencial triplo Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados. Propriedades do algoritmo R de amortecimento exponencial triplo Modo de saída Selecione o modo em que você deseja exibir a saída. • Tendência: exibe os dados de origem junto com os valores previstos para um conjunto de dados informado. • Previsão: exibe os valores previstos para o período informado. Coluna dependente Selecione a coluna de entrada para realizar uma análise de séries temporais. Período Selecione o período para a previsão. Períodos por ano Selecione o período para a previsão. Esta opção só fica ativada se você selecionar "Personalizar" para "Período". Ano inicial Insira o ano do qual as observações devem ser consideradas. Por exemplo, 2009, 1987, 2019. Período inicial Insira o período do qual as observações devem ser consideradas. Períodos a serem previstos Insira o número de períodos a serem previstos. Esse valor é usado apenas se o modo de saída é previsto. 58 Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Valores de ano Insira um nome para a coluna recém criada que contenha os valores de ano. Valores de trimestre Insira um nome para a coluna recém criada que contenha os valores de trimestre. Valores de mês Insira um nome para a coluna recém criada que contenha os valores de mês. Valores de período Insira um nome para a coluna recém criada que contenha os valores de período. 2013-01-31 Propriedades do componente Alfa Insira uma constante de amortecimento para observações de amortecimento (parâmetros de base). Intervalo: 0-1 Beta Insira uma constante de amortecimento para encontrar os parâmetros de tendência. Intervalo: 0-1 Gama Insira uma constante de amortecimento para encontrar os parâmetros de tendência sazonal. Sazonal Selecione o tipo de algoritmo de amortecimento exponencial HoltWinters. Nível de confiança Insira o nível de confiança do algoritmo (a precisão das previsões). Número de observações periódicas Insira o número de observações periódicas necessárias para iniciar o cálculo. Nível Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0,4 Tendência Insira o valor inicial para encontrar os parâmetros de tendência (b[0]) (b.start). Por exemplo: 0,4 Estação Insira os valores iniciais para encontrar os parâmetros sazonais (s.start). O valor depende da coluna selecionada. Por exemplo, se você selecionar trimestre como período, deverá inserir quatro valores dobrados. Entradas otimizadoras Insira os valores iniciais de alfa, beta e gama necessários para o otimizador. Por exemplo: 0,3, 0,1, 0,1 9.1.4 Árvores de decisão 9.1.4.1 HANA C 4.5 Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas com base em outra variáveis. Propriedades do algoritmo HANA C 4.5 Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. • Preencher: preenche os valores em falta na coluna de destino. 59 2013-01-31 Propriedades do componente Colunas independentes Selecione as colunas de origem de entrada. Coluna dependente Selecione a coluna de destino. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Percentual Insira o percentual de dados a ser considerado na análise. Número de threads Insira o número de threads a ser usado na execução. Nome da coluna Insira o nome da coluna independente que contenha valores numéricos. Inserir intervalos binários Insira intervalos binários. 9.1.4.2 R de árvore CNR Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas com base em outra variáveis. No entanto, você pode usar este algoritmo para identificar tendências nos dados. Observação: • • • O pacote "rpart" que faz parte do R 2.15 não processa nomes de coluna com espaço nem caracteres especiais. O pacote "rpart" suporta apenas formato de nome de coluna de entrada suportado pelo dataframe R. Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos de coluna independente usados durante a criação do modelo. Nomes de coluna que contenham espaços ou qualquer outro caractere especial diferente de ponto (.) não são suportados. Propriedades do algoritmo R de árvore CNR Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. • Preencher: preenche os valores em falta na coluna de destino. Colunas independentes 60 Selecione as colunas de origem de entrada. 2013-01-31 Propriedades do componente Coluna dependente Selecione a coluna de destino. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Rpart: o algoritmo exclui todas as observações das quais a coluna dependente está em falta. No entanto, ele retém as observações das quais uma ou mais colunas independentes estão em falta. • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Método Selecione o tipo de regra de repartição. Valores possíveis: • Classificação: use este método se a variável dependente tiver valores de categoria. • Regressão: use este método se a variável dependente tiver valores contínuos. Divisão mínima Insira um número mínimo de observações necessário para divisão de um nó. Critérios de divisão Selecione os critérios de divisão do nó. Valores possíveis: • Gini: impureza Gini • Informações: ganho de informações. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Parâmetro de complexidade Insira o parâmetro de complexidade para economizar o tempo de computação, evitando qualquer divisão que não melhore o ajuste. Profundidade máxima Insira o nível máximo do nó na árvore final com o nó raiz computado como nível 0. Observação: Se a profundidade máxima for maior que 30, o algoritmo não produz os resultados esperados (em máquinas de 32 bits). 61 Validação cruzada Insira o número de validações cruzadas. Um valor maior de validação cruzada aumenta o tempo de computação e produz resultados mais precisos. Probabilidade prioritária Insira o vetor de probabilidades prioritárias. 2013-01-31 Propriedades do componente Utilizar substituto Selecione o substituto para usar no processo de repartição. Valores possíveis: • Exibir apenas - uma observação com um valor em falta para a regra de divisão primária não será enviada aos níveis inferior da árvore. • Utilizar substituto - use esta opção para repartir objetos sem a variável principal; se todos os substitutos estiverem em falta, a observação não será dividida. • Interromper se estiver em falta - se todos os substitutos estiverem em falta, a observação será enviada na direção majoritária. Estilo de substituto Insira o estilo que controla a seleção do melhor substituto. Valores possíveis: • Usar classificação correta total - o algoritmo usa o número total de classificações corretas para encontrar uma variável substituta potencial. • Usar percentual de casos que não estão em falta - o algoritmo usa o percentual de casos que não estão em falta, classificados para encontrar um substituto potencial. Substituto máximo Insira o número máximo de substitutos a ser retido em cada nó de uma árvore. 9.1.4.3 HANA R de árvore CNR Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas com base em outra variáveis. No entanto, você pode usar este algoritmo para identificar tendências nos dados. Observação: • • • 62 O pacote "rpart" que faz parte do R 2.15 não processa nomes de coluna com espaço nem caracteres especiais. O pacote "rpart" suporta apenas formato de nome de coluna de entrada suportado pelo dataframe R. Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos de coluna independente usados durante a criação do modelo. Nomes de coluna que contenham espaços ou qualquer outro caractere especial diferente de ponto (.) não são suportados. 2013-01-31 Propriedades do componente Propriedades do algoritmo HANA R de árvore CNR Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. • Preencher: preenche os valores em falta na coluna de destino. Colunas independentes Selecione as colunas de origem de entrada. Coluna dependente Selecione a coluna de destino. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: retém os valores em falta. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Método Selecione o tipo de regra de repartição. Valores possíveis: • Classificação: use este método se a variável dependente tiver valores de categoria. • Regressão: use este método se a variável dependente tiver valores contínuos. Divisão mínima Insira um número mínimo de observações necessário para divisão de um nó. Critérios de divisão Selecione os critérios de divisão do nó. Valores possíveis: • Gini: impureza Gini • Informações: ganho de informações. 63 Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Parâmetro de complexidade Insira o parâmetro de complexidade para economizar o tempo de computação, evitando qualquer divisão que não melhore o ajuste. 2013-01-31 Propriedades do componente Profundidade máxima Insira o nível máximo do nó na árvore final com o nó raiz computado como nível 0. Observação: Se a profundidade máxima for maior que 30, o algoritmo não produz os resultados esperados (em máquinas de 32 bits). Validação cruzada Insira o número de validações cruzadas. Um valor maior de validação cruzada aumenta o tempo de computação e produz resultados mais precisos. Probabilidade prioritária Insira o vetor de probabilidades prioritárias. Utilizar substituto Selecione o substituto para usar no processo de repartição. Valores possíveis: • Exibir apenas - uma observação com um valor em falta para a regra de divisão primária não será enviada aos níveis inferior da árvore. • Utilizar substituto - use esta opção para repartir objetos sem a variável principal; se todos os substitutos estiverem em falta, a observação não será dividida. • Interromper se estiver em falta - se todos os substitutos estiverem em falta, a observação será enviada na direção majoritária. Estilo de substituto Insira o estilo que controla a seleção do melhor substituto. Valores possíveis: • Usar classificação correta total - o algoritmo usa o número total de classificações corretas para encontrar uma variável substituta potencial. • Usar percentual de casos que não estão em falta - o algoritmo usa o percentual de casos que não estão em falta, classificados para encontrar um substituto potencial. Substituto máximo Insira o número máximo de substitutos a ser retido em cada nó de uma árvore. 9.1.5 Rede neural 9.1.5.1 R de rede neural MONMLP 64 2013-01-31 Propriedades do componente Use este algoritmo para previsão, classificação e reconhecimento de padrão estatístico usando as funções da biblioteca R. Observação: R não suporta armazenamento PMML para rede neural MONMLP. Propriedades do algoritmo R de rede neural MONMLP Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. • Preencher: preenche os valores em falta na coluna de destino. Colunas independentes Selecione as colunas de origem de entrada. Coluna dependente Selecione a coluna de destino. Neurônios da camada1 oculta Insira o número de nós/neurônios na primeira camada oculta (hidden1). Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Função de transferência de camada Selecione a função de ativação a ser usada para a camada oculta oculta (Th). Função de transferência de camada Selecione a função de ativação a ser usada para a camada de de saída saída (To). Derivativo de função de transferência de camada oculta Selecione o derivativo da função de ativação de camada oculta (Th.prime). Derivativo de função de Selecione o derivativo da função de ativação de camada de transferência de camada de saída saída (To.prime). 65 Neurônios da camada2 oculta Insira o número de nós/neurônios na segunda camada oculta (hidden2). Iterações máximas Insira o número máximo de iterações para o algoritmo de otimização (iter.max). Colunas com monotonicidade Insira os índices de coluna à qual você deseja aplicar a restrição de monotonicidade (monotone). Iterações de treinamento Insira o número de iterações de treinamento após as quais o cálculo da função de custos será interrompido (iter.stopped). Pesos iniciais Insira um vetor de peso inicial (init.weights). 2013-01-31 Propriedades do componente Exceções máximas Insira o número máximo de exceções para a rotina de otimização (max.exceptions). Escalar coluna dependente Para escalar colunas dependentes até a média zero e variação unitária antes do ajuste, selecione Verdadeiro (scale.y) Agregação bootstrap necessária Para usar a agregação bootstrap, selecione Verdadeiro (bag). Testes para evitar mínimos locais Insira o número de testes repetidos para evitar mínimos locais (n.trials). Número de membros do conjunto Insira o número de membros do conjunto a serem ajustados (n.ensemble) 9.1.5.2 R de rede neural NNet Use este algoritmo para previsão, classificação e reconhecimento de padrão estatístico usando as funções da biblioteca R. Propriedades do algoritmo R de rede neural NNet Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Valores possíveis: • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra na saída que contenha os valores previstos. • Preencher: preenche os valores em falta na coluna de destino. Colunas independentes Selecione as colunas de origem de entrada. Coluna dependente Selecione a coluna de destino. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: o algoritmo retém os valores em falta para processamento. • Parar: o algoritmo para se um valor estiver em falta na coluna independente ou na coluna dependente. Neurônios da camada oculta Insira o número de nós/neurônios na camada oculta. Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores previstos. Tipo 66 Selecione o tipo de análise a ser realizada pelo algoritmo. 2013-01-31 Propriedades do componente Ignorar camada oculta Para adicionar conexões skip-layer da entrada para a saída, selecione Verdadeiro. Saída linear Para obter uma saída linear, selecione Verdadeiro. Se você selecionar o tipo de análise Classificação, este valor deve ser verdadeiro. Usar Softmax Selecione Verdadeiro para utilizar os ajustes "modelo de log linear" e "probabilidade condicional máxima". linout, entropy, softmax e censored são mutuamente excludentes. Usar entropia Para utilizar o ajuste de "probabilidade condicional máxima", selecione Verdadeiro. Por padrão, o algoritmo usa o método dos mínimos quadrados. Valores possíveis: • Verdadeiro: use o ajuste "probabilidade condicional máxima". • Falso: use o método dos mínimos quadrados. Usar Censored Para softmax, uma linha de (0,1,1) indica um exemplo das classes 2 e 3, mas para censored, indica um exemplo das classes 2 ou 3. Intervalo Insira pesos iniciais aleatórios [-rang, rang]. Defina este valor como 0,5 a menos que a entrada seja grande. Se a entrada for grande, escolha o 'rang' usando a fórmula rang * max(|x|) <= 1 Decaimento de peso Insira um valor usado para cálculo de novos pesos (weight decay). Iterações máximas Insira o número máximo de iterações permitidas. Matriz hessiana necessária Para retornar uma medida hessiana no melhor conjunto de pesos, selecione Verdadeiro. Pesos máximos Insira o número máximo de pesos permitidos no cálculo. Não existe limite intrínseco no código, mas o aumento no número de pesos pode permitir ajustes que serão bem lentos e demorados. 67 Abstol Insira o valor que indica o ajuste perfeito (abstol). Reltol O algoritmo termina se o otimizador não puder reduzir os critérios de ajuste pelo fator: 1 - reltol Contrastes Insira a lista de contrastes a ser usada para fatores que aparecem como variáveis no modelo. Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. 2013-01-31 Propriedades do componente 9.1.6 Clustering 9.1.6.1 HANA de valor médio K Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters. Observação: • • Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o algoritmo HANA de valor médio K. No entanto, as observações em cada cluster permanecem iguais. A criação de modelos usando o algoritmo HANA de valor médio K não é suportada. Propriedades do algoritmo HANA de valor médio K Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Colunas independentes Selecione as colunas de origem de entrada. Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Ignorar: o algoritmo ignora o registro que contenha valores em falta durante o cálculo. No entanto, os registros são retidos na tabela de resultados. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Número de clusters Insira o número de grupos para clustering. Nome do cluster Insira um nome para a coluna recém criada que contenha o nome do cluster. Iterações máximas Insira o número de iterações permitido para localização de clusters. Método de cálculo do centro Selecione o método a ser usado para cálculo inicial do centro do cluster. 68 Normalização Para normalizar os dados, selecione Verdadeiro. Número de threads Insira o número de threads a ser usado na execução. 2013-01-31 Propriedades do componente Limite de saída Insira o valor limite para a saída das iterações. 9.1.6.2 R de valor médio K Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters. Observação: • • Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o algoritmo R de valor médio K. No entanto, as observações em cada cluster permanecem iguais. A criação de modelos usando o algoritmo R de valor médio K não é suportada. Propriedades do algoritmo R de valor médio K Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Colunas independentes Selecione as colunas de origem de entrada. Número de clusters Insira o número de grupos para clustering. Nome do cluster Insira um nome para a coluna recém criada que contenha o nome do cluster. Iterações máximas Insira o número de iterações permitido para localização de clusters. Número de conjuntos iniciais Insira o número de conjuntos iniciais aleatórios para clustering (n inicial). Algoritmo Selecione o tipo de algoritmo a ser usado para execução de clustering de valores médios K. 9.1.6.3 HANA R de valor médio K Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters. Observação: • 69 Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o algoritmo R de valor médio K. No entanto, as observações em cada cluster permanecem iguais. 2013-01-31 Propriedades do componente • A criação de modelos usando o algoritmo HANA R de valor médio K não é suportada. Propriedades do HANA R de valor médio K Modo de saída Selecione o modo em que você deseja exibir os dados de saída. Colunas independentes Selecione as colunas de origem de entrada. Número de clusters Insira o número de grupos para clustering. Nome do cluster Insira um nome para a coluna recém criada que contenha o nome do cluster. Iterações máximas Insira o número de iterações permitido para localização de clusters. Número de conjuntos iniciais Insira o número de conjuntos iniciais aleatórios para clustering (n inicial). Algoritmo Selecione o tipo de algoritmo a ser usado para execução de clustering de valores médios K. 9.1.7 Associação 9.1.7.1 HANA apriori Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados transacionais volumosos para gerar regras de associação. Este algoritmo é usado para identificar quais produtos e serviços os clientes tendem a adquirir simultaneamente. Analisando as tendências de compra dos clientes com a análise de associação, você pode prever o comportamento futuro. Por exemplo, a informação de que o cliente que compra sapatos tende mais a comprar meias ao mesmo tempo pode ser representada nesta regra de associação (com um suporte mínimo e uma confiança mínima): Sapatos=> Meias [suporte = 0,5, confiança = 0,1] Propriedades do algoritmo HANA apriori 70 Colunas de item Selecione as colunas que contenham os itens que você deseja aplicar ao algoritmo. Coluna de TransactionID Selecione a coluna que contenha os IDs de transação que você deseja aplicar ao algoritmo. 2013-01-31 Propriedades do componente Valores em falta Selecione o método para manipulação dos valores em falta. Valores possíveis: • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: o algoritmo retém os valores em falta para processamento. Suporte Insira um valor para o suporte mínimo de um item. Confiança Insira um valor para a confiança mínima de regras/associação Pré-regra Insira um nome para a nova coluna que contenha o (LE) antecedente da regra apriori para o conjunto de dados informado. Pós-regra Insira um nome para a nova coluna que contenha o (LD) consequente da regra apriori para o conjunto de dados informado. Valores de suporte Insira um nome para a nova coluna que contenha o suporte para as regras correspondentes. Valores de confiança Insira um nome para a nova coluna que contenha valores de confiança para as regras correspondentes. Valores de aumento Insira um nome para a nova coluna que contenha valores de aumento para as regras correspondentes. Número de threads Insira o número de threads a ser usado na execução. 9.1.7.2 R apriori Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados transacionais volumosos para gerar regras de associação usando o pacote R "arules". Este algoritmo é usado para identificar quais produtos e serviços os clientes tendem a adquirir simultaneamente. Analisando as tendências de compra dos clientes com uma análise de associação, o comportamento futuro pode ser previsto. Por exemplo, a informação de que o cliente que compra sapatos tende mais a comprar meias ao mesmo tempo pode ser representada nesta regra de associação (com um suporte mínimo e uma confiança mínima): Sapatos=> Meias [suporte = 0,5, confiança = 0,1] Propriedades do algoritmo R apriori 71 Modo de saída Selecione o modo de exibição da saída. Formato de entrada Selecione o formato dos dados de entrada. Colunas de item Selecione as colunas que contenham os itens que você deseja aplicar ao algoritmo. 2013-01-31 Propriedades do componente 72 Coluna de TransactionID Selecione a coluna que contenha os IDs de transação que você deseja aplicar ao algoritmo. Suporte Insira um valor para o suporte mínimo de um item. Confiança Insira um valor para a confiança mínima de regras/associação Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Regras Insira um nome para a nova coluna que contenha as regras apriori para o conjunto de dados informado. Valores de suporte Insira um nome para a nova coluna que contenha o suporte para as regras correspondentes. Valores de confiança Insira um nome para a nova coluna que contenha valores de confiança para as regras correspondentes. Valores de aumento Insira um nome para a nova coluna que contenha valores de aumento para as regras correspondentes. ID da transação Insira um nome para a nova coluna que contenha o ID de transação. Itens Insira um nome para a nova coluna que contenha os nomes dos itens. Regras correspondentes Insira um nome para a nova coluna que contenha as regras correspondentes. Item(ns) LE Insira etiquetas separadas por vírgula para os itens que aparecem à esquerda das regras ou dos conjuntos de itens. Item(ns) LD Insira etiquetas separadas por vírgula para os itens que aparecem à direita das regras ou dos conjuntos de itens. Ambos os itens Insira etiquetas separadas por vírgula para os itens que aparecem em ambos os lados das regras ou dos conjuntos de itens. Nenhum item Insira etiquetas separadas por vírgula para os itens que não precisam aparecer nas regras ou nos conjuntos de itens. Aparência padrão Insira a aparência padrão dos itens não mencionados explicitamente. Classificar itens Selecione a opção de classificação para classificar os itens por frequência. Filtrar itens Insira um valor numérico indicando como filtrar os itens não usados das transações. Visão de árvore Para organizar transações como árvore de prefixos, selecione Verdadeiro. Usar HeapSort Para usar heapsort em vez de quicksort para classificar as transações, selecione Verdadeiro. Minimizar memória Para minimizar o uso da memória em vez de maximizar a velocidade, selecione Verdadeiro. 2013-01-31 Propriedades do componente Carregar transação Para carregar transações na memória, selecione Verdadeiro. 9.1.7.3 HANA R apriori Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados transacionais volumosos para gerar regras de associação usando o pacote R "arules". Este algoritmo é usado para identificar quais produtos e serviços os clientes tendem a adquirir simultaneamente. Analisando as tendências de compra dos clientes com uma análise de associação, o comportamento futuro pode ser previsto. Por exemplo, a informação de que o cliente que compra sapatos tende mais a comprar meias ao mesmo tempo pode ser representada nesta regra de associação (com um suporte mínimo e uma confiança mínima): Sapatos=> Meias [suporte = 0,5, confiança = 0,1] Propriedades do algoritmo HANA R apriori 73 Modo de saída Selecione o modo de exibição da saída. Formato de entrada Selecione o formato dos dados de entrada. Colunas de item Selecione as colunas que contenham os itens que você deseja aplicar ao algoritmo. Coluna de TransactionID Selecione a coluna que contenha os IDs de transação que você deseja aplicar ao algoritmo. Suporte Insira um valor para o suporte mínimo de um item. Confiança Insira um valor para a confiança mínima de regras/associação Salvar o modelo Se você quiser salvar o estado do algoritmo, selecione esta opção. Para salvar, você precisa inserir um nome e uma descrição para o modelo. Regras Insira um nome para a nova coluna que contenha as regras apriori para o conjunto de dados informado. Valores de suporte Insira um nome para a nova coluna que contenha o suporte para as regras correspondentes. Valores de confiança Insira um nome para a nova coluna que contenha valores de confiança para as regras correspondentes. Valores de aumento Insira um nome para a nova coluna que contenha valores de aumento para as regras correspondentes. ID da transação Insira um nome para a nova coluna que contenha o ID de transação. Itens Insira um nome para a nova coluna que contenha os nomes dos itens. 2013-01-31 Propriedades do componente Regras correspondentes Insira um nome para a nova coluna que contenha as regras correspondentes. Item(ns) LE Insira etiquetas separadas por vírgula para os itens que aparecem à esquerda das regras ou dos conjuntos de itens. Item(ns) LD Insira etiquetas separadas por vírgula para os itens que aparecem à direita das regras ou dos conjuntos de itens. Ambos os itens Insira etiquetas separadas por vírgula para os itens que aparecem em ambos os lados das regras ou dos conjuntos de itens. Nenhum item Insira etiquetas separadas por vírgula para os itens que não precisam aparecer nas regras ou nos conjuntos de itens. Aparência padrão Insira a aparência padrão dos itens não mencionados explicitamente. Classificar itens Selecione a opção de classificação para classificar os itens por frequência. Filtrar itens Insira um valor numérico indicando como filtrar os itens não usados das transações. Visão de árvore Para organizar transações como árvore de prefixos, selecione Verdadeiro. Usar HeapSort Para usar heapsort em vez de quicksort para classificar as transações, selecione Verdadeiro. Minimizar memória Para minimizar o uso da memória em vez de maximizar a velocidade, selecione Verdadeiro. Carregar transação Para carregar transações na memória, selecione Verdadeiro. 9.1.8 Classificação 9.1.8.1 HANA KNN Use este componente para classificar os objetos com base nos dados de amostra treinados. No KNN, os objetos são classificados pela maioria dos votos da vizinhança. Propriedades do algoritmo HANA KNN Colunas independentes 74 Selecione as colunas de origem de entrada. 2013-01-31 Propriedades do componente Contagem da vizinhança Insira o número de vizinhos a ser considerado para determinar distâncias. Tipo de votação Selecione o tipo de votação. Valores em falta Selecione o método para manipulação dos valores em falta. • Remover: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente. • Manter: o algoritmo considera os valores em falta para processamento. • Parar: o algoritmo para a execução se um valor estiver em falta na coluna independente ou na coluna dependente. Nome do esquema Insira o esquema que contenha os dados treinados. Nome da tabela Insira a tabela que contenha os dados treinados. Colunas independentes Insira as colunas de entrada a serem consideradas no treinamento dos dados. Coluna dependente Insira a coluna de saída a ser considerada no treinamento dos dados. Número de threads Insira o número de threads a ser usado na execução. Nome da coluna prevista Insira um nome para a nova coluna que contenha os valores de classificação. 9.2 Componentes de preparação de dados Use os componentes de preparação de dados para preparar os dados para análise. Os componentes são opcionais. 9.2.1 Fórmula Use este componente para aplicar funções e operadores predefinidos aos dados. Todas as funções e expressões, exceto as funções de manipulação de dados, adicionam uma nova coluna com o resultado da fórmula. Observação: • 75 Ao inserir uma string literal que contenha aspas simples, cada aspa dentro da string literal deve ser acompanhada de uma barra invertida. Por exemplo, insira 'Customer's' como 'Customer\'s'. 2013-01-31 Propriedades do componente • Ao inserir o nome de uma coluna que contenha colchetes, cada colchete dentro do nome da coluna deve ser acompanhada de uma barra invertida. Por exemplo, insira [Customer[Age]] como [Customer\[Age\]]. Propriedades da fórmula Nome Insira um nome para a nova coluna criada aplicando a fórmula. Expressão Insira a fórmula que você deseja aplicar. Por exemplo, Average([Age]). Exemplo: Calculando a idade média dos funcionários Tabela Employee: Emp ID (ID do funcionário) Emp Name (Nome do funcionário) DOB (Data de nascimento) Date of Joining (Data de conAge (Idade) tratação) Date of Confirmation (Data de confirmação) 1 Laura 11/11/1986 25 12/9/2005 27/11/2005 2 Desy 12/5/1981 30 24/6/2000 10/7/2000 3 Alex 30/5/1978 33 10/10/1998 24/12/1998 4 John 6/6/1979 32 2/12/1999 20/12/1999 1. Arraste o componente Fórmula até o editor de análise. 2. Na visão de propriedades, insira um nome para a fórmula. Por exemplo, Average_Age. 3. No campo Expressão, insira a fórmula: AVERAGE([Age]) 4. Selecione Validar e aplicar para validar a sintaxe da fórmula. Tabela de saída: 76 2013-01-31 Propriedades do componente Emp ID (ID Emp Name DOB (Data do fun(Nome do de nasci- Age cionário) funcionário) mento) (Idade) Date of Joining (Data de contratação) Date of Confirmation (Data de confirAvermação) age_Age 1 Laura 11/11/1986 25 12/9/2005 27/11/2005 30 2 Desy 12/5/1981 30 24/6/2000 10/7/2000 30 3 Alex 30/5/1978 33 10/10/1998 24/12/1998 30 4 John 6/6/1979 2/12/1999 20/12/1999 30 32 Funções suportadas Categoria Função (Função aplicada à tabela Employee) Descrição Data DAYSBETWEEN Retorna o número de dias entre duas datas. CURRENTDATE Retorna a data atual do sistema. MONTHSBETWEEN Retorna o número de meses entre duas datas. Por exemplo, a nova coluna contém 2,0,2,0 quando a função MONTHSBETWEEN([Date of Joining],[Date of Confirmation]) é aplicada à tabela Employee. DAYNAME Retorna o nome do dia em formato de string. Por exemplo, a nova coluna contém Monday, Saturday, Saturday, Thursday quando a função DAYNAME([Date of Joining]) é aplicada à tabela Employee. DAYNUMBEROFMONTH Retorna o número do dia de um mês específico. Por exemplo, 12/11/1980 retorna 12. DAYNUMBEROFWEEK Retorna o número do dia de uma semana. Por exemplo, Sunday =1, Monday=2. DAYNUMBEROFYEAR Retorna o número do dia de um ano. Por exemplo, 1st Jan =1, 1st Feb=32, 3rd Feb=34. LASTDATEOFWEEK Retorna a data do último dia de uma semana. Por exemplo, 12/9/2005 retorna 17/9/2005 77 2013-01-31 Propriedades do componente Categoria Função (Função aplicada à tabela Employee) Descrição LASTDATEOFMONTH Retorna a data do último dia de um mês. Por exemplo, 12/9/2005 retorna 30/9/2005 MONTHNUMBEROFYEAR Retorna o número do mês de uma data. Por exemplo, Jan=1, Feb=2, Mar=3 WEEKNUMBEROFYEAR Retorna o número da semana de um ano. Por exemplo, 12/9/2005 retorna 38. QUARTERNUMBEROFDATE Retorna o número do trimestre de uma data. Por exemplo, 12/9/2005 retorna 3. String CONCAT Concatena duas strings. Por exemplo, CONCAT('USA', 'Australia') retorna USAAustralia. INSTRING Retorna verdadeiro - se a string de pesquisa for encontrada na string de origem. Por exemplo, INSTRING('USA', 'US') retorna verdadeiro. SUBSTRING Retorna uma substring da string de origem. Por exemplo, SUBSTRING('USA', 1,2) retorna US. STRLEN Matemáti- MAX ca Manipulação de dados 78 Retorna o número de caracteres na string de origem. Por exemplo, STRLEN('Australia') retorna 9. Retorna o valor máximo de uma coluna. MIN Retorna o valor mínimo de uma coluna. COUNT Retorna o número de valores de uma coluna. SUM Retorna a soma dos valores de uma coluna. AVERAGE Retorna a média dos valores de uma coluna. @REPLACE Executa a substituição de uma string no local. Por exemplo, @REPLACE([country],'USA', 'AMERICA') substitui USA por AMERICA na coluna de países. 2013-01-31 Propriedades do componente Categoria Função (Função aplicada à tabela Employee) Descrição @BLANK Substitui os valores em branco por um valor específico. Por exemplo, @BLANK([country], 'USA') substitui todos os valores em branco por USA na coluna de países. @SELECT Seleciona linhas que satisfaçam a condição dada. Você pode usar qualquer operador condicional para especificar a condição. Por exemplo, @SELECT([country]=='USA') seleciona linhas cujo país seja igual a USA. Expressão condicional IF(condição) THEN(expressão de string/ex- Verifica se a condição é cumprida e retorna pressão matemática/expressão condicional) um valor se 'verdadeiro' e outro valor se 'falELSE(expressão de string/expressão so'. matemática/expressão condicional) Por exemplo, IF([Date of Joining]>12/9/2005) THEN ('Funcionário contratado após 12/09/2005') ELSE ('Funcionário contratado em ou antes de 12/09/2005') Observação: Expressões matemáticas contendo funções que retornem valor numérico não são suportadas. Por exemplo, a expressão DAYNUMBEROFMONTH(CURRENTDATE())+2 não é suportada porque DAYNUMBEROFMONTH retorna um valor numérico. Operadores matemáticos Use operadores matemáticos para criar fórmulas contendo colunas numéricas e/ou números. Por exemplo, a expressão [Age] + 1 adiciona uma nova coluna com os valores 26, 31, 34, 33. 79 Operadores matemáticos Descrição + Operador de adição - Operador de subtração * Operador de multiplicação / Operador de divisão () Parêntesis 2013-01-31 Propriedades do componente Operadores matemáticos Descrição ^ Operador de potência % Operador de módulo E Operador de exponencial Operadores condicionais Use os operadores condicionais para criar expressões IF THEN ELSE ou SELECT. Operadores condicionais Descrição == Igual a != Diferente de < Menor que > Maior que <= Menor que ou igual a >= Maior que ou igual a Operadores lógicos Use operadores lógicos para comparar duas condições e retornar 'verdadeiro' ou 'falso'. Por exemplo, IF([Date of Joining]>12/9/2005 && [Age] >=25 ) THEN ('Verdadeiro') ELSE ('Falso') adiciona uma nova coluna com os valores Verdadeiro, Falso, Falso, Falso. Operadores lógicos Descrição && AND || OR 9.2.2 Amostra Use este componente para selecionar um subconjunto de dados de conjuntos de dados volumosos. O componente Amostra suporta estes tipos de amostra: • Primeiro N: seleciona o primeiro registro N do conjunto de dados. • Último N: seleciona o último registro N do conjunto de dados. • Todos os N: seleciona todo n-ésimo registro do conjunto de dados, em que N representa um intervalo. Por exemplo, se N=2, o 2º, 4º, 6º e 8º registros são selecionados e assim por diante. 80 2013-01-31 Propriedades do componente • • Aleatório simples: seleciona aleatoriamente os registros de N tamanho ou N percentual de registros de um conjunto de dados. Aleatório sistemático: neste tipo de amostra, os intervalos ou os subgrupos numéricos de amostra são criados com base no tamanho do subgrupo numérico. O componente Amostra seleciona aleatoriamente o n-ésimo registro do primeiro subgrupo numérico e o n-ésimo registro de cada subgrupo numérico subsequente. Propriedades da amostra Tipo de amostragem Selecione o tipo de amostragem. Limitar linhas por Selecione o método para limitação das linhas. Número de linhas Insira o número de linhas a serem selecionadas. Percentual de linhas Insira o percentual de linhas a serem selecionadas. Tamanho do subgrupo numérico Insira o tamanho do subgrupo numérico no qual será selecionada uma linha aleatória. Intervalo Insira o intervalo entre as linhas a serem selecionadas. Máximo de linhas Insira o número máximo de linhas a serem selecionadas. Exemplo: Selecionando um subconjunto de dados de um conjunto de dados informado Emp ID (ID do funcionário) Emp Name (Nome do funcionário) DOB (Data de nascimento) Age (Idade) 1 Laura 11/11/1986 25 2 Desy 12/5/1981 30 3 Alex 30/5/1978 33 4 John 6/6/1979 32 5 Ted 4/7/1987 24 6 Tom 30/6/1970 41 7 Anna 24/6/1965 46 8 Valerie 6/7/1990 21 9 Mary 19/9/1985 26 10 Martin 21/11/1986 25 1. Primeiro N: para N=5 81 2013-01-31 Propriedades do componente Emp ID (ID do funcionário) Emp Name (Nome do funcionário) DOB (Data de nascimento) Age (Idade) 1 Laura 11/11/1986 25 2 Desy 12/5/1981 30 3 Alex 30/5/1978 33 4 John 6/6/1979 32 5 Ted 4/7/1987 24 2. Último N: para N=4 Emp ID (ID do funcionário) Emp Name (Nome do fun- DOB (Data de nascicionário) mento) Age (Idade) 7 Anna 24/6/1965 46 8 Valerie 6/7/1990 21 9 Mary 19/9/1985 26 10 Martin 21/11/1986 25 3. Todos os N: intervalo=3 Emp ID (ID do funcionário) Emp Name (Nome do fun- DOB (Data de nascicionário) mento) Age (Idade) 3 Alex 30/5/1978 33 6 Tom 30/6/1970 41 9 Mary 19/9/1985 26 4. Aleatório simples: para número de linhas=2 Quaisquer duas linhas pode ser o resultado. Emp ID (ID do funcionário) Emp Name (Nome do fun- DOB (Data de nascicionário) mento) Age (Idade) 7 Anna 24/6/1965 46 8 Valerie 6/7/1990 21 5. Aleatório sistemático: tamanho do subgrupo numérico=4 82 2013-01-31 Propriedades do componente Emp ID (ID do funcionário) Emp Name (Nome do fun- DOB (Data de nascicionário) mento) Age (Idade) 2 Desy 12/5/1981 30 6 Tom 30/6/1970 41 10 Martin 21/11/1986 25 ou Emp ID (ID do funcionário) Emp Name (Nome do fun- DOB (Data de nascicionário) mento) Age (Idade) 1 Laura 11/11/1986 25 5 Ted 4/7/1987 24 9 Mary 19/9/1985 26 9.2.3 Definição de tipo de dados Use este componente para alterar o nome, o tipo de dados e o formato de data da coluna de origem. A definição do tipo de dados facilita a preparação dos dados para torná-los adequados para uma análise posterior. Por exemplo, • Se o nome da coluna na fonte de dados for "des", isso pode não ficar claro durante a análise. Na análise, você pode alterar o nome da coluna para "Designação", para que o usuário final entenda facilmente. • Se a data estiver armazenada no formato mmddaa (120201, sem qualquer separador de datas), o sistema pode interpretá-la como um valor inteiro. Usando o componente de definição de tipo de dados, você pode alterar o formato da data para qualquer formato válido, como mm/dd/aaaa ou dd/mm/aaaa e assim por diante. Para alterar o nome, o tipo de dados e o formato da data da coluna de origem, siga estes procedimentos: 1. Adicione na análise o componente de definição de tipo de dados. 2. Clique no componente com o botão direito do mouse e selecione Configurar propriedades. 3. Para alterar o nome da coluna, insira um nome do alias para a coluna de origem solicitada. 4. Para alterar o tipo de dados da coluna, selecione o tipo de dados solicitado para a coluna de origem. 83 2013-01-31 Propriedades do componente 9.2.4 Filtro Use este componente para filtrar linhas e colunas com base em uma condição específica. Observação: • • O componente de filtro no banco de dados não suporta funções e expressões avançadas. Se você alterar a fonte de dados após configurar o componente de filtro, este ainda reterá os filtros de linha anteriormente definidos. Propriedades do filtro Colunas selecionadas Selecione as colunas para análise. Condição de filtro Insira as condições de filtro. Exemplo: Filtre a coluna "Store" da fonte de dados e aplique a condição "Profit >2000". Loja Receita bruta Lucro Land Mark 10000 1000 Spencer 20000 4500 Soch 25000 8000 1. Desmarque a coluna "Store" das colunas selecionadas. 2. No painel Filtro da linha, selecione a coluna Lucro. 3. Na opção Selecionar do intervalo, insira 2000 na caixa de texto De. A caixa de texto Até deve ficar em branco. 4. Selecione OK. 5. Selecione Salvar e fechar. 6. Execute a análise. Receita bruta Lucro 20000 4500 25000 8000 Observação: O componente de filtro suporta apenas expressões que retornem resultado booleano. Por exemplo, na tabela Employee abaixo: 84 2013-01-31 Propriedades do componente Emp ID (ID do funcionário) Emp Name (Nome DOB (Data de do funcionário) nascimento) Date of Joining (Data de conAge (Idade) tratação) Date of Confirmation (Data de confirmação) 1 Laura 11/11/1986 25 12/9/2005 27/11/2005 2 Desy 12/5/1981 30 24/6/2000 10/7/2000 3 Alex 30/5/1978 33 10/10/1998 24/10/1998 4 John 6/6/1979 32 2/12/1999 20/12/1999 • • A expressão DAYSBETWEEN([Date of Joining],[Date of Confirmation]) não é uma expressão de filtro válida porque retorna um valor numérico. O uso correto da expressão DAYSBETWEEN no filtro é DAYSBETWEEN([Date of Joining],[Date of Confirmation]) == 14. Essa expressão seleciona as linhas em que o número de dias entre "Date of Joining" e "Date of Confirmation" seja 14. No caso da tabela de funcionários acima, a terceira linha será selecionada. DAYNAME([Date of Joining]) == 'Saturday' seleciona a segunda e terceira linhas da tabela de funcionários. Observação: • • Ao inserir uma string literal que contenha aspas simples, cada aspa dentro da string literal deve ser acompanhada de uma barra invertida. Por exemplo, insira 'Customer's' como 'Customer\'s'. Ao inserir o nome de uma coluna que contenha colchetes, cada colchete dentro do nome da coluna deve ser acompanhada de uma barra invertida. Por exemplo, insira [Customer[Age]] como [Customer\[Age\]]. Funções suportadas Observação: O componente de filtro não suporta funções de manipulação de dados. Categoria Função (Função aplicada à tabela Employee) Descrição Data DAYSBETWEEN Retorna o número de dias entre duas datas. CURRENTDATE Retorna a data atual do sistema. MONTHSBETWEEN Retorna o número de meses entre duas datas. Por exemplo, a nova coluna contém 2,0,2,0 quando a função MONTHSBETWEEN([Date of Joining],[Date of Confirmation]) é aplicada à tabela Employee. DAYNAME Retorna o nome do dia em formato de string. Por exemplo, a nova coluna contém Monday, Saturday, Saturday, Thursday quando a função DAYNAME([Date of Joining]) é aplicada à tabela Employee. 85 2013-01-31 Propriedades do componente Categoria Função (Função aplicada à tabela Employee) Descrição DAYNUMBEROFMONTH Retorna o número do dia de um mês específico. Por exemplo, 12/11/1980 retorna 12. DAYNUMBEROFWEEK Retorna o número do dia de uma semana. Por exemplo, Sunday =1, Monday=2. DAYNUMBEROFYEAR Retorna o número do dia de um ano. Por exemplo, 1st Jan =1, 1st Feb=32, 3rd Feb=34. LASTDATEOFWEEK Retorna a data do último dia de uma semana. Por exemplo, 12/9/2005 retorna 17/9/2005 LASTDATEOFMONTH Retorna a data do último dia de um mês. Por exemplo, 12/9/2005 retorna 30/9/2005 MONTHNUMBEROFYEAR Retorna o número do mês de uma data. Por exemplo, Jan=1, Feb=2, Mar=3 WEEKNUMBEROFYEAR Retorna o número da semana de um ano. Por exemplo, 12/9/2005 retorna 38. QUARTERNUMBEROFDATE Retorna o número do trimestre de uma data. Por exemplo, 12/9/2005 retorna 3. String CONCAT Concatena duas strings. Por exemplo, CONCAT('USA', 'Australia') retorna USAAustralia. INSTRING Retorna verdadeiro - se a string de pesquisa for encontrada na string de origem. Por exemplo, INSTRING('USA', 'US') retorna verdadeiro. SUBSTRING Retorna uma substring da string de origem. Por exemplo, SUBSTRING('USA', 1,2) retorna US. Matemáti- MAX ca 86 Retorna o valor máximo de uma coluna. 2013-01-31 Propriedades do componente Categoria Função (Função aplicada à tabela Employee) Descrição Expressão condicional MIN Retorna o valor mínimo de uma coluna. COUNT Retorna o número de valores de uma coluna. SUM Retorna a soma dos valores de uma coluna. AVERAGE Retorna a média dos valores de uma coluna. IF(condição) THEN(expressão de string/ex- Verifica se a condição é cumprida e retorna pressão matemática/expressão condicional) um valor se 'verdadeiro' e outro valor se 'falELSE(expressão de string/expressão so'. matemática/expressão condicional) Por exemplo, IF([Date of Joining]>12/9/2005) THEN ('Funcionário contratado após 12/09/2005') ELSE ('Funcionário contratado em ou antes de 12/09/2005') Observação: Expressões matemáticas contendo funções que retornem valor numérico não são suportadas. Por exemplo, a expressão DAYNUMBEROFMONTH(CURRENTDATE())==2 não é suportada porque DAYNUMBEROFMONTH retorna um valor numérico. Operadores matemáticos Use operadores matemáticos para criar fórmulas contendo colunas numéricas e/ou números. Por exemplo, a expressão [Age] + 1 adiciona uma nova coluna com os valores 26, 31, 34, 33. Operadores matemáticos Descrição + Operador de adição - Operador de subtração * Operador de multiplicação / Operador de divisão () Parêntesis ^ Operador de potência % Operador de módulo E Operador de exponencial Operadores condicionais Use os operadores condicionais para criar expressões IF THEN ELSE ou SELECT. 87 2013-01-31 Propriedades do componente Operadores condicionais Descrição == Igual a != Diferente de < Menor que > Maior que <= Menor que ou igual a >= Maior que ou igual a Operadores lógicos Use operadores lógicos para comparar duas condições e retornar 'verdadeiro' ou 'falso'. Por exemplo, IF([Date of Joining]>12/9/2005 && [Age] >=25 ) THEN ('Verdadeiro') ELSE ('Falso') adiciona uma nova coluna com os valores Verdadeiro, Falso, Falso, Falso. Operadores lógicos Descrição && AND || OR 9.3 Gravadores de dados Use gravadores de dados para armazenar os resultados da análise em arquivos planos ou bancos de dados para uma análise posterior. 9.3.1 CSV Writer Use este componente para gravar os dados em arquivos planos, como arquivos CSV, TEXT e DAT. Propriedades do CSV Writer 88 Nome do arquivo Selecione arquivo .csv ou .dat ou .txt Sobregravar Para sobregravar um arquivo existente, selecione esta opção. Separador de colunas Selecione um delimitador de colunas que separe os tokens de dados no arquivo. Caractere de aspas duplas Selecione o caractere a ser adicionado durante a gravação dos dados. 2013-01-31 Propriedades do componente Incluir cabeçalhos de coluna Selecione esta opção para usar a primeira linha como cabeçalho da coluna. Codificação Selecione o método de codificação de texto a ser usado durante a gravação dos dados. Separador de decimal Selecione o caractere a ser usado para representação decimal em agrupamento de dígitos. Separador de agrupamento Selecione o caractere a ser usado como separador de milhares. Formato numérico Insira o formato numérico que você deseja aplicar aos dados numéricos. Formato de data e hora Selecione o formato de data que você deseja aplicar às datas. 9.3.2 JDBC Writer Use este componente para gravar os dados em bancos de dados relacionais, como MySQL, MS SQL Server, DB2, Oracle, SAP MaxDB e SAP HANA. Propriedades do JDBC Writer 89 Tipo de banco de dados Selecione o tipo de banco de dados. Caminho do driver do banco de dados Insira o local do caminho do driver do JDBC. Por exemplo, para gravar no banco de dados Oracle, você precisa especificar o local do Oracle JDBC jar (C:\ojdbc6.jar) Nome da máquina Insira o nome da máquina em que o banco de dados está instalado. Número da porta Insira o número da porta do banco de dados ou do serviço. Nome do banco de dados Insira o nome do banco de dados. Nome do usuário Insira o nome do usuário do banco de dados. Senha Insira a senha do usuário do banco de dados. Tipo da tabela Insira o tipo da tabela. Esta propriedade é aplicável durante a gravação em banco de dados SAP HANA. Nome da tabela Insira o nome da tabela. Sobregravar Selecione esta opção para sobregravar a tabela se ela já existir. 2013-01-31 Propriedades do componente 9.3.3 HANA Writer Use este componente para gravar os dados nas tabelas de banco de dados SAP HANA. Componente HANA Writer Nome do esquema Insira o nome do esquema. Tipo da tabela Selecione o tipo da tabela no qual você deseja gravar os dados. Nome da tabela Insira o nome da tabela. Sobregravar Selecione esta opção para sobregravar a tabela se ela já existir. 9.4 Modelos salvos Os modelos que você cria salvando o estado dos algoritmos ficam listados na guia Modelos salvos. A aplicação SAP Predictive Analysis não contém modelos predefinidos. Portanto, quando você inicia pela primeira vez a aplicação, a guia Modelos salvos não é exibida. Para informações sobre como criar um novo modelo, consulte a seção "Criando um modelo" em Trabalhando com modelos. 90 2013-01-31 Mais informações Mais informações Informações Local Informações sobre o produto SAP BusinessObjects http://www.sap.com Vá para http://help.sap.com/businessobjects e, no painel lateral "SAP BusinessObjects Overview", clique em All Products. SAP Help Portal Você pode acessar a documentação mais atual relacionada a todos os produtos SAP BusinessObjects e suas implementações no SAP Help Portal. Você pode fazer o download das versões em PDF ou das bibliotecas em HTML instaláveis. Alguns guias estão armazenados no SAP Service Marketplace e não estão disponíveis no SAP Help Portal. Esses guias estão listados no Help Portal acompanhados por um link para o SAP Service Marketplace. Os clientes com um contrato de manutenção tem um ID de usuário autorizado a acessar esse site. Para obter um ID, entre em contato com seu representante de suporte ao cliente. http://service.sap.com/bosap-support > Documentação • • SAP Service Marketplace Guias de instalação: https://service.sap.com/bosap-instguides Notas de versão: http://service.sap.com/releasenotes O SAP Service Marketplace armazena alguns guias de instalação, guias de atualização e migração, guias de implementação, notas de versão e documentos das Plataformas suportadas. Os clientes com um contrato de manutenção tem um ID de usuário autorizado a acessar esse site. Entre em contato com o representante de suporte ao cliente para obter um ID. Se você for redirecionado para o SAP Service Marketplace a partir do SAP Help Portal, use o menu no painel de navegação à esquerda para localizar a categoria que contém a documentação que você quer acessar. https://cw.sdn.sap.com/cw/community/docupedia Docupedia 91 A Docupedia oferece recursos de documentação adicionais, um ambiente de criação colaborativo e um canal de feedback interativo. 2013-01-31 Mais informações Informações Local https://boc.sdn.sap.com/ Recursos para o desenvolvedor https://www.sdn.sap.com/irj/sdn/businessobjects-sdklibrary Artigos da SAP BusinessObjects no SAP Community Network https://www.sdn.sap.com/irj/boc/businessobjects-articles Esses artigos eram conhecidos anteriormente como artigos técnicos. https://service.sap.com/notes Observações Fóruns no SAP Community Network Essas notas eram conhecidas anteriormente como artigos Knowledge Base. https://www.sdn.sap.com/irj/scn/forums http://www.sap.com/services/education Treinamento Dos cursos tradicionais em sala de aula aos seminários de e-learning direcionados, a SAP pode oferecer um pacote de treinamento que se adeque às suas necessidades de aprendizado e estilo de aprendizado preferido. http://service.sap.com/bosap-support Suporte online ao cliente O SAP Support Portal contém informações sobre programas e serviços de Suporte ao cliente. Ele também tem links para uma ampla variedade de informações técnicas e downloads. Os clientes com um contrato de manutenção tem um ID de usuário autorizado a acessar esse site. Para obter um ID, entre em contato com seu representante de suporte ao cliente. http://www.sap.com/services/bysubject/businessobjectsconsulting Consultoria 92 Consultores podem acompanhá-lo do estágio inicial de análise à entrega de seu projeto de implementação. Informações técnicas estão disponíveis em tópicos como bancos de dados relacionais e multidimensionais, conectividade, ferramentas de design do banco de dados e tecnologia de incorporação personalizada. 2013-01-31