Guia do usuário do SAP Predictive Analysis

Transcrição

Guia do usuário do SAP Predictive Analysis
Guia do usuário do SAP Predictive Analysis
■ SAP Predictive Analysis 1.0.8
2013-01-31
Copyright
© 2012 SAP AG. Todos os direitos reservados. SAP, R/3, SAP NetWeaver, Duet, PartnerEdge,
ByDesign, SAP BusinessObjects Explorer, StreamWork, SAP HANA e outros produtos e serviços
da SAP aqui mencionados, bem como seus respectivos logotipos, são marcas comerciais ou marcas
registradas pertencentes à SAP AG na Alemanha e em outros países. Business Objects e o logotipo
da Business Objects, BusinessObjects, Crystal Reports, Crystal Decisions, Web Intelligence, Xcelsius
e outros produtos e serviços da Business Objects aqui mencionados, bem como seus respectivos
logotipos, são marcas comerciais ou marcas registradas pertencentes à Business Objects Software
Ltd., uma empresa da SAP.Sybase e Adaptive Server, iAnywhere, Sybase 365, SQL Anywhere e
outros produtos e serviços da Sybase aqui mencionados, bem como seus respectivos logotipos,
são marcas comerciais ou marcas registradas pertencentes à Sybase, Inc., uma empresa da SAP.
Crossgate, m@gic EDDY, B2B 360° e B2B 360° Services são marcas registradas pertencentes à
Crossgate AG na Alemanha e em outros países. Crossgate é uma empresa da SAP. Todos os outros
produtos e serviços aqui mencionados são marcas comerciais pertencentes às suas respectivas
empresas. Os dados incluídos neste documento são meramente informativos. As especificações
nacionais de produto podem variar de acordo com o País ou Região. Este material está sujeito a
alterações promovidas pela SAP AG sem prévio aviso. Este material é fornecido pela SAP AG e suas
empresas afiliadas ("Grupo SAP") apenas para fins informativos, sem declaração ou garantia de
qualquer espécie, de forma que o Grupo SAP não se responsabiliza por omissões ou erros relativos
ao mesmo. As únicas garantias para os produtos e serviços do Grupo SAP são aquelas definidas
nas declarações expressas de garantia que acompanham os respectivos produtos e serviços. Nada
nos termos deste documento deve ser interpretado como garantia adicional.
2013-01-31
Sumário
3
Capítulo 1
Sobre este guia.......................................................................................................................7
1.1
1.2
Conteúdo do guia.....................................................................................................................7
Capítulo 2
Visão geral do SAP Predictive Analysis..................................................................................9
Capítulo 3
Instalando o SAP Predictive Analysis...................................................................................11
3.1
3.2
3.3
3.4
3.4.1
3.4.2
3.5
Pré-requisitos de instalação...................................................................................................11
Capítulo 4
Instalação e configuração do ambiente R de fonte aberta....................................................15
4.1
4.2
Instalando o ambiente R-2.15.1 e os pacotes necessários.....................................................15
Capítulo 5
Introdução ao SAP Predictive Analysis.................................................................................17
5.1
5.2
5.3
5.3.1
5.3.2
5.4
Princípios básicos do SAP Predictive Analysis.......................................................................17
Capítulo 6
Criando análises...................................................................................................................23
6.1
6.1.1
6.1.2
Criando uma análise...............................................................................................................23
Público alvo..............................................................................................................................7
Para instalar o SAP Predictive Analysis usando o programa de instalação..............................11
Para desinstalar o SAP Predictive Analysis ...........................................................................12
Aspectos importantes a serem considerados no uso do SAP HANA.....................................12
Para configurar o _SYS_REPO para o usuário do SAP Predictive Analysis.............................13
Medidas OLAP suportadas ...................................................................................................13
Aspectos importantes a serem considerados no uso de universos do SAP BusinessObjects..13
Configurando o ambiente R....................................................................................................15
Iniciando o SAP Predictive Analysis........................................................................................18
Conhecendo o SAP Predictive Analysis.................................................................................18
Visão de designer..................................................................................................................19
Visão de resultados...............................................................................................................19
Usando o SAP Predictive Analysis do início ao fim.................................................................20
Adquirindo dados de uma fonte de dados..............................................................................23
Preparando os dados para análise..........................................................................................25
2013-01-31
Sumário
4
6.1.3
6.1.4
6.2
6.3
6.4
Aplicando algoritmos..............................................................................................................25
Capítulo 7
Analisando os dados.............................................................................................................31
7.1
7.1.1
7.1.2
7.1.3
7.1.4
7.1.5
7.1.6
7.1.7
Gráficos de visualização.........................................................................................................31
Capítulo 8
Trabalhando com modelos....................................................................................................37
8.1
8.2
8.3
8.4
8.5
8.6
Criando um modelo................................................................................................................37
Capítulo 9
Propriedades do componente...............................................................................................41
9.1
9.1.1
9.1.2
9.1.3
9.1.4
9.1.5
9.1.6
9.1.7
9.1.8
9.2
9.2.1
9.2.2
9.2.3
9.2.4
9.3
Algoritmos.............................................................................................................................41
Armazenando os resultados da análise...................................................................................27
Executando a análise..............................................................................................................28
Salvando a análise.................................................................................................................28
Visualizando os resultados.....................................................................................................29
Gráfico de matriz de dispersão...............................................................................................31
Gráfico de resumo estatístico................................................................................................32
Coordenadas paralelas...........................................................................................................33
Árvore de decisão..................................................................................................................33
Gráfico de regressão.............................................................................................................34
Gráfico de série de tempo......................................................................................................35
Gráfico de cluster...................................................................................................................36
Visualizando as informações do modelo.................................................................................38
Exportando um modelo como PMML.....................................................................................38
Exportando um modelo como arquivo .spar............................................................................38
Importando um modelo...........................................................................................................39
Excluindo um modelo.............................................................................................................39
Regressão.............................................................................................................................41
Valores atípicos.....................................................................................................................51
Série de tempo......................................................................................................................53
Árvores de decisão................................................................................................................59
Rede neural............................................................................................................................64
Clustering..............................................................................................................................68
Associação............................................................................................................................70
Classificação..........................................................................................................................74
Componentes de preparação de dados..................................................................................75
Fórmula..................................................................................................................................75
Amostra.................................................................................................................................80
Definição de tipo de dados.....................................................................................................83
Filtro......................................................................................................................................84
Gravadores de dados.............................................................................................................88
2013-01-31
Sumário
5
9.3.1
9.3.2
9.3.3
9.4
CSV Writer............................................................................................................................88
Apêndice A
Mais informações..................................................................................................................91
JDBC Writer..........................................................................................................................89
HANA Writer..........................................................................................................................90
Modelos salvos......................................................................................................................90
2013-01-31
Sumário
6
2013-01-31
Sobre este guia
Sobre este guia
1.1 Conteúdo do guia
Este guia contém as seguintes informações:
• Visão geral do SAP Predictive Analysis
• Informações sobre como instalar e configurar o SAP Predictive Analysis
• Informações sobre os vários algoritmos e componentes disponíveis no SAP Predictive Analysis
• Informações sobre como criar análises e modelos
• Informações sobre como analisar os dados usando técnicas de visualização de análise preditiva
Este guia não aborda:
• Como adquirir dados de várias fontes de dados
• Como executar operações de manipulação de dados, limpeza de dados e enriquecimento semântico
no painel de preparação
• Como compartilhar gráficos e conjuntos de dados
Observação:
O SAP Predictive Analysis herda a funcionalidade de aquisição de dados e manipulação de dados do
SAP Visual Intelligence. Portanto, para informações sobre fluxos de trabalho não abordados neste
guia, consulte o Guia do usuário do SAP Visual Intelligence disponível em http://help.sap.com/vi.
Recomendamos que você leia o Guia do usuário do SAP Visual Intelligence junto com o Guia do usuário
do SAP Predictive Analysis para entender o fluxo de trabalho completo para análise de dados usando
os algoritmos de análise preditiva.
1.2 Público alvo
Este guia é destinado a profissionais especializados em análise de dados, analistas de negócios e
designers de informação que queiram usar a aplicação SAP Predictive Analysis para analisar e visualizar
os dados usando algoritmos preditivos.
Observação:
Para usar a aplicação SAP Predictive Analysis, você precisa conhecer algoritmos de análise estatística
e de mineração de dados e saber usá-los.
7
2013-01-31
Sobre este guia
8
2013-01-31
Visão geral do SAP Predictive Analysis
Visão geral do SAP Predictive Analysis
O SAP Predictive Analysis é uma solução de análise estatística e de mineração de dados que permite
a criação de modelos preditivos para identificar visões e relações ocultas nos dados, com base nos
quais você pode prever eventos futuros.
Com o SAP Predictive Analysis, você realiza várias análises de dados, inclusive previsão de série de
tempo, detecção de valores atípicos, análise de tendência, análise de classificação, análise de
segmentação e análise de afinidade. Com a aplicação, você analisa os dados usando diferentes
técnicas de visualização, como gráficos de matriz de dispersão, coordenadas paralelas, gráficos de
cluster e árvores de decisão.
O SAP Predictive Analysis oferece uma ampla gama de algoritmos de análise preditiva, suporta o uso
de linguagem de análise estatística de fonte aberta R e oferece recursos de mineração de dados na
memória (in-memory) para um processamento eficiente de análise de dados volumosos.
Observação:
O SAP Predictive Analysis herda a funcionalidade de aquisição de dados e manipulação de dados do
SAP Visual Intelligence. SAP Visual Intelligence é uma ferramenta de manipulação e visualização de
dados. Usando o SAP Visual Intelligence, você pode conectar-se a várias fontes de dados, como
arquivos planos, bancos de dados relacionais, bancos de dados na memória e universos do SAP
BusinessObjects, além de operar com diferentes volumes de dados, de uma matriz de dados pequena
em arquivo CSV até um conjunto bem volumoso de dados no SAP HANA, selecionar e limpar os dados
e manipulá-los.
9
2013-01-31
Visão geral do SAP Predictive Analysis
10
2013-01-31
Instalando o SAP Predictive Analysis
Instalando o SAP Predictive Analysis
3.1 Pré-requisitos de instalação
Antes de instalar o SAP Predictive Analysis, verifique estes requisitos:
•
•
•
•
•
O sistema operacional Microsoft Windows 7 deve estar instalado na sua máquina. O SAP Predictive
Analysis é compatível com máquinas de 32 e 64 bits.
Se você já tiver o SAP Visual Intelligence instalado na sua máquina, desinstale-o antes de instalar
o SAP Predictive Analysis.
Você precisa de direitos de administrador para instalar o SAP Predictive Analysis no computador.
É necessário espaço suficiente em disco para os seguintes recursos:
Recurso
Espaço necessário
Unidade de hospedagem da pasta de dados da aplicação do usuário
2,5 GB
Pasta temporária de usuário (\AppData\Local\Temp)
200 MB
Unidade de hospedagem do diretório de instalação
500 MB
Estas portas devem estar disponíveis:
Porta
Necessária para
6401
Banco de dados Sybase IQ
Qualquer porta no intervalo de 4520-4539
Instalação do SAP Predictive Analysis
Para uma lista detalhada dos ambientes suportados e dos requisitos de hardware, consulte Product
Availability Matrix em:http://service.sap.com/pam
3.2 Para instalar o SAP Predictive Analysis usando o programa de instalação
1. Execute o arquivo setup.exe.
A caixa de diálogo "Controle de conta de usuário" será exibida com uma mensagem de aviso.
2. Selecione Sim na solicitação de confirmação.
11
2013-01-31
Instalando o SAP Predictive Analysis
3. Especifique a pasta de destino de instalação do SAP Predictive Analysis.
• Para aceitar o diretório de instalação padrão, selecione Avançar.
• Para navegar até a pasta em que você deseja instalar o SAP Predictive Analysis, selecione
Procurar. Selecione a pasta e, Avançar.
A página do "Contrato de licenciamento" será exibida.
4. Leia o contrato de licenciamento e selecione Aceito o contrato de licenciamento, e selecione
Avançar.
5. Para começar a instalação, selecione Avançar.
A instalação será concluída quando a página "Concluir a instalação" for exibida.
6. Para sair da instalação, selecione Concluir.
3.3 Para desinstalar o SAP Predictive Analysis
1. Selecione Iniciar > Painel de Controle > Programas.
2. Selecione Desinstalar um programa.
3. Clique com o botão direito do mouse em SAP Predictive Analysis e selecione Desinstalar.
O assistente do SAP Predictive Analysis Setup será exibido.
4. Na página Confirmar desinstalação, selecione Avançar.
5. Para completar a desinstalação, selecione Concluir.
3.4 Aspectos importantes a serem considerados no uso do SAP HANA
Esta seção contém considerações e requisitos importantes para o uso do SAP Predictive Analysis com
o banco de dados SAP HANA.
Requisitos de segurança para publicação no SAP HANA
Para que o usuário possa publicar conteúdo no SAP HANA, ele precisa de privilégios e funções
específicos. Esses privilégios e funções também são necessários para recuperação de dados do SAP
HANA. Use a aplicação SAP HANA Studio para atribuir privilégios e funções ao usuário. Para
informações sobre como administrar o banco de dados SAP HANA e usar o SAP HANA Studio, consulte
o SAP HANA Database – Administration Guide. Para informações sobre segurança do usuário, consulte
o SAP HANA Security Guide (incluindo o SAP HANA Database Security).
A conta de usuário usada para efetuar logon no sistema SAP HANA do SAP Predictive Analysis deve
ser atribuída à função "MODELING" (no SAP HANA).
Observação:
Esta ação só pode ser executada por um usuário com privilégios ROLE_ADMIN no banco de dados
SAP HANA.
12
2013-01-31
Instalando o SAP Predictive Analysis
Quando um usuário do SAP Predictive Analysis efetua logon no sistema SAP HANA, a conta interna
_SYS_REPO deve:
•
•
Ter Privilégios SQL SELECT.
Ter a opção Grantable to others selecionada no esquema do usuário (SAP Predictive Analysis).
3.4.1 Para configurar o _SYS_REPO para o usuário do SAP Predictive Analysis
Se já houver uma conta definida para o usuário do SAP Predictive Analysis no sistema SAP HANA:
1. Da conexão com o sistema, na janela SAP HANA Studio Navigator, selecione Catalog >
Authorization > Users.
2. Clique duas vezes na conta _SYS_REPO.
3. Na guia SQL Privileges, clique no ícone + , digite o nome do esquema do usuário, e selecione OK.
4. Escolha SELECT e a opção Yes correspondente em Grantable to others.
5. Escolha Deploy ou Save.
Observação:
O usuário também pode abrir um editor SQL no SAP HANA Studio e executar esta instrução SQL:
GRANT SELECT ON SCHEMA <user_account_name> TO _SYS_REPO WITH GRANT OPTION
3.4.2 Medidas OLAP suportadas
O SAP HANA suporta apenas as seguintes medidas de agregação nas fontes de dados OLAP
•
•
•
•
SUM
MIN
MAX
COUNT
Se o seu conjunto de dados contiver uma agregação com base em uma medida não listada acima, a
agregação será ignorada pelo SAP HANA durante a publicação e não fará parte do artefato final
publicado.
3.5 Aspectos importantes a serem considerados no uso de universos do SAP
BusinessObjects.
13
2013-01-31
Instalando o SAP Predictive Analysis
•
•
Para adquirir dados de universos existentes na plataforma BI 4.0, é necessário que o Web Intelligence
Server esteja em execução.
Também é necessário que a plataforma Business Intelligence seja BI 4.0 SP2 nível de correção 14
ou superior.
Observação:
Você também pode adquirir dados de universos existentes em plataformas BI 4.0 SP3 e BI 4.0 SP4.
14
2013-01-31
Instalação e configuração do ambiente R de fonte aberta
Instalação e configuração do ambiente R de fonte aberta
4.1 Instalando o ambiente R-2.15.1 e os pacotes necessários
Para usar algoritmos R de fonte aberta na sua análise, você precisa instalar o ambiente R e configurá-lo
com a aplicação SAP Predictive Analysis.
O SAP Predictive Analysis oferece uma opção de instalação e configuração do R 2.15.1 e dos pacotes
necessários da aplicação. Durante a instalação do ambiente R, você precisa estar conectado à Internet.
Para instalar o ambiente R e os pacotes necessários, siga estes procedimentos:
1. Inicie a aplicação SAP Predictive Analysis.
2. No menu Arquivo, selecione Instalar e configurar ambiente R.
3. Selecione Instalar ambiente R
4. Leia o contrato de licenciamento do ambiente R de fonte aberta e as instruções, e selecione
Concordo em instalar o ambiente R usando o script.
5. Selecione OK.
Observação:
Se você já tiver instalado o R 2.15.x, use este procedimento para instalar os pacotes R necessários.
4.2 Configurando o ambiente R
Depois de instalado o R, você precisa configurar o ambiente R para ativar os algoritmos R na aplicação.
Se você já tiver instalado o R-2.11.1 ou R-2.15.1 e os pacotes necessários, poderá ignorar a etapa de
instalação e configurar diretamente o ambiente R.
Observação:
Antes de configurar o R-2.11.1, você precisa definir certas variáveis de ambiente. Por exemplo, se
você tiver instalado o R em C:\Program Files\R\R-2.11.1, você precisa definir as variáveis de
ambiente da seguinte forma:
• R_HOME= C:\Program Files\R\R-2.11.1
• R_LIBS = C:\Program Files\R\R-2.11.1\library
• Path = caminho existente; C:\Program Files\R\R-2.11.1\library\rJava\jri;
C:\Program Files\R\R-2.11.1\bin
15
2013-01-31
Instalação e configuração do ambiente R de fonte aberta
Para configurar o ambiente R, siga estes procedimentos:
1. Inicie a aplicação SAP Predictive Analysis.
2. No menu Arquivo, selecione Instalar e configurar ambiente R.
3. Na guia Configuração, selecione Ativar algoritmos R de fonte aberta.
4. Selecione Procurar para selecionar a pasta
5. Selecione OK.
A caixa de diálogo "Controle de conta de usuário" será exibida com uma mensagem de aviso.
6. Selecione Sim na solicitação de confirmação.
16
2013-01-31
Introdução ao SAP Predictive Analysis
Introdução ao SAP Predictive Analysis
5.1 Princípios básicos do SAP Predictive Analysis
Componente
Componente é a unidade básica de processamento do SAP Predictive Analysis. Cada componente
contém âncoras de entrada e/ou saída (pontos de conexão). As âncoras são usadas para conectar
componentes por meio de conectores. Quando você conecta os componentes, os dados são transmitidos
dos componentes precedentes para seus componentes sucessores.
O SAP Predictive Analysis contém estes componentes:
• Preparação de dados
• Algoritmos
• Gravadores de dados
Você pode acessar os componentes da visão de designer do painel de previsão. Depois de adicionar
componentes ao editor de análise, o ícone de status de um componente permite identificar seu estado.
Estes são os estados de um componente:
•
(Não configurado): este estado é exibido quando você arrasta um componente até o editor de
análise. Indica a necessidade de configurar o componente antes da execução da análise.
•
(Configurado): este estado é exibido quando todas as propriedades necessárias do componente
estão configuradas.
•
(Sucesso): este estado é exibido após a execução bem sucedida da análise.
•
(Falha): este estado é exibido se o componente causar falha na execução da análise.
Análise
Análise consiste em uma série de componentes diferentes conectados em sequência específica por
meio de conectores que definem a direção do fluxo de dados.
17
2013-01-31
Introdução ao SAP Predictive Analysis
Modelo
Modelo é um componente reutilizável, criado treinando um algoritmo com os dados históricos.
No banco de dados (In-DB)
No banco de dados (in-DB) é um modo de execução de análise em que os dados são processados
dentro do banco de dados usando recursos de mineração de dados. Neste modo, os dados jamais
são processados fora do banco de dados, portanto, a velocidade de processamento é bem alta. Este
modo pode ser usado para processar conjuntos de dados volumosos. O SAP HANA suporta mineração
de dados no banco de dados por meio de integração R e da biblioteca de análise preditiva (PAL).
No processo (In-Proc)
No processo (in-Proc) é um modo de execução de análise em que os dados são processados,
retirando-os do banco de dados e colocando-os em um espaço no processo de análise preditiva. Este
tipo de análise também é denominado Out-DB (análise fora do banco de dados).
5.2 Iniciando o SAP Predictive Analysis
Para iniciar o SAP Predictive Analysis, selecione Iniciar > Todos os Programas > SAP Business
Intelligence > SAP Predictive Analysis > SAP Predictive Analysis.
5.3 Conhecendo o SAP Predictive Analysis
Quando você inicia o SAP Predictive Analysis, a página inicial é exibida. A página inicial contém
informações para ajudá-lo a começar a trabalhar com o SAP Predictive Analysis.
Para começar a analisar os dados usando o SAP Predictive Analysis, primeiro você precisa conectar-se
à fonte de dados e adquirir os dados para análise. Depois de adquiridos os dados, você pode realizar
estas operações:
• Preparar os dados para análise, aplicando funções de manipulação e limpeza de dados
• Analisar os dados, aplicando algoritmos de mineração de dados e de análise estatística
• Compartilhar conjuntos de dados e gráficos com colaboradores externos
Observação:
Este guia descreve como analisar os dados, aplicando algoritmos de mineração de dados e de análise
estatística. Para informações sobre como adquirir os dados, preparar os dados e compartilhar conjuntos
de dados, consulte o Guia do usuário do SAP Visual Intelligence disponível em http://help.sap.com/vi
Depois de adquiridos os dados de uma fonte de dados, você precisa mudar para o painel de previsão
para analisar os dados.
18
2013-01-31
Introdução ao SAP Predictive Analysis
5.3.1 Visão de designer
A visão de designer permite projetar e executar análises e criar modelos preditivos.
5.3.2 Visão de resultados
A visão de resultados permite entender os dados e os resultados da análise usando várias técnicas
de visualização e gráficos intuitivos.
19
2013-01-31
Introdução ao SAP Predictive Analysis
5.4 Usando o SAP Predictive Analysis do início ao fim
Esta é uma visão geral do processo de construção de um gráfico baseado em um conjunto de dados.
O processo não é linear, portanto você pode retroceder uma etapa para ajustar o gráfico ou os dados.
Etapas do trabalho com os
seus dados
Efetue a conexão à fonte de
dados.
Observação:
Para informações sobre como conectar-se a sua fonte
de dados, consulte a seção
Conectando-se a sua fonte
de dados do Guia do usuário
do SAP Visual Intelligence.
Visualize e organize as colunas e os atributos.
Observação:
Para informações sobre como visualizar colunas e
atributos, consulte a seção
Preparando os dados do
Guia do usuário do SAP Visual Intelligence.
20
Descrição
Se a fonte de dados for:
• RDBMS: insira suas credenciais, conecte-se ao servidor do banco
de dados e selecione uma fonte de dados; por exemplo, se você
estiver se conectando ao SAP HANA, selecione uma visualização
e um cubo para construir um gráfico.
• Arquivo plano: escolha as colunas a serem adquiridas, cortadas
ou exibidas e ocultas.
• Universo: insira suas credenciais do universo, conecte-se ao
repositório Central Management Server e selecione um universo
para construir seu gráfico.
Você pode visualizar os dados adquiridos como colunas ou facetas.
Você pode organizar a exibição de dados para facilitar a construção
do gráfico desta forma:
• Crie filtros e oculte as colunas desnecessárias
• Crie medidas, hierarquias de tempo e hierarquias geográficas
• Limpe e organize os dados em colunas, usando várias ferramentas
de manipulação
• Crie colunas com fórmulas, usando a ampla seleção de funções
disponíveis
2013-01-31
Introdução ao SAP Predictive Analysis
Etapas do trabalho com os
seus dados
Descrição
Depois de adquiridos os dados relevantes no painel de preparação,
mude para o painel de previsão e crie uma análise para encontrar
padrões nos dados e prever resultados futuros.
Analise os dados usando algoritmos de análise preditiva.
Observação:
Este guia contém informações de como analisar os
dados usando algoritmos de
análise preditiva.
No painel de previsão, você pode:
• Criar uma análise
• Construir modelos preditivos
• Visualizar os resultados da análise
• Exibir visualizações de modelo
• Construir gráficos
Observação:
Para informações sobre como criar gráficos, consulte a seção Visualizando os dados do Guia do usuário do SAP Visual Intelligence.
Salve a análise
21
Nomeie e salve a análise incluindo seus gráficos. A análise é salva e
um documento com o formato de arquivo .SViD na pasta da aplicação,
em Documentos, no caminho do seu perfil.
2013-01-31
Introdução ao SAP Predictive Analysis
22
2013-01-31
Criando análises
Criando análises
6.1 Criando uma análise
Você pode usar o SAP Predictive Analysis para mineração de dados e análise estatística, executando
os dados em uma série de componentes. A série de componentes devem ser conectados entre si por
meio de conectores, que definem a direção do fluxo de dados. Esse processo é denominado análise.
Usando a análise, você pode ler os dados de uma fonte de dados; analisar os dados, aplicando funções
de manipulação de dados, mineração de dados e algoritmos estatísticos; e armazenar os resultados
da análise.
Para criar uma análise, siga estes procedimentos:
1. Adquira dados de uma fonte de dados
2. (Opcional) Prepare os dados para análise (por exemplo, filtrando os dados)
3. Aplique os algoritmos
4. (Opcional) Armazene os resultados para uma análise posterior
Tópicos relacionados
• Adquirindo dados de uma fonte de dados
• Preparando os dados para análise
• Aplicando algoritmos
• Armazenando os resultados da análise
6.1.1 Adquirindo dados de uma fonte de dados
1. Na página inicial, selecione o botão Novo documento no canto superior esquerdo.
2. Efetue a conexão com ou navegue até a sua fonte de dados.
Você pode adquirir dados das seguintes fontes de dados:
23
2013-01-31
Criando análises
Fonte de dados
Descrição
Arquivo CSV
Você pode adquirir dados de um arquivo de
dados com valores separados por vírgula e executar a análise no processo (in-proc) usando
algoritmos SAP e R.
Free hand SQL
Você pode criar manualmente seu próprio
provedor de dados inserindo sua própria linguagem de consulta estruturada (SQL - Structured Query Language) para uma fonte de dados de destino e executar a análise no processo
(in-proc) usando algoritmos SAP e R.
SAP HANA Offline
Você pode adquirir dados de tabelas, visualizações e visões de análise do SAP HANA e executar a análise no processo (in-proc) usando
algoritmos SAP e R.
SAP HANA Online
Você pode adquirir dados de tabelas, visualizações e visões de análise do SAP HANA e executar a análise no banco de dados (in-db) usando algoritmos HANA PAL.
MS Excel
Você pode adquirir dados de uma planilha do
Microsoft Excel e executar a análise no processo (in-proc) usando algoritmos SAP e R.
Universe 3.x
Você pode adquirir dados de universos do SAP
BusinessObjects existentes na plataforma XI
3.x e executar a análise no processo (in-proc)
usando algoritmos SAP e R.
Universe 4.x
Você pode adquirir dados de universos do SAP
BusinessObjects existentes na plataforma BI
4.x e executar a análise no processo (in-proc)
usando algoritmos SAP e R.
3. Marque a opção Adquirir ou Selecionar conforme necessário.
As colunas aparecem no painel de dados, os atributos e as medidas, à esquerda no painel Semântica.
Você está pronto para começar a construir sua análise. No painel de previsão, o componente
configurado de leitor de dados é adicionado ao editor de análise. Você pode executar a análise para
ver os resultados do componente de leitor de dados.
Observação:
Para informações sobre como conectar-se a uma fonte de dados específica, consulte o Guia do usuário
do SAP Visual Intelligence disponível em http://help.sap.com/vi.
24
2013-01-31
Criando análises
6.1.2 Preparando os dados para análise
Esta etapa é opcional.
Em muitos casos, os dados brutos da fonte de dados podem não serem adequados para a análise.
Para obter resultados precisos, talvez seja necessário preparar e processar os dados antes da análise.
Você encontra funções de manipulação de dados no painel de preparação e as funções de preparação
de dados no painel de previsão.
A preparação de dados consiste em verificação da precisão dos dados e de campos em falta, filtragem
dos dados com base em valores de intervalo, amostragem de dados para investigação de um
subconjunto de dados e manipulação de dados. Você pode processar os dados usando os componentes
de preparação de dados.
1. No painel de previsão, clique duas vezes no componente de preparação de dados necessário na
guia Preparação de dados.
O componente de preparação de dados será adicionado ao editor de análise e uma conexão
automática será criada para o componente de leitor de dados.
2. Clique no componente de preparação de dados com o botão direito do mouse e selecione Configurar
propriedades.
3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as
propriedades do componente de preparação de dados.
4. Selecione Salvar e fechar.
5. Para ver os resultados do componente de leitor de dados e do componente de preparação de dados,
selecione
.
Tópicos relacionados
• Componentes de preparação de dados
6.1.3 Aplicando algoritmos
Obtidos os dados relevantes para análise, você precisa aplicar os algoritmos apropriados para determinar
os padrões nos dados.
É uma tarefa desafiadora determinar o algoritmo apropriado para uma finalidade específica. Você pode
usar uma combinação de inúmeros algoritmos para analisar os dados. Por exemplo, primeiro você
pode usar algoritmos de série de tempo para amortecer os dados e depois usar algoritmos de regressão
para encontrar tendências.
25
2013-01-31
Criando análises
A seguinte tabela contém informações dos algoritmos que devem ser selecionados para finalidades
específicas:
Realizando previsões com base no tempo
Algoritmos de série de tempo
•
•
•
•
Amortecimento exponencial triplo
R de amortecimento exponencial individual
R de amortecimento exponencial duplo
R de amortecimento exponencial triplo
Prevendo variáveis contínuas com base em outras Algoritmos de regressão
variáveis no conjunto de dados.
• Regressão linear
• Regressão exponencial
• Regressão geométrica
• Regressão logarítmica
• HANA de regressão linear múltipla
• R de regressão linear
• R de regressão exponencial
• R de regressão geométrica
• R de regressão logarítmica
• R de regressão linear múltipla
Encontrando padrões frequentes de conjunto de Algoritmos de associação
itens em conjuntos volumosos de dados transa• HANA apriori
cionais para gerar regras de associação
• R apriori
Criando clusters de observações em grupos de
conjuntos de itens similares
26
Algoritmos de clustering
•
•
HANA de valor médio K
Valor médio K
2013-01-31
Criando análises
Classificando e prevendo uma ou mais variáveis Árvores de decisão
discretas com base em outras variáveis no conjun• HANA C 4.5
to de dados
• R de árvore CNR
Detectando valores atípicos no conjunto de dados Algoritmos de detecção de valor atípico
•
•
Intervalo interquartil
Valor atípico vizinho mais próximo
Prevendo, classificando e reconhecendo padrões Algoritmos de rede neural
estatísticos
• R de rede neural NNet
• R de rede neural MONMLP
1. No painel de previsão, clique duas vezes no componente de algoritmo necessário na guia
Algoritmos.
O componente de algoritmo será adicionado ao editor de análise e conectado ao componente
anterior na análise.
2. Clique no componente de algoritmo com o botão direito do mouse e selecione Configurar
propriedades.
3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as
propriedades do componente de algoritmo.
4. Selecione Salvar e fechar.
5. Para ver os resultados do componente de leitor de dados, componente de preparação de dados e
algoritmo, selecione
.
Tópicos relacionados
• Algoritmos
6.1.4 Armazenando os resultados da análise
Esta etapa é opcional.
Você pode armazenar os resultados da análise em arquivos planos ou bancos de dados para uma
análise posterior, usando componentes de gravação de dados.
1. No painel de previsão, clique duas vezes no componente de gravação de dados necessário na
guia Gravadores de dados.
O componente de gravação de dados será adicionado ao editor de análise e conectado ao
componente anterior na análise.
27
2013-01-31
Criando análises
2. Clique no componente de gravação de dados com o botão direito do mouse e selecione Configurar
propriedades.
3. Na caixa de diálogo de propriedades do componente, insira os detalhes necessários para as
propriedades do componente de gravação de dados.
4. Selecione Salvar e fechar.
5. Para ver os resultados do componente de leitor de dados, componente de preparação de dados,
algoritmo e componente de gravação de dados, selecione
.
Tópicos relacionados
• Gravadores de dados
6.2 Executando a análise
Para executar a análise, selecione
na barra de ferramentas do editor de análise ou clique com o
botão direito do mouse no último componente da análise, e selecione Executar análise.
Se a sua análise for muito volumosa e complexa, você pode executá-la, componente por componente,
e analisar os dados. Para executar parte da análise, selecione
na barra de ferramentas do editor
de análise ou clique com o botão direito do mouse na análise até a qual deseja executar e selecione
Executar até aqui.
6.3 Salvando a análise
Depois de criada a análise, você pode salvá-la para reutilizar no futuro. No SAP Predictive Analysis,
você precisa salvar o documento para salvar a análise correspondente. O documento é salvo em
formato de arquivo .SViD. O documento salvo contém o conjunto de dados (componente de leitor de
dados) que você adquiriu da fonte de dados e a análise que você criou.
Para salvar a análise em um documento, siga estes procedimentos:
1. Selecione Arquivo > Salvar.
2. Insira um nome para o documento.
3. Selecione Salvar.
Se você criar várias análises com o mesmo conjunto de dados, todas serão salvas no mesmo
documento. Você pode acessar todas as análise de um documento pela lista de opções Alterar.
28
2013-01-31
Criando análises
Para adicionar uma nova análise ao documento, selecione
na barra de ferramentas de análise.
Para renomear a análise, selecione
e insira um novo nome. Para excluir uma análise existente do
documento, selecione
.
Observação:
Os resultados de execução dos componentes não são salvos com as análises. Para ver os resultados
do componente, você precisa executar novamente a análise.
6.4 Visualizando os resultados
Para visualizar os resultados dos componentes em uma análise, após a execução da análise, clique
com o botão direito do mouse no componente e selecione Visualizar resultados. A visão Resultados
será exibida.
29
2013-01-31
Criando análises
30
2013-01-31
Analisando os dados
Analisando os dados
Depois da execução correta da análise, o resultado de cada componente da análise é representado
usando diferentes gráficos de visualização.
Para analisar os dados, siga estes procedimentos:
1. Depois de executar a análise, mude para a visão de resultados selecionando o botão Resultados
na barra de ferramentas.
2. Do painel de seleção de componentes, selecione o componente necessário na análise para ver
a visualização.
Por padrão, o resultado do componente é exibido no painel de grade. Você pode mudar para o painel
de gráficos para ver o resultado do componente no gráfico de visualização correspondente. Além
disso, você pode construir seu próprio gráfico no painel de visualização.
A seguinte tabela mostra resumidamente os componentes e respectivos gráficos de visualização
suportados.
Componentes
Gráficos de visualização
Leitores de dados e
preparação de dados
Gráfico de matriz de dispersão, gráfico de resumo estatístico e coordenadas paralelas
Algoritmos de clustering
Gráfico de cluster e resumo do algoritmo
Árvores de decisão
Árvore de decisão, resumo do algoritmo
Algoritmos de série de tempo
Gráfico de série de tempo, resumo do algoritmo
Algoritmos de regressão
Gráfico de regressão, resumo do algoritmo
7.1 Gráficos de visualização
7.1.1 Gráfico de matriz de dispersão
31
2013-01-31
Analisando os dados
Gráficos de matriz de dispersão são matrizes de gráficos (gráficos n*n, em que n é o número de atributos
selecionados) usados para comparar os dados em diferentes dimensões. Por padrão, no máximo
quatro atributos contínuos são selecionados para análise, começando do primeiro atributo dos dados
de origem, para criar um gráfico de matriz 4*4. No entanto, você pode selecionar manualmente os
atributos necessários na opção Configurações e atualizar a visualização selecionando Aplicar
Observação:
Você pode selecionar no máximo quatro atributos contínuos na opção Configurações.
7.1.2 Gráfico de resumo estatístico
O resumo estatístico contém informações resumidas de atributos contínuos da fonte de dados. Ele
contém informações resumidas de contagem, valor mínimo, valor máximo, variação, desvio padrão,
soma, média, intervalo e número de registros. Um gráfico em forma de histograma é criado para cada
atributo.
32
2013-01-31
Analisando os dados
7.1.3 Coordenadas paralelas
Coordenadas paralelas são uma técnica de visualização de dados multidimensionais e padrões
multivariáveis dos dados para análise.
Neste gráfico, por padrão, os primeiros cinco atributos estão representados como eixos paralelos
espaçados verticalmente. Para escolher um subconjunto de atributos para visualização no gráfico, use
a opção Configurações. A etiqueta de cada eixo contém o nome do atributo, e os valores mínimo e
máximo dos atributos. Cada observação é representada como uma série de pontos conectados ao
longo dos eixos paralelos. Você pode selecionar a cor por opção para filtragem dos dados com base
no valor da categoria.
Observação:
Você pode selecionar no máximo sete atributos contínuos na opção Configurações.
7.1.4 Árvore de decisão
Árvore de decisão é uma técnica de visualização que permite classificar as observações em grupos e
prever eventos futuros com base no conjunto de regras de decisão.
Esta apresentação será usada para análise da árvore de decisão. Nesta técnica, uma árvore de decisão
binária é criada dividindo as observações em subgrupos menores até preencher os critérios de parada.
O nó final indica os dados classificados. Você pode ampliar a árvore de decisão usando o botão de
aproximação.
Observação:
•
33
A aplicação não cria árvores de decisão se houver mais de 32 valores de categoria para uma coluna
dependente.
2013-01-31
Analisando os dados
•
A aparência e o comportamento da árvore de decisão variam dependendo do fornecedor de
algoritmos. Por exemplo, a árvore de decisão para o algoritmo R de árvore CNR é diferente da
árvore de decisão para o algoritmo HANA C4.5.
Cada nó da árvore de decisão representa a classificação dos dados naquele nível. Você pode visualizar
o conteúdo do nó selecionando
em cada nó.
7.1.5 Gráfico de regressão
O gráfico de regressão é usado para visualizar a correlação entre as variáveis dependente e
independente. No modo tendência, você pode analisar o desempenho do algoritmo, comparando as
variáveis dependentes reais com os valores previstos, com as variáveis dependentes representadas
como gráfico de barras e os valores previstos representados como gráficos de linhas. No modo
preenchimento, o algoritmo preenche os valores que faltam e o resultado é exibido em gráfico de linhas.
34
2013-01-31
Analisando os dados
Se o conjunto de dados for volumoso, o gráfico pode não ficar claro. Para visualizar melhor os dados,
use o botão de seleção Intervalo localizado na base do gráfico para selecionar um intervalo de dados
específico de um conjunto volumoso de dados. Os dados na área selecionada são exibidos no editor
de visualização.
7.1.6 Gráfico de série de tempo
O gráfico de série de tempo permite visualizar os dados de série de tempo comparados com os valores
ajustados ou previstos do algoritmo. Você pode usar o gráfico para visualizar os dados previstos ao
longo de um período específico. No modo tendência, uma variável dependente é representada em
gráfico de barras e os valores de tendência são representados em gráfico de linhas. No modo previsão,
uma variável dependente é representada em gráfico de barras e os valores previstos são representados
em gráfico de linhas.
Se o conjunto de dados for volumoso, o gráfico pode não ficar claro. Para visualizar melhor os dados,
use o botão de seleção Intervalo localizado na base do gráfico para selecionar um intervalo de dados
específico de um conjunto volumoso de dados. Os dados na área selecionada são exibidos no editor
de visualização.
35
2013-01-31
Analisando os dados
7.1.7 Gráfico de cluster
Gráfico de cluster é uma técnica de visualização que utiliza diferentes gráficos para representar
informações do cluster, como tamanho do cluster, densidade e distância do cluster, comparação variável
do cluster e comparação do cluster.
Observação:
Se você utilizar o algoritmo HANA de valor médio K para observações de cluster, apenas informações
de tamanho e comparação variável do cluster serão representadas graficamente.
Tamanho do cluster
Tamanho do cluster é o número de elementos em cada cluster e é representado por um gráfico de
barras horizontais. No entanto, você também pode visualizar o tamanho do cluster em um gráfico de
pizza ou um gráfico de barras verticais.
Densidade e distância do cluster
A distância entre clusters e a densidade de cada cluster são representadas por um gráfico de rede.
Cada nó da rede representa um cluster e seu tamanho. A cor do nó representa a densidade. Você
amplia o gráfico de rede selecionando
.
Comparação variável do cluster
A comparação entre a distribuição total de todos os clusters e a distribuição de cada cluster é
representada por um histograma. Você pode selecionar o atributo necessário do cluster em uma lista
de opções variáveis e alterar o cluster usando o controle deslizante.
Comparação do cluster
O algoritmo R de valor médio K computa os pontos centrais de cada atributo de entrada em cada
cluster. A comparação entre cada ponto central e o cluster é representada pelo gráfico radial. Você
pode selecionar a opção Normalizar resultado para visualizar o gráfico com os dados normalizados.
No modo normalizado, os dados são representados no intervalo de 0 a 1.
36
2013-01-31
Trabalhando com modelos
Trabalhando com modelos
Modelo é um componente reutilizável, criado treinando um algoritmo com os dados históricos e salvando
a instância.
Geralmente você cria modelos para:
• Compartilhar regras comerciais aplicáveis a dados similares
• Analisar rapidamente os resultados sem os dados históricos, usando a instância treinada do algoritmo
8.1 Criando um modelo
Para criar um modelo, você precisa salvar o estado do algoritmo.
1. Adquira os dados da fonte de dados solicitada.
O componente de fonte de dados será adicionado ao editor de análise no painel de previsão.
2. No painel de previsão, clique duas vezes no componente de algoritmo solicitado.
3. Clique no componente de algoritmo com o botão direito do mouse e selecione Configurar
propriedades.
4. Configure as propriedades do algoritmo na caixa de diálogo.
a. Insira os valores necessários para as propriedades do algoritmo.
b. Em Informações do modelo, selecione Salvar o modelo.
c. Insira um nome e uma descrição para o modelo.
d. Se você quiser substituir o modelo existente por um novo, selecione Sobregravar, se existir.
e. Selecione Salvar e fechar.
5. Selecione
.
O modelo será criado e exibido na guia Modelos salvos. Você pode usar este modelo apenas como
qualquer outro componente para a criação de uma análise.
Observação:
Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos de
coluna independente usados durante a criação do modelo.
37
2013-01-31
Trabalhando com modelos
8.2 Visualizando as informações do modelo
As informações do modelo abrangem:
• Detalhes da coluna, como quais foram as colunas usadas durante a geração do modelo
• Resumo do algoritmo
Esta informação é útil para os analistas de dados entenderem a estrutura do modelo.
Para visualizar as informações do modelo, siga estes procedimentos:
1. No painel de previsão, na guia Modelos salvos, clique duas vezes no modelo desejado.
A guia Modelos salvos só será exibida se os modelos já estiverem salvos no repositório.
2. Clique no modelo com o botão direito do mouse e selecione Visualizar informações do modelo.
A visualização correspondente do algoritmo selecionado durante a geração do modelo será exibida.
8.3 Exportando um modelo como PMML
Você pode exportar as informações do modelo em um arquivo local, no formato padrão da indústria
Predictive Modeling Markup Language (PMML), e compartilhá-lo com outras aplicações compatíveis
com PMML para analisar dados similares.
Para exportar um modelo em formato PMML, siga estes procedimentos:
1. Crie um modelo.
2. No painel de previsão, na guia Modelos salvos, clique duas vezes no modelo desejado.
3. Clique com o botão direito do mouse no modelo e selecione Exportar como PMML.
4. Insira um nome para o arquivo.
5. Selecione o tipo de arquivo desejado: PMML ou XML.
6. Selecione Salvar.
8.4 Exportando um modelo como arquivo .spar
Você pode exportar um modelo criado em um documento SVID para um arquivo .spar e usá-lo em
outro documento SVID importando o arquivo.
Para exportar um modelo, execute os seguintes procedimentos:
1. Crie um modelo.
38
2013-01-31
Trabalhando com modelos
2. Clique com o botão direito no modelo e escolha Exportar modelo.
3. Insira um nome para o arquivo .spar.
4. Selecione Salvar.
8.5 Importando um modelo
Você pode reutilizar um modelo solicitado no documento SVID em outro documento SVID importando
o arquivo do arquivo .spar.
Para importar um modelo, execute os seguintes procedimentos:
1. Inicie o SAP Predictive Analysis.
2. No painel de Previsão escolhaImportar modelo.
3. Escolha um arquivo .spar válido e escolha Abrir.
O modelo foi importado e exibido na guia Modelos salvos.
8.6 Excluindo um modelo
Recomendamos que você use esta opção com cautela porque a exclusão de um modelo pode inutilizar
a análise que contenha a referência do modelo.
Para excluir um modelo, siga estes procedimentos:
1. No painel de previsão, selecione a guia Modelos salvos.
2. Clique com o botão direito no modelo solicitado e escolha Excluir.
39
2013-01-31
Trabalhando com modelos
40
2013-01-31
Propriedades do componente
Propriedades do componente
9.1 Algoritmos
Use algoritmos para executar a mineração de dados e análise estatística dos dados. Por exemplo,
para determinar tendências e padrões com base nos dados.
O SAP Predictive Analysis contém algoritmos incorporados, como de regressão, série de tempo e valor
atípico. No entanto, a aplicação suporta inclusive algoritmos da biblioteca R de fonte aberta, como de
árvore de decisão, valor médio k, rede neural, série de tempo e regressão. Você também pode executar
uma análise interna do banco de dados usando algoritmos da biblioteca de análise preditiva (Predictive
Analysis Library - PAL) do SAP HANA.
9.1.1 Regressão
9.1.1.1 Regressão exponencial
Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão
de uma variável. Ele determina como uma variável individual influencia outra variável usando a função
exponencial com a metodologia de mínimo quadrado.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
Propriedades de regressão exponencial
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
41
2013-01-31
Propriedades do componente
Coluna independente
Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que a regressão deve ser executada.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.1.2 Regressão geométrica
Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão
de uma variável. Ele determina como uma variável individual influencia outra variável usando a função
geométrica com a metodologia de mínimo quadrado.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
Propriedades da regressão geométrica
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída contendo os valores previstos.
42
Coluna independente
Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que a regressão deve ser executada.
2013-01-31
Propriedades do componente
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.1.3 HANA de regressão linear múltipla
Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis
independentes.
Propriedades do algoritmo HANA de regressão linear múltipla
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
Colunas independentes Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que você deseja executar a regressão.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores
em falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
Número de threads
43
Insira o número de threads a ser usado na execução.
2013-01-31
Propriedades do componente
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.1.4 Regressão linear
Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão
de uma variável. Ele determina como uma variável individual influencia outra variável com a metodologia
de mínimo quadrado.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
Propriedades da regressão linear
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
Coluna independente
Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que você deseja executar a regressão.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
44
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
2013-01-31
Propriedades do componente
9.1.1.5 Regressão logarítmica
Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão
de uma variável. Ele determina como uma variável individual influencia outra variável usando a função
logarítmica com a metodologia de mínimo quadrado.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
Propriedades da regressão logarítmica
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
Coluna independente
Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que você deseja executar a regressão.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.1.6 R de regressão exponencial
45
2013-01-31
Propriedades do componente
Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão
de uma variável. Ele determina como uma variável individual influencia outra variável usando a função
exponencial da biblioteca de fonte aberta R.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
Propriedades do algoritmo R de regressão exponencial
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
Coluna independente
Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que você deseja executar a regressão.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na coluna
independente ou na coluna dependente.
Permitir único ajuste
Um valor booleano - se definido como verdadeiro, os coeficientes com alias
serão ignorados na matriz de covariância de coeficiente. Se definido como
falso, um modelo com coeficientes com alias produzirá um erro.
Um modelo com coeficientes com alias significa que a matriz quadrada x*x
é única.
Contrastes
Selecione a lista de contrastes a ser usada para fatores que aparecem como
variáveis no modelo.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.1.7 R de regressão geométrica
46
2013-01-31
Propriedades do componente
Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão
de uma variável. Ele determina como uma variável individual influencia outra variável usando a função
geométrica da biblioteca de fonte aberta R.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
Propriedades do algoritmo R de regressão geométrica
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
Coluna independente
Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que você deseja executar a regressão.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na coluna
independente ou na coluna dependente.
Permitir único ajuste
Um valor booleano - se definido como verdadeiro, os coeficientes com alias
serão ignorados na matriz de covariância de coeficiente. Se definido como
falso, um modelo com coeficientes com alias produzirá um erro.
Um modelo com coeficientes com alias significa que a matriz quadrada x*x
é única.
Contrastes
Selecione a lista de contrastes a ser usada para fatores que aparecem como
variáveis no modelo.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.1.8 R de regressão linear
47
2013-01-31
Propriedades do componente
Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão
de uma variável. Ele determina como uma variável individual influencia outra variável usando a biblioteca
R de fonte aberta.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
Propriedades do algoritmo R de regressão linear
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
Coluna independente
Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que você deseja executar a regressão.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na coluna
independente ou na coluna dependente.
Permitir único ajuste
Um valor booleano - se definido como verdadeiro, os coeficientes com alias
serão ignorados na matriz de covariância de coeficiente. Se definido como
falso, um modelo com coeficientes com alias produzirá um erro.
Um modelo com coeficientes com alias significa que a matriz quadrada x*x
é única.
Contrastes
Selecione a lista de contrastes a ser usada para fatores que aparecem como
variáveis no modelo.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.1.9 R de regressão logarítmica
48
2013-01-31
Propriedades do componente
Use este algoritmo para encontrar tendências nos dados. Este algoritmo executa a análise de regressão
de uma variável. Ele determina como uma variável individual influencia outra variável usando a função
logarítmica da biblioteca R de fonte aberta.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
Propriedades do algoritmo R de regressão logarítmica
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
Coluna independente
Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que você deseja executar a regressão.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na coluna
independente ou na coluna dependente.
Permitir único ajuste
Um valor booleano - se definido como verdadeiro, os coeficientes com alias
serão ignorados na matriz de covariância de coeficiente. Se definido como
falso, um modelo com coeficientes com alias produzirá um erro.
Um modelo com coeficientes com alias significa que a matriz quadrada x*x
é única.
Contrastes
Selecione a lista de contrastes a ser usada para fatores que aparecem como
variáveis no modelo.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.1.10 R de regressão linear múltipla
49
2013-01-31
Propriedades do componente
Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis
independentes.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
Propriedades do algoritmo R de regressão linear múltipla
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
Colunas independentes Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que a regressão deve ser executada.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores
em falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
Nível de confiança
Insira o nível de confiança do algoritmo (a precisão das previsões).
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.1.11 HANA R de regressão linear múltipla
Use este algoritmo para identificar a relação linear entre a variável dependente e uma ou mais variáveis
independentes.
Observação:
O tipo de dados da coluna usado durante a pontuação do modelo deve ser igual ao tipo de dados das
colunas usado durante a construção do modelo.
50
2013-01-31
Propriedades do componente
Propriedades do algoritmo HANA R de regressão linear múltipla
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Preencher: preenche os valores em falta na coluna de destino.
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
Colunas independentes Selecione a coluna de origem de entrada com a qual você deseja executar
a regressão.
Coluna dependente
Selecione a coluna de destino em que a regressão deve ser executada.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo remove registros que contenham valores
ausentes nas colunas independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
Nível de confiança
Insira o nível de confiança do algoritmo (a precisão das previsões).
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores
previstos.
9.1.2 Valores atípicos
9.1.2.1 Intervalo interquartil
Use este algoritmo para identificar valores atípicos com base na distribuição estatística entre o primeiro
e terceiro quartis.
Observação:
Os dados de entrada para o algoritmo IQR devem ser de no mínimo 4 linhas.
51
2013-01-31
Propriedades do componente
Propriedades do algoritmo de intervalo interquartil
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Exibir valores atípicos: adiciona uma coluna booleana aos dados de
entrada, especificando se o valor correspondente é atípico.
• Remover valores atípicos: remove os valores atípicos dos dados de
entrada.
Coluna independente Selecione a coluna de origem de entrada.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na coluna
independente ou na coluna dependente.
Coeficiente limitador
Insira o desvio permitido para os valores do intervalo interquartil.
9.1.2.2 Valor atípico vizinho mais próximo
Use este algoritmo para identificar valores atípicos com base no número de vizinhos (N) e na distância
média dos valores comparados aos seus vizinhos N mais próximos.
Propriedades do valor atípico vizinho mais próximo
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Exibir valores atípicos: adiciona uma coluna booleana aos dados de
entrada, especificando se o valor correspondente é atípico.
• Remover valores atípicos: remove os valores atípicos dos dados de
entrada.
Coluna independente
52
Selecione a coluna de origem de entrada.
2013-01-31
Propriedades do componente
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores
em falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
Contagem da vizinhança
Insira o desvio permitido para os valores do intervalo interquartil.
Número de valores
atípicos
Insira o número de valores atípicos a ser removido.
Nome da coluna prevista
Insira um nome para a nova coluna que contenha os valores previstos.
9.1.3 Série de tempo
9.1.3.1 Amortecimento exponencial triplo
Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados.
Propriedades do logaritmo de amortecimento exponencial triplo
Modo de saída
Selecione o modo em que você deseja exibir a saída.
• Tendência: exibe os dados de origem junto com os valores previstos
para um conjunto de dados informado.
• Previsão: exibe os valores previstos para o período informado.
Coluna dependente
Selecione a coluna de entrada a ser prevista.
Considerar coluna de datas Selecione esta opção para especificar se a coluna de datas deve ou
não ser usada.
53
Coluna de datas
Insira o nome da coluna que contenha valores de data.
Valores em falta
Selecione o método para lidar com as entradas em falta.
• Remover: o algoritmo ignora os registros que contenham os valores
em falta na coluna independente ou dependente.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
2013-01-31
Propriedades do componente
Período
Selecione o período para a previsão.
Períodos por ano
Selecione o período para a previsão. Esta opção só fica ativada se você
selecionar "Personalizar" para "Período".
Ano inicial
Insira o ano do qual as observações devem ser consideradas. Por
exemplo, 2009, 1987, 2019.
Período inicial
Insira o período do qual as observações devem ser consideradas.
Períodos a serem previstos Insira o número de períodos a serem previstos.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
Valores de ano
Insira um nome para a coluna recém criada que contenha os valores
de ano.
Valores de trimestre
Insira um nome para a coluna recém criada que contenha os valores
de trimestre.
Valores de mês
Insira um nome para a coluna recém criada que contenha os valores
de mês.
Valores de período
Insira um nome para a coluna recém criada que contenha os valores
de período.
Alfa
Insira uma constante de amortecimento para observações de
amortecimento (parâmetros de base). Intervalo: 0-1
Beta
Insira uma constante de amortecimento para encontrar os parâmetros
de tendência. Intervalo: 0-1
Gama
Insira uma constante de amortecimento para encontrar os parâmetros
de tendência sazonal. Intervalo: 0-1
9.1.3.2 R de amortecimento exponencial duplo
Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados.
Propriedades do algoritmo de amortecimento exponencial duplo
54
Modo de saída
Selecione o modo em que você deseja exibir a saída.
• Tendência: exibe os dados de origem junto com os valores
previstos para um conjunto de dados informado.
• Previsão: exibe os valores previstos para o período informado.
Coluna dependente
Selecione a coluna de entrada a ser prevista.
2013-01-31
Propriedades do componente
Período
Selecione o período para a previsão.
Períodos por ano
Selecione o período para a previsão. Esta opção só fica ativada se
você selecionar "Personalizar" para "Período".
Ano inicial
Insira o ano do qual as observações devem ser consideradas. Por
exemplo, 2009, 1987, 2019.
Período inicial
Insira o período do qual as observações devem ser consideradas.
Períodos a serem previstos Insira o número de períodos a serem previstos.
Nome da coluna prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
Valores de ano
Insira um nome para a coluna recém criada que contenha os valores
de ano.
Valores de trimestre
Insira um nome para a coluna recém criada que contenha os valores
de trimestre.
Valores de mês
Insira um nome para a coluna recém criada que contenha os valores
de mês.
Valores de período
Insira um nome para a coluna recém criada que contenha os valores
de período.
Alfa
Insira uma constante de amortecimento para observações de
amortecimento (parâmetros de base). Intervalo: 0-1
Beta
Insira uma constante de amortecimento para encontrar os parâmetros
de tendência. Intervalo: 0-1
Nível de confiança
Insira o nível de confiança do algoritmo (a precisão das previsões).
Número de observações
periódicas
Insira o número de observações periódicas necessárias para iniciar
o cálculo.
Nível
Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0,4
Tendência
Insira o valor inicial para encontrar os parâmetros de tendência (b[0])
(b.start). Por exemplo: 0,4
Entradas otimizadoras
Insira os valores iniciais de alfa, beta e gama necessários para o
otimizador. Por exemplo: 0,3, 0,1, 0,1
9.1.3.3 R de amortecimento exponencial individual
Use este algoritmo para amortecer os dados de origem.
55
2013-01-31
Propriedades do componente
Propriedades do algoritmo R de amortecimento exponencial individual
Modo de saída
Selecione o modo em que você deseja exibir a saída.
• Tendência: exibe os dados de origem junto com os valores
previstos para um conjunto de dados informado.
• Previsão: exibe os valores previstos para o período informado.
Coluna dependente
Selecione a coluna de entrada a ser prevista.
Período
Selecione o período para a previsão.
Períodos por ano
Selecione o período para a previsão. Esta opção só fica ativada se
você selecionar "Personalizar" para "Período".
Ano inicial
Insira o ano do qual as observações devem ser consideradas. Por
exemplo, 2009, 1987, 2019.
Período inicial
Insira o período do qual as observações devem ser consideradas.
Períodos a serem previstos
Insira o número de períodos a serem previstos.
Nome da coluna prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
Valores de ano
Insira um nome para a coluna recém criada que contenha os valores
de ano.
Valores de trimestre
Insira um nome para a coluna recém criada que contenha os valores
de trimestre.
Valores de mês
Insira um nome para a coluna recém criada que contenha os valores
de mês.
Valores de período
Insira um nome para a coluna recém criada que contenha os valores
de período.
Alfa
Insira uma constante de amortecimento para observações de
amortecimento (parâmetros de base). Intervalo: 0-1
Nível de confiança
Insira o nível de confiança do algoritmo (a precisão das previsões).
Número de observações
periódicas
Insira o número de observações periódicas necessárias para iniciar
o cálculo.
Nível
Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0,4
9.1.3.4 R de amortecimento exponencial triplo
Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados.
56
2013-01-31
Propriedades do componente
Propriedades do algoritmo R de amortecimento exponencial triplo
Modo de saída
Selecione o modo em que você deseja exibir a saída.
• Tendência: exibe os dados de origem junto com os valores previstos
para um conjunto de dados informado.
• Previsão: exibe os valores previstos para o período informado.
Coluna dependente
Selecione a coluna de entrada a ser prevista.
Período
Selecione o período para a previsão.
Períodos por ano
Selecione o período para a previsão. Esta opção só fica ativada se
você selecionar "Personalizar" para "Período".
Ano inicial
Insira o ano do qual as observações devem ser consideradas. Por
exemplo, 2009, 1987, 2019.
Período inicial
Insira o período do qual as observações devem ser consideradas.
Períodos a serem previstos Insira o número de períodos a serem previstos.
57
Nome da coluna prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
Valores de ano
Insira um nome para a coluna recém criada que contenha os valores
de ano.
Valores de trimestre
Insira um nome para a coluna recém criada que contenha os valores
de trimestre.
Valores de mês
Insira um nome para a coluna recém criada que contenha os valores
de mês.
Valores de período
Insira um nome para a coluna recém criada que contenha os valores
de período.
Alfa
Insira uma constante de amortecimento para observações de
amortecimento (parâmetros de base). Intervalo: 0-1
Beta
Insira uma constante de amortecimento para encontrar os parâmetros
de tendência. Intervalo: 0-1
Gama
Insira uma constante de amortecimento para encontrar os parâmetros
de tendência sazonal.
Sazonal
Selecione o tipo de algoritmo de amortecimento exponencial
HoltWinters.
Nível de confiança
Insira o nível de confiança do algoritmo (a precisão das previsões).
Número de observações
periódicas
Insira o número de observações periódicas necessárias para iniciar o
cálculo.
Nível
Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0,4
Tendência
Insira o valor inicial para encontrar os parâmetros de tendência (b[0])
(b.start). Por exemplo: 0,4
2013-01-31
Propriedades do componente
Estação
Insira os valores iniciais para encontrar os parâmetros sazonais (s.start).
O valor depende da coluna selecionada. Por exemplo, se você
selecionar trimestre como período, deverá inserir quatro valores
dobrados.
Entradas otimizadoras
Insira os valores iniciais de alfa, beta e gama necessários para o
otimizador. Por exemplo: 0,3, 0,1, 0,1
9.1.3.5 HANA R de amortecimento exponencial triplo
Use este algoritmo para amortecer os dados de origem e identificar tendências sazonais nos dados.
Propriedades do algoritmo R de amortecimento exponencial triplo
Modo de saída
Selecione o modo em que você deseja exibir a saída.
• Tendência: exibe os dados de origem junto com os valores previstos
para um conjunto de dados informado.
• Previsão: exibe os valores previstos para o período informado.
Coluna dependente
Selecione a coluna de entrada para realizar uma análise de séries
temporais.
Período
Selecione o período para a previsão.
Períodos por ano
Selecione o período para a previsão. Esta opção só fica ativada se você
selecionar "Personalizar" para "Período".
Ano inicial
Insira o ano do qual as observações devem ser consideradas. Por
exemplo, 2009, 1987, 2019.
Período inicial
Insira o período do qual as observações devem ser consideradas.
Períodos a serem previstos Insira o número de períodos a serem previstos. Esse valor é usado
apenas se o modo de saída é previsto.
58
Nome da coluna prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
Valores de ano
Insira um nome para a coluna recém criada que contenha os valores
de ano.
Valores de trimestre
Insira um nome para a coluna recém criada que contenha os valores
de trimestre.
Valores de mês
Insira um nome para a coluna recém criada que contenha os valores
de mês.
Valores de período
Insira um nome para a coluna recém criada que contenha os valores
de período.
2013-01-31
Propriedades do componente
Alfa
Insira uma constante de amortecimento para observações de
amortecimento (parâmetros de base). Intervalo: 0-1
Beta
Insira uma constante de amortecimento para encontrar os parâmetros
de tendência. Intervalo: 0-1
Gama
Insira uma constante de amortecimento para encontrar os parâmetros
de tendência sazonal.
Sazonal
Selecione o tipo de algoritmo de amortecimento exponencial HoltWinters.
Nível de confiança
Insira o nível de confiança do algoritmo (a precisão das previsões).
Número de observações
periódicas
Insira o número de observações periódicas necessárias para iniciar o
cálculo.
Nível
Insira o valor inicial para o nível (a[0]) (l.start). Por exemplo: 0,4
Tendência
Insira o valor inicial para encontrar os parâmetros de tendência (b[0])
(b.start). Por exemplo: 0,4
Estação
Insira os valores iniciais para encontrar os parâmetros sazonais (s.start).
O valor depende da coluna selecionada. Por exemplo, se você
selecionar trimestre como período, deverá inserir quatro valores
dobrados.
Entradas otimizadoras
Insira os valores iniciais de alfa, beta e gama necessários para o
otimizador. Por exemplo: 0,3, 0,1, 0,1
9.1.4 Árvores de decisão
9.1.4.1 HANA C 4.5
Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas
com base em outra variáveis.
Propriedades do algoritmo HANA C 4.5
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
• Preencher: preenche os valores em falta na coluna de destino.
59
2013-01-31
Propriedades do componente
Colunas independentes
Selecione as colunas de origem de entrada.
Coluna dependente
Selecione a coluna de destino.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores
em falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na
coluna independente ou na coluna dependente.
Percentual
Insira o percentual de dados a ser considerado na análise.
Número de threads
Insira o número de threads a ser usado na execução.
Nome da coluna
Insira o nome da coluna independente que contenha valores numéricos.
Inserir intervalos binários
Insira intervalos binários.
9.1.4.2 R de árvore CNR
Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas
com base em outra variáveis. No entanto, você pode usar este algoritmo para identificar tendências
nos dados.
Observação:
•
•
•
O pacote "rpart" que faz parte do R 2.15 não processa nomes de coluna com espaço nem caracteres
especiais. O pacote "rpart" suporta apenas formato de nome de coluna de entrada suportado pelo
dataframe R.
Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos de
coluna independente usados durante a criação do modelo.
Nomes de coluna que contenham espaços ou qualquer outro caractere especial diferente de ponto
(.) não são suportados.
Propriedades do algoritmo R de árvore CNR
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Tendência: prevê os valores da coluna dependente e adiciona uma coluna
extra na saída que contenha os valores previstos.
• Preencher: preenche os valores em falta na coluna de destino.
Colunas
independentes
60
Selecione as colunas de origem de entrada.
2013-01-31
Propriedades do componente
Coluna dependente
Selecione a coluna de destino.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Rpart: o algoritmo exclui todas as observações das quais a coluna
dependente está em falta. No entanto, ele retém as observações das
quais uma ou mais colunas independentes estão em falta.
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na coluna
independente ou na coluna dependente.
Método
Selecione o tipo de regra de repartição.
Valores possíveis:
• Classificação: use este método se a variável dependente tiver valores
de categoria.
• Regressão: use este método se a variável dependente tiver valores
contínuos.
Divisão mínima
Insira um número mínimo de observações necessário para divisão de um
nó.
Critérios de divisão
Selecione os critérios de divisão do nó.
Valores possíveis:
• Gini: impureza Gini
• Informações: ganho de informações.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
Parâmetro de
complexidade
Insira o parâmetro de complexidade para economizar o tempo de
computação, evitando qualquer divisão que não melhore o ajuste.
Profundidade máxima Insira o nível máximo do nó na árvore final com o nó raiz computado como
nível 0.
Observação:
Se a profundidade máxima for maior que 30, o algoritmo não produz os
resultados esperados (em máquinas de 32 bits).
61
Validação cruzada
Insira o número de validações cruzadas. Um valor maior de validação
cruzada aumenta o tempo de computação e produz resultados mais precisos.
Probabilidade
prioritária
Insira o vetor de probabilidades prioritárias.
2013-01-31
Propriedades do componente
Utilizar substituto
Selecione o substituto para usar no processo de repartição.
Valores possíveis:
• Exibir apenas - uma observação com um valor em falta para a regra de
divisão primária não será enviada aos níveis inferior da árvore.
• Utilizar substituto - use esta opção para repartir objetos sem a variável
principal; se todos os substitutos estiverem em falta, a observação não
será dividida.
• Interromper se estiver em falta - se todos os substitutos estiverem em
falta, a observação será enviada na direção majoritária.
Estilo de substituto
Insira o estilo que controla a seleção do melhor substituto.
Valores possíveis:
• Usar classificação correta total - o algoritmo usa o número total de
classificações corretas para encontrar uma variável substituta potencial.
• Usar percentual de casos que não estão em falta - o algoritmo usa o
percentual de casos que não estão em falta, classificados para encontrar
um substituto potencial.
Substituto máximo
Insira o número máximo de substitutos a ser retido em cada nó de uma
árvore.
9.1.4.3 HANA R de árvore CNR
Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas
com base em outra variáveis. No entanto, você pode usar este algoritmo para identificar tendências
nos dados.
Observação:
•
•
•
62
O pacote "rpart" que faz parte do R 2.15 não processa nomes de coluna com espaço nem caracteres
especiais. O pacote "rpart" suporta apenas formato de nome de coluna de entrada suportado pelo
dataframe R.
Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos de
coluna independente usados durante a criação do modelo.
Nomes de coluna que contenham espaços ou qualquer outro caractere especial diferente de ponto
(.) não são suportados.
2013-01-31
Propriedades do componente
Propriedades do algoritmo HANA R de árvore CNR
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
• Preencher: preenche os valores em falta na coluna de destino.
Colunas independentes Selecione as colunas de origem de entrada.
Coluna dependente
Selecione a coluna de destino.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores em
falta na coluna independente ou dependente.
• Manter: retém os valores em falta.
• Parar: o algoritmo para a execução se um valor estiver em falta na coluna
independente ou na coluna dependente.
Método
Selecione o tipo de regra de repartição.
Valores possíveis:
• Classificação: use este método se a variável dependente tiver valores
de categoria.
• Regressão: use este método se a variável dependente tiver valores
contínuos.
Divisão mínima
Insira um número mínimo de observações necessário para divisão de um
nó.
Critérios de divisão
Selecione os critérios de divisão do nó.
Valores possíveis:
• Gini: impureza Gini
• Informações: ganho de informações.
63
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
Nome da coluna
prevista
Insira um nome para a coluna recém criada que contenha os valores
previstos.
Parâmetro de
complexidade
Insira o parâmetro de complexidade para economizar o tempo de
computação, evitando qualquer divisão que não melhore o ajuste.
2013-01-31
Propriedades do componente
Profundidade máxima
Insira o nível máximo do nó na árvore final com o nó raiz computado como
nível 0.
Observação:
Se a profundidade máxima for maior que 30, o algoritmo não produz os
resultados esperados (em máquinas de 32 bits).
Validação cruzada
Insira o número de validações cruzadas. Um valor maior de validação
cruzada aumenta o tempo de computação e produz resultados mais
precisos.
Probabilidade
prioritária
Insira o vetor de probabilidades prioritárias.
Utilizar substituto
Selecione o substituto para usar no processo de repartição.
Valores possíveis:
• Exibir apenas - uma observação com um valor em falta para a regra de
divisão primária não será enviada aos níveis inferior da árvore.
• Utilizar substituto - use esta opção para repartir objetos sem a variável
principal; se todos os substitutos estiverem em falta, a observação não
será dividida.
• Interromper se estiver em falta - se todos os substitutos estiverem em
falta, a observação será enviada na direção majoritária.
Estilo de substituto
Insira o estilo que controla a seleção do melhor substituto.
Valores possíveis:
• Usar classificação correta total - o algoritmo usa o número total de
classificações corretas para encontrar uma variável substituta potencial.
• Usar percentual de casos que não estão em falta - o algoritmo usa o
percentual de casos que não estão em falta, classificados para encontrar
um substituto potencial.
Substituto máximo
Insira o número máximo de substitutos a ser retido em cada nó de uma
árvore.
9.1.5 Rede neural
9.1.5.1 R de rede neural MONMLP
64
2013-01-31
Propriedades do componente
Use este algoritmo para previsão, classificação e reconhecimento de padrão estatístico usando as
funções da biblioteca R.
Observação:
R não suporta armazenamento PMML para rede neural MONMLP.
Propriedades do algoritmo R de rede neural MONMLP
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Tendência: prevê os valores da coluna dependente e
adiciona uma coluna extra na saída que contenha os valores
previstos.
• Preencher: preenche os valores em falta na coluna de
destino.
Colunas independentes
Selecione as colunas de origem de entrada.
Coluna dependente
Selecione a coluna de destino.
Neurônios da camada1 oculta
Insira o número de nós/neurônios na primeira camada oculta
(hidden1).
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta
opção. Para salvar, você precisa inserir um nome e uma
descrição para o modelo.
Nome da coluna prevista
Insira um nome para a coluna recém criada que contenha os
valores previstos.
Função de transferência de camada Selecione a função de ativação a ser usada para a camada
oculta
oculta (Th).
Função de transferência de camada Selecione a função de ativação a ser usada para a camada de
de saída
saída (To).
Derivativo de função de
transferência de camada oculta
Selecione o derivativo da função de ativação de camada oculta
(Th.prime).
Derivativo de função de
Selecione o derivativo da função de ativação de camada de
transferência de camada de saída saída (To.prime).
65
Neurônios da camada2 oculta
Insira o número de nós/neurônios na segunda camada oculta
(hidden2).
Iterações máximas
Insira o número máximo de iterações para o algoritmo de
otimização (iter.max).
Colunas com monotonicidade
Insira os índices de coluna à qual você deseja aplicar a restrição
de monotonicidade (monotone).
Iterações de treinamento
Insira o número de iterações de treinamento após as quais o
cálculo da função de custos será interrompido (iter.stopped).
Pesos iniciais
Insira um vetor de peso inicial (init.weights).
2013-01-31
Propriedades do componente
Exceções máximas
Insira o número máximo de exceções para a rotina de
otimização (max.exceptions).
Escalar coluna dependente
Para escalar colunas dependentes até a média zero e variação
unitária antes do ajuste, selecione Verdadeiro (scale.y)
Agregação bootstrap necessária
Para usar a agregação bootstrap, selecione Verdadeiro (bag).
Testes para evitar mínimos locais Insira o número de testes repetidos para evitar mínimos locais
(n.trials).
Número de membros do conjunto Insira o número de membros do conjunto a serem ajustados
(n.ensemble)
9.1.5.2 R de rede neural NNet
Use este algoritmo para previsão, classificação e reconhecimento de padrão estatístico usando as
funções da biblioteca R.
Propriedades do algoritmo R de rede neural NNet
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Valores possíveis:
• Tendência: prevê os valores da coluna dependente e adiciona uma
coluna extra na saída que contenha os valores previstos.
• Preencher: preenche os valores em falta na coluna de destino.
Colunas independentes Selecione as colunas de origem de entrada.
Coluna dependente
Selecione a coluna de destino.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores
em falta na coluna independente ou dependente.
• Manter: o algoritmo retém os valores em falta para processamento.
• Parar: o algoritmo para se um valor estiver em falta na coluna
independente ou na coluna dependente.
Neurônios da camada
oculta
Insira o número de nós/neurônios na camada oculta.
Nome da coluna prevista Insira um nome para a coluna recém criada que contenha os valores
previstos.
Tipo
66
Selecione o tipo de análise a ser realizada pelo algoritmo.
2013-01-31
Propriedades do componente
Ignorar camada oculta
Para adicionar conexões skip-layer da entrada para a saída, selecione
Verdadeiro.
Saída linear
Para obter uma saída linear, selecione Verdadeiro. Se você selecionar o
tipo de análise Classificação, este valor deve ser verdadeiro.
Usar Softmax
Selecione Verdadeiro para utilizar os ajustes "modelo de log linear" e
"probabilidade condicional máxima".
linout, entropy, softmax e censored são mutuamente excludentes.
Usar entropia
Para utilizar o ajuste de "probabilidade condicional máxima", selecione
Verdadeiro. Por padrão, o algoritmo usa o método dos mínimos quadrados.
Valores possíveis:
• Verdadeiro: use o ajuste "probabilidade condicional máxima".
• Falso: use o método dos mínimos quadrados.
Usar Censored
Para softmax, uma linha de (0,1,1) indica um exemplo das classes 2 e 3,
mas para censored, indica um exemplo das classes 2 ou 3.
Intervalo
Insira pesos iniciais aleatórios [-rang, rang]. Defina este valor como 0,5
a menos que a entrada seja grande. Se a entrada for grande, escolha o
'rang' usando a fórmula rang * max(|x|) <= 1
Decaimento de peso
Insira um valor usado para cálculo de novos pesos (weight decay).
Iterações máximas
Insira o número máximo de iterações permitidas.
Matriz hessiana
necessária
Para retornar uma medida hessiana no melhor conjunto de pesos,
selecione Verdadeiro.
Pesos máximos
Insira o número máximo de pesos permitidos no cálculo.
Não existe limite intrínseco no código, mas o aumento no número de
pesos pode permitir ajustes que serão bem lentos e demorados.
67
Abstol
Insira o valor que indica o ajuste perfeito (abstol).
Reltol
O algoritmo termina se o otimizador não puder reduzir os critérios de
ajuste pelo fator: 1 - reltol
Contrastes
Insira a lista de contrastes a ser usada para fatores que aparecem como
variáveis no modelo.
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção. Para
salvar, você precisa inserir um nome e uma descrição para o modelo.
2013-01-31
Propriedades do componente
9.1.6 Clustering
9.1.6.1 HANA de valor médio K
Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento
anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como
parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da
observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters.
Observação:
•
•
Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o
algoritmo HANA de valor médio K. No entanto, as observações em cada cluster permanecem iguais.
A criação de modelos usando o algoritmo HANA de valor médio K não é suportada.
Propriedades do algoritmo HANA de valor médio K
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Colunas independentes
Selecione as colunas de origem de entrada.
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores
em falta na coluna independente ou dependente.
• Ignorar: o algoritmo ignora o registro que contenha valores em
falta durante o cálculo. No entanto, os registros são retidos na
tabela de resultados.
• Parar: o algoritmo para a execução se um valor estiver em falta
na coluna independente ou na coluna dependente.
Número de clusters
Insira o número de grupos para clustering.
Nome do cluster
Insira um nome para a coluna recém criada que contenha o nome do
cluster.
Iterações máximas
Insira o número de iterações permitido para localização de clusters.
Método de cálculo do centro Selecione o método a ser usado para cálculo inicial do centro do
cluster.
68
Normalização
Para normalizar os dados, selecione Verdadeiro.
Número de threads
Insira o número de threads a ser usado na execução.
2013-01-31
Propriedades do componente
Limite de saída
Insira o valor limite para a saída das iterações.
9.1.6.2 R de valor médio K
Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento
anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como
parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da
observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters.
Observação:
•
•
Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o
algoritmo R de valor médio K. No entanto, as observações em cada cluster permanecem iguais.
A criação de modelos usando o algoritmo R de valor médio K não é suportada.
Propriedades do algoritmo R de valor médio K
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Colunas independentes
Selecione as colunas de origem de entrada.
Número de clusters
Insira o número de grupos para clustering.
Nome do cluster
Insira um nome para a coluna recém criada que contenha o nome
do cluster.
Iterações máximas
Insira o número de iterações permitido para localização de
clusters.
Número de conjuntos iniciais
Insira o número de conjuntos iniciais aleatórios para clustering
(n inicial).
Algoritmo
Selecione o tipo de algoritmo a ser usado para execução de
clustering de valores médios K.
9.1.6.3 HANA R de valor médio K
Use este algoritmo para formar grupos de observações relacionadas sem qualquer conhecimento
anterior das relações. O algoritmo agrupa observações em grupos k, em que k é fornecido como
parâmetro de entrada. O algoritmo atribui cada observação a clusters com base na proximidade da
observação com o valor médio do cluster. O processo continua até ocorrer a convergência dos clusters.
Observação:
•
69
Você poderá obter um número diferente de clusters para cada cluster toda vez que executar o
algoritmo R de valor médio K. No entanto, as observações em cada cluster permanecem iguais.
2013-01-31
Propriedades do componente
•
A criação de modelos usando o algoritmo HANA R de valor médio K não é suportada.
Propriedades do HANA R de valor médio K
Modo de saída
Selecione o modo em que você deseja exibir os dados de saída.
Colunas independentes
Selecione as colunas de origem de entrada.
Número de clusters
Insira o número de grupos para clustering.
Nome do cluster
Insira um nome para a coluna recém criada que contenha o nome
do cluster.
Iterações máximas
Insira o número de iterações permitido para localização de
clusters.
Número de conjuntos iniciais
Insira o número de conjuntos iniciais aleatórios para clustering
(n inicial).
Algoritmo
Selecione o tipo de algoritmo a ser usado para execução de
clustering de valores médios K.
9.1.7 Associação
9.1.7.1 HANA apriori
Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados
transacionais volumosos para gerar regras de associação. Este algoritmo é usado para identificar quais
produtos e serviços os clientes tendem a adquirir simultaneamente. Analisando as tendências de
compra dos clientes com a análise de associação, você pode prever o comportamento futuro.
Por exemplo, a informação de que o cliente que compra sapatos tende mais a comprar meias ao
mesmo tempo pode ser representada nesta regra de associação (com um suporte mínimo e uma
confiança mínima): Sapatos=> Meias [suporte = 0,5, confiança = 0,1]
Propriedades do algoritmo HANA apriori
70
Colunas de item
Selecione as colunas que contenham os itens que você deseja aplicar
ao algoritmo.
Coluna de TransactionID
Selecione a coluna que contenha os IDs de transação que você deseja
aplicar ao algoritmo.
2013-01-31
Propriedades do componente
Valores em falta
Selecione o método para manipulação dos valores em falta.
Valores possíveis:
• Remover: o algoritmo ignora os registros que contenham os valores
em falta na coluna independente ou dependente.
• Manter: o algoritmo retém os valores em falta para processamento.
Suporte
Insira um valor para o suporte mínimo de um item.
Confiança
Insira um valor para a confiança mínima de regras/associação
Pré-regra
Insira um nome para a nova coluna que contenha o (LE) antecedente
da regra apriori para o conjunto de dados informado.
Pós-regra
Insira um nome para a nova coluna que contenha o (LD) consequente
da regra apriori para o conjunto de dados informado.
Valores de suporte
Insira um nome para a nova coluna que contenha o suporte para as
regras correspondentes.
Valores de confiança
Insira um nome para a nova coluna que contenha valores de confiança
para as regras correspondentes.
Valores de aumento
Insira um nome para a nova coluna que contenha valores de aumento
para as regras correspondentes.
Número de threads
Insira o número de threads a ser usado na execução.
9.1.7.2 R apriori
Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados
transacionais volumosos para gerar regras de associação usando o pacote R "arules". Este algoritmo
é usado para identificar quais produtos e serviços os clientes tendem a adquirir simultaneamente.
Analisando as tendências de compra dos clientes com uma análise de associação, o comportamento
futuro pode ser previsto.
Por exemplo, a informação de que o cliente que compra sapatos tende mais a comprar meias ao
mesmo tempo pode ser representada nesta regra de associação (com um suporte mínimo e uma
confiança mínima): Sapatos=> Meias [suporte = 0,5, confiança = 0,1]
Propriedades do algoritmo R apriori
71
Modo de saída
Selecione o modo de exibição da saída.
Formato de entrada
Selecione o formato dos dados de entrada.
Colunas de item
Selecione as colunas que contenham os itens que você deseja aplicar
ao algoritmo.
2013-01-31
Propriedades do componente
72
Coluna de TransactionID
Selecione a coluna que contenha os IDs de transação que você deseja
aplicar ao algoritmo.
Suporte
Insira um valor para o suporte mínimo de um item.
Confiança
Insira um valor para a confiança mínima de regras/associação
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção.
Para salvar, você precisa inserir um nome e uma descrição para o
modelo.
Regras
Insira um nome para a nova coluna que contenha as regras apriori
para o conjunto de dados informado.
Valores de suporte
Insira um nome para a nova coluna que contenha o suporte para as
regras correspondentes.
Valores de confiança
Insira um nome para a nova coluna que contenha valores de confiança
para as regras correspondentes.
Valores de aumento
Insira um nome para a nova coluna que contenha valores de aumento
para as regras correspondentes.
ID da transação
Insira um nome para a nova coluna que contenha o ID de transação.
Itens
Insira um nome para a nova coluna que contenha os nomes dos itens.
Regras correspondentes
Insira um nome para a nova coluna que contenha as regras
correspondentes.
Item(ns) LE
Insira etiquetas separadas por vírgula para os itens que aparecem à
esquerda das regras ou dos conjuntos de itens.
Item(ns) LD
Insira etiquetas separadas por vírgula para os itens que aparecem à
direita das regras ou dos conjuntos de itens.
Ambos os itens
Insira etiquetas separadas por vírgula para os itens que aparecem
em ambos os lados das regras ou dos conjuntos de itens.
Nenhum item
Insira etiquetas separadas por vírgula para os itens que não precisam
aparecer nas regras ou nos conjuntos de itens.
Aparência padrão
Insira a aparência padrão dos itens não mencionados explicitamente.
Classificar itens
Selecione a opção de classificação para classificar os itens por
frequência.
Filtrar itens
Insira um valor numérico indicando como filtrar os itens não usados
das transações.
Visão de árvore
Para organizar transações como árvore de prefixos, selecione
Verdadeiro.
Usar HeapSort
Para usar heapsort em vez de quicksort para classificar as transações,
selecione Verdadeiro.
Minimizar memória
Para minimizar o uso da memória em vez de maximizar a velocidade,
selecione Verdadeiro.
2013-01-31
Propriedades do componente
Carregar transação
Para carregar transações na memória, selecione Verdadeiro.
9.1.7.3 HANA R apriori
Use este algoritmo para identificar padrões frequentes de conjuntos de itens em conjuntos de dados
transacionais volumosos para gerar regras de associação usando o pacote R "arules". Este algoritmo
é usado para identificar quais produtos e serviços os clientes tendem a adquirir simultaneamente.
Analisando as tendências de compra dos clientes com uma análise de associação, o comportamento
futuro pode ser previsto.
Por exemplo, a informação de que o cliente que compra sapatos tende mais a comprar meias ao
mesmo tempo pode ser representada nesta regra de associação (com um suporte mínimo e uma
confiança mínima): Sapatos=> Meias [suporte = 0,5, confiança = 0,1]
Propriedades do algoritmo HANA R apriori
73
Modo de saída
Selecione o modo de exibição da saída.
Formato de entrada
Selecione o formato dos dados de entrada.
Colunas de item
Selecione as colunas que contenham os itens que você deseja aplicar
ao algoritmo.
Coluna de TransactionID
Selecione a coluna que contenha os IDs de transação que você deseja
aplicar ao algoritmo.
Suporte
Insira um valor para o suporte mínimo de um item.
Confiança
Insira um valor para a confiança mínima de regras/associação
Salvar o modelo
Se você quiser salvar o estado do algoritmo, selecione esta opção.
Para salvar, você precisa inserir um nome e uma descrição para o
modelo.
Regras
Insira um nome para a nova coluna que contenha as regras apriori
para o conjunto de dados informado.
Valores de suporte
Insira um nome para a nova coluna que contenha o suporte para as
regras correspondentes.
Valores de confiança
Insira um nome para a nova coluna que contenha valores de confiança
para as regras correspondentes.
Valores de aumento
Insira um nome para a nova coluna que contenha valores de aumento
para as regras correspondentes.
ID da transação
Insira um nome para a nova coluna que contenha o ID de transação.
Itens
Insira um nome para a nova coluna que contenha os nomes dos itens.
2013-01-31
Propriedades do componente
Regras correspondentes
Insira um nome para a nova coluna que contenha as regras
correspondentes.
Item(ns) LE
Insira etiquetas separadas por vírgula para os itens que aparecem à
esquerda das regras ou dos conjuntos de itens.
Item(ns) LD
Insira etiquetas separadas por vírgula para os itens que aparecem à
direita das regras ou dos conjuntos de itens.
Ambos os itens
Insira etiquetas separadas por vírgula para os itens que aparecem
em ambos os lados das regras ou dos conjuntos de itens.
Nenhum item
Insira etiquetas separadas por vírgula para os itens que não precisam
aparecer nas regras ou nos conjuntos de itens.
Aparência padrão
Insira a aparência padrão dos itens não mencionados explicitamente.
Classificar itens
Selecione a opção de classificação para classificar os itens por
frequência.
Filtrar itens
Insira um valor numérico indicando como filtrar os itens não usados
das transações.
Visão de árvore
Para organizar transações como árvore de prefixos, selecione
Verdadeiro.
Usar HeapSort
Para usar heapsort em vez de quicksort para classificar as transações,
selecione Verdadeiro.
Minimizar memória
Para minimizar o uso da memória em vez de maximizar a velocidade,
selecione Verdadeiro.
Carregar transação
Para carregar transações na memória, selecione Verdadeiro.
9.1.8 Classificação
9.1.8.1 HANA KNN
Use este componente para classificar os objetos com base nos dados de amostra treinados. No KNN,
os objetos são classificados pela maioria dos votos da vizinhança.
Propriedades do algoritmo HANA KNN
Colunas independentes
74
Selecione as colunas de origem de entrada.
2013-01-31
Propriedades do componente
Contagem da vizinhança
Insira o número de vizinhos a ser considerado para determinar
distâncias.
Tipo de votação
Selecione o tipo de votação.
Valores em falta
Selecione o método para manipulação dos valores em falta.
• Remover: o algoritmo ignora os registros que contenham os
valores em falta na coluna independente ou dependente.
• Manter: o algoritmo considera os valores em falta para
processamento.
• Parar: o algoritmo para a execução se um valor estiver em falta
na coluna independente ou na coluna dependente.
Nome do esquema
Insira o esquema que contenha os dados treinados.
Nome da tabela
Insira a tabela que contenha os dados treinados.
Colunas independentes
Insira as colunas de entrada a serem consideradas no treinamento
dos dados.
Coluna dependente
Insira a coluna de saída a ser considerada no treinamento dos
dados.
Número de threads
Insira o número de threads a ser usado na execução.
Nome da coluna prevista
Insira um nome para a nova coluna que contenha os valores de
classificação.
9.2 Componentes de preparação de dados
Use os componentes de preparação de dados para preparar os dados para análise. Os componentes
são opcionais.
9.2.1 Fórmula
Use este componente para aplicar funções e operadores predefinidos aos dados. Todas as funções
e expressões, exceto as funções de manipulação de dados, adicionam uma nova coluna com o resultado
da fórmula.
Observação:
•
75
Ao inserir uma string literal que contenha aspas simples, cada aspa dentro da string literal deve ser
acompanhada de uma barra invertida. Por exemplo, insira 'Customer's' como 'Customer\'s'.
2013-01-31
Propriedades do componente
•
Ao inserir o nome de uma coluna que contenha colchetes, cada colchete dentro do nome da coluna
deve ser acompanhada de uma barra invertida. Por exemplo, insira [Customer[Age]] como
[Customer\[Age\]].
Propriedades da fórmula
Nome
Insira um nome para a nova coluna criada aplicando a fórmula.
Expressão
Insira a fórmula que você deseja aplicar. Por exemplo, Average([Age]).
Exemplo: Calculando a idade média dos funcionários
Tabela Employee:
Emp ID (ID
do funcionário)
Emp Name
(Nome do funcionário)
DOB (Data de
nascimento)
Date of Joining
(Data de conAge (Idade) tratação)
Date of Confirmation
(Data de confirmação)
1
Laura
11/11/1986
25
12/9/2005
27/11/2005
2
Desy
12/5/1981
30
24/6/2000
10/7/2000
3
Alex
30/5/1978
33
10/10/1998
24/12/1998
4
John
6/6/1979
32
2/12/1999
20/12/1999
1. Arraste o componente Fórmula até o editor de análise.
2. Na visão de propriedades, insira um nome para a fórmula.
Por exemplo, Average_Age.
3. No campo Expressão, insira a fórmula: AVERAGE([Age])
4. Selecione Validar e aplicar para validar a sintaxe da fórmula.
Tabela de saída:
76
2013-01-31
Propriedades do componente
Emp ID (ID Emp Name DOB (Data
do fun(Nome do
de nasci- Age
cionário) funcionário) mento)
(Idade)
Date of Joining
(Data de contratação)
Date of Confirmation
(Data de confirAvermação)
age_Age
1
Laura
11/11/1986 25
12/9/2005
27/11/2005
30
2
Desy
12/5/1981 30
24/6/2000
10/7/2000
30
3
Alex
30/5/1978 33
10/10/1998
24/12/1998
30
4
John
6/6/1979
2/12/1999
20/12/1999
30
32
Funções suportadas
Categoria Função (Função aplicada à tabela Employee) Descrição
Data
DAYSBETWEEN
Retorna o número de dias entre duas datas.
CURRENTDATE
Retorna a data atual do sistema.
MONTHSBETWEEN
Retorna o número de meses entre duas
datas.
Por exemplo, a nova coluna contém 2,0,2,0
quando a função MONTHSBETWEEN([Date
of Joining],[Date of Confirmation]) é aplicada
à tabela Employee.
DAYNAME
Retorna o nome do dia em formato de string.
Por exemplo, a nova coluna contém Monday,
Saturday, Saturday, Thursday quando a
função DAYNAME([Date of Joining]) é aplicada à tabela Employee.
DAYNUMBEROFMONTH
Retorna o número do dia de um mês específico.
Por exemplo, 12/11/1980 retorna 12.
DAYNUMBEROFWEEK
Retorna o número do dia de uma semana.
Por exemplo, Sunday =1, Monday=2.
DAYNUMBEROFYEAR
Retorna o número do dia de um ano.
Por exemplo, 1st Jan =1, 1st Feb=32, 3rd
Feb=34.
LASTDATEOFWEEK
Retorna a data do último dia de uma semana.
Por exemplo, 12/9/2005 retorna 17/9/2005
77
2013-01-31
Propriedades do componente
Categoria Função (Função aplicada à tabela Employee) Descrição
LASTDATEOFMONTH
Retorna a data do último dia de um mês.
Por exemplo, 12/9/2005 retorna 30/9/2005
MONTHNUMBEROFYEAR
Retorna o número do mês de uma data.
Por exemplo, Jan=1, Feb=2, Mar=3
WEEKNUMBEROFYEAR
Retorna o número da semana de um ano.
Por exemplo, 12/9/2005 retorna 38.
QUARTERNUMBEROFDATE
Retorna o número do trimestre de uma data.
Por exemplo, 12/9/2005 retorna 3.
String
CONCAT
Concatena duas strings.
Por exemplo, CONCAT('USA', 'Australia')
retorna USAAustralia.
INSTRING
Retorna verdadeiro - se a string de pesquisa
for encontrada na string de origem.
Por exemplo, INSTRING('USA', 'US') retorna
verdadeiro.
SUBSTRING
Retorna uma substring da string de origem.
Por exemplo, SUBSTRING('USA', 1,2) retorna US.
STRLEN
Matemáti- MAX
ca
Manipulação de
dados
78
Retorna o número de caracteres na string
de origem. Por exemplo, STRLEN('Australia')
retorna 9.
Retorna o valor máximo de uma coluna.
MIN
Retorna o valor mínimo de uma coluna.
COUNT
Retorna o número de valores de uma coluna.
SUM
Retorna a soma dos valores de uma coluna.
AVERAGE
Retorna a média dos valores de uma coluna.
@REPLACE
Executa a substituição de uma string no local.
Por exemplo, @REPLACE([country],'USA',
'AMERICA') substitui USA por AMERICA na
coluna de países.
2013-01-31
Propriedades do componente
Categoria Função (Função aplicada à tabela Employee) Descrição
@BLANK
Substitui os valores em branco por um valor
específico.
Por exemplo, @BLANK([country], 'USA')
substitui todos os valores em branco por
USA na coluna de países.
@SELECT
Seleciona linhas que satisfaçam a condição
dada. Você pode usar qualquer operador
condicional para especificar a condição.
Por exemplo, @SELECT([country]=='USA')
seleciona linhas cujo país seja igual a USA.
Expressão
condicional
IF(condição) THEN(expressão de string/ex- Verifica se a condição é cumprida e retorna
pressão matemática/expressão condicional) um valor se 'verdadeiro' e outro valor se 'falELSE(expressão de string/expressão
so'.
matemática/expressão condicional)
Por exemplo, IF([Date of Joining]>12/9/2005)
THEN ('Funcionário contratado após
12/09/2005') ELSE ('Funcionário contratado
em ou antes de 12/09/2005')
Observação:
Expressões matemáticas contendo funções que retornem valor numérico não são suportadas. Por
exemplo, a expressão DAYNUMBEROFMONTH(CURRENTDATE())+2 não é suportada porque
DAYNUMBEROFMONTH retorna um valor numérico.
Operadores matemáticos
Use operadores matemáticos para criar fórmulas contendo colunas numéricas e/ou números. Por
exemplo, a expressão [Age] + 1 adiciona uma nova coluna com os valores 26, 31, 34, 33.
79
Operadores matemáticos
Descrição
+
Operador de adição
-
Operador de subtração
*
Operador de multiplicação
/
Operador de divisão
()
Parêntesis
2013-01-31
Propriedades do componente
Operadores matemáticos
Descrição
^
Operador de potência
%
Operador de módulo
E
Operador de exponencial
Operadores condicionais
Use os operadores condicionais para criar expressões IF THEN ELSE ou SELECT.
Operadores condicionais
Descrição
==
Igual a
!=
Diferente de
<
Menor que
>
Maior que
<=
Menor que ou igual a
>=
Maior que ou igual a
Operadores lógicos
Use operadores lógicos para comparar duas condições e retornar 'verdadeiro' ou 'falso'. Por exemplo,
IF([Date of Joining]>12/9/2005 && [Age] >=25 ) THEN ('Verdadeiro') ELSE ('Falso') adiciona uma nova
coluna com os valores Verdadeiro, Falso, Falso, Falso.
Operadores lógicos
Descrição
&&
AND
||
OR
9.2.2 Amostra
Use este componente para selecionar um subconjunto de dados de conjuntos de dados volumosos.
O componente Amostra suporta estes tipos de amostra:
• Primeiro N: seleciona o primeiro registro N do conjunto de dados.
• Último N: seleciona o último registro N do conjunto de dados.
• Todos os N: seleciona todo n-ésimo registro do conjunto de dados, em que N representa um intervalo.
Por exemplo, se N=2, o 2º, 4º, 6º e 8º registros são selecionados e assim por diante.
80
2013-01-31
Propriedades do componente
•
•
Aleatório simples: seleciona aleatoriamente os registros de N tamanho ou N percentual de registros
de um conjunto de dados.
Aleatório sistemático: neste tipo de amostra, os intervalos ou os subgrupos numéricos de amostra
são criados com base no tamanho do subgrupo numérico. O componente Amostra seleciona
aleatoriamente o n-ésimo registro do primeiro subgrupo numérico e o n-ésimo registro de cada
subgrupo numérico subsequente.
Propriedades da amostra
Tipo de amostragem
Selecione o tipo de amostragem.
Limitar linhas por
Selecione o método para limitação das linhas.
Número de linhas
Insira o número de linhas a serem selecionadas.
Percentual de linhas
Insira o percentual de linhas a serem selecionadas.
Tamanho do subgrupo numérico
Insira o tamanho do subgrupo numérico no qual será
selecionada uma linha aleatória.
Intervalo
Insira o intervalo entre as linhas a serem selecionadas.
Máximo de linhas
Insira o número máximo de linhas a serem selecionadas.
Exemplo: Selecionando um subconjunto de dados de um conjunto de dados informado
Emp ID (ID do funcionário)
Emp Name (Nome do funcionário)
DOB (Data de nascimento)
Age (Idade)
1
Laura
11/11/1986
25
2
Desy
12/5/1981
30
3
Alex
30/5/1978
33
4
John
6/6/1979
32
5
Ted
4/7/1987
24
6
Tom
30/6/1970
41
7
Anna
24/6/1965
46
8
Valerie
6/7/1990
21
9
Mary
19/9/1985
26
10
Martin
21/11/1986
25
1. Primeiro N: para N=5
81
2013-01-31
Propriedades do componente
Emp ID (ID do funcionário)
Emp Name (Nome do
funcionário)
DOB (Data de nascimento)
Age (Idade)
1
Laura
11/11/1986
25
2
Desy
12/5/1981
30
3
Alex
30/5/1978
33
4
John
6/6/1979
32
5
Ted
4/7/1987
24
2. Último N: para N=4
Emp ID (ID do funcionário)
Emp Name (Nome do fun- DOB (Data de nascicionário)
mento)
Age (Idade)
7
Anna
24/6/1965
46
8
Valerie
6/7/1990
21
9
Mary
19/9/1985
26
10
Martin
21/11/1986
25
3. Todos os N: intervalo=3
Emp ID (ID do funcionário)
Emp Name (Nome do fun- DOB (Data de nascicionário)
mento)
Age (Idade)
3
Alex
30/5/1978
33
6
Tom
30/6/1970
41
9
Mary
19/9/1985
26
4. Aleatório simples: para número de linhas=2
Quaisquer duas linhas pode ser o resultado.
Emp ID (ID do funcionário)
Emp Name (Nome do fun- DOB (Data de nascicionário)
mento)
Age (Idade)
7
Anna
24/6/1965
46
8
Valerie
6/7/1990
21
5. Aleatório sistemático: tamanho do subgrupo numérico=4
82
2013-01-31
Propriedades do componente
Emp ID (ID do funcionário)
Emp Name (Nome do fun- DOB (Data de nascicionário)
mento)
Age (Idade)
2
Desy
12/5/1981
30
6
Tom
30/6/1970
41
10
Martin
21/11/1986
25
ou
Emp ID (ID do funcionário)
Emp Name (Nome do fun- DOB (Data de nascicionário)
mento)
Age (Idade)
1
Laura
11/11/1986
25
5
Ted
4/7/1987
24
9
Mary
19/9/1985
26
9.2.3 Definição de tipo de dados
Use este componente para alterar o nome, o tipo de dados e o formato de data da coluna de origem.
A definição do tipo de dados facilita a preparação dos dados para torná-los adequados para uma
análise posterior.
Por exemplo,
• Se o nome da coluna na fonte de dados for "des", isso pode não ficar claro durante a análise. Na
análise, você pode alterar o nome da coluna para "Designação", para que o usuário final entenda
facilmente.
• Se a data estiver armazenada no formato mmddaa (120201, sem qualquer separador de datas), o
sistema pode interpretá-la como um valor inteiro. Usando o componente de definição de tipo de
dados, você pode alterar o formato da data para qualquer formato válido, como mm/dd/aaaa ou
dd/mm/aaaa e assim por diante.
Para alterar o nome, o tipo de dados e o formato da data da coluna de origem, siga estes procedimentos:
1. Adicione na análise o componente de definição de tipo de dados.
2. Clique no componente com o botão direito do mouse e selecione Configurar propriedades.
3. Para alterar o nome da coluna, insira um nome do alias para a coluna de origem solicitada.
4. Para alterar o tipo de dados da coluna, selecione o tipo de dados solicitado para a coluna de origem.
83
2013-01-31
Propriedades do componente
9.2.4 Filtro
Use este componente para filtrar linhas e colunas com base em uma condição específica.
Observação:
•
•
O componente de filtro no banco de dados não suporta funções e expressões avançadas.
Se você alterar a fonte de dados após configurar o componente de filtro, este ainda reterá os filtros
de linha anteriormente definidos.
Propriedades do filtro
Colunas selecionadas
Selecione as colunas para análise.
Condição de filtro
Insira as condições de filtro.
Exemplo: Filtre a coluna "Store" da fonte de dados e aplique a condição "Profit >2000".
Loja
Receita bruta
Lucro
Land Mark
10000
1000
Spencer
20000
4500
Soch
25000
8000
1. Desmarque a coluna "Store" das colunas selecionadas.
2. No painel Filtro da linha, selecione a coluna Lucro.
3. Na opção Selecionar do intervalo, insira 2000 na caixa de texto De. A caixa de texto Até deve
ficar em branco.
4. Selecione OK.
5. Selecione Salvar e fechar.
6. Execute a análise.
Receita bruta
Lucro
20000
4500
25000
8000
Observação:
O componente de filtro suporta apenas expressões que retornem resultado booleano.
Por exemplo, na tabela Employee abaixo:
84
2013-01-31
Propriedades do componente
Emp ID (ID
do funcionário)
Emp Name (Nome DOB (Data de
do funcionário)
nascimento)
Date of Joining
(Data de conAge (Idade) tratação)
Date of Confirmation
(Data de confirmação)
1
Laura
11/11/1986
25
12/9/2005
27/11/2005
2
Desy
12/5/1981
30
24/6/2000
10/7/2000
3
Alex
30/5/1978
33
10/10/1998
24/10/1998
4
John
6/6/1979
32
2/12/1999
20/12/1999
•
•
A expressão DAYSBETWEEN([Date of Joining],[Date of Confirmation]) não é uma expressão de
filtro válida porque retorna um valor numérico. O uso correto da expressão DAYSBETWEEN no
filtro é DAYSBETWEEN([Date of Joining],[Date of Confirmation]) == 14. Essa expressão seleciona
as linhas em que o número de dias entre "Date of Joining" e "Date of Confirmation" seja 14. No
caso da tabela de funcionários acima, a terceira linha será selecionada.
DAYNAME([Date of Joining]) == 'Saturday' seleciona a segunda e terceira linhas da tabela de
funcionários.
Observação:
•
•
Ao inserir uma string literal que contenha aspas simples, cada aspa dentro da string literal deve ser
acompanhada de uma barra invertida. Por exemplo, insira 'Customer's' como 'Customer\'s'.
Ao inserir o nome de uma coluna que contenha colchetes, cada colchete dentro do nome da coluna
deve ser acompanhada de uma barra invertida. Por exemplo, insira [Customer[Age]] como
[Customer\[Age\]].
Funções suportadas
Observação:
O componente de filtro não suporta funções de manipulação de dados.
Categoria Função (Função aplicada à tabela Employee) Descrição
Data
DAYSBETWEEN
Retorna o número de dias entre duas datas.
CURRENTDATE
Retorna a data atual do sistema.
MONTHSBETWEEN
Retorna o número de meses entre duas
datas.
Por exemplo, a nova coluna contém 2,0,2,0
quando a função MONTHSBETWEEN([Date
of Joining],[Date of Confirmation]) é aplicada
à tabela Employee.
DAYNAME
Retorna o nome do dia em formato de string.
Por exemplo, a nova coluna contém Monday,
Saturday, Saturday, Thursday quando a
função DAYNAME([Date of Joining]) é aplicada à tabela Employee.
85
2013-01-31
Propriedades do componente
Categoria Função (Função aplicada à tabela Employee) Descrição
DAYNUMBEROFMONTH
Retorna o número do dia de um mês específico.
Por exemplo, 12/11/1980 retorna 12.
DAYNUMBEROFWEEK
Retorna o número do dia de uma semana.
Por exemplo, Sunday =1, Monday=2.
DAYNUMBEROFYEAR
Retorna o número do dia de um ano.
Por exemplo, 1st Jan =1, 1st Feb=32, 3rd
Feb=34.
LASTDATEOFWEEK
Retorna a data do último dia de uma semana.
Por exemplo, 12/9/2005 retorna 17/9/2005
LASTDATEOFMONTH
Retorna a data do último dia de um mês.
Por exemplo, 12/9/2005 retorna 30/9/2005
MONTHNUMBEROFYEAR
Retorna o número do mês de uma data.
Por exemplo, Jan=1, Feb=2, Mar=3
WEEKNUMBEROFYEAR
Retorna o número da semana de um ano.
Por exemplo, 12/9/2005 retorna 38.
QUARTERNUMBEROFDATE
Retorna o número do trimestre de uma data.
Por exemplo, 12/9/2005 retorna 3.
String
CONCAT
Concatena duas strings.
Por exemplo, CONCAT('USA', 'Australia')
retorna USAAustralia.
INSTRING
Retorna verdadeiro - se a string de pesquisa
for encontrada na string de origem.
Por exemplo, INSTRING('USA', 'US') retorna
verdadeiro.
SUBSTRING
Retorna uma substring da string de origem.
Por exemplo, SUBSTRING('USA', 1,2) retorna US.
Matemáti- MAX
ca
86
Retorna o valor máximo de uma coluna.
2013-01-31
Propriedades do componente
Categoria Função (Função aplicada à tabela Employee) Descrição
Expressão
condicional
MIN
Retorna o valor mínimo de uma coluna.
COUNT
Retorna o número de valores de uma coluna.
SUM
Retorna a soma dos valores de uma coluna.
AVERAGE
Retorna a média dos valores de uma coluna.
IF(condição) THEN(expressão de string/ex- Verifica se a condição é cumprida e retorna
pressão matemática/expressão condicional) um valor se 'verdadeiro' e outro valor se 'falELSE(expressão de string/expressão
so'.
matemática/expressão condicional)
Por exemplo, IF([Date of Joining]>12/9/2005)
THEN ('Funcionário contratado após
12/09/2005') ELSE ('Funcionário contratado
em ou antes de 12/09/2005')
Observação:
Expressões matemáticas contendo funções que retornem valor numérico não são suportadas. Por
exemplo, a expressão DAYNUMBEROFMONTH(CURRENTDATE())==2 não é suportada porque
DAYNUMBEROFMONTH retorna um valor numérico.
Operadores matemáticos
Use operadores matemáticos para criar fórmulas contendo colunas numéricas e/ou números. Por
exemplo, a expressão [Age] + 1 adiciona uma nova coluna com os valores 26, 31, 34, 33.
Operadores matemáticos
Descrição
+
Operador de adição
-
Operador de subtração
*
Operador de multiplicação
/
Operador de divisão
()
Parêntesis
^
Operador de potência
%
Operador de módulo
E
Operador de exponencial
Operadores condicionais
Use os operadores condicionais para criar expressões IF THEN ELSE ou SELECT.
87
2013-01-31
Propriedades do componente
Operadores condicionais
Descrição
==
Igual a
!=
Diferente de
<
Menor que
>
Maior que
<=
Menor que ou igual a
>=
Maior que ou igual a
Operadores lógicos
Use operadores lógicos para comparar duas condições e retornar 'verdadeiro' ou 'falso'. Por exemplo,
IF([Date of Joining]>12/9/2005 && [Age] >=25 ) THEN ('Verdadeiro') ELSE ('Falso') adiciona uma nova
coluna com os valores Verdadeiro, Falso, Falso, Falso.
Operadores lógicos
Descrição
&&
AND
||
OR
9.3 Gravadores de dados
Use gravadores de dados para armazenar os resultados da análise em arquivos planos ou bancos de
dados para uma análise posterior.
9.3.1 CSV Writer
Use este componente para gravar os dados em arquivos planos, como arquivos CSV, TEXT e DAT.
Propriedades do CSV Writer
88
Nome do arquivo
Selecione arquivo .csv ou .dat ou .txt
Sobregravar
Para sobregravar um arquivo existente, selecione esta opção.
Separador de colunas
Selecione um delimitador de colunas que separe os tokens de
dados no arquivo.
Caractere de aspas duplas
Selecione o caractere a ser adicionado durante a gravação dos
dados.
2013-01-31
Propriedades do componente
Incluir cabeçalhos de coluna
Selecione esta opção para usar a primeira linha como cabeçalho
da coluna.
Codificação
Selecione o método de codificação de texto a ser usado durante
a gravação dos dados.
Separador de decimal
Selecione o caractere a ser usado para representação decimal
em agrupamento de dígitos.
Separador de agrupamento
Selecione o caractere a ser usado como separador de milhares.
Formato numérico
Insira o formato numérico que você deseja aplicar aos dados
numéricos.
Formato de data e hora
Selecione o formato de data que você deseja aplicar às datas.
9.3.2 JDBC Writer
Use este componente para gravar os dados em bancos de dados relacionais, como MySQL, MS SQL
Server, DB2, Oracle, SAP MaxDB e SAP HANA.
Propriedades do JDBC Writer
89
Tipo de banco de dados
Selecione o tipo de banco de dados.
Caminho do driver do banco de
dados
Insira o local do caminho do driver do JDBC. Por exemplo, para
gravar no banco de dados Oracle, você precisa especificar o
local do Oracle JDBC jar (C:\ojdbc6.jar)
Nome da máquina
Insira o nome da máquina em que o banco de dados está
instalado.
Número da porta
Insira o número da porta do banco de dados ou do serviço.
Nome do banco de dados
Insira o nome do banco de dados.
Nome do usuário
Insira o nome do usuário do banco de dados.
Senha
Insira a senha do usuário do banco de dados.
Tipo da tabela
Insira o tipo da tabela. Esta propriedade é aplicável durante a
gravação em banco de dados SAP HANA.
Nome da tabela
Insira o nome da tabela.
Sobregravar
Selecione esta opção para sobregravar a tabela se ela já existir.
2013-01-31
Propriedades do componente
9.3.3 HANA Writer
Use este componente para gravar os dados nas tabelas de banco de dados SAP HANA.
Componente HANA Writer
Nome do esquema
Insira o nome do esquema.
Tipo da tabela
Selecione o tipo da tabela no qual você deseja gravar os dados.
Nome da tabela
Insira o nome da tabela.
Sobregravar
Selecione esta opção para sobregravar a tabela se ela já existir.
9.4 Modelos salvos
Os modelos que você cria salvando o estado dos algoritmos ficam listados na guia Modelos salvos.
A aplicação SAP Predictive Analysis não contém modelos predefinidos. Portanto, quando você inicia
pela primeira vez a aplicação, a guia Modelos salvos não é exibida.
Para informações sobre como criar um novo modelo, consulte a seção "Criando um modelo" em
Trabalhando com modelos.
90
2013-01-31
Mais informações
Mais informações
Informações
Local
Informações sobre o produto SAP
BusinessObjects
http://www.sap.com
Vá para http://help.sap.com/businessobjects e, no painel lateral "SAP
BusinessObjects Overview", clique em All Products.
SAP Help Portal
Você pode acessar a documentação mais atual relacionada a todos os
produtos SAP BusinessObjects e suas implementações no SAP Help
Portal. Você pode fazer o download das versões em PDF ou das bibliotecas em HTML instaláveis.
Alguns guias estão armazenados no SAP Service Marketplace e não
estão disponíveis no SAP Help Portal. Esses guias estão listados no
Help Portal acompanhados por um link para o SAP Service Marketplace.
Os clientes com um contrato de manutenção tem um ID de usuário autorizado a acessar esse site. Para obter um ID, entre em contato com
seu representante de suporte ao cliente.
http://service.sap.com/bosap-support > Documentação
•
•
SAP Service Marketplace
Guias de instalação: https://service.sap.com/bosap-instguides
Notas de versão: http://service.sap.com/releasenotes
O SAP Service Marketplace armazena alguns guias de instalação, guias
de atualização e migração, guias de implementação, notas de versão e
documentos das Plataformas suportadas. Os clientes com um contrato
de manutenção tem um ID de usuário autorizado a acessar esse site.
Entre em contato com o representante de suporte ao cliente para obter
um ID. Se você for redirecionado para o SAP Service Marketplace a
partir do SAP Help Portal, use o menu no painel de navegação à esquerda para localizar a categoria que contém a documentação que você quer
acessar.
https://cw.sdn.sap.com/cw/community/docupedia
Docupedia
91
A Docupedia oferece recursos de documentação adicionais, um ambiente
de criação colaborativo e um canal de feedback interativo.
2013-01-31
Mais informações
Informações
Local
https://boc.sdn.sap.com/
Recursos para o desenvolvedor
https://www.sdn.sap.com/irj/sdn/businessobjects-sdklibrary
Artigos da SAP BusinessObjects
no SAP Community Network
https://www.sdn.sap.com/irj/boc/businessobjects-articles
Esses artigos eram conhecidos anteriormente como artigos técnicos.
https://service.sap.com/notes
Observações
Fóruns no SAP Community Network
Essas notas eram conhecidas anteriormente como artigos Knowledge
Base.
https://www.sdn.sap.com/irj/scn/forums
http://www.sap.com/services/education
Treinamento
Dos cursos tradicionais em sala de aula aos seminários de e-learning
direcionados, a SAP pode oferecer um pacote de treinamento que se
adeque às suas necessidades de aprendizado e estilo de aprendizado
preferido.
http://service.sap.com/bosap-support
Suporte online ao cliente
O SAP Support Portal contém informações sobre programas e serviços
de Suporte ao cliente. Ele também tem links para uma ampla variedade
de informações técnicas e downloads. Os clientes com um contrato de
manutenção tem um ID de usuário autorizado a acessar esse site. Para
obter um ID, entre em contato com seu representante de suporte ao
cliente.
http://www.sap.com/services/bysubject/businessobjectsconsulting
Consultoria
92
Consultores podem acompanhá-lo do estágio inicial de análise à entrega
de seu projeto de implementação. Informações técnicas estão disponíveis
em tópicos como bancos de dados relacionais e multidimensionais,
conectividade, ferramentas de design do banco de dados e tecnologia
de incorporação personalizada.
2013-01-31