Transcript
PUBLIC
SAP Predictive Analytics 2.0 2015-02-10
Manual de usuario de Expert Analytics
Contenido
1
Recursos de documentación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2
Novedades en Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3
Acerca de este manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.1
Contenido de este manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.2
Audiencia de destino. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4
Expert Analytics Resumen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
5
Introducción a Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5.1
Conceptos básicos de Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5.2
Iniciar Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.3
Entender Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12 Vista Diseñador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Vista Resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.4
Utilizar Expert Analytics de principio a fin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
5.5
Configurar funciones avanzadas de Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
6
Adquirir datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6.1
Adquirir datos de un origen de datos para crear un conjunto de datos. . . . . . . . . . . . . . . . . . . . . . . . . . 17 Ver una conexión de fuente de datos y sus documentos asociados. . . . . . . . . . . . . . . . . . . . . . . . . 18 Adquirir datos a partir de un libro de MS Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Adquirir datos de un archivo de texto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Adquirir datos copiados en el Portapapeles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22 Adquirir datos a partir de vistas de SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Adquirir datos de universo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28 Adquirir datos mediante consulta con SQL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Descargar datos de la base de datos SAP BW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Tratar un conjunto de datos adquirido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Objetos ocultos de la lista de objetos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Editar el archivo de sugerencias de mejoras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
7
Preparar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
7.1
Preparar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Preparar espacio: Visualización, limpieza y manipulación de datos. . . . . . . . . . . . . . . . . . . . . . . . . 42 Editar y limpiar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Crear indicadores y jerarquías. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Crear un indicador o una dimensión calculados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Contenido
Trabajo con conjuntos de datos múltiples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 8
Crear análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
8.1
Crear un análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Aplicar Componentes de procesamiento previo a datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Aplicar algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 Opcional: Almacenar resultados del análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
8.2
Ejecutar el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
8.3
Guardar el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.4
Eliminación de análisis desde el documento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.5
Ver resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78
8.6
Exportación de un análisis como un procedimiento almacenado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
9
Agregar componentes personalizados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
9.1
Componente R personalizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .80 Asistente de creación de componentes R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Crear un componente R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
9.2
Componente PAL personalizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Asistente de creación de componentes PAL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Crear un componente PAL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
10
Análisis de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
10.1
Analizar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
10.2
Gráfico de matriz de dispersión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92
10.3
Gráfico de resumen estadístico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92
10.4
Coordenadas paralelas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
10.5
Árbol de decisiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
10.6
Gráfico de tendencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
10.7
Gráfico de clúster. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
10.8
Gráfico de nube de etiquetas a priori. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
10.9
Matriz de confusión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
10.10
Gráfico de componentes R personalizados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
11
Visualizar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
11.1
Visualizar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .99 Crear gráficos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .102 Ordenación de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 Filtrado de datos de gráfico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Aplicar formato condicional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 Datos jerárquicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Buscar indicadores, dimensiones y valores de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Indicadores asociados con dimensiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 Tipos de agregaciones admitidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Manual de usuario de Expert Analytics Contenido
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
3
12
Crear guiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
12.1
Guiones y datos visualizados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .120 Elementos de página. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Creación de un guión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Guardar un guión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Modificar un guion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 Explorar una visualización en una historia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Actualizar datos en una página de infográfico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
13
Compartir datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128
13.1
Publicar en SAP Lumira Server. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Publicación de guiones y conjuntos de datos en SAP Lumira Server. . . . . . . . . . . . . . . . . . . . . . . .128
14
Trabajar con modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
14.1
Crear un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
14.2
Exportar un modelo como PMML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .130
14.3
Exportar un modelo a un archivo .spar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
14.4
Exportar un modelo de SAP HANA como procedimiento almacenado. . . . . . . . . . . . . . . . . . . . . . . . . 131 Eliminar el procedimiento almacenado exportado de SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . 132
14.5
Importar un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
14.6
Eliminar un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133
15
Propiedades de los componentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
15.1
Algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 Regresión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .134 Valores atípicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 Serie temporal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Árboles de decisiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 Red neuronal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Agrupación en clústeres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 Asociación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 Clasificación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
15.2
Componentes de preparación de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 Fórmula. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202 Muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .208 Definición del tipo de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 Filtro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 Normalización. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 Categorización de HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 Normalización de HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 Partición HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
15.3
4
Grabadores de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Contenido
CSV Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 JDBC Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 HANA Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 15.4
Modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
Manual de usuario de Expert Analytics Contenido
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
5
1
Recursos de documentación
En la tabla siguiente se proporciona la lista de manuales disponibles para SAP Predictive Analytics: Tabla 1: ¿Qué es lo que se desea hacer?
Entonces vaya aquí...
Obtenga ayuda inmediata sobre cómo usar Expert Analytics o busque información sobre una función o un flujo de trabajo.
La Ayuda en pantalla está disponible dentro del conjunto de herramientas Expert Analytics del siguiente modo:
Obtenga ayuda instantánea sobre cómo usar Automated Analytics o encuentre información sobre una función o un flujo de trabajo.
●
Haga clic en el icono de ayuda (?) en un cuadro o ventana de diálogo.
●
Seleccione
Ayuda
Ayuda
.
La Ayuda en pantalla está disponible dentro del conjunto de herramientas Automated Analytics del siguiente modo: ●
Pulse F1.
●
Seleccione
Ayuda
Ayuda
.
Obtenga documentación completa sobre cómo usar SAP Predictive Analytics (en inglés).
SAP Predictive Analytics Página de inicio
Obtenga documentación completa sobre cómo usar SAP Predictive Analytics en un idioma distinto.
Página Todos los productos de SAP
Nota
Seleccione un idioma, luego SAP Predictive Analytics y la ver sión necesaria de las listas desplegables.
La documentación en otros idiomas distintos al inglés sólo está disponible para ciertos manuales. Obtenga la información más actualizada sobre el soporte de base de datos y del software para SAP Predictive Analytics.
6
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
SAP Product Availability Matrix
Manual de usuario de Expert Analytics Recursos de documentación
2
Novedades en Expert Analytics
Hay disponible una lista de las nuevas funciones con Expert Analytics y una descripción de cada función. Las siguientes Expert Analytics funciones nuevas están disponibles en esta versión de SAP Predictive Analytics: Tabla 2: Novedades de esta versión
Descripción
Soporte fuera de línea BW (Business Warehouse)
Puede conectarse a un sistema BW (en ejecución en SAP HANA o cualquier otra base de datos) y descargar la fecha para el análisis fuera de línea. Ambos InfoSitios y consultas BEx se soportan con o sin variables.
Se soportan nuevos algoritmos de APL (Automated Predictive Library) online
Los siguientes algoritmos APL online se soportan y pueden utilizarse en análisis: ●
HANA Auto Classification Identifica el mejor modelo de clasificación binaria que predice la categoría para datos invisibles. Esto se realiza automáticamente seleccionando un algoritmo de clasifi cación y variables de entrada clave para generar el mejor modelo.
●
HANA Auto Clustering Descubre segmentos en los datos con referencia a una variable destino. Esto se realiza automáticamente selec cionando un algoritmo de clúster y variables de entrada clave para generar el mejor modelo.
●
HANA Auto Regression Identifica automáticamente el mejor modelo de regre sión que mejor explica las relaciones entre las variables de entrada independientes y la variable destino.
Manual de usuario de Expert Analytics Novedades en Expert Analytics
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
7
3
Acerca de este manual
3.1
Contenido de este manual
Este manual ofrece: ●
Un resumen de Expert Analytics
●
Cómo adquirir datos desde varios orígenes de datos
●
Cómo realizar operaciones de manipulación de datos, limpieza de datos y operaciones de mejoras semánticas en el espacio Preparar
●
Información acerca de los distintos algoritmos y componentes disponibles en Expert Analytics
●
Información sobre cómo crear análisis y modelos
●
Información sobre cómo analizar datos mediante técnicas de visualización predictiva
●
Cómo crear cuadros de historias
●
Cómo compartir gráficos y conjuntos de datos
Nota Expert Analytics hereda la funcionalidad de adquisición de datos y de manipulación de datos de SAP Lumira. Por lo tanto, para obtener información acerca de los flujos de trabajo que no se tratan en este manual, consulte el Manual de usuario de SAP Lumira disponible en: http://help.sap.com/lumira.
Nota La información acerca de cómo instalar y configurar la aplicación y de cómo instalar R se cubre en el SAP Predictive AnalyticsManual de instalación de desktop.
3.2
Audiencia de destino
Esta guía está destinada a analistas profesionales de datos, usuarios empresariales, estadísticos y científicos de datos que desean usar la aplicación Expert Analyticspara analizar y visualizar datos usando algoritmos predictivos.
Nota Para usar Expert Analytics, debe familiarizarse con los algoritmos estadísticos y de minería de datos y tener un conocimiento básico acerca del uso de estos algoritmos.
8
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Acerca de este manual
4
Expert Analytics Resumen
Expert Analytics es una solución de análisis estadístico y minería de datos que permite elaborar modelos predictivos para descubrir perspectivas y relaciones ocultas en los datos, desde los que puede realizar predicciones sobre eventos futuros. Expert Analytics es un conjunto de herramientas de la aplicación SAP Predictive Analytics. Con Expert Analytics, puede realizar varios análisis en los datos, incluida la previsión de series de tiempo, la detección de valores atípicos, el análisis de tendencias, el análisis de clasificación, el análisis de segmentación y el análisis de afinidad. Esta aplicación permite analizar datos mediante distintas técnicas de visualización, como gráficos de matriz de dispersión, coordenadas paralelas, gráficos de clúster y árboles de decisiones. Expert Analytics ofrece una gama de algoritmos de análisis predictivo, admite el uso del idioma de análisis estadístico de origen abierto R y ofrece capacidades de minería de datos en la memoria para gestionar de forma eficaz análisis de datos de gran volumen.
Nota Expert Analytics hereda la funcionalidad de adquisición de datos y de manipulación de datos de SAP Lumira. SAP Lumira es una herramienta de manipulación y visualización de datos. Con SAP Lumira, puede conectarse a varios orígenes de datos, como archivos sin procesar, bases de datos relacionales, bases de datos en memoria y universos de SAP BusinessObjects, y puede trabajar en distintos volúmenes de datos, desde una pequeña matriz de datos de un archivo CSV hasta un conjunto de datos muy grande de SAP HANA, puede seleccionar y limpiar los datos, y manipular los datos.
Manual de usuario de Expert Analytics Expert Analytics Resumen
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
9
5
Introducción a Expert Analytics
5.1
Conceptos básicos de Expert Analytics
Conceptos importantes relevantes al utilizar Expert Analytics.
Componente Un componente es la unidad de proceso básica de Expert Analytics. Cada componente contiene uno y/o varios puntos de conexión de salida. Estos puntos de conexión sirven para conectar componentes mediante conectores. Cuando se conectan componentes entre sí, los datos se transmiten de los componentes predecesores a sus componentes sucesores. Expert Analytics se compone de los siguientes componentes: ●
Preprocesadores
●
Algoritmos
●
Grabadores de datos
Puede obtener acceso a los componentes desde la vista Diseñador del espacio Predecir. Una vez que haya agregado componentes al editor de análisis, el icono de estado de los componentes permite identificar sus estados. Los estados de un componente pueden ser: ●
Sin icono de estado: este estado se muestra cuando se arrastra un componente al editor de análisis. Indica que el componente tiene que configurarse antes de ejecutar el análisis.
●
(Configurado): este estado se muestra cuando se han configurado para el componente todas las propiedades necesarias.
● ●
10
(Correcto): este estado se muestra tras la ejecución correcta del análisis. (Error): este estado se muestra si la ejecución del análisis no finaliza correctamente debido al componente.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Introducción a Expert Analytics
Análisis Un análisis es una serie de componentes diferentes conectados entre sí en un orden determinado con conectores, que definen la dirección del flujo de datos.
Modelo Un modelo es un componente reutilizable creado para enseñar a un algoritmo a usar datos históricos.
Modo de trabajo en base de datos (In-DB) En base de datos (In-DB) es un modo de ejecución de análisis en el que el proceso de datos se realiza en la base de datos de SAP HANA usando las capacidades de minería de datos. En este modo, los datos nunca se extraen de la base de datos para su proceso y, por ello, la velocidad de proceso es muy elevada. Este modo se puede usar para procesar conjuntos de datos grandes. SAP HANA admite la minería de datos en base de datos mediante la integración R y la biblioteca de Predictive Analysis (PAL). Este tipo de análisis también es conocido como análisis online.
Nota Para obtener información acerca del tamaño de la base de datos SAP HANA para realizar análisis en BD, consulte la nota SAP 1514966.
Modo de trabajo en proceso (In-proc) En proceso (In-Proc) es un modo de ejecución de análisis en el que el proceso de los datos se realiza extrayendo los datos de la base de datos en un espacio de proceso de análisis predictivo. En este modo no puede utilizar los algoritmos PAL de SAP HANA para el análisis. No obstante, puede trabajar con algoritmos R y SAP. Este tipo de análisis también es conocido como análisis fuera de base de datos u offline.
Nota Para obtener información acerca de los requisitos de hardware necesarios para realizar análisis en proceso, consulte Product Availability Matrix en SAP Product Availability Matrix
Manual de usuario de Expert Analytics Introducción a Expert Analytics
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
11
5.2
Iniciar Expert Analytics
Para iniciar Expert Analytics, seleccione Predictive Analytics Desktop
5.3
Inicio
Todos los programas
SAP Predictive Analytics
SAP Business Intelligence
SAP
Expert Analytics .
Entender Expert Analytics
Aparece la página de inicio al iniciar Expert Analytics. La página de inicio contiene información que le ayuda a comenzar con la aplicación. También muestra la opción Probar con ejemplos. Esta opción le permite probar las funciones de Expert Analytics utilizando conjuntos de datos de muestra. También puede ver documentos de modelo de Expert Analytics en SAP Lumira utilizando su clave de licencia de prueba de SAP Predictive Analytics. Para comenzar con el análisis de datos utilizando Expert Analytics, necesita realizar las siguientes tareas: ●
Conéctese al origen de datos y adquiera los datos para el análisis
●
Preparar los datos para el análisis mediante la aplicación de funciones de manipulación de datos y de limpieza de datos
●
Analizar datos mediante la aplicación de algoritmos de minería de datos y de análisis estadísticos
●
Compartir conjuntos de datos y gráficos con colaboradores externos
5.3.1
Vista Diseñador
La vista Diseñador del espacio Predecir le permite diseñar y ejecutar análisis y crear modelos predictivos.
12
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Introducción a Expert Analytics
5.3.2
Vista Resultados
La vista Resultados del espacio Predecir le permite comprender los datos y los resultados de análisis mediante diferentes técnicas de visualización y gráficos intuitivos.
Manual de usuario de Expert Analytics Introducción a Expert Analytics
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
13
5.4
Utilizar Expert Analytics de principio a fin
A continuación, se facilita información general del proceso que puede seguir para crear un gráfico basado en un conjunto de datos. El proceso no es lineal y puede ir de un paso a uno anterior para ajustar el gráfico o los datos. Tabla 3: Pasos para trabajar con los datos
Descripción
Conéctese al origen de datos.
Si el origen de datos es:
14
●
RDBMS: introduzca las credenciales, conéctese al servidor de base de datos, exa mine y seleccione el origen de datos; por ejemplo, si se está conectando a SAP HANA, seleccione una vista y un cubo para crear el gráfico.
●
Archivo plano: elija las columnas que desea adquirir, reducir o mostrar y ocultar.
●
Universo: introduzca las credenciales de universo, conéctese al repositorio del Ser vidor de administración central y seleccione un universo para crear el gráfico.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Introducción a Expert Analytics
Pasos para trabajar con los datos
Descripción
Vea y organice las columnas y las di Puede ver los datos adquiridos como columnas o restricciones. Puede organizar los da mensiones. tos mostrados para facilitar la creación de gráficos realizando estas acciones del modo siguiente:
Analice los datos usando algoritmos de análisis predictivo.
●
Crear filtros y ocultar las columnas no necesarias
●
Crear indicadores, jerarquías temporales y geográficas
●
Limpiar y organizar los datos en columnas usando un rango de herramientas de manipulación
●
Crear columnas con fórmulas usando una amplia selección de funciones disponi bles
Cuando disponga de los datos pertinentes en el espacio Preparar, cambie al espacio Predecir y cree un análisis para descubrir patrones en los datos y predecir los resulta dos futuros. En el espacio Predecir puede hacer lo siguiente:
Guardar el análisis
5.5
●
Crear un análisis
●
Crear modelos predictivos
●
Ver resultados de análisis
●
Ver visualizaciones de modelos
●
Crear gráficos
Dar nombre y guardar el análisis que incluye los gráficos. Los análisis se guardan en un documento con el formato de archivo .lums en la carpeta de la aplicación Documentos de la ruta del perfil.
Configurar funciones avanzadas de Expert Analytics
Puede configurar las funciones avanzadas de Expert Analytics, como la optimización del rendimiento y la habilitación de soporte de tipo de datos para algoritmos PAL mediante el archivo SAPPredictiveAnalysis.ini. 1.
Cierre la aplicación SAP Predictive Analytics.
2.
Vaya a
\Desktop.
3.
Abra el archivo SAPPredictiveAnalysis.ini.
4.
Establezca los valores para los parámetros siguientes en true para habilitar la función correspondiente. Establezca en valor en false para deshabilitar la función. Tabla 4: Parámetro
Descripción
-Dpa.batch.sql
Este parámetro optimiza el rendi True miento de Expert Analytics mediante la ejecución de lote de SQLs.
Manual de usuario de Expert Analytics Introducción a Expert Analytics
Valor predeterminado
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
15
Parámetro
Descripción
Valor predeterminado
-Dpa.decimal.enabled
Este parámetro habilita el soporte de tipo de datos decimal para algoritmos PAL. El soporte de tipo de datos deci mal está disponible a partir de SAP HANA 7.1 y anterior.
False
5.
Grabe y cierre el archivo SAPPredictiveAnalysis.ini.
6.
Reinicie SAP Predictive Analytics.
16
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Introducción a Expert Analytics
6
Adquirir datos
6.1
Adquirir datos de un origen de datos para crear un conjunto de datos
Se adquieren datos al copiarlos de un origen de datos a un conjunto de datos local. Al adquirir datos la aplicación muestra una vista previa de ellos, analiza los datos sintácticamente y analiza columnas para determinar su tipo de datos. Se proponen los objetos que representan columnas como dimensiones o indicadores. Puede ocultar manualmente algunos tipos de columnas en función del nombre de columna y propiedades de datos.
Nota La cantidad máxima de celdas que se puede adquirir está limitada por la capacidad de su equipo. Recibirá una advertencia cuando una adquisición incluya 30 millones de celdas para sistemas operativos de 64 bits o 15 millones de celdas para sistemas operativo de 32 bits. Según el origen de datos, los datos se pueden adaptar antes de su adquisición para incluir o eliminar columnas, dimensiones, indicadores o variables y parámetros de entrada. Algunas fuentes de datos tienen opciones adicionales, como datos de formato, columnas de nombre y de recorte o especifican prefijos de nombre de columna. Tabla 5: Orígenes de datos disponibles Origen de datos
Descripción
Portapapeles
Crea un conjunto de datos que se copió en el portapapeles.
Microsoft Excel
Carga una hoja de trabajo Excel como set de datos
Archivo de texto
Carga un archivo de texto (.csv o .txt) como set de datos
SAP HANA
Descarga datos desde el modo SAP HANA (sin conexión) Se conecta al modo SAP HANA (en línea)
Universo SAP BusinessObjects
Descarga datos desde archivos de universo SAP BusinessObjects (.unv y .unx)
Consulta con SQL
Ejecuta SQL manual en una base de datos para descargar un set de datos
Tras adquirir un set de datos, puede añadir o eliminar columnas, dimensiones, medidas y variables.
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
17
Información relacionada Adquirir datos de un archivo de texto [página 21] Adquirir datos a partir de vistas de SAP HANA [página 24] Adquirir datos a partir de un libro de MS Excel [página 18] Adquirir datos mediante consulta con SQL [página 30] Conectar con un origen de datos de universo [página 28] Tratar un conjunto de datos adquirido [página 39] Objetos ocultos de la lista de objetos [página 39]
6.1.1
Ver una conexión de fuente de datos y sus documentos asociados
Puede ver todas las conexiones definidas para la aplicación y los documentos asociados con cada conexión y modificar la fuente de datos de destino para conexiones definidas en la página inicial. 1.
En la página inicial, seleccione Conexiones. Si se abre un documento en el espacio Preparar o Compartir, deberá guardar y cerrarlo antes de que pueda ir a la página inicial. El panel CONEXIONES aparece en la derecha y ofrece una lista de todas las conexiones de fuentes de datos disponibles. Seleccione una conexión para visualizar una lista de documentos asociados con la misma. El panel DOCUMENTO PARA aparece a la derecha del panel CONEXIONES y los documentos asociados con cada conexión.
2.
Seleccione una conexión local de la lista para mostrar la fuente de datos de destino. Puede seleccionar otra fuente de datos en caso necesario.
3.
(Opcional) Para cambiar la conexión de una o varias fuentes de datos para un documento, realice las siguientes acciones: a.
Seleccione la conexión a cambiar.
b.
Seleccione el documento para el que desea modificar la fuente de datos en el panel DOCUMENTO PARA.
c.
Seleccione una nueva fuente de datos para el documento en el panel CONEXIONES y seleccione Aplicar.
6.1.2
Adquirir datos a partir de un libro de MS Excel
1.
En la página inicial, seleccione Adquirir datos.
2.
En el diálogo Set de datos nuevo, seleccione Microsoft Excel y luego, Siguiente.
3.
Elija uno o más ficheros Excel y seleccione Abrir. Los datos de ficheros Excel se previsualizan en la ventana de diálogo Set de datos nuevo.
4.
(Opcional) Modificar las opciones de Excel para adquirir datos.
5.
Seleccione Crear.
Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar.
18
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
6.1.2.1
Nuevas opciones de diálogo de set de datos para Excel
Puede adquirir datos desde uno o varios libros de Microsoft Excel. Seleccione qué filas y columnas desea adquirir. También puede adquirir datos de las tablas de referencias. Tabla 6: Nuevas opciones de diálogo de set de datos para Excel Opción
Descripción
Nombre de set de datos
Escriba un nombre para el set de datos nuevo.
Archivo(s)
Seleccione los libros de Excel que serán la fuente de datos para el set de datos nuevo.
Hoja
Si un libro de Excel contiene múltiples hojas de trabajo, seleccione la hoja de trabajo que desea adquirir para el set de datos.
Agregar todas las hojas
Marque esta casilla de selección para añadir todas las hojas de tra bajo en el libro para el set de datos. Si se agregan las columnas co munes, las columnas distintas se agregan como columnas nuevas.
Establecer la primera fila como nombres de columna
Marque esta casilla de selección para establecer los primeros valo res de fila en la hoja de cálculo como nombres de columna en el set de datos.
Tipo de cabecera de tabla
Seleccione Tabla estándar (sin transformaciones) o Tabla de referencias.
Seleccionar todo
Marque esta casilla de selección para añadir todas las columnas en la hoja de cálculo para el set de datos.
Mostrar recuento de registro
Seleccione esta casilla de selección para mostrar el número de co lumnas y el número de líneas en el set de datos.
Opciones avanzadas
Mostrar columnas ocultas
Marque esta casilla de selección para mostrar columnas de hoja de
Opciones avanzadas
Mostrar filas ocultas
Marque esta casilla de selección para mostrar filas de hoja de tra
Opciones avanzadas
Detectar celdas fusionadas
Marque esta casilla de selección para destacar celdas de hoja de
Opciones avanzadas
Selección de rango
Si una hoja de trabajo contiene uno o varios rangos con nombre, se
trabajo ocultas como cabeceras de columna en el set de datos.
bajo ocultas en el set de datos.
cálculo fusionadas en el set de datos.
leccione el rango que va a aplicar a las columnas adquiridas para el set de datos. El set de datos está restringido a las columnas defini das en este rango.
Opciones avanzadas
Columna
Manual de usuario de Expert Analytics Adquirir datos
Para tablas cruzadas, especifique el número de columnas a usar para el encabezado izquierdo.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
19
Opción
Descripción
Opciones avanzadas
6.1.2.2
Fila
Especifique el número de filas a usar para el encabezado superior.
Adquirir datos a partir de libros múltiples de MS Excel
Al adquirir datos de libros múltiples de Excel, el formato de fecha y el tipo de datos deben ser los mismos en todos los libros. 1.
En la página inicial, seleccione Adquirir datos.
2.
En el diálogo Set de datos nuevo, seleccione Microsoft Excel y luego, Siguiente.
3.
Elija uno o más ficheros Excel y seleccione Abrir. Los datos de ficheros Excel se previsualizan en la ventana de diálogo Set de datos nuevo.
4.
(Opcional) En el cuadro Nombre de set de datos, indique un nombre para el set de datos.
5.
Junto a Archivo/s, seleccione Añadir archivos y examine y seleccione la hoja de cálculo de Excel de la que adquirir los datos. Puede utilizar comodines para buscar un nombre de hoja de cálculo. Por defecto, el primer archivo en la vía de acceso se considera como el archivo de referencia al que se adjuntan los datos desde el resto de hojas de cálculo adquiridas. Por ejemplo, indique C:\data\monthly updates\*.xls(x) para buscar todos los archivos .xls(x) en la vía de acceso.
6.
En la lista Hoja, seleccione una hoja de trabajo. Dicha hoja de trabajo es la hoja de referencia a la que se adjuntan los datos de otras hojas de trabajo. El recuento de registros se actualiza para reflejar el número de archivos de todos los datos adquiridos. Se añade una columna "Archivo de origen" al set de datos, que lista cada nombre de fuente de datos. Si ha marcado la casilla de selección Adjuntar todas las hojas, se adjuntarán todas las hojas de trabajo a la hoja de cálculo de Excel en el set de datos. Aparecerán los datos de la hoja de trabajo en el panel de vista previa del diálogo Set de datos nuevo.
7.
(Opcional) Para visualizar filas o columnas ocultas de la hoja de trabajo en el set de datos, seleccione Opciones avanzadas.
8.
(Opcional) Para visualizar columnas de hoja de trabajo ocultas en los datos adquiridos, marque la casilla de selección Mostrar columnas ocultas e indique el rango de columna a visualizar en la lista Selección de rango.
9.
(Opcional) Para visualizar filas de hoja de trabajo ocultas en los datos adquiridos, marque la casilla de selección Mostrar filas ocultas e indique el rango de fila a visualizar en la lista Selección de rango.
10. Seleccione Crear. Los datos se adquieren y aparecen en el espacio Preparar.
20
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
6.1.3
Adquirir datos de un archivo de texto
Puede adquirir datos de uno o más ficheros de texto si los datos se almacenan con delimitadores o en columnas con ancho fijo. Un ejemplo de fichero de texto usando delimitadores es un fichero con valores separados por comas.csv). Un archivo .csv almacena números y texto en formato de texto plano. Cada registro se compone de campos que suelen estar separados con una coma o una tabulación y registros separados por saltos de línea. Aquí hay un ejemplo de un fichero .csv con datos separados por comas: "Product","Country","Year","Quantity","Margin" "Skis","Italy","2013","1,297","1,929" "Computers","China","2014","609","10,659" Adquirir datos de este archivo .csv resulta en cinco columnas en el conjunto de datos: "Producto," "País," "Año," "Cantidad," y "Margen." Columna 2, en este ejemplo, contiene los valores "País" "Italia" y "China". Este es un ejemplo de un fichero de texto con los datos almacenado en columnas de ancho fijo: Product Country Skis Italy Computers China
Year 2013 2014
Quantity 1,297 609
Margin 1,929 10,659
Puede adquirir datos de varios orígenes de datos de archivos múltiples. Los ficheros deben tener el mismo formato y tipo de datos. Tabla 7: Nuevas opciones de diálogo de set de datos para archivos de texto Opción
Descripción
Nombre de set de datos
El nombre del conjunto de datos
Archivo(s)
El archivo o archivos que contiene datos para el conjunto de datos. Puede importar datos de uno o varios archivos. Para especificar varios archivos separe las rutas de archivo en el campo Archivo(s) con puntos y comas o seleccione Añadir archivos y elija uno o más archi vos para añadir a la selección.
Separador
Seleccione si los datos en sus archivos los separan los delimitadores o si se introducen en columnas con ancho fijo. Los delimitadores son símbolos, como comas, fichas o espacios, que separan campos en la fuente de datos y que especifican columnas en el conjunto de datos en SAP Lumira.
Establecer la primera fila como
Marque esta casilla de selección para usar la primera fila de datos como nombres de co
nombres de columna
lumna en el conjunto de datos. Desmarque esta casilla de selección para asignar el nombre estándar de las columnas ("Columna1," "Columna2," etc).
Opciones avanzadas
El formato para columnas numéricas en el set de datos
Formato de números
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
21
Opción
Descripción El formato para columnas de fecha en el set de datos
Opciones avanzadas Formato de fecha Opciones avanzadas
Salto
de columna
Al adquirir datos almacenados como columnas con ancho fijo, analice el fichero de datos y sugiera anchos de columna en caracteres para separar datos en columnas en el conjunto de datos. Si los anchos sugeridos no son adecuados, puede modificar los anchos introduciendo valo res separados por comas. Por ejemplo, si sus datos están en tres columnas y el ancho de columna es cinco, diez y quince caracteres, debe escribir 5,10,15 en el campo Salto de columna y seleccionar Aplicar para ver una vista preliminar del conjunto de datos resul tante.
Opciones avanzadas Eliminar espacios en blanco
Marque esta casilla de selección para eliminar valores principales y secundarios de núme ros y texto en el set de datos, de modo que no aparezcan las cabeceras de columna como campos vacíos. Por ejemplo, si una entrada "Producto" tiene un espacio principal (" Pro ducto"), el espacio se elimina y aparece "Producto" como la cabecera de columna.
1.
En la página inicial, seleccione Adquirir datos.
2.
En el diálogo Set de datos nuevo, seleccione Texto y luego, Siguiente.
3.
Elija uno o más ficheros Excel y seleccione Abrir. Los datos de ficheros Excel se previsualizan en la ventana de diálogo Set de datos nuevo.
4.
(Opcional) Ajuste las opciones del conjunto de datos en el diálogo según sea necesario.
5.
Seleccione Crear.
Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar.
6.1.4
Adquirir datos copiados en el Portapapeles
Los datos basados en texto se pueden copiar en el portapapeles de un fichero basado en texto (por ejemplo, Microsoft Excel) o de una página Web. Tabla 8: Nuevas opciones de diálogo de conjunto de datos para datos copiados desde el portapapeles Opción
Descripción
Nombre de set de datos
El nombre del conjunto de datos
Separador
Seleccione si los datos en el portapapeles los separa los delimitadores o si se introducen en columnas con ancho fijo. Los delimitadores son símbolos, como comas, fichas o espa cios, que separan campos en la fuente de datos y que especifican columnas en el conjunto de datos en la aplicación.
22
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
Opción
Descripción
Establecer la primera fila como
Marque esta casilla de selección para usar la primera fila de datos como nombres de co
nombres de columna
lumna en el set de datos. Desmarque esta casilla de selección para asignar el nombre estándar de las columnas ("Columna1," "Columna2," etc). El formato para columnas numéricas en el set de datos
Opciones avanzadas Formato de números
El formato para columnas de fecha en el set de datos
Opciones avanzadas Formato de fecha Opciones avanzadas
Salto
de columna
Al adquirir datos almacenados como columnas con ancho fijo, analice el fichero de datos y sugiera anchos de columna en caracteres para separar datos en columnas en el conjunto de datos. Si los anchos sugeridos no son adecuados, puede modificar los anchos introduciendo valo res separados por comas. Por ejemplo, si sus datos están en tres columnas y el ancho de columna es cinco, diez y quince caracteres, debe escribir 5,10,15 en el campo Salto de columna y seleccionar Aplicar para ver una vista preliminar del conjunto de datos resul tante.
Opciones avanzadas Eliminar espacios en blanco
Marque esta casilla de selección para eliminar valores principales y secundarios de núme ros y texto en el set de datos, de modo que no aparezcan las cabeceras de columna como campos vacíos. Por ejemplo, si una entrada "Producto" tiene un espacio principal (" Pro ducto"), el espacio se elimina y aparece "Producto" como la cabecera de columna.
Nota El navegador web de Microsoft Internet Explorer (IE) tiene un problema conocido al copiar texto al portapapeles. Si se encuentra con ese problema, utilice en su lugar el navegador diferente soportado. 1.
En la página inicial, seleccione Adquirir datos.
2.
En la ventana de diálogo Set de datos nuevo, haga clic en Copiar desde portapapeles y seleccione Siguiente.
3.
Copiar texto en el portapapeles.
4.
En la aplicación, crear un documento nuevo.
5.
En la ventana de diálogo Set de datos nuevo, haga clic en Copiar desde portapapeles y seleccione Siguiente.
6.
(Opcional) Seleccione Espacios de corte para eliminar espacios principales y secundarios de números y texto en el set de datos.
7.
(Opcional) Seleccione Cortar fila para eliminar líneas en blanco desde el conjunto de datos.
8.
Seleccione Continuar. Los datos de ficheros Excel se previsualizan en la ventana de diálogo Set de datos nuevo.
9.
(Opcional) Ajuste las opciones del conjunto de datos en el diálogo según sea necesario.
10. Seleccione Crear.
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
23
Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar.
6.1.5
Adquirir datos a partir de vistas de SAP HANA
Puede adquirir datos desde vistas analíticas o de cálculo SAP HANA. Los datos de la base de datos SAP HANA están accesibles en una "vista": una agrupación virtual predefinida de columnas de tabla que permite el acceso de datos para un requisito empresarial particular. Las vistas son específicas de un tipo o tablas para el tipo de cálculos que se aplican a las columnas. Por ejemplo, la vista de atributos se estructura en tablas de dimensión, las vistas analíticas se estructuran en una tabla de hechos y en la vista de atributos, y la vista de cálculo ejecuta una función en columnas al acceder a la vista. Puede conectarse a las vistas de SAP HANA de dos formas: ●
Al descargar datos desde SAP HANA Los datos se copian localmente y se pueden manipular y editar antes de visualizarlos en gráficos.
●
Al visualizar datos en SAP HANA Los datos son solo de lectura (es decir, no puede editarlos), pero puede visualizarlos en gráficos.
Después de conectarse con una vista, se presentan los datos como columnas, facetas, indicadores, dimensiones, y jerarquías en la aplicación.
Información relacionada Descargar datos desde SAP HANA [página 26] Conectarse a SAP HANA [página 25] Acceder a datos de SAP BW en vistas de SAP HANA [página 27] Especificar valores para variables de SAP HANA y parámetros de entrada de string [página 27]
6.1.5.1
Restricciones para conexiones SAP HANA One
Tabla 9: Restricciones para conectar al origen de datos SAP HANA One Restricción
Descripción
Solo está disponible un nivel
Solo se puede utilizar un solo atributo a la vez al crear una jerarquía geográfica.
para las jerarquías geográfi cas. Medidas con dimensioens nu
Las medidas se detectan desde la vista analítica SAP HANA. Deben crearse en la vista SAP
méricas o de candena no pue
HANA antes de que la aplicación pueda adquirirlas automáticamente.
den crearse.
24
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
Restricción
Descripción
No se pueden publicar sets de datos en SAP HANA. No se soportan algunas fun ciones.
Las siguientes funciones SAP HANA no se soportan: ●
AddMonthToDate
●
AddYearToDate
●
LastDayOfMonth
●
DayOfYear
●
Semana
●
LastWord
●
ExceptLastWord
Algunas características no es Si una vista analítica utiliza una vista de cálculo (por ejemplo, si una vista de atributo con la tás disponibles para vistas analísticas que usan una vista de cálculo.
vista analítica tiene una medida calculada o una o varias columnas calculadas): ●
La vista en cuadrícula no está disponible en el espacio Preparar.
●
Las facetas no muestran valores cuando una medida se ha seleccionado en el espacio Preparar.
●
6.1.5.2
No es posible ordenar por medidas en el espacio Visualizar.
Conectarse a SAP HANA
Al conectarse a SAP HANA, podrá visualizar datos y crear visualizaciones de un cubo SAP HANA . Debe conocer su nombre de servidor SAP HANA, número de puerto, nombre de usuario y contraseña. Para obtener más información, póngase en contacto con su administrador SAP HANA. 1.
En la página inicial, seleccione Adquirir datos.
2.
En el diálogo Set de datos nuevo, seleccione Conectar con SAP HANA One y luego, en Siguiente.
3.
Seleccione el servidor al que conectarse en la lista Servidor.
4.
Introduzca el número de puerta al que conectarse en el cuadro Instance/Puerta.
5.
Conectarse al servidor SAP HANA: Opción
Descripción
Si se conecta introduciendo las credenciales
Introduzca su nombre de usuario y su contraseña, y luego haga clic en Conectar.
Si se conecta mediante un inicio de sesión
Seleccione la casilla de selección Autenticar mediante sistema
único (SSO)
operativo (SSO) y seleccione Conectar.
6.
Seleccione Siguiente. Aparece una ventana Set de datos nuevo: Aparece el diálogo Vistas SAP HANA, que muestra vistas SAP HANA disponibles.
7.
Amplíe la vista SAP HANA que contiene los datos a visualizar, y seleccione el cubo que contiene los datos.
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
25
8.
Selección de los datos a adquirir: ○
Para adquirir dimensiones y medidas particulares en los datos, seleccione Siguiente, elija las dimensiones y medidas y seleccione Aceptar.
○
Para adquirir todos los datos, seleccione Crear.
Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar.
Información relacionada Especificar valores para variables de SAP HANA y parámetros de entrada de string [página 27] Restricciones para conexiones SAP HANA One [página 24]
6.1.5.3
Descargar datos desde SAP HANA
Usted puede manipular los datos y crear visualizaciones a partir de un cubo de SAP HANA. Debe conocer su nombre de servidor SAP HANA, número de puerto, nombre de usuario y contraseña. Para obtener más información, póngase en contacto con su administrador SAP HANA. 1.
En la página inicial, seleccione Adquirir datos.
2.
En el diálogo Set de datos nuevo, seleccione Descargar de SAP HANA One y luego, Siguiente.
3.
Seleccione el servidor al que conectarse en la lista Servidor.
4.
Introduzca el número de puerta al que conectarse en el cuadro Instance/Puerta.
5.
Conectarse al servidor SAP HANA: Opción
Descripción
Si se conecta introduciendo las credenciales
Introduzca su nombre de usuario y su contraseña, y luego haga clic en Conectar.
Si se conecta mediante un inicio de sesión
Seleccione la casilla de selección Autenticar mediante sistema
único (SSO)
operativo (SSO) y seleccione Conectar.
6.
Seleccione Siguiente. Aparece una ventana Set de datos nuevo: Aparece el diálogo Vistas SAP HANA, que muestra vistas SAP HANA disponibles.
7.
Amplíe la vista SAP HANA que contiene los datos a visualizar, y seleccione el cubo que contiene los datos.
8.
Selección de los datos a adquirir: ○
Para adquirir dimensiones y medidas particulares en los datos, seleccione Siguiente, elija las dimensiones y medidas y seleccione Aceptar.
○
Para adquirir todos los datos, seleccione Crear.
Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar.
26
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
Información relacionada Adquirir datos a partir de vistas de SAP HANA [página 24] Especificar valores para variables de SAP HANA y parámetros de entrada de string [página 27]
6.1.5.4
Acceder a datos de SAP BW en vistas de SAP HANA
Puede acceder a datos de SAP Business Warehouse (BW) que se encuentran disponibles en las vistas analítica o de cálculo de SAP HANA. En sistema SAP BW en SAP HANA, puede utilizar el modelador SAP HANA para importar modelos SAP BW (por ejemplo, cubos optimizados para SAP HANA, objetos DataStore (DSO) e instantáneas de query BW) como vistas analíticas y de cálculo. Una vez que se activan los modelos, la aplicación puede consumirlos conectándose con un cubo SAP HANA. Para obtener información sobre la implementación de un sistema SAP BW en SAP HANA y sobre cómo hacer que sean disponibles datos para SAP HANA, véanse las Preguntas frecuentes: documento BW en HANA en http:// www.experiencesaphana.com/community/solutions/net-weaver-bw/bwonhanafaq .
Información relacionada Descargar datos desde SAP HANA [página 26]
6.1.5.5
Especificar valores para variables de SAP HANA y parámetros de entrada de string
El sistema le pide que indique un valor para una variable SAP HANA o un parámetro de entrada de string cuando adquiere una vista analítica en modo Descargar de SAP HANA One y al crear un documento en una vista analítica en modo Conectar a SAP HANA One. Cada variable de SAP HANA define un filtro en una dimensión de una vista. Introduce un valor para cada dimensión antes de adquirir datos y aparece el valor como una fila de restricción después de adquirir. Introduce un valor para cada parámetro de entrada de SAP HANA cuando adquiere datos y SAP Lumira pasa el valor a un cálculo como una fórmula para una medida calculada. Cuando se introduce un valor para un parámetro de entrada de string, tiene que introducir un enunciado SQL, utilizando comillas simples para indicar el inicio y el final del string de enunciado. Por ejemplo, introduzca BUKRS='CALP' para buscar CALP. 1.
Conéctese a una instancia SAP HANA en modo Descargar desde SAP HANA Oneo Conectar a SAP HANA One.
2.
Selección de los datos a adquirir: ○
Para elegir qué datos adquirir, seleccione una vista analítica, seleccione Previsualizar y seleccionar datos, seleccione Seleccionar, elija valores de dimensión e indicadores, y marque Editar variables. Si no hay variables o parámetros de entrada definidos en la vista, el botón Editar variables no está disponible.
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
27
○
Para adquirir todos los datos disponibles en una vista analítica, elija la vista y seleccione Crear.
Aparece un cuadro Variables HANA, que recoge las variables y parámetros de entrada definidos para la vista analítica. Las variables van precedidas de "VAR" y los parámetros de entrada van precedidos de "IP". 3.
Elija una variable o un parámetro de entrada. El valor de dimensión o de parámetro de entrada se muestra en el panel derecho.
4.
Elija uno o más valores y seleccione Agregar. Para elegir valores individuales múltiples, mantenga pulsada la tecla Ctrl y seleccione cada valor. Para elegir un rango de valores, mantenga pulsada Mayús y seleccione el primer y el último valor en el rango. Los valores seleccionados aparecen en el panel inferior.
5.
Seleccione OK.
6.
Si está adquiriendo datos a través de Vista previa y selección de datos, seleccione Crear para iniciar la adquisición de datos. Los datos aparecen en el espacio Preparar y cada variable aparece como una faceta con los valores de petición seleccionados.
El botón de Variables aparece en la parte superior del área de ventana de las restricciones. Seleccione el botón para ver los valores para las variables de SAP HANA .
6.1.6
Adquirir datos de universo
Puede adquirir datos desde archivos de universo SAP BusinessObjects. Los archivos universo (.unx) para acceso BW SAP NetWeaver se crean con SAP Information Design Tool que está instalado con la plataforma para SAP BusinessObjects Business Intelligence. Para obtener información sobre la herramienta en diseño de información, véase http://help.sap.com/businessobject/product_guides/sbo41/en/ sbo41sp1_info_design_tool_en.pdf. Para obtener más información sobre federación de datos, consulte http://help.sap.com/businessobject/ product_guides/sbo41/en/sbo41_dfat_guide_en.pdf. Para obtener una lista completa de universos soportados y opciones de acceso de base de datos, véase Product Availability Matrix en el SAP Service Marketplace en SAP Product Availability Matrix .
6.1.6.1
Conectar con un origen de datos de universo
1.
En la página inicial, seleccione Adquirir datos.
2.
En el diálogo Set de datos nuevo, seleccione Universo y luego, Siguiente.
3.
En el panel Credenciales de universo: a.
Introduzca el nombre o la dirección IP del servidor que aloja su Servidor de administración central (CMS). Si se está conectando a un CMS que pertenece a un dominio de red diferente, debe asegurarse de que el archivo de hosts que se encuentra en C:\Windows\System32\drivers\etc tiene la entrada del nombre de host correspondiente (por ejemplo, x.x.x.x).
b.
28
Introduzca el nombre de usuario CMS, contraseña y tipo de autenticación.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
c.
Para usar la autenticación Windows AD para conectarse al CMS, agregue las siguientes dos entradas al archivo SAPLumira.ini que se encuentra en: \SAPLumira\Desktop:
-Djava.security.auth.login.config=\bscLogin.conf -Djava.security.krb5.conf=\krb5.ini -Djava.security.auth.login.config=C:\Windows\bscLogin.conf -Djava.security.krb5.conf=C:\Windows\krb5.ini a.
Seleccione Conectar.
Aparece una lista de universos disponibles en el CMS. 4.
Seleccione un universo y después Seleccionar.
5.
Seleccione los objetos necesarios en el árbol de universos y seleccione Adquirir. Antes de adquirir datos, puede obtener una presentación preliminar de los datos y aplicar filtros seleccionando la opción Vista previa y selección de datos. Si una consulta contiene contextos o mensajes, debe responder a ellos antes de que puedan adquirirse los datos. Al crear una consulta, puede establecer las siguientes propiedades de consulta: ○
Máx. filas recuperadas: el número máximo de filas que debe recuperar la consulta.
○
Tiempo de recuperación máx.: El tiempo máximo que se puede ejecutar una consulta (en segundos).
○
Recuperar filas duplicadas: Seleccione para recuperar las filas duplicadas.
Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar un conjunto de datos, cambie a el espacio Preparar.
6.1.6.2
Sugerencias para solucionar problemas de conexiones de datos de universo
Puede encontrar estos mensajes y causas posibles al trabajar con el origen de datos de universo. Tabla 10: Pasos para solucionar problemas de conexiones de datos de universo Mensaje
Causa
No se pudo conectar al Servidor de
●
CMS no responde.
administración central (CMS)
●
Su nombre de usuario o contraseña incorrectos.
●
El tipo de autenticación es incorrecto.
●
Se ha producido un problema en la red.
●
El universo está dañado.
●
CMS no responde.
●
La conexión con el universo no está configurada correc
No se pudo cargar el universo seleccionado
tamente.
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
29
Mensaje
Causa
No se pudo validar la consulta
●
Existe un problema con la conexión con la base de datos.
●
Los tipos de datos no coinciden con el objeto.
●
Un resultado devuelto por el servidor ha alcanzado el lí mite fijado para parámetro de configuración Tamaño máximo de flujo de caracteres (MB) del servidor de infor mes SAP Web Intelligence.
●
Uno o más objetos del universo no están configurados correctamente.
La consulta no devuelve conjuntos de filas Una consulta para el objeto no ha devuelto datos.
6.1.7
Adquirir datos mediante consulta con SQL
Puede crear su propio proveedor de datos al introducir manualmente el SQL para una fuente de datos de destino. Puede especificar las tablas de origen, las columnas y las funciones para adquirir los datos. Para obtener una lista completa de middleware de base de datos a los que pueda acceder la consulta con SQL, véase SAP Product Availability Matrix . Tabla 11: Controladores middleware de base de datos disponibles Opción middleware de base
Cómo obtener el controlador
de datos Apache
Los controladores Amazon EMR y Apache Hive Simba están incluidos en SAP Lumira.
Cloudera
El controlador Cloudera Impala Simba está incluido en SAP Lumira.
IBM DB2
Vaya a la página de descargas de conectividad de IBM DB2 en https://www.ibm.com/account/ profile/us?page=reghelpdesk
. Seleccione el controlador adecuado para su base de datos,
grabe el fichero de instalación comprimido en su ordenador, extraiga el fichero comprimido (db2jcc.jar) en un directorio local y ejecute el instalador desde su ordenador. En cambio, para versiones anteriores a 9.5 debe extraer db2cc.jar y db2jcc_license_cu.jar. Antes de poder descargar un controlador, debe registrarse indicando una dirección de correo electrónico de usuario reconocida por IBM como nombre de cuenta. Si no sabe qué versión del controlador utilizar, los dos controladores de la versión DB2 [DB2 versión 10.1 FP0 (GA) y ver sión 10] son adecuados para todas las versiones posteriores a la versión DB2 9.5. Para obtener más información, póngase en contacto con el administrador de su base de datos. IBM Netezza
30
Póngase en contacto con el administrador Netezza.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
Opción middleware de base
Cómo obtener el controlador
de datos Microsoft SQL Server
Vaya a la página del centro de descargas de controladores de Microsoft 2005, 2008 y 2012 del servidor SQL en http://www.microsoft.com/en-us/download/driver.aspx?q=driver
. Selec
cione el controlador adecuado para su base de datos, grabe el fichero de instalación en su or denador y ejecute el instalador desde su ordenador. Si no sabe qué versión de controlador utilizar, Microsoft JDBC Driver 4.0 para SQL Server es válido para todas las versiones de servidor SQL admitidas. Si está instalando JDBC Driver 4.0 para SQL Server, el controlador para un sistema operativo Windows es
sqljdbc_4.0.2206.100_enu.exe. El archivo de controlador sqljdbc4.jar se ex trae a \sqljdbc_4.0\enu\, en la carpeta de extracción especificada. Oracle
Vaya a la página de descargas de controladores JDBC Oracle en http://www.oracle.com/tech network/database/features/jdbc/index-091264.html Antes de poder descargar un controlador, debe crear una cuenta de usuario gratuita. Si no sabe qué versión del controlador utilizar, el controlador ojdbc14.jar es válido para todas las versiones soportadas de Oracle 10 y 11.
Sybase
El controlador Sybase (jconn4.jar) se instala por defecto. No precisa instalarlo. Se encuen tra en \\\Program Files\SAP Lumira\Desktop\plugins
\com.businessobjects.connectionserver.standalone_3.1.3.v20120603 -0404\ConnectionServer\jdbc\drivers\IQ15. Teradata
Vaya a la página de descarga de conectividad de Teradata en http://downloads.teradata.com/ download/connectivity/jdbc-driver
. Seleccione el controlador adecuado para su base de
datos, grabe el fichero de instalación comprimido en su ordenador, extraiga el fichero compri mido en un directorio local y ejecute el instalador desde su ordenador. Antes de poder descargar un controlador, debe crear una cuenta de usuario gratuita. Si no sabe qué versión de controlador usar, Teradata JDBC Driver 14 es válido para todas las versio nes de Teradata soportadas. Para Windows, utilice TeraJDBC__indep_indep.
14.00.00.14.zip. Una vez extraídos, los ficheros de controlador son tdgssconfig.jar y terajdbc4.jar. Tabla 12: Controladores JDBS disponibles para el middleware de base de datos típico Middleware de base de datos
Nombre de archivo de controlador JDBC
Oracle
ojdbc14.jar
Microsoft SQL Server
sqljdbc4.jar
Teradata
terajdbc4.jar y tdgssconfig.jar
Sybase
jconn4.jar
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
31
Middleware de base de datos
Nombre de archivo de controlador JDBC
IBM DB2
db2jcc.jar o db2cc.jar y db2jcc_license_cu.jar para versiones anteriores a 9.5
IBM Netezza
nzjdbc.jar
Información relacionada Instalar controladores de acceso a datos [página 32] Conectarse a un origen de datos Query with SQL [página 35] Propiedades de conexión SQL [página 34]
6.1.7.1
Instalar controladores de acceso a datos
El controlador de acceso a datos de Sybase IQ 15 se instala automáticamente con la aplicación. Si utiliza otras bases de datos, tendrá que instalar el controlador de acceso a datos JDBC para el middleware de su base de datos antes de utilizar Query with SQL. ●
Debe familiarizarse con su base de datos y con el idioma SQL.
●
Debe instalarse el controlador de acceso de datos correcto para su middleware de base de datos. Un controlador de acceso a datos es el software que proporciona un proveedor de base de datos para permitir que una aplicación cliente se conecte al middleware y acceda a los datos de una base de datos. Copie el controlador de acceso de datos para su middleware desde el sitio web de soporte de proveedor de base de datos en una carpeta local, y luego seleccione el controlador en la aplicación y luego conéctese a la base de datos.
Nota La instalación de controladores de acceso a datos desde un sitio de proveedor puede ser una tarea problemática debido a las diferentes versiones de controladores y formatos de archivo. Si no está familiarizado con su versión de base de datos o el sitio web de proveedor, contacte con su administrador de base de datos. Siga los pasos generales siguientes para obtener un controlador de acceso de datos: 1.
Descargue el controlador de acceso de datos (un archivo .jar) desde la página del proveedor de la base de datos y copie el archivo en una carpeta local.
2.
Registre la vía de acceso del controlador seleccionado el controlador en la aplicación.
3.
Seleccione un query con un origen de datos Query SQL desde la ficha Controladores SQL en las preferencias de la aplicación. Puede seleccionar un controlador SQL instalado o instalar el controlador necesario.
1.
Seleccione
32
Archivo
Preferencias
Controladores SQL .
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
La página Instalación de controlador enumera los nombres de middleware de base de datos y el status de los controladores:
2.
○
Cuando la marca de verificación es verde, el controlador se ha instalado correctamente y puede empezar a usar Query con SQL.
○
Si la marca es roja, el controlador no se ha instalado correctamente para ese middleware y debe instalarlo.
○
Si la marca de status es amarilla, hay un controlador compatible disponible para el middleware, pero la aplicación debe reiniciarse antes de que esté disponible. Una vez reiniciado el software, puede utilizar Query with SQL.
Seleccione una fuente de datos y realice una de las acciones siguientes: Opción
Descripción
Si el origen de datos middleware tiene una marca Seleccione Siguiente, introduzca la información de conexión middle de verificación verde ware y después, Crear. El controlador de acceso de datos está instalado. No necesita reali zar el resto de pasos de esta tarea. Si el origen de datos middleware tiene una marca Reinicie la aplicación y repita el paso 1. de verificación amarilla Si el origen de datos middleware tiene una marca Vaya al paso 3. de verificación roja
3.
Si el controlador de middleware no está configurado, seleccione Instalar, elija el controlador de base de datos y seleccione Instalar controladores, en la parte superior de la lista de base de datos.
4.
En el cuadro de selección que aparece, a partir de la disponibilidad local del middleware, realice una de las acciones siguientes: Opción
Descripción
Si el archivo .jar correcto está dispo nible
Vaya al paso 6.
Si el archivo .jar correcto no está dis ponible
Descargue el controlador del sitio de soporte del proveedor, instale el contro lador, seleccione Cancelar para cerrar el cuadro de selección y descargue e instale el archivo .jar correcto.
Es necesario que acceda a la página web que enumera los controladores de acceso a datos JDBC para el proveedor de middleware. Dependiendo de la base de datos, hay disponibles diferentes tipos de archivos de controladores. Normalmente hay un archivo comprimido que contiene los controladores, o un archivo ejecutable para instalar los controladores automáticamente. Para la aplicación sólo tiene que descargar el archivo comprimido. 5.
En el sitio Web de soporte de su proveedor, descargue el fichero de controlador JDBC comprimido (por ejemplo, un fichero .tar, .gz, or .zip) para su versión de middleware de base de datos.
6.
En su ordenador, seleccione la carpeta que contiene los archivos de controladores JDBC extraídos para el middleware de su base de datos. La lista completa de controladores JDBC soportados se incluye en Product Availablity Matrix, disponible en el sitio del SAP Service Marketplace en https://support.sap.com/pam .
7.
Reinicie la aplicación. La lista de controladores middleware de la base de datos disponible está actualizada.
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
33
Cuando utilice Query with SQL para crear un documento nuevo en la aplicación, el middleware de base de datos de destino se muestra en una lista con una marca de verificación verde que indica que el controlador está disponible para acceder a la base de datos.
6.1.7.2
Propiedades de conexión SQL
Puede crear su propio proveedor de datos introduciendo manualmente el SQL para un origen de datos de destino para adquirir datos para la tabla. Cuando utiliza Query with SQL debe introducir información de conexión para la base de datos de destino y, además, puede especificar parámetros de conexión para optimizar la obtención de datos. Tabla 13: Parámetros de inicio de sesión Parámetros de inicio de se
Descripción
sión Nombre del usuario Contraseña Server (:)
Nombre y puerto del servidor que aloja la base de datos.
Base de datos
Nombre de la base de datos
Tabla 14: Parámetros de optimización Parámetros avanzados
Descripción
Modo de conjunto de conexiones
Si utiliza un conjunto de conexiones, éste es el método que se usará para mantener la co nexión del modo de conjunto de conexiones activa.
Tiempo de espera de conjunto
Si define el Modo de conjunto de conexiones en Mantener la conexión activa durante, éste es el período de tiempo, en minutos, que se mantendrá abierta la conexión.
Tamaño Array fetch
El número máximo de filas autorizado con cada recuperación desde la base de datos. Por ejemplo, si introduce 20 y la consulta devuelve 100 filas, la conexión recupera los datos en cinco recuperaciones de 20 filas cada una. Para desactivar cualquier array fetch, intro duzca un tamaño array fetch de 1. Los datos se recuperan fila por fila. Al desactivar el tamaño de array fetch, puede aumentar la eficiencia de la recuperación de datos, pero reducir el rendimiento del servidor. Cuanto mayor sea el valor de tamaño array fetch, más rápido se recuperarán las filas. Sin embargo, asegúrese de que su sistema cliente tiene la memoria adecuada.
Tamaño Array Bind
Tamaño del Array bind antes de su transmisión a la base de datos. Por lo general, mien tras mayor sea el array bind, más filas (n) se podrán cargar en una operación y mejor será el rendimiento.
Tiempo de espera de inicio de
El número de minutos antes de que un intento de conexión supere el tiempo de espera y
sesión
se muestre un mensaje de error.
34
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
Parámetros avanzados
Descripción
Propiedades del controlador de
Valores para propiedades del controlador JDBC. Puede definir el valor de varias propieda
JDBC
des separándolos con comas. Por ejemplo, el siguiente valor
oracle.jdbc.defaultNChar=true,defaultNChar=true para propiedades del controlador JDBC define las propiedades de los controladores
oracle.jdbc.defaultNChar y defaultNChar:
6.1.7.3
Editor SQL para Query with SQL
Use un editor de SQL para escribir SQL y crear un origen de datos de Query with SQL a partir de una base de datos conectada. Al editor de SQL se accede desde la opción de conexión a Query with SQL al crear un documento nuevo. Solo la declaración SELECT está autorizada en el editor de SQL para adquirir datos de tablas de bases de datos. Use estas opciones de editor SQL para seleccionar tablas para el origen de datos: Tabla 15: Opciones del editor de
Descripción
SQL Catálogo
Las cuentas disponibles para la base de datos conectada. Expanda cada nodo para ver las tablas disponibles. Haga doble clic en una tabla para añadir la tabla en la consulta SQL.
Consulta
La consulta SELECT para obtener las tablas. (Solamente se admite SELECT). Puede agregar nom bres de tabla haciendo doble clic en la tabla, en el nodo de cuenta del panel izquierdo.
Historial de SQL
Mantiene un registro de las declaraciones SELECT usadas en el panel de consultas. Seleccione una declaración para incluirla en la consulta.
Vista previa de datos
Seleccione esta opción para obtener una vista previa de las tablas que adquiere SELECT.
Seleccionar todo/
Seleccionar todo o sin columnas, o seleccionar columnas individuales para adquisición.
ninguno
Información relacionada Conectarse a un origen de datos Query with SQL [página 35]
6.1.7.4
Conectarse a un origen de datos Query with SQL
Puede conectarse directamente a una base de datos para especificar qué datos desea adquirir y establecer parámetros para optimizar la conexión a la base de datos.
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
35
●
Debe familiarizarse con su base de datos y con el idioma SQL.
●
Debe instalarse el controlador de acceso de datos correcto para su middleware de base de datos. Un controlador de acceso a datos es el software que proporciona un proveedor de base de datos para permitir que una aplicación cliente se conecte al middleware y acceda a los datos de una base de datos. Copie el controlador de acceso de datos para su middleware desde el sitio web de soporte de proveedor de base de datos en una carpeta local, y luego seleccione el controlador en la aplicación y luego conéctese a la base de datos.
Nota La instalación de controladores de acceso a datos desde un sitio de proveedor puede ser una tarea problemática debido a las diferentes versiones de controladores y formatos de archivo. Si no está familiarizado con su versión de base de datos o el sitio web de proveedor, contacte con su administrador de base de datos. Debe instalar un controlador de acceso a datos JDBC para el middleware de su base de datos antes de usar Query with SQL. El controlador de acceso a datos es un archivo .jar que puede descargar del sitio de un proveedor de bases de datos y copiarlo en la carpeta de controladores de la ruta de instalación de la aplicación. Consulte la información sobre cómo encontrar e instalar el controlador de acceso a datos correcto para el middleware de su base de datos. 1.
En la página inicial, seleccione Adquirir datos.
2.
En el diálogo Set de datos nuevo, seleccione Query con SQL y luego, Siguiente. Se muestra una lista de middleware de bases datos.
3.
○
Cuando aparece una marca de verificación verde junto al nombre de middleware, el middleware se instala y ya puede empezar a usar Query con SQL.
○
Cuando aparece una cruz roja junto al nombre de middleware, el controlador de acceso de datos para middleware no está instalado, debe instalarlo.
Seleccione el middleware de la base de datos para la base de datos de destino: Opción
Descripción
Si el middleware está disponible
Seleccione el middleware y Siguiente.
Si el middleware no está disponible
Seleccione Instalar e instale el middleware.
4.
Introduzca sus credenciales de inicio en la ficha Iniciar sesión y, si es necesario, introduzca los parámetros del controlador en la ficha Avanzadas .
5.
Seleccione Crear. Se abre el Editor de SQL.
6.
Introduzca el SQL para obtener las tablas que desee, obtenga una presentación preliminar de la consulta SQL y seleccione Crear. Aparece el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar.
Información relacionada Propiedades de conexión SQL [página 34] Editor SQL para Query with SQL [página 35]
36
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
Instalar controladores de acceso a datos [página 32]
6.1.8
Descargar datos de la base de datos SAP BW
Puede conectarse directamente con sistemas SAP Business Warehouse (BW) utilizando la conectividad Business Intelligence Consumer Services (BICS). Eso le permite descargar conjuntos de ejemplo de formación para formación de modelo fuera de línea. No sólo puede conectarse con InfoSitios SAP BW, sino que también puede ejecutar consultas BEx y ajustar valores para variables definidas en las consultas. Esto elimina la necesidad de descargar o exportar datos manualmente desde SAP BW para realizar previsiones de los datos. Puede ver un resumen de la arquitectura para la conexión BW fuera de línea aquí:
Información relacionada Crear conjuntos de datos BW offline [página 38]
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
37
6.1.8.1
Crear conjuntos de datos BW offline
Aprenda cómo conectar con BEx Queries o InfoSitios, seleccionar dimensiones e indicadores y fijar valores para variables (para BEx queries). Esto permite delimitar el conjunto train para ejecutar predicciones en los datos. Antes de conectar al sistema SAP Business Warehouse (BW) es necesario estar registrado mediante SAP GUI para Windows en el mismo ordenador. Es recomendable verificar la conectividad del sistema BW registrado mediante SAP Logon antes de usarla Expert Analytics. Consulte la documentación SAP GUI para Windows en SAP Help Portal en http://help.sap.com para configurar un sistema nuevo. Para descargar SAP GUI for Windows, puede dirigirse a SAP Service Marketplace . 1.
Para crear un conjunto de datos nuevo, primero elija una fuente seleccionado
Archivo
Nuevo .
2.
En el diálogo que aparece, seleccione la opción Descargar desde SAP Business Warehouse y elija Siguiente.
3.
Introduzca los detalles de conexión BW como ID de cliente, Idioma, Usuario y Contraseña y elija Conectar.
Nota La lista de servidores BW disponibles deriva desde SAP Logon. 4.
Seleccione BEx Query desde los queries disponibles y seleccione Crear. Puede buscar su BEx Query o InfoSitio usando la vista Roles o InfoSitios. O bien puede buscar palabras claves en el cuadro Buscar.
5.
Introduzca los valores para las variables obligatorias de BEx Query.
6.
Si los queries tienen variables de jerarquía definidas, necesita seleccionar una jerarquía.
7.
Seleccione valores dentro de la jerarquía que se han filtrado según el nodo seleccionada para la variable previa y seleccione Aceptar.
8.
Finalmente, seleccione dimensiones e indicadores teniendo en cuenta el uso predictivo. Estos se descargan cuando seleccione Crear.
El conjunto se añade en el espacio Predecir y puede aplicar algoritmos al conjunto de datos para generar predicciones.
6.1.8.2
Recomendaciones de BEx Query
Algunas recomendaciones y prácticas recomendadas para usar BEx Queries al descargar datos desde SAP Business Warehouse (BW) con Expert Analytics.
Recomendación ●
Durante la adquisición de datos, es posible definir valores de filtro para las características de las BEx Queries solo si se especifican como parámetros de entrada durante la creación de BEx Query. También hay una opción para seleccionar un subconjunto de características y ratios del BEx Query subyacente para informes durante la adquisición de datos.
●
Las jerarquías se aplanan durante la adquisición de datos para asegurar que los datos tienen el formato correcto para el procesamiento de algoritmo predictivo.
●
Expert Analytics respeta las opciones de visualización para la clave y el texto para las características en el BEx Query subyaciente. Como resultado es importante asegurar que los BEx Queries están configurados de manera que los usuarios puedan aprovechar las descripciones para los valores de dimensión.
38
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
●
La información de moneda y de unidad para los ratios solo está disponible en la visualización de tabla de Expert Analytics. Según esto, puede ofrecer a los usuarios la opción de seleccionar una unidad o moneda usando las variables BEx como parte del BEx Query subyacente o configurar la unidad o moneda como valor fijo en el BEx Query. También es recomendable que se configure la misma unidad o moneda para todos los ratios para evitar cualquier confusión.
●
Expert Analytics respeta las condiciones (N superiores) definidas en el BEx Query subyacente, pero los usuarios no reciben ninguna información acerca de las condiciones configuradas. Como resultado, no recomendamos usar las condiciones en queries ideados para usar con algoritmos predictivos.
●
Los factores de escala no se respetan en Expert Analytics. Cualquier factor de escala que se aplique se eliminará en la adquisición de datos y se mostrará el valor real del ratio.
●
Recomendamos que evite queries con ambos cálculos de lista y supresión cero al usar BEx Queries con Expert Analytics. Esto no es obvio para un usuario durante la adquisición de datos, y por tanto, podría tener resultados inesperados.
●
Por defecto, los BEx Queries omiten valores de datos maestros sin contabilizaciones. Si tales posiciones son necesarias durante el procesamiento del algoritmo asegúrese de que se realizan las opciones adecuadas en el query.
6.1.9
Tratar un conjunto de datos adquirido
Una vez que se ha adquirido un conjunto de datos, se puede tratar. Puede editar esta información en conjuntos de datos adquiridos: ●
Agregue nuevas columnas que se habían eliminado del origen de datos cuando se adquirió originalmente.
●
Eliminar columnas incluidas en la fuente de datos original
●
Modifique los valores seleccionados para variables y parámetros de entrada de SAP HANA .
1.
Abra un conjunto de datos que ya se ha adquirido en la aplicación.
2.
Seleccione
3.
Realice una o más de las siguientes acciones:
4.
Datos
Editar origen de datos .
○
Marque una casilla de selección de nombre de columna para añadir una columna nueva.
○
Desmarque la casilla de selección de nombre de columna para eliminar una columna.
○
Seleccione o desmarque las casillas de selección para añadir o eliminar dimensiones e indicadores.
○
Para modificar variables SAP HANA y parámetros de entrada, haga clic en Editar variables, indique o borre valores para variables o parámetros de entrada, y seleccione OK.
Seleccione OK.
El conjunto de datos se actualiza con las columnas, dimensiones, indicadores, o variables agregados o eliminados.
6.1.10 Objetos ocultos de la lista de objetos Utilice el archivo de sugerencias de mejoras para evitar que ciertas columnas se propongan como indicadores en la aplicación cuando se adquieren los datos. Para evitar que las columnas específicas se propongan como indicadores cuando se adquieren datos, la aplicación usa el archivo enrichment_suggestions..txt para identificar columnas que no
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
39
se deben proponer como indicadores. La primera vez que cree un documento, este archivo se graba en su directorio @user.home/.sapvi (por ejemplo C:\Users\\.sapvi). Por defecto, los nombres de columnas en el archivo de sugerencias de mejoras están en inglés. Sin embargo, puede definir nombres en otros idiomas, especificar nombres de columna para ocultar de lista de objetos y evitar que los objetos se consideren objetos de tiempo o geográficos. Las mejoras se procesarán si ha seleccionado detección automática de mejoras en las preferencias de la aplicación. Cuando actualiza la aplicación, se guarda una nueva versión de las sugerencias de mejoras sin sobrescribir su archivo original. Puede utilizar el archivo original como una referencia para modificar el nuevo archivo de sugerencias. La aplicación usará el nombre del archivo que corresponde a la versión instalada de la aplicación.
6.1.11
Editar el archivo de sugerencias de mejoras
Edite el archivo de sugerencias de mejoras para identificar qué objetos no deberían proponerse como atributos de indicadores, de tiempo o geográficos en el panel Medidas y dimensiones . Puede definir todas las reglas que necesite en el mismo archivo enrichment_suggestions..txt. Para cada regla, debe declarar cuatro propiedades. La sintaxis es Java regex y los metadatos no distinguen entre mayúsculas y minúsculas. Tabla 16: Las propiedades necesarias para cada regla en el archivo de sugerencias de mejoras Propiedad necesaria
atributo
objectName
Patrón que se corresponde con el nombre del objeto (cabecera de columna). Se puede utilizar cualquier carácter. Cuando se utiliza .*DAY.*, cualquier objeto que contenga la cadena DAY se incluye en la regla (MONDAY, TUESDAY, etc.).
dataType
Lista de tipos de datos Los tipos de datos reconocidos son: ●
entero
●
entero grande
●
doble
●
cadena
●
fecha
●
booleano
Cualquier nombre de columna, con cualquier tipo de datos se considerará para ser excluido del panel de propuestas. Si no se declarado ningún dataType se tendrán en cuenta todos los tipos de datos.
mejoras
Evita que aparezcan objetos. Los valores son MEASURE o TIME (objetos de jerar quía de tiempo) o GEO (objetos de jerarquía geográfica).
regla
El valor predeterminado es hide. No modifique este valor.
El siguiente ejemplo muestra el archivo de mejoras por defecto. {
40
"version":"1.0", "policies":{ PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Adquirir datos
}
}, "suggestionRules":[ { "objectName":"(?i).*year.*|.*month.*|.*quarter.* |.*week|.*day|.*semester.*|.*hour|.*minute|.*second", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*zip.*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*_id\\d*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*key.*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*zip.*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"TIME", "rule":"hide" }, { "objectName":"(?i).*_id\\d*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"TIME", "rule":"hide" }, { "objectName":"(?i).*key.*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"TIME", "rule":"hide" } ]
1.
Abra el archivo enrichment_suggestions..txt en un editor de textos.
2.
Para cada objeto, defina el tipo(s) de datos y mejoras, y, si es necesario, defina otras propiedades. Debe mantener "rule" fijado en "hide".
3.
Guarde el archivo con el mismo nombre.
Manual de usuario de Expert Analytics Adquirir datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
41
7
Preparar datos
7.1
Preparar datos
Cuando la aplicación adquiere los datos por primera vez, son datos preliminares que a menudo se formatean de forma inconsistente, y no es fácil que los usuarios empresariales los interpreten. Antes de crear los gráficos para visualizar los datos, suele ser necesario preparar los datos para que se puedan presentar y comprender. La preparación de datos se puede realizar en la vista Cuadrícula o Facetas mediante la utilización del panel de Herramientas de manipulación a la derecha del espacio Preparar. Las tareas de edición se pueden aplicar a todos los valores de una columna o a valores seleccionados.
Información relacionada Editar y limpiar datos [página 46] Convertir datos a otro tipo [página 50] Crear una jerarquía geográfica o de tiempo [página 51] Crear un indicador a partir de una columna o dimensión [página 54] Agregación de un conjunto de datos [página 71] Alternar a otro set de datos [página 72] Fusionar conjuntos de datos (JOIN) [página 72]
7.1.1
Preparar espacio: Visualización, limpieza y manipulación de datos
Antes de crear gráficos, utilice las herramientas del espacio Preparar para ver y preparar los datos. El espacio Preparar muestra datos para la fuente de datos conectada y se divide en tres partes.
42
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Tabla 17: Partes del espacio Preparar Parte
Descripción
Panel Datos
La parte central muestra los datos en filas y columnas (vista Tabla) o en facetas (vista Facetas). Es donde se ven los datos y se pueden aplicar las siguientes herramientas (si están disponibles) a los valores de columna: ●
Modificar agregación
●
Ordenar
●
Filtrar
●
Visualizar formato
●
Convertir a número
●
Convertir a fecha
●
Convertir a texto
●
Crear un indicador
●
Crear una jerarquía de tiempo
●
Crear una jerarquía geográfica
●
Crear una jerarquía personalizada
●
Cambiar nombre
●
Eliminar
●
Fusionar la columna
●
Ocultar columna
●
Ajustar a contenido
●
Crear dimensión calculada
●
Duplicar
Panel Indicadores y
El panel situado a la izquierda de la zona de datos enumera los indicadores y las dimensiones que la
dimensiones
aplicación haya detectado en los datos. Utilice las herramientas del panel Indicadores y dimensiones para editar o definir nuevos indicadores y para crear jerarquías temporales y geográficas.
Panel Herramientas
Un panel situado a la derecha de la parte de datos para editar texto y convertir valores de una celda o
de manipulación
columna de datos concreta, para crear nuevas columnas con fórmulas y para cambiar el nombre de columnas, duplicarlas y eliminarlas.
Información relacionada Panel de indicadores y de dimensiones [página 44] Panel de datos [página 44] Panel de herramientas de manipulación [página 45] Preparar datos [página 42]
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
43
7.1.1.1
Panel de indicadores y de dimensiones
el panel Indicadores y dimensiones está ubicado en la parte izquierda del generador de gráficos. Muestra una lista de los indicadores, dimensiones, jerarquías, y dimensiones inferidas del conjunto de datos. Tabla 18: Objetos en el panel Indicadores y dimensiones Objetos del panel Indica
Descripción
dores y de dimensiones Indicador
Se asigna a datos agregados en una columna o cálculo. Utilice los indicadores para obtener el re sultado calculado al combinar columnas. Por ejemplo, un indicador llamado Ingresos de ventas puede representar a la columna Ingresos de ventas, y contiene la suma de los ingresos por ven tas. Los indicadores se detectan y listan automáticamente.
Jerarquía
Hace referencia a más de una columna relacionada en un conjunto de datos, y las columnas tie nen relaciones jerárquicas. Por ejemplo, un objeto Tiempo puede incluir las columnas Año, Tri mestre y Mes organizadas en una estructura jerárquica bajo el objeto principal Tiempo.
Atributo
Se asignan a las columnas del conjunto de datos.
Dimensión inferida
Una o varias columnas creadas a partir de datos geográficos o de tiempo disponibles en la aplica ción (para soportar una jerarquía)
Información relacionada Preparar datos [página 42] Crear una jerarquía geográfica o de tiempo [página 51] Creación de indicadores [página 54] Crear indicadores y jerarquías [página 50]
7.1.1.2
Panel de datos
El panel Datos es el panel central que muestra sus datos en el espacio Preparar. Puede usar el panel Datos para ver, organizar y preparar los datos para la visualización. Tabla 19: Opciones en la parte superior del panel Datos Opción
Descripción
Lista Selección de fuente de
Lista las fuentes de datos conectadas a la sesión actual. Utilice esta herramienta para cam
datos
biar de un conjunto de datos a otro y para añadir un conjunto de datos nuevo a la sesión ac tual.
Filtros de datos
44
Seleccione para definir restricciones para filtrar los datos de las columnas.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Opción
Descripción
Cuadrícula
Seleccione para presentar datos en columnas y filas. Se muestran todas las filas.
Facetas
Seleccione para presentar datos en columnas, con sólo valores únicos. No se muestran los valores repetidos de las columnas. Utilizar aspectos puede ayudar si un conjunto d edatos incluye muchos valores repetidos.
Mostrar/ocultar columnas
Seleccione para mostrar u ocultar columnas en un conjunto de datos.
Cálculo
Seleccione para agregar dimensiones o indicadores calculados.
Combinar
Seleccione para fusionar o adjuntar datos a un conjunto de datos. Puede fusionar datos de múltiples conjuntos de datos en el conjunto de datos actual, pero los datos deben ser com patibles. Puede adjuntoar otro conjunto de datos al actual. Los datos en columnas comunes se anexan al conjunto de datos actual, pero los datos en columnas únicas se agregan a co lumnas nuevas.
Actualizar los datos de
Seleccione para actualizar el/los conjunto/s de datos utilizado/s en el documento.
documento Deshacer/Rehacer
Seleccione para deshacer la última acción o repetirla.
Información relacionada Editar y limpiar datos [página 46] Filtrar datos en columnas y gráficos [página 49] Agregación de un conjunto de datos [página 71] Fusionar conjuntos de datos (JOIN) [página 72] Alternar a otro set de datos [página 72] Crear un indicador o una dimensión calculados [página 55]
7.1.1.3
Panel de herramientas de manipulación
El panel de Herramientas de manipulación, a la derecha del espacio Preparar, contiene herramientas que le permiten editar y dar formato a los valores. En función del tipo de datos de la columna seleccionada, puede: ●
Duplicar, cambiar el nombre y eliminar columnas
●
Crear dimensiones calculadas
●
Encontrar, reemplazar y cambiar valores de cadena
●
Rellenar prefijos y sufijos
●
Convertir, reducir y agrupar valores
●
Editar cadenas de texto
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
45
7.1.2
Editar y limpiar datos
Puede usar el panel Herramientas de manipulación (situado a la derecha del panel central) para editar y dar formato a los valores de una columna. El panel está disponible en las vistas Cuadrícula y Facetas. Es posible acceder a algunas de las acciones de datos en el panel Herramientas de manipulación seleccionando la flecha del nombre de la columna, o haciendo clic en el botón derecho en el nombre de la columna. Tabla 20: Acciones de datos para columnas Acción de da Descripción
Disponible en el menú
tos
del nombre de la co
Disponible para Carácter
Fecha
Número
Sí
Sí
Sí
Sí
Cambiar el nombre de la columna.
Sí
Sí
Sí
Sí
Crear una nueva columna con valores de cadena
No
Sí
No
No
lumna (o en el menú de contexto) Crear una
Crear una columna nueva
columna nueva Duplicar
Crear una nueva columna que sea una copia de la columna seleccionada.
Cambiar nombre Dividir
que se muestran detrás de un punto de separación definido. La separación puede ser un signo de pun tuación como, por ejemplo, una coma o una ca dena de texto. Eliminar
Eliminar la columna seleccionada.
Sí
Sí
Sí
Sí
Convertir
Cambiar los valores de cadena a minúsculas o ma
No
Sí
No
No
caso
yúsculas.
Reemplazar
Encontrar una cadena y sustituirla por una nueva.
No
Sí
No
No
Relleno
Especifica un carácter que se antepondrá o pos
No
Sí
No
No
Sí
No
No
Sí
Sí
Sí
No
No
Sí
Sí
No
No
pondrá a una cadena en una longitud de caracte res definida. Convertir a
Insertar una copia de una columna con valores
texto
convertidos a texto.
Convertir a
Insertar una copia de una columna con valores
número
convertidos a números.
Convertir a
Seleccione un formato de fecha y valídelo. Se in
fecha
serta una copia de la columna con los valores con vertidos a fechas.
46
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Acción de da Descripción
Disponible en el menú
tos
del nombre de la co
Disponible para Carácter
Fecha
Número
No
Sí
No
No
No
Sí
Sí
Sí
No
No
Sí
Sí
No
Sí
No
No
lumna (o en el menú de contexto) Convertir
Seleccione Minúsculas o Mayúsculas para cambiar
caso
el texto a minúsculas o mayúsculas.
Reducir
Elimine caracteres que se encuentran detrás o de lante de un signo de puntuación o un carácter es pecificado.
Agrupación
Cree una nueva columna donde pueda crear nue vos grupos de filas (por ejemplo, grupo 1, grupo 2...) para organizar las filas. Las filas que no están en un grupo específico pueden organizarse en un grupo llamado "Otros" o pueden quedarse sin agrupar.
Crear
Cree una columna nueva para tipos de número y
dimensión
fecha que aplican una función a los valores. Por
calculada
ejemplo, una función "Límite inferior" puede apli carse a una columna "Margen" para crear una nueva columna de valores de margen, redondea dos por defecto al siguiente número entero más cercano.
Selección
Haga doble clic en la vista Rejilla o doble clic lento
interna de
en la vista Facetas para seleccionar un intervalo de
celda
caracteres en una palabra. Puede realizar las ac ciones siguientes en los caracteres o palabra: ●
Eliminar, sustituir porciones de texto
●
Crear una columna nueva con las mismas filas pero limpias (por ejemplo: eliminar "recurso" de valores).
●
Mover el texto seleccionado al inicio del valor de fila
1.
Realice una de las siguientes acciones: Opción
Descripción
Editar todos los valores de una única columna
Seleccione la cabecera de la columna.
Editar todos los valores en varias columnas
Pulse Ctrl y seleccione todas las cabeceras de columna.
Editar un valor concreto
Seleccione una celda.
Editar varios valores en una columna
Pulse Ctrl y seleccione todas las celdas.
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
47
Opción
Descripción
Editar un intervalo de caracteres o una palabra en una celda (selección dentro de celda)
(Solo valores de carácter) Haga doble clic en la vista de Rejilla o haga doble clic lento en la vista de Facetas y seleccione un inter valo de caracteres o una palabra.
2.
Abra el panel Herramientas de manipulación en la parte derecha del panel Datos. Los valores de columna únicos se muestran en un cuadro Valores en la parte superior del panel. Puede seleccionar uno o varios valores para editarlos en este cuadro, o introducir una cadena de búsqueda en el cuadro Buscar. Las selecciones en el panel del editor sustituyen las selecciones de valores realizadas directamente en una columna. Las acciones de datos disponibles para una columna dependen del tipo de datos de la columna y en si se ha seleccionado una columna, celda o intervalo de caracteres dentro de una celda.
3.
Seleccione una opción de edición en el panel Herramientas de manipulación, modifique los valores si es necesario, y seleccione Aplicar.
7.1.2.1
Utilizar el panel de filtros
El panel de filtros se utiliza para definir un filtro. El panel de filtros no soporta el idioma de fórmula SAP Lumira o expresiones regulares (regex). Para crear un filtro más complejo puede que tenga que añadir una medida calculada o dimensión. Tabla 21: Opciones en el panel de filtro Opción
Descripción
Buscar
Indique el valor que desea buscar.
Valores
Seleccione uno o más valores en los que filtrar la columna o dimensión.
Ver registros
Seleccione esta opción para ver el número de apariciones para cada valor de columna.
Conservar solo
Seleccione esta opción para incluir los valores seleccionados en la columna o la dimen sión. No se visualizan otros valores.
Excluir valores
Seleccione esta opción para excluir los valores seleccionados en la columna o la dimen sión. No se visualizan otros valores.
1.
Para abrir el panel de filtro, seleccione el icono Opciones dimensión o medida, y seleccione Filtro.
en una cabecera de columna o para una
2.
En el panel de filtros, en caso necesario, seleccione opciones para datos basados en texto: Para seleccionar valores múltiples, mantenga pulsada la tecla Ctrl y seleccione cada valor.
3.
48
Seleccione OK.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Información relacionada Crear un indicador o una dimensión calculados [página 55]
7.1.2.1.1
Filtrar datos en columnas y gráficos
Un filtro es una restricción impuesta en un conjunto de datos para limitar los valores que se muestran. Aparecen filtros en la barra de filtros situada en la parte superior del panel Datos. Puede editar los filtros directamente desde la barra de filtros. Tabla 22: Filtros en la barra de filtros en el panel Datos Alcance
Descripción
Filtro de conjunto de datos
Defina un filtro en una columna. El filtro se aplica a los datos en la columna y a gráficos que utilicen dichos datos.
Filtro de nivel de visualización
Defina un filtro en un gráfico. El filtro sólo se aplica al gráfico, no a nivel de conjunto de datos.
Ejemplo Si un gráfico muestra los ingresos por productos vendidos entre los años 1995 y 2012, pero sólo quiere ver los ingresos de los años 2010 a 2012, puede crear un filtro en la dimensión Año para limitar los valores que se muestran para este periodo.
Información relacionada Filtrar datos en columnas y restricciones [página 49] Utilizar el panel de filtros [página 48] Filtrado de datos de gráfico [página 112]
7.1.2.1.2
Filtrar datos en columnas y restricciones
Cree un filtro en una columna o faceta desde una cabecera de columna. El filtro aparece en la barra de filtro encima de la cuadrícula de datos. 1.
Seleccione el icono Cuadrícula
2.
Seleccione el icono Opciones
3.
Utilice las opciones del panel de filtro para definir el filtro.
Manual de usuario de Expert Analytics Preparar datos
para visualizar las columnas para la fuente de datos. en una cabecera de columna y seleccione Filtro.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
49
Información relacionada Utilizar el panel de filtros [página 48]
7.1.2.2
Convertir datos a otro tipo
Puede convertir datos de un tipo de datos a otro. Por ejemplo, puede convertir texto en fechas o números en texto. 1.
2.
Realice una de las siguientes acciones: ○
En el panel Medidas y dimensiones, seleccione el icono Opciones
○
En el panel Datos, seleccione la fecha en la cabecera de una columna de número o fecha.
junto a una dimensión.
En el diálogo de conversión de datos, seleccione las opciones que necesite y seleccione OK.
7.1.2.3
Aplicar formato a números y fechas
Puede seleccionar el formato de visualización para columnas de números y fechas en la sala Preparar o Visualizar. Por ejemplo, los números se pueden visualizar como porcentajes o utilizar notaciones científicas, y los números negativos pueden representarse entre paréntesis. 1.
En la sala Preparar, seleccione el icono Opciones al lado de una medida o dimensión en el panel Medidas y dimensiones o en la cabecera de una columna de números o fechas en el panel Datos y después seleccionar Formato de la visualización.
2.
En el diálogo de formato de visualización, seleccione las opciones de formato que necesite y seleccione OK.
7.1.3
Crear indicadores y jerarquías
Puede enriquecer los datos agregando indicadores y jerarquías de geografía y tiempo. Los indicadores le permiten manipular fácilmente los cálculos y las jerarquías le permiten usar una agrupamiento natural de columnas relacionadas. Al adquirir datos, SAP Lumira detecta jerarquías e indicadores potenciales. Los indicadores detectados se visualizan en el panel Indicadores y dimensiones, y las dimensiones identificadas como jerarquías potenciales se marcan con un interrogante. Puede seleccionar el icono Opciones manualmente.
50
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
para que una dimensión cree jerarquías
Manual de usuario de Expert Analytics Preparar datos
Información relacionada Crear una jerarquía geográfica o de tiempo [página 51] Creación de indicadores [página 54]
7.1.3.1
Crear una jerarquía geográfica o de tiempo
Las jerarquías de tiempo, geográficas y personalizadas enriquecen un conjunto de datos. Las jerarquías de tiempo y geográficas se detectan automáticamente al adquirir un conjunto de datos, pero puede crear jerarquías en cualquier momento. Las jerarquías de tiempo se pueden crear en columnas de tipo numérico y de fecha. Las jerarquías de geografía solo se pueden crear en columnas que contienen valores compatibles con valores de datos de geografía de la base de datos NAVTEQ que usa la aplicación. Utilice los menús contextuales de dimensiones o cabeceras de columnas para crear jerarquías. 1.
Seleccione el icono Opciones
junto a una dimensión y luego,
Crear una jerarquía geográfica
Por
nombres o Crear una jerarquía de tiempo. Aparecerán opciones de enriquecimiento de columna o dimensión para la jerarquía. 2.
Seleccione qué columnas asignar a la jerarquía: ○
Para la jerarquías de tiempo, seleccione las columnas por asignar para los niveles Año, Trimestre, Mes, y Día.
○
Para las jerarquías geográficas, seleccione las columnas que desea asignar para algunos o todos los niveles País, Región, Subregión y Ciudad. Estas columnas se exploran para detectar coincidencias con la base de datos de geografía interna que usa la aplicación. Seleccione Columnas borradas para visualizar columnas detectadas como posibles coincidencias en listas desplegables para el nivel. Si no se detecta ninguna columna, las listas se muestran vacías. Seleccione Todas las columnas para incluir todas las columnas en listas desplegables para el nivel.
Para jerarquías de tiempo, las nuevas columnas seleccionadas como niveles se agregan automáticamente al conjunto de datos, y la nueva jerarquía de tiempo se muestra en la ficha semántica Jerarquías. Para jerarquías geográficas, aparece la ventana de diálogo Datos geográficos, que muestra columnas coincidentes con la base de datos interna en verde, las columnas con coincidencia ambigua en naranja, y columnas que no coinciden en rojo. Para dimensiones inferidas, se crean columnas para las jerarquías. 3.
(Opcional para jerarquías geográficas) En el diálogo Datos geográficos, por cada coincidencia propuesta, seleccione la fila de propuesta y luego, Seleccionar para aceptar la ubicación, o No existe para eliminar la fila, y seleccione Confirmar. Las nuevas columnas de geografía seleccionadas como niveles se agregan automáticamente al conjunto de datos y la nueva jerarquía de geografía se muestra en el panel Indicadores y dimensiones.
Puede cambiar el color de los niveles coincidentes de una jerarquía geográfica en cualquier momento. (Seleccione el icono Opciones junto al nombre de jerarquía, luego, Editar reconciliación, cambie las coincidencias propuestas y luego, Aceptar).
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
51
Información relacionada Crear una jerarquía geográfica con datos de latitud y longitud [página 52] Crear una jerarquía personalizada [página 53]
7.1.3.2
Crear una jerarquía geográfica con datos de latitud y longitud
Si el conjunto de datos contiene datos de latitud y longitud, puede personalizar una jerarquía geográfica para usar estos datos. La aplicación crea un indicador para cada columna durante la adquisición de datos. Los datos de latitud y longitud deben ser numéricos. Si no es así, deberá convertir los valores de columna usando una fórmula de conversión, (por ejemplo ToNumber()). Si las columnas no son numéricas, deberá definir las dimensiones de conversión numérica como indicadores. La aplicación calcula automáticamente niveles jerárquicos sobre y bajo la dimensión de geografía seleccionada. Puede aceptar estos niveles calculados en su jerarquía, o sustituirlos con niveles definidos por el usuario en función de los datos de latitud y longitud.
Nota La aplicación no soporta crear jerarquías geográficas con datos de latitud y longitud de fuentes de datos SAP HANA. 1.
Compruebe que se han creado los indicadores para las columnas de latitud y longitud. Si se han creado indicadores, siga al paso 4.
2.
Si no se han creado indicadores, convierta las columnas de latitud y longitud en un tipo de datos numérico: a.
Seleccione el icono Opciones en la cabecera de la dimensión o columna de latitud, y luego, Crear dimensión calculada. El cuadro de diálogo Nueva dimensión calculada se abre con el nombre de columna ya en la fórmula (por ejemplo, {column_1}).
b.
Haga doble clic en la función ToNumber () para insertarla en la fórmula.
c.
Mueva el nombre de columna que aparece en el paso b a la función ToNumber(). La fórmula entera debería ser ToNumber({column_1}).
3.
4.
d.
Escriba un nombre para la dimensión calculada y haga clic en Aceptar.
e.
Repita los pasos a-d en la dimensión o columna de longitud.
Defina las nuevas dimensiones numéricas de latitud y longitud como indicadores: a.
Haga clic en Opciones indicador.
b.
Seleccione el icono Opciones
Seleccione el icono Opciones
para obtener la nueva dimensión numérica de latitud y seleccione Crear un
para la nueva dimensión de longitud numérica y luego, Crear un inicador.
en la cabecera de la columna o dimensión de geografía para utilizarla como
base de la jerarquía y luego, Crear una jerarquía geográfica Por latitud/longitud . Aparece el diálogo Datos geográficos. El panel Nombre de nivel desglosa los niveles de jerarquía calculados por la aplicación. La dimensión original se muestra en rojo, y el resto de niveles de jerarquía calculados, en
52
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
verde. Puede aceptar la jerarquía propuesta en función de los datos de latitud/longitud, o personalizar los niveles de la jerarquía. Seleccione un nivel para ver sus propiedades en el panel izquierdo. Tabla 23: Propiedades de un nivel calculado en una jerarquía Propiedad de nivel
Descripción
Categoría
Definición del nivel, ya sea calculado automáticamente en base a datos de latitud/longitud o definido por el usuario (seleccione la columna en la que basar el nivel) Para un nivel definido por usuario, seleccione una columna
Columna
para utilizar en el nivel. Para un nivel definido por usuario, seleccione los datos de
Latitud
latitud. Para un nivel definido por usuario, seleccione los datos de
Longitud
longitud.
Tipo de nivel
El nombre del nivel en la jerarquía
5.
Para aceptar los niveles calculados propuestos, seleccione Aceptar y vaya al paso 7.
6.
Para seleccionar las columnas en las basar los niveles, para cada nivel que desee definir en la jerarquía, seleccione Definido por usuario en la lista Categoría, y luego, propiedades para el nivel en el resto de listas. Utilice las flechas a la izquierda para moverla hacia arriba o hacia abajo en la jerarquía. Añada un nivel a la jerarquía seleccionando Añadir nivel, o elimine un nivel seleccionando el icono X a la izquierda del nivel.
7.
Seleccione Aceptar.
La nueva jerarquía geográfica se agrega a la categoría Jerarquías en el panel semántico. Puede cambiar el color de los niveles de una jerarquía en cualquier momento. (Seleccione el icono Opciones junto al nombre de jerarquía, luego, Editar reconciliación, y seleccione la columna en la que basar el nivel, luego, Aceptar).
Información relacionada Crear una jerarquía geográfica o de tiempo [página 51] Crear un indicador o una dimensión calculados [página 55]
7.1.3.3
Crear una jerarquía personalizada
Puede crear una jerarquía mediante cualquier combinación de dimensiones disponibles. 1.
Seleccione el icono Opciones. para la dimensión que debe utilizarse como base para la jerarquía.
2.
Seleccione Crear una jerarquía personalizada. Aparecerá el cuadro de diálogo Crear jerarquía. Las dimensiones disponibles en el panel Indicadores y dimensiones están desglosadas en la parte izquierda del panel. Puede introducir una cadena de búsqueda para encontrar una dimensión (por ejemplo, las primeras letras del nombre una dimensión).
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
53
3.
Añadir dimensiones a la jerarquía en el panel derecho.
Sugerencias Puede hacer doble clic sobre dimensiones para moverlas entre paneles. 4.
(Opcional) Utilice las flechas junto a la lista de jerarquías para mover una dimensión seleccionada arriba o abajo en la jerarquía.
5.
Especifique el nombre de la jerarquía y haga clic en Crear. Aparece la nueva jerarquía personalizada en el panel Indicadores y dimensiones. Se crean columnas nuevas para cada nivel de la nueva jerarquía.
7.1.3.4
Creación de indicadores
Los indicadores enriquecen los conjuntos de datos. Puede crearlos manualmente en cualquier momento directamente desde una columna o dimensión o utilizando el idioma de fórmula para crear un indicador calculado, o puede permitir que la aplicación los detecte automáticamente en tipos de datos de columna numéricos al adquirir un conjunto de datos.
Nota Cuando usa una fuente de datos Conectarse a SAP HANA, no puede crear un indicador con una dimensión numérica o de cadena. Los indicadores en fuentes de datos Conectarse a SAP HANA se detectan directamente desde la vista analítica de SAP HANA. Se deben crear indicadores en la vista de SAP HANA antes de que se puedan adquirir automáticamente en la aplicación.
Información relacionada Crear un indicador a partir de una columna o dimensión [página 54] Crear un indicador o una dimensión calculados [página 55]
7.1.3.4.1
Crear un indicador a partir de una columna o dimensión
Puede crear un indicador a partir de casi cualquier columna o dimensión. Sin embargo, existen estas excepciones: ●
Si el tipo de datos de columna es Numérico, puede usar cualquier función de agrupamiento para el indicador.
●
Si el tipo de datos de la columna es Fecha o Cadena, ni Totalizar ni Media pueden utilizarse.
●
El agrupamiento se realiza cuando el indicador se usa en la vista Restricciones. No está disponible en la vista de Cuadrícula.
54
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
1.
Seleccione el icono Opciones sobre una cabecera de columna o la dimensión a utilizar ocmo base para el indicador, y luego, Crear un indicador. Se crea un indicador en la sección Indicadores del panel Indicadores y dimensiones.
2.
Seleccione el icono Opciones para el indicador nuevo, seleccione Modificar agregación y luego, una de las siguientes funciones agregadas siguientes: Opción
Descripción
Suma
Devuelve la suma de un indicador
Mín
Devuelve el valor más pequeño de un conjunto de valores
Máx
Devuelve el valor más grande en un conjunto de valores
Recuento (distintivo)
Devuelve el número de valores distintivos de un conjunto de valores.
Recuento (todo) Devuelve el número de valores en un conjunto de valores Promedio
Devuelve el promedio de un indicador
Ninguno
Para permitir que una dimensión numérica sea utilizada como indicador, sin agregación. Este tipo de indicador permite que cualquier valor se visualice en un gráfico, que puede ser útil para determinados tipos de gráficos. Por ejemplo, para una nube de puntos que visualiza margen y valores de cantidad vendida, utilizando Ninguno se visualizan todos los puntos en la nube de puntos y se mues tra la distribución de valores individuales que no serían aparentes con una función de agregación.
Para ver el indicador aplicado a los datos del conjunto de datos, haga clic en la vista Restricciones. Para ver cambios en los valores de datos causados por agregación, seleccione un indicador.
7.1.4
Crear un indicador o una dimensión calculados
Ahora puede crear indicadores y dimensiones calculadas usando el lenguaje de la fórmula deSAP Lumira. Dispone de las siguientes características que admite el editor de fórmulas: ●
Combinar dos columnas en el conjunto de datos
●
Aplicar funciones de un conjunto predefinido de funciones numéricas, de fecha y de texto
●
Utilice las cláusulas "si", "entonces" "sino"
●
Use la finalización automática para mejorar la velocidad de la edición
●
Use un selector de calendario para los parámetros de fecha
●
Copie y pegue texto y sintaxis en la definición de función
1.
Haga clic en el botón Cálculo y seleccione Nueva dimensión calculada o Nuevo indicador calculado.
Sugerencias Como alternativa, cree un indicador o dimensión calculados con el icono Opciones junto a un indicador o una dimensión, o seleccionando Crear dimensión calculada en el panel Herramientas de manipulación. 2.
Indique el nombre del indicador o de la dimensión.
3.
Haga doble clic en indicadores o dimensiones, y en funciones para introducirlas en el cuadro de sintaxis Fórmula.
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
55
4.
Introduzca los parámetros de la función y la información asociada según la tarea de la función. Debe escribir los nombres de las columnas que se usan en la fórmula. La compleción automática sugerirá un nombre de columna después de escribir la primera letra.
5.
Si está entrando información de calendario, haga clic en el botón Seleccionar una fecha en la parte inferior de la lista de funciones para seleccionar fechas.
6.
Haga clic en Aceptar para aplicar la fórmula. Se crea un nuevo indicador o dimensión.
Ejemplo Si desea crear una fórmula que multiplique los valores en la columna por 100, y redondea al siguiente entero. 1.
Haga clic en el botón Cálculo y seleccione Nueva dimensión calculada.
2.
En el diálogo Nueva dimensión calculada, haga doble clic sobre un objeto o función de dimensión para introducir la dimensión o función en la casilla Fórmula. Por ejemplo, haga doble clic en Ceil(num) .
3.
Edite la fórmula y agregue otros objetos de dimensión según sea necesario. Se crea una nueva columna con el nombre de fórmula predeterminado. Por ejemplo, añada Ceil(margin_gross_percent )*100 a la fórmula para crear una columna llamada Ceil(margin_gross_percent )*100.
4.
Escriba un nombre para la nueva dimensión calculada y haga clic en Aceptar. Se crea la nueva columna en el Panel Datos y aparece en el panel Indicadores y dimensiones.
7.1.4.1
Referencia para funciones
Puede definir qué funciones estarán dipsonibles en la barra de fórmulas. Tabla 24: Categorías o funciones Categoría
Descripción
Agregación
Agrega datos (por ejemplo sumando o haciendo el promedio
Las funciones agregadas se implementan en la definición de
de un conjunto de valores)
un indicador. Carácter
Manipula cadenas de caracteres
Fecha y hora
Devuelve datos de la fecha o la hora
Numéricos
Devuelve datos numéricos
Lógicos
Devuelve true o false
Varios
Las funciones que no encajan en ninguna otra categoría
56
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Información relacionada Crear un indicador a partir de una columna o dimensión [página 54] Funciones de caracteres [página 57] Funciones de fecha y hora [página 62] Funciones numéricas [página 66] Funciones lógicas [página 69] Funciones varias [página 70]
7.1.4.1.1
Funciones de caracteres
Utilice una función de caracteres para manipular las cadenas de caracteres de una fórmula. La entrada es una columna de su conjunto de datos y las funciones se aplican a los contenidos de las celdas. Tabla 25: Funciones de caracteres Función
como
Sintaxis ● ●
Uso
matchExpr: Expresión de string a
Se utiliza para determinar si una cadena
buscar
de caracteres se corresponde con un pa
pattern: Constante de string de
trón específico. La búsqueda no distin
patrón a buscar para
gue entre mayúsculas y minúsculas. El patrón puede incluir caracteres nor males y los siguientes caracteres espe ciales: ●
"_" equivale a un único carácter
●
"%" equivale a cero o muchos ca racteres
Antes de poder utilizar un carácter espe cial como carácter normal, debe evitarlo con una antibarra "\".
Nota "[", "^", "-", y "]" se reservan a un uso futuro. Por ejemplo:
"Hiking is fun" like "H% is _un" devuelve true
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
57
Función
Concatenate(str1, str2)
Sintaxis
Uso
●
str1: primera cadena
Se utiliza para concatenar dos cadenas
●
str2: segunda cadena
en una única cadena. El operador + también permite concate nar strings. Por ejemplo:
Concatenate("Mr", "Brown") devuelve "MrBrown"
Contener(whereStr, whatStr)
● ●
whereStr: Cadena en la que se
Se utiliza para devolver repeticiones de
lleva a cabo la búsqueda
una cadena dentro de otra cadena. La
whatStr: Subcadena que es el ob búsqueda no distingue entre mayúscu jeto de la búsqueda
las y minúsculas. Por ejemplo:
Contain("Cats are grey", "aRe") devuelve true
ExceptFirstWord(cad, sep)
●
str: cadena de entrada
Se utiliza para devolver una copia de una
●
sep: un separador
cadena sin la primera palabra. Por ejemplo:
ExceptFirstWord("Level 3, Standford Street", ", ") devuelve "Standford Street"
ExceptLastWord(cad, sep)
●
str: cadena de entrada
Se utiliza para devolver una copia de una
●
sep: un separador
cadena sin la última palabra. Por ejemplo:
ExceptLastWord("james.bro [email protected]", "@") devuelve "james.brown"
58
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Función
FirstWord(cad, sep)
Sintaxis
Uso
●
str: cadena de entrada
Se utiliza para devolver la primera pala
●
sep: un separador
bra de una cadena. Por ejemplo:
FirstWord("Senior Developer", " ") devuelve "Senior"
LastWord(cad, sep)
●
str: cadena de entrada
Se utiliza para devolver la última palabra
●
sep: un separador
de una cadena. Por ejemplo:
LastWord("Red/Purple", "/") devuelve "Purple"
Length(cadena)
Se utiliza para devolver la longitud de
str: cadena de entrada
una cadena. Por ejemplo:
Length("How long") devuelve 8
LowerCase(cadena)
Se utililza para devuelve una copia de
str: cadena de entrada
una cadena, con todos los caracteres convertidos a minúsculas. Por ejemplo:
LowerCase("GOOD JOB") devuelve "good job"
Lpad(cad, longitud, alm)
●
str: cadena de entrada
●
length: número de caracteres es una cadena a la que se añaden caracte res delante hasta completar la longitud
perado. ●
pad: Secuencia de caracteres a añadir
Se utiliza para devuelve una copia de
total especificada. Por ejemplo:
Lpad("Incomplete field", 20, "#") devuelve "####Incomplete
field"
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
59
Función
Sintaxis
Uso
Replace(cad, destino,
●
str: cadena de entrada
Se utiliza para devolver una cadena con
sustituto)
●
target: Cadena a reemplazar
todas las apariciones de una cadena es
●
replacement: Valor de cadena a introducir
pecífica con otra cadena específica. Por ejemplo:
Replace("Very good song", "o" , "u") devuelve "Very guud sung"
Rpad(cad, longitud, alm)
●
str: cadena de entrada
●
length: número de caracteres es cadena a la que se añaden caracteres perado.
●
pad: Secuencia de caracteres a añadir
Se utiliza para devolver una copia de una detrás hasta completar la longitud total especificada. Por ejemplo:
Rpad("Incomplete field", 20, "#") devuelve "Incomplete
field####" SubString(cad, inicio)
●
str: La cadena a partir de la que se Se utiliza para devolver una subcadena calcula la subcadena.
●
de una cadena.
start: Posición inicial de la subca Por ejemplo: dena de entrada.
SubString("Wong", 3) devuelve "ng"
SubString(cad, inicio,
●
longitud) ●
str: La cadena para la que se cal
Se utiliza para devolver una subcadena
cula la subcadena
de una cadena.
start: La posición inicial de la sub Por ejemplo: cadena de entrada.
●
length: La longitud de la subca dena que se debe devolver
ToText(parámetro)
param: Parámetro a convertir
SubString("Wong", 2, 2) devuelve "on" Se utiliza para convertir un parámetro en una cadena. Todos los parámetros son válidos y los números se truncan en los 0 espacios decimales.
60
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Función
Trim(cad, cortar)
Sintaxis
Uso
●
str: cadena de entrada
Se utiliza para devolver una copia de la
●
toTrim: Carácter a eliminar
cadena con las repeticiones iniciales y secundarias de un carácter eliminado. Esta función distingue entre mayúsculas y minúsculas. Por ejemplo:
Trim("Aurora", "a") devuelve "Auror"
TrimLeft(cad, cortar)
●
str: cadena de entrada
Se utiliza para devolver una copia de la
●
toTrim: Carácter a eliminar
cadena con la repetición inicial de un ca rácter eliminado. Esta función distingue entre mayúsculas y minúsculas. Por ejemplo:
TrimLeft("Above", "A") devuelve "bove"
TrimRight(cad, cortar)
●
str: cadena de entrada
Se utiliza para devolver una copia de la
●
toTrim: Carácter a eliminar
cadena con las repeticiones iniciales de un carácter eliminado. Esta función dis tingue entre mayúsculas y minúsculas. Por ejemplo:
TrimRight("Laura", "a") devuelve "Laur"
UpperCase(cad)
str: cadena de entrada
Se utililza para devolver una copia de una cadena, con todos los caracteres convertidos a mayúsculas. Por ejemplo:
UpperCase("Little Boy") devuelve "LITTLE BOY"
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
61
Función
Sintaxis
Uso
ToDate(cadena, formato)
El formato de fecha es una combinación
Se utiliza para convertir una cadena de
de los siguientes tokens reservados se
entrada de un conjunto de datos en una
parados por delimitadores:
fecha en un formato específico, cuando
●
d o dd: día del mes (1-31)
●
M o MM: mes del año (1-12)
●
y o yy: Año abreviado sin siglo (00-99)
yyyy: Año con siglo (1956, 2012, 2014, etc.) El resto de secuencias se consideran de limitadores ●
string: String de entrada a con
●
format: constante de la cadena de
las fechas de una columna de una fuente de datos original están en formato de ca dena. Por ejemplo:
ToDate(Obj, 'yyyy/dd/MM') convierte una cadena en el formato
aaaa/dd/MM a una fecha:
vertir formato de fecha. Tabla 26: Ejemplo de la función Trim(str, toTrim): Trim ({Name},"a") Nombre
Cadena recortada
Aurora
Auror
Auror
Auror
auror
uror
aurora
uror
uror
uror
Esta fórmula devuelve "Auror": Recortar("Aurora", "a").
7.1.4.1.2
Funciones de fecha y hora
Las funciones de fecha y hora devuelven los datos de fecha o de hora. Tenga en cuenta que puede que necesite convertir el formato de sus datos de origen en la aplicación.
62
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Tabla 27: Funciones de fecha y hora Función
Sintaxis
Uso
AddMonthToDate(#date#,perio
●
#date#: Fecha original
Se utiliza para devolver una fecha que se
ds)
●
periods: La cantidad de períodos
obtiene añadiendo una cantidad deter
a agregar
minada de meses a una fecha específica. Por ejemplo:
AddMonthToDate(#2012-01-0 1#,1) devuelve 2012-02-01
AddWeekToDate(#date#,period
●
#date#: Fecha original
Se utiliza para devolver una fecha que se
s)
●
periods: Cantidad de períodos a
obtiene añadiendo una cantidad deter
agregar
minada de semanas a una fecha. Por ejemplo:
AddWeekToDate(#2012-01-01 #,1) devuelve 08.01.12
AddYearToDate(#date#,period
●
#date#: Fecha original
Se utiliza para devolver una fecha que se
s)
●
periods: Cantidad de períodos a
obtiene añadiendo una cantidad deter
agregar
minada de años a una fecha específica. Utilice números negativos para eliminar un año. Por ejemplo:
AddYearToDate(#2012-01-01 #,1) devuelve 01.01.13 Se utiliza para devolver la fecha actual
FechaActual()
como fecha. Por ejemplo:
CurrentDate() devuelve
DateDiffInDays(#start#,#end
●
#) ●
#start#: Fecha de inicio del inter Se utiliza para devolver la cantidad de valo
días entre dos fechas.
#end#: Fecha de fin del intervalo
Por ejemplo:
DateDiffInDays(#2012-03-2 3#,#2012-01-30#) devuelve -53
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
63
Función
DateDiffInMonths(#start#,#e
Sintaxis ●
nd#) ●
Uso
#start#: Fecha de inicio del inter Se utiliza para devolver la cantidad de valo
meses entre dos fechas específicas.
#end#: Fecha de fin del intervalo
Por ejemplo:
DateDiffInMonths(#2013-02 -01#,#2014-01-01#) devuelve 11
Day(#date#)
#date#: una fecha.
Se utiliza para devolver el día del mes como un número del 1 al 31. Por ejemplo:
Day(#2012-03-23#) devuelve 23
DayOfWeek(#date#)
#date#: una fecha.
Se utiliza para devolver el día de la se mana como un número del 1 (domingo) al 7 (sábado). Por ejemplo:
DayOfWeek(#2012-03-23#) devuelve 6
DayOfYear(#date#)
#date#: una fecha.
Se utiliza para devolver el día del año como un número. Por ejemplo:
DayOfYear(#2012-03-23#) devuelve 83
LastDayOfMonth(#date#)
#date#: una fecha.
Se utiliza para devolver la fecha resul tante al calcular el último día del mes de la fecha específica. Por ejemplo:
LastDayOfMonth(#2012-03-2 3#) devuelve la fecha 2012-03-31
64
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Función
Sintaxis
Uso
LastDayOfWeek(#date#)
#date#: Una fecha
Se utiliza para devolver la fecha resul tante al calcular el último día de la se mana de una fecha específica. Por ejemplo:
LastDayOfWeek(#2012-03-23 #) devuelve la fecha 24.03.12
MakeDate(year,month,day)
● ● ●
year: Un número que representa
Se utiliza para devolver una fecha que se
un año
crea a partir del año, el mes y el día es
month: Un número que representa
pecíficos.
un mes
Por ejemplo:
day: Un número que representa un día del mes
MakeDate(2011,6,12) devuelve la fecha 12.06.11
Month(#date#)
#date#: Una fecha
Se utiliza para devolver el mes del año como un número del 1 al 12. Por ejemplo:
Month(#2012-03-23#) devuelve 3
Quarter(#date#)
#date#: Una fecha
Se utiliza para devolver un número que representa el trimestre de una fecha es pecífica. Por ejemplo:
Quarter(#2012-03-23#) devuelve 1
Week(#date#)
#date#: Una fecha
Se utiliza para devolver un número que representa la semana de una fecha es pecífica. Por ejemplo:
Week(#2012-03-23#) devuelve 12
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
65
Función
Sintaxis
Uso
Year(#date#)
#date#: Una fecha
Esta sintaxis devuelve el año de una fe cha específica. Por ejemplo:
Year(#2012-03-23#) devuelve 2012
7.1.4.1.3
Funciones numéricas
Utilice funciones numéricas para devolver valores numéricos en una fórmula. Tabla 28: Funciones numéricas Función
Sintaxis
Uso
Ceil(num)
num: un número.
Se utiliza para devolver el entero más pequeño superior o igual a un número determinado. Por ejemplo:
Ceil(14.2) devuelve 15
Floor(num)
num: un número.
Se utiliza para devolver el entero mayor que no sea superior a un número deter minado. Por ejemplo:
Floor(14.8) devuelve 14
Log(num)
num: un número.
Se utiliza para devolver el logaritmo na tural de un número especificado. Por ejemplo:
Log(100) devuelve 4,605
66
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Función
Sintaxis
Uso
Log10(num)
num: un número.
Se utiliza para devolver el logaritmo base 10 de un número especificado. Por ejemplo:
Log10(100) devuelve 2
Mod(número, divisor)
●
num: un número.
Sirve para devolver el resto de la división
●
divisor: el divisor.
de un número entre otro número. Por ejemplo:
Mod(15,2) devuelve 1
Power(número, exponente)
●
num: un número.
Se utiliza para elevar un número a una
●
exponent: el exponente.
potencia. Se puede usar el operador ^ en vez de esta función. Por ejemplo:
Power(2,3) devuelve 8
Round(número, dígitos)
●
num: un número.
Se utiliza para devolver un valor numé
●
digits: El número de decimales
rico redondeado a un número de deci
para redondear.
males determinado. Por ejemplo:
Round(14.81, 1) devuelve 14,8
Sign(número)
num: un número.
Se utiliza para devolver -1 si un número determinado es negativo, 0 si el número es cero, o +1 si el número es positivo. Por ejemplo:
Sign(-2) devuelve -1
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
67
Función
ToText(número, dígitos)
Sintaxis
Uso
●
num: un número.
Se utiliza para convertir un número de
●
digits: Número de decimales
terminado en una cadena. El número se
para usar. Este parámetro es opcio
trunca a un número especificado de de
nal, el valor predeterminado es 0.
cimales. Por ejemplo:
ToText(12.1451, 2) devuelve 12,14
Truncate(número, dígitos)
●
num: un número.
Se utiliza para devolver un valor numé
●
digits: Número de decimales
rico, truncado en un número de decima
para truncar
les determinado. Por ejemplo:
Truncate(12.281, 1) devuelve 12,200 Tabla 29: Ejemplo de la función ToText(num, digits): ToText({Temperature},2) Temperatura
Texto
-2.01
-2.0
-1.06
-1.1
0.08
0.1
1.07
1.1
2.08
2.1
3.99
4.0
5.00
5.0
Esta fórmula devuelve 12,14: ToText(12.1451, 2). Tabla 30: Ejemplo de la función Truncate(num, digits): Truncate({Temperature},1) Temperatura
truncada
-2.01
-2.00
-1.06
-1.00
0.08
0.00
1.07
1.00
2.08
2.00
3.99
3.90
5.00
5.00
Esta fórmula devuelve 12.200: Truncar(12.281, 1).
68
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
7.1.4.1.4
Funciones lógicas
Las funciones lógicas se pueden utilizar en una fórmula para devolver true o false. Tabla 31: Funciones lógicas Función
Sintaxis
Uso
IsNotNull(obj)
obj: Objeto de usuario (columna)
Utilícelo para devolver un valor booleano que indica si un campo proporcionado no contiene un valor nulo. Cuando un campo contiene un valor nulo, la función devuelve false. Para todos los demás valores, la función devuelve true.
IsNull(obj)
obj: Objeto de usuario (columna)
Utilícelo para devolver un valor booleano que indica si el campo proporcionado contiene un valor nulo. Cuando un campo contiene un valor nulo, la función devuelve true. Para todos los demás valores, la función devuelve false.
y
●
izquierda: Operando izquierdo
Sirven para devolver la conjunción lógica
●
derecha: Operando derecho
de sus entradas booleanas. Esta función devuelve false: true y false.
o
●
izquierda: Operando izquierdo
Sirven para devolver la disyunción lógica
●
derecha: Operando derecho
de sus entradas booleanas. Esta función devuelve true: true o false.
●
cond: Condición booleana a verifi
Sirven para seleccionar una de las dos
car
alternativas basándose en una condición
●
alt1: Alternativa 1
booleana. La segunda alternativa es op
●
alt2: Alternativa 2
en
●
testExpr: Expresión a probar
Se utiliza para determinar si una primera
●
candidateList: Lista de candi
entrada coincide con un valor en una se
datos que coinciden
gunda lista de entrada.
if then else
cional y se evalúa como null cuando falta.
Por ejemplo:
3 in [2, 4, 6] devuelve false
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
69
Función
Sintaxis
Uso
not
bool: Un booleano
Se utiliza para negar una entrada boo leana. Por ejemplo:
not false devuelve true Tabla 32: Ejemplo de la función y Izquierda
Derecha
Resultado de <{Left}> y <{Right}>
True
True
true
True
False
false
False
True
false
False
False
false
Esta función devuelve false: true y false. Tabla 33: Ejemplo de la función o Izquierda
Derecha
Resultado de <{Left}> o <{Right}>
True
True
true
True
False
true
False
True
true
False
False
false
Esta función devuelve true: true o false.
7.1.4.1.5
Funciones varias
Estas funciones se pueden utilizar en una fórmula, pero no encajan en una categoría estándar para familias de funciones.
70
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Tabla 34: Funciones varias Función
Sintaxis ●
GroupValues(columna,
Uso
column: Objeto de usuario para aplicar la agrupación a
ListOfValues, newValue) ●
Por ejemplo:
ListOfValues: Lista de valores que se debe agrupar
●
Utilizar para agrupar una lista de valores.
newValue: Valor que debe susti tuir a los valores agrupados
GroupValues(CountryColumn , ["USA", "India", "France"], "My Countries") devuelve "My Countries" cuando la columna CountryColumn contiene
"USA", "India", o "France" ToNumber(parámetro)
param: Parámetro a convertir
Utilizar para convertir cualquier tipo de parámetro a un valor numérico. Los nú meros se cortan en las 0 posiciones de cimales.
7.1.5
Trabajo con conjuntos de datos múltiples
Puede agregar un conjunto de datos a los conjuntos de datos disponibles, moverse entre conjuntos de datos y fusionar o anexar dos conjuntos de datos. Al combinar conjuntos de datos, dos conjuntos de datos se fusionan con el operador JOIN, y dos conjuntos de datos coincidentes se fusionan con el operador UNION. Los conjuntos de datos anexados son compatibles y tienen un número de columnas equivalente en la tabla fusionada.
Información relacionada Agregación de un conjunto de datos [página 71] Alternar a otro set de datos [página 72] Fusionar conjuntos de datos (JOIN) [página 72] Agregar conjuntos de datos (UNION) [página 73] Eliminación de un conjunto de datos [página 73]
7.1.5.1
Agregación de un conjunto de datos
Puede abrir varios conjuntos de datos en el mismo documento, y puede agregar un conjunto de datos a un documento. 1.
En la lista de conjuntos de datos situada en la parte superior del panel Datos, seleccione Añadir conjunto de datos.
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
71
2.
En el diálogo Conjunto de datos nuevo, seleccione un conjunto d datos en el panel Seleccionar una fuente o Todas las utilizadas recientemente, y luego, Siguiente.
3.
Introduzca la información de la conexión y seleccione Crear.
Los datos del conjunto de datos se adquieren en el documento.
7.1.5.2
Alternar a otro set de datos
Puede tener múltiples conjuntos de datos abiertos en un documento a la vez y cambiar de uno a otro, cosa que resulta útil al preparar una fusión entre dos conjuntos de datos. En la lista de conjuntos de datos situada en la parte superior del panel Datos, seleccione el conjunto de datos al que debe cambiarse. El conjunto de datos seleccionado es ahora el conjunto de datos activo.
7.1.5.3
Fusionar conjuntos de datos (JOIN)
Utilice el operador JOIN para fusionar dos conjuntos de datos. ●
El conjunto de datos que se quiere fusionar debe tener una columna clave.
●
Sólo pueden fusionarse columnas con el mismo tipo de datos.
●
La fusión combina todas las columnas.
Las columnas del segundo conjunto de datos se comparan con una columna clave en el conjunto de datos original. La aplicación propone coincidencias de columna potenciales y la probabilidad de cada una de ellas.
Nota Una vez que el conjunto de datos se ha fusionado con otro, estos se convierten en una unidad. No puede eliminarse ninguno de los dos. 1.
Seleccione el icono Combinar como. en la barra de menú, y luego, Fusionar.
2.
En el diálogo Fusionar datos, seleccione la columna clave que debe utilizarse como la columna identificativa para las coincidencias.
3.
Realice una de las siguientes acciones: Opción
Descripción
Si el conjunto de datos por fusionar ya está disponible Seleccione el conjunto de datos en la lista sobre el panel dere en el documento cho. Si el conjunto de datos por fusionar no está abierto
Seleccione Añadir conjunto de datos nuevo, y luego, la fuente de datos para fusionar.
Las columnas que pueden coincidir en base a la columna clave en el conjunto de datos original se desglosan en Conjunto de datos de búsqueda. 4.
Seleccione Fusionar.
Las columnas en el segundo conjunto de datos se añaden al conjunto de datos original.
72
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Preparar datos
Información relacionada Agregar conjuntos de datos (UNION) [página 73]
7.1.5.4
Agregar conjuntos de datos (UNION)
Utilice el operador UNION para adjuntar dos conjuntos de datos. Ambas tablas en la unión deben contener una cantidad equivalente de columnas y tipos de datos compatibles. Sólo un conjunto de datos compatible con el de destino puede adjuntarse. Una vez que un conjunto de datos se ha fusionado con otro, estos se convierten en una unidad y no pueden separarse. 1.
Seleccione el icono Combinar.en la barra de menú, y luego, Adjuntar.
2.
En el cuadro de diálogo Adjuntar datos, lleve a cabo una de las acciones siguientes: Opción
Descripción
Si el conjunto de datos por adjuntar ya está disponi Seleccione el conjunto de datos en la lista sobre el panel derecho. ble en el documento Si el conjunto de datos por adjuntar no está abierto
Seleccione Añadir conjunto de datos nuevo, y luego, la fuente de datos para adquirir y adjuntar.
Si el conjunto de datos por adjuntar es compatible con el conjunto de datos original, las columnas de dimensión se desglosan en Conjunto de datos de búsqueda en la parte derecha del panel. En la columna Ejemplo de valores únicos se muestra un ejemplo de los valores únicos para cada dimensión seleccionada. 3.
Para seleccionar una dimensón de fuente diferente para la unión con la dimensión destino coincidente, seleccione otra dimensión de la lista. Si la dimensión seleccionada contiene un tipo de datos compatible, puede adjuntarse. Si aparece un mensahe La unión no es posible en rojo, la dimensión seleccionada no contenía un tipo de datos compatible y debe seleccionar una dimensión compatible.
4.
Seleccione Adjuntar. Los dos conjuntos de datos se combinan. El conjunto de datos combinado conserva los nombres de columna del conjunto de datos de destino.
7.1.5.5
Eliminación de un conjunto de datos
Puede eliminar un conjunto de datos de un documento, si no se ha adjuntado o fusionado con otro conjunto de datos: 1.
En la lista de conjuntos de datos situada en la parte superior del panel Datos, seleccione el conjunto de datos que debe eliminarse.
2.
Seleccione el icono Eliminar conjunto de datosjunto al conjunto de datos.
El conjunto de datos y cualquier visualización basada en él se borran.
Manual de usuario de Expert Analytics Preparar datos
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
73
8
Crear análisis
8.1
Crear un análisis
Puede usar Expert Analytics para realizar minería y análisis estadísticos de datos mediante la ejecución de los datos con una serie de componentes. Los componentes de la serie están conectados entre sí con conectores, lo que define la dirección del flujo de datos. Este proceso recibe el nombre de análisis. Un documento es el punto de inicio al usar Expert Analytics. Debe crear un documento para empezar a analizar los datos y crear nuevos análisis. Puede abrir documentos guardados que están almacenados localmente para ver o modificar análisis y conjuntos de datos existentes. Cada documento es un archivo que contiene: ●
Parámetros de conexión para el origen de datos, si el origen es un RDBMS.
●
Conjunto de datos: los datos de la columna usada para crear gráficos.
●
Análisis y modelos y sus resultados.
●
Los gráficos se crean a partir de los datos y se guardan como visualizaciones.
Para crear un análisis, realice los siguientes pasos: 1.
Adquiera datos de un origen de datos.
2.
Opcional: Prepare los datos para el análisis (por ejemplo, filtrando los datos).
3.
Aplique algoritmos.
4.
Opcional: Almacene los resultados de los análisis para realizar análisis posteriores.
Para agregar múltiples análisis al documento, seleccione el botón herramientas de análisis.
(Añadir análisis) de la barra de
Información relacionada Preparar datos [página 42] Aplicar Componentes de procesamiento previo a datos [página 74] Aplicar algoritmos [página 75] Opcional: Almacenar resultados del análisis [página 77]
8.1.1
Aplicar Componentes de procesamiento previo a datos
Puede aplicar componentes de procesamiento previo a sus datos, por ejemplo, filtros, antes de ejecutar el análisis. Este paso es opcional.
74
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Crear análisis
Es posible que, en muchos casos, los datos sin procesar del origen de datos no sean adecuados para el análisis. Para obtener resultados precisos, es posible que tenga que preparar y procesar los datos antes del análisis. Puede encontrar las funciones de manipulación de datos en el espacio Preparar y las funciones de preparación de datos en el espacio Predecir. En el espacio Preparar puede trabajar en datos estáticos o preliminares que se importa a Expert Analytics. En el espacio Predecir, puede trabajar con datos transitorios mediante componentes de preprocesadores. La preparación de datos implica la comprobación de los datos para la precisión y los campos faltantes, el filtrado de datos según valores de rango, el muestreo de datos para investigar un subconjunto de datos y la manipulación de datos. Puede procesar los datos mediante componentes de preparación de datos. 1.
En el espacio Predecir, haga doble clic en el componente de algoritmo necesario en la lista de componentes a la derecha. El componente de preprocesador se agrega al editor de análisis y se crea una conexión automática al componente de fuente de datos.
2.
Desde el menú contextual del componente de preprocesador, seleccione Configurar propiedades.
3.
En el cuadro de diálogo de propiedades de componente, introduzca los detalles necesarios para las propiedades del componente de preprocesador.
4.
Seleccione Fin.
5.
Para ver los resultados del análisis, seleccione
(Ejecutar análisis).
Información relacionada Componentes de preparación de datos [página 202]
8.1.2
Aplicar algoritmos
Cuando disponga de los datos pertinentes para el análisis, tendrá que aplicar los algoritmos adecuados para descubrir los patrones de los datos. Saber qué algoritmo se tiene que usar en cada caso no es evidente. Puede usar una combinación de algoritmos para analizar los datos. Por ejemplo, primero puede usar algoritmos de series temporales para suavizar los datos y después usar algoritmos de regresión para averiguar las tendencias. En la tabla siguiente, se proporciona información sobre qué algoritmos elegir en determinados casos: Finalidad
Algoritmo
Realizar predicciones basadas en tiempo
Algoritmos de series temporales
Predicción de variables continuas basadas en otras variables del conjunto de datos
Manual de usuario de Expert Analytics Crear análisis
●
Suavizado exponencial sencillo
●
Suavizado exponencial doble
●
Suavizado exponencial triple
Algoritmos de regresión
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
75
Finalidad
Algoritmo
Localizar patrones frecuentes de conjuntos de elementos en grandes conjuntos de datos transaccionales para generar reglas de asociaciones
Agrupar observaciones en grupos de conjuntos de datos similares Clasificar y predecir una o más variables discretas sobre la base de otras variables del conjunto de datos
Detectar valores atípicos del conjunto de datos
Predicción, clasificación y reconocimiento de patrón estadístico
●
Regresión lineal
●
Regresión exponencial
●
Regresión geométrica
●
Regresión algorítmica
●
Regresión lineal múltiple
●
Regresión polinómica
●
Regresión logística
Algoritmos de asociación ●
Apriori
●
AprioriLite
Algoritmos de agrupación en clúster ●
K-Means
Árboles de decisiones ●
HANA C 4.5
●
Árbol CNR R
●
CHAID
Algoritmos de detección de valores atípicos ●
Rango intercuartil
●
Valor atípico de vecino más próximo
●
Detección de anomalías
●
Prueba de varianza
Algoritmos de red neuronal ●
Red neuronal NNet R
●
Red neuronal MONMLP R
Si no ha encontrado un algoritmo relevante, puede crear su propio componente personalizado con el script de R en Expert Analytics y realizar en el análisis en los datos que haya adquirido. Para obtener más información sobre cómo añadir un componente adicional, consulte: Asistente de creación de componentes R [página 80] 1.
En el espacio Predecir, haga doble clic en el componente de algoritmo necesario en la lista de componentes a la derecha. El componente de algoritmo se agrega al editor de análisis y se conecta al componente anterior del análisis.
2.
Desde el menú contextual del componente de logaritmos, seleccione Configurar propiedades.
3.
En el cuadro de diálogo de propiedades de componente, introduzca los detalles necesarios para las propiedades del componente de algoritmo.
4.
Seleccione Fin.
5.
Para ver los resultados del análisis, seleccione
76
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
(Ejecutar análisis).
Manual de usuario de Expert Analytics Crear análisis
Información relacionada Algoritmos [página 134]
8.1.3
Opcional: Almacenar resultados del análisis
Puede almacenar los resultados del análisis en archivos planos o en bases de datos para analizarlos posteriormente usando componentes grabadores de datos. Solo se almacena la vista de tabla en el componente grabador de datos. 1.
En el espacio Predecir, haga doble clic en el componente de algoritmo necesario en la lista de componentes a la derecha. El componente grabador de datos se agrega al editor de análisis y se conecta al componente anterior del análisis.
2.
Desde el menú contextual del componente grabador de datos, seleccione Configurar propiedades.
3.
En el cuadro de diálogo de propiedades del componente, introduzca los detalles necesarios para las propiedades del componente grabador de datos.
4.
Seleccione Fin.
5.
Para ver los resultados del análisis, seleccione
(Ejecutar análisis).
Información relacionada Grabadores de datos [página 224]
8.2
Ejecutar el análisis
Tras haber preparado los datos y aplicado los algoritmos necesarios, puede ejecutar un análisis. ●
Para ejecutar el análisis, seleccione
●
Si su análisis es muy grande y complejo, puede ejecutar el análisis componente por componente y analizar los datos. Para ejecutar una parte del análisis, seleccione Ejecutar hasta aquí desde el menú contextual del componente hasta el que quiere realizar la ejecución.
Manual de usuario de Expert Analytics Crear análisis
(Ejecutar análisis) en la barra de herramientas del editor de análisis.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
77
8.3
Guardar el análisis
Después de crear un análisis, puede guardarlo para volverlo a usar en el futuro. En Expert Analytics, debe guardar el documento para guardar el análisis que cree. El documento guardado contiene el conjunto de datos, los análisis, resultados y visualizaciones. El documento se guarda con el formato de archivo .lums Para guardar un análisis en un documento, realice los siguientes pasos: 1.
Seleccione
Archivo
Guardar .
2.
Introduzca un nombre para el documento.
3.
Seleccione Guardar.
Si crea varios análisis con el mismo conjunto de datos, todos los análisis se guardan en el mismo documento. Puede acceder a todos los análisis de un documento mediante la lista desplegable Análisis.
8.4
Eliminación de análisis desde el documento
Puede eliminar un análisis si ya no lo necesita. Para eliminar un análisis existente del documento, pase el puntero del ratón sobre la imagen del análisis de la barra de análisis y seleccione
8.5
Ver resultados
Para ver los resultados de componentes en un análisis, una vez ejecutado, cambie a la vista Resultados o, en el menú contextual del componente, seleccione Ver resultados.
8.6
Exportación de un análisis como un procedimiento almacenado
Puede exportar un análisis SAP HANA como procedimiento almacenado a la base de datos SAP HANA. Cualquier usuario de SAP HANA puede utilizar ese análisis en SAP HANA Studio para realizar más análisis. Antes de exportar un análisis como un procedimiento almacenado a una base de datos SAP HANA, asegúrese de que su cuenta está definida en SAP HANA. 1.
Crear un análisis.
2.
Ejecutar el análisis.
3.
Seleccione el último componente de algoritmo en el análisis y desde el menú contextual, seleccione Exportar como un procedimiento almacenado.
78
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Crear análisis
4.
Seleccione el nombre de esquema.
5.
Escriba un nombre para el procedimiento.
6.
Si desea sobrescribir el procedimiento existente con un procedimiento creado recientemente, seleccione la opción Sobrescribir, si existe.
7.
Opcional: Introduzca un nombre para la vista:
8.
Seleccione Exportar.
El procedimiento exportado y los objetos asociados aparecen en el esquema seleccionado en la base de datos SAP HANA. Los siguientes objetos se creadn en la base de datos SAP HANA bajo el esquema seleccionado: ●
Procedimiento con nombre especificado.
●
Si ha decidido crear una vista, entonces una vista de columna con nombre especificado.
●
Uno o varios procedimientos para cada componente en la cadena de análisis.
●
Una vista de columna por cada componente en la cadena.
●
Tipos de tabla necesarios para algoritmos SAP HANA.
●
Tablas necesarias para dichos algoritmos que puedan contener parámetros de entrada.
Ejemplo Utilizar el procedimiento almacenado
Sugerencias El siguiente snippet SQL le muestra cómo puede utilizar el procedimiento almacenado exportado: CREATE TABLE ResultTable like "TestProc_OUT_TYPE"; call "TEST80"."TestProc"(ResultTable) WITH OVERVIEW; select * from ResultTable ; TestProc_OUT_TYPE es el mismo que el tipo de tabla que TestProc prevé como parámetro de salida. Utilizar la vista de columna
Sugerencias Hay una función adicional disponible con la que el usuario puede crear vistas de columna sobre el procedimiento almacenado: Select * from VIEW_TESTPROC
Información relacionada Exportar un modelo de SAP HANA como procedimiento almacenado [página 131]
Manual de usuario de Expert Analytics Crear análisis
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
79
9
Agregar componentes personalizados
9.1
Componente R personalizado
Como usuario experto, podrá crear y añadir un componente mediante secuencias de comandos R. El nuevo componente R añadido se clasifica en Componentes R personalizados Algoritmos en la lista de componentes de la derecha, dependiendo del tipo de componente creado. Puede clasificarse por ejemplo como algoritmo, componente de procesador o grabador de datos. Puede utilizar componentes personalizados para realizar un análisis del conjunto de datos adquirido. R es un lenguaje y entorno de programación de software para computación estadística y gráficos. Expert Analytics le proporciona un entorno para utilizar scripts R (dentro de un formato de función R válido) y crear un componente, que puede utilizarse para su análisis del mismo modo que para otro componente existente. Durante la creación de un componente R, puede proporcionar un nombre para el componente que aparece en la Algoritmos
clasificación
9.1.1
Componentes R personalizados
de la lista de componentes de la derecha.
Asistente de creación de componentes R
Puede especificar propiedades para el componente R personalizado.
Propiedades del asistente de creación de componentes R Tabla 35: General Propiedad
Descripción
Nombre de componente
Introduzca un nombre para el componente.
Nota No puede cambiar el nombre de un componente personali zado existente. Tipo de componente
Seleccione el tipo de componente.
Descripción de los componentes
Indique una descripción del componente. Ésta aparecerá como información en pantalla del componente creado.
Tabla 36: Secuencia de comandos Propiedad
Descripción
Cargar script R
Haga clic para cargar una secuencia de comandos R.
80
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Agregar componentes personalizados
Propiedad
Descripción
Editor de secuencia de comandos
Copie y pegue o escriba el script R en la caja de texto.
Nombre de la función principal
Seleccione el nombre de la función que desee ejecutar.
Marco de datos de entrada
Seleccione el Marco de datos de entrada de la lista de pará metros.
Marco de datos de salida
Indique un nombre para la variable que desee utilizar como Marco de datos de salida.
Nombre de la variable de modelo
Indique un nombre para la variable que desee utilizar como variable de modelo.
Mostrar visualización
Seleccione esta opción para visualizar los resultados de la eje cución de componente personalizado en formato de gráfico.
Mostrar resumen
Seleccione esta opción para visualizar el resumen del algo ritmo tras la ejecución del componente personalizado.
Opción para guardar el modelo
Seleccione esta casilla de verificación para permitir la opción Guardar como modelo para el componente personalizado.
Nota Si selecciona Opción para guardar el modelo, se habilita el campo Nombre de variable de modelo y aparece detalles de la función de puntaje modelo Opción para exportar como PMML
Seleccione esta casilla de verificación para permitir la opción Exportar como PMML para el componente personalizado.
Nota Solo se habilita la casilla de selección Opción de exportar como PMML si selecciona Opción para guardar el modelo. Nombre de la función Definición de puntaje de modelo
Seleccione el nombre de la función de puntaje modelo que de see ejecutar.
Nota Los campos de función de puntaje modelo solo son visibles si selecciona la casilla de verificación Opción para guardar el modelo. Marco de datos de entrada
Seleccione el Marco de datos de entrada de la lista de pará metros.
Marco de datos de salida
Indique un nombre para la variable que desee utilizar como Marco de datos de salida.
Nombre de la variable de modelo de entrada
Seleccione el Nombre de variable modelo de entrada de la lista de parámetros.
Manual de usuario de Expert Analytics Agregar componentes personalizados
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
81
Tabla 37: Configuración Propiedad
Descripción
Función principal: Definición de tabla de salida Tenga en cuenta todas las columnas del componente anterior, Seleccione incluir o excluir respectivamente la columna pre o más vista del componente principal en la salida del componente personalizado. Tipo de datos
Seleccione el tipo de datospara la columna prevista del com ponente personalizado.
Nuevo nombre de columna prevista
Introduzca un nombre para la columna prevista. Ésta es la co lumna de salida del componente personalizado.
Función principal: Definición de vista de propiedad Parámetros de función
Parámetros definidos.
Nombre de visualización de la propiedad
Indique el nombre de la Columna independientey de la Columna dependiente que aparecerá en la vista de propieda des del componente personalizado.
Tipo de control
Seleccione el Tipo de controlde la Columna independientey de la Columna dependiente.
Puntaje de modelo: Definición de tabla de salida Tenga en cuenta todas las columnas del componente anterior, Seleccione incluir o excluir respectivamente la columna pre o más vista del componente principal en la salida del puntaje mo delo. Tipo de datos
Seleccione el Tipo de datospara la columna prevista del pun taje modelo.
Nuevo nombre de columna prevista
Introduzca un nombre para la columna prevista. Ésta es la co lumna de salida del puntaje modelo.
Puntaje de modelo: Definición de vista de propiedad Parámetros de función
Parámetros definidos.
Nombre de visualización de la propiedad
Introduzca el nombre de la columna que aparece en la vista de propiedades del modelo guardado.
Tipo de control
Seleccione el Tipo de controlde la Columna independientey de la Columna dependiente.
Información relacionada Crear un componente R [página 82]
9.1.2
Crear un componente R
Cómo crear un componente R personalizado para su uso en análisis. Antes de crear un componente R, debe asegurarse de que cumple los siguientes requisitos:
82
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Agregar componentes personalizados
●
La secuencia de comandos R está escrita en un formato de función R válido.
●
La secuencia de comandos R se ejecuta en la consola de GUI de R.
●
La secuencia de comandos R al menos tiene una función principal.
●
Los paquetes necesarios para ejecutar la secuencia de comandos R deben estar instalados en su máquina o en el servidor de SAP HANA.
●
La secuencia de comandos R escrito para el análisis en la base de datos devuelve un marco de datos.
Debe tener en cuenta los siguientes procedimientos recomendados al escribir la secuencia de comandos R: ●
La secuencia de comandos R escrito para el análisis en proceso devuelve un marco de datos.
●
Se recomienda la conversión de tipo, por ejemplo, si una columna tiene valores numéricos, indíquela como as.numeric(output)
●
Para variables de categoría utilizadas en la secuencia de comandos R, especifique la variable con el comando as.factor.
1.
En el espacio Predecir, en la lista de componentes de la derecha, seleccione Aparece un asistente Crear nuevo componente R personalizado.
2.
En la página General, introduzca la siguiente información: a.
Componente R
En el cuadro de texto Nombre de componente, escriba Mi componente.
b.
En la lista desplegable Tipo de componente, seleccione Algoritmo.
c.
En el cuadro de texto Descripción de componente, escriba Componente R para regresión lineal sencilla.
3.
Seleccione Siguiente. Aparecerá la página Comando.
4.
En la página Secuencia de comandos, seleccione Cargar secuencia de comandos para seleccionar un archivo a cargar.
Nota Puede escribir o copiar y pegar el siguiente comando R de muestra en el cuadro de texto.
Nota Consulte los comentarios en la siguiente función R para poder entender y escribir su propio comando R. #This is a sample script for a simple linear regression component. #The script should be written in a valid R function format. #Function name and variable name in R script can be user-defined, which are supported in R. #The following is the argument description for the primary function SLR: #InputDataFrame - Dataframe in R that contains the output of the parent component. #The following two parameters are fetched from the user from the property view: #IndepenentColumns - Column names that you want to use as independent variables for the component. #DependentColumn - Column name that you want to use as a dependent variable for the component. SLR<-function(InputDataFrame,IndepenentColumn,DependentColumn) { finalString<-paste(paste(DependentColumn,"~" ), IndepenentColumn); # Formatting the final string to #pass to "lm" function
Manual de usuario de Expert Analytics Agregar componentes personalizados
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
83
slr_model<-lm(finalString); # calling the "lm" function and storing the output model in "slr_model" #To get the predicted values for the training data set, call the "predict" function withthis model and #input dataframe, which is represented by "InputDataFrame". result<-predict(slr_model, InputDataFrame); # Storing the predicted values in the "result" variable. output<- cbind(InputDataFrame, result);#combining "InputDataFrame" and "result" to get the final table. plot(slr_model); #Plotting model visualization. # returnvalue - function must always return a list that contains results("out"), and model variable #("slrmodel"), if present. #The output variable stores the final result. #The model variable is used for model scoring. return (list(slrmodel=slr_model,out=output)) } #The following is the argument description for the model scoring function "SLRModelScoring": #MInputDataFrame - Dataframe in R that contains the output of the parent component. #MIndepenentColumns - Column names to be used as independent variables for the component. #Model - Model variable that is used for scoring. SLRModelScoring<-function (MInputDataFrame, MIndependentColumn, Model) { #Calling "predict" function to get the predictive value with "Model " and "MInputDataFrame". predicted<-predict (Model, data.frame(MInputDataFrame [, MIndependentColumn]), level=0.95); # returnvalue - function should always return a list that contains the result ("model result"), # The output variable stores the final result return(list(modelresult=predicted)) } A continuación se ofrecen dos ejemplos para convertir un script R a un formato de función R válido, reconocidos por Expert Analytics: Secuencia de comandos R
dataFrame<-read.csv("C:\\CSVs\ \Iris.csv") attach(dataFrame) set.seed(4321) kmeans_model Calcetines [compatibilidad = 0,5, confianza= 0,1]
Nota No se admite la creación de modelos mediante el algoritmo Apriori de HANA.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
189
Propiedades de Apriori de HANA Tabla 96: Propiedades del algoritmo Propiedad
Descripción
Tipo a priori
Seleccione Apriori.
Columna de elementos
Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo..
Columna de ID de transacción
Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo.
Valores faltantes
Seleccione el método para manejar los valores perdidos. Valores posibles: ●
Omitir: el algoritmo omite los registros que contienen va lores faltantes en las columnas independientes o depen dientes.
●
Conservar: el algoritmo conserva los valores faltantes para su procesamiento.
Compatibilidad
Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es 0,1.
Confianza
Introduzca un valor para la confianza mínima de reglas/ asociación. El valor predeterminado es 0,8.
Recuento máximo de elementos
Introduzca la longitud de los elementos iniciales y de los ele mentos dependientes de la salida. El valor predeterminado es 5.
Número de subprocesos
Escriba el número de hilos que el algoritmo debe ejecutar. El valor predeterminado es 1.
15.1.7.2
HANA Apriori Lite
Propiedades que se pueden configurar para el algoritmo HANA AprioriLite .
Sintaxis Use este algoritmo para buscar patrones frecuentes de conjuntos de elementos en conjuntos de datos transaccionales grandes para generar reglas de asociación. Apriori Lite también admite el muestreo dentro del algoritmo.
Nota
190
●
Puede usar HANA Apriori Lite desde las propiedades del algoritmo de HANA Apriori al seleccionar AprioriLite como el Tipo Apriori.
●
No se admite la creación de modelos mediante el algoritmo AprioriLite de HANA.
●
Solo calcula dos conjuntos de elementos de gran tamaño.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Propiedades de AprioriLite de HANA Tabla 97: Propiedades del algoritmo Propiedad
Descripción
Tipo a priori
Haga clic en AprioriLite.
Columna de elementos
Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo..
Columna de ID de transacción
Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo.
Valores faltantes
Seleccione el método para manejar los valores perdidos. Métodos posibles: ●
Omitir: el algoritmo omite los registros que contienen va lores faltantes en las columnas independientes o depen dientes.
●
Conservar: el algoritmo conserva los valores faltantes para su procesamiento.
Compatibilidad
Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es 0,1.
Confianza
Introduzca un valor para la confianza mínima de reglas/ asociación. El valor predeterminado es 0,8.
Ejemplo obligatorio
Seleccione esta opción si desea ejemplificar los datos.
Ejemplificación de porcentaje
Introduzca el porcentaje de ejemplificación.
Recálculo obligatorio
Seleccione esta opción si desea recalcular el soporte y la con fianza de cada iteración.
Número de subprocesos
Introduzca el número de subprocesos que se usarán para la ejecución.
15.1.7.3
HANA R Apriori
Propiedades que se pueden configurar para el algoritmo HANA R-Apriori.
Sintaxis Utilice este algoritmo para encontrar patrones en los conjuntos de elementos frecuentes en conjuntos de datos grandes para generar reglas de asociación mediante el paquete de R "arules". Este algoritmo sirve para averiguar qué productos y servicios suelen comprar simultáneamente los clientes. Si se analizan las tendencias de compra de los clientes con un análisis de asociación, se puede realizar una predicción de sus comportamientos en el futuro. Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines [compatibilidad = 0,5, confianza= 0,1]
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
191
Propiedades de HANA R Apriori Tabla 98: Propiedades del algoritmo Propiedad
Descripción
Modo de salida
Seleccione el modo en el que desea usar la salida de este algo ritmo.
Formato de entrada
Seleccione el formato de los datos de entrada.
Columnas de elementos
Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo..
Columna de ID de transacción
Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo.
Compatibilidad
Introduzca un valor para el soporte mínimo de un elemento.
Confianza
Introduzca un valor para la confianza mínima de reglas/ asociación.
Reglas
Introduzca un nombre para la nueva columna que contiene las reglas a priori para un conjunto de datos determinado.
Valores compatibles
Introduzca un nombre para la nueva columna que contiene la compatibilidad para las reglas correspondientes.
Valores de confianza
Introduzca un nombre para la columna nueva que contiene los valores de confianza de las reglas correspondientes.
Valores de elevación
Introduzca un nombre para la nueva columna que contiene los valores de elevación para las reglas correspondientes.
ID de transacción
Introduzca un nombre para la nueva columna que contiene la ID de transacción.
Elementos
Introduzca un nombre para la nueva columna que contiene los nombres de los elementos.
Reglas coincidentes
Introduzca un nombre para la nueva columna que contiene las reglas coincidentes.
Elemento(s) Lhs
Introduzca etiquetas separadas por comas para los elemen tos que deberían aparecer a la izquierda de las reglas o de los conjuntos de elementos.
Elemento(s) Rhs
Introduzca etiquetas separadas por comas para los elemen tos que deberían aparecer a la derecha de las reglas o de los conjuntos de elementos.
Ambos elementos
Introduzca etiquetas separadas por comas para los elemen tos que deberían aparecer a ambos lados de las reglas o de los conjuntos de elementos.
Ningún elemento(s)
Introduzca etiquetas separadas por comas que indiquen los elementos que no deben aparecer en las reglas o en los con juntos de elementos.
Apariencia predeterminada
Introduzca la apariencia predeterminada de los elementos que no se mencionen específicamente.
Tipo de ordenación:
Seleccione la opción de ordenación para ordenar los elemen tos atendiendo a su frecuencia.
192
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Propiedad
Descripción
Criterios de filtro
Introduzca un valor numérico que indique el modo de filtrar los elementos sin usar de las transacciones. El valor predeter minado es 0,1.
Usar estructura de árbol
Para organizar transacciones según un árbol de prefijos, se leccione True.
Usar ordenación por montículos
Para usar la ordenación por montículos en lugar de la ordena ción rápida para ordenar las transacciones, seleccione True.
Optimizar memoria
Para minimizar el uso de memoria en lugar de maximizar la velocidad, seleccione True.
Cargar transacciones a la memoria
Para cargar las transacciones en la memoria, seleccione True.
15.1.7.4
Apriori R
Propiedades que se pueden configurar para el algoritmo R-Apriori.
Sintaxis Utilice este algoritmo para encontrar patrones en los conjuntos de elementos frecuentes en conjuntos de datos grandes para generar reglas de asociación mediante el paquete de R "arules". Este algoritmo sirve para averiguar qué productos y servicios suelen comprar simultáneamente los clientes. Si se analizan las tendencias de compra de los clientes con un análisis de asociación, se puede realizar una predicción de sus comportamientos en el futuro. Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines [compatibilidad = 0,5, confianza= 0,1]
Propiedades de R-Apriori Tabla 99: Propiedades del algoritmo Propiedad
Descripción
Modo de salida
Seleccione el modo en el que desea usar la salida de este algo ritmo.
Formato de entrada
Seleccione el formato de los datos de entrada.
Columnas de elementos
Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo..
Columna de ID de transacción
Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
193
Propiedad
Descripción
Compatibilidad
Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es 0,1.
Confianza
Introduzca un valor para la confianza mínima de reglas/ asociación. El valor predeterminado es 0,8.
Reglas
Introduzca un nombre para la nueva columna que contiene las reglas a priori para un conjunto de datos determinado.
Valores compatibles
Introduzca un nombre para la nueva columna que contiene la compatibilidad para las reglas correspondientes.
Valores de confianza
Introduzca un nombre para la columna nueva que contiene los valores de confianza de las reglas correspondientes.
Valores de elevación
Introduzca un nombre para la nueva columna que contiene los valores de elevación para las reglas correspondientes.
ID de transacción
Introduzca un nombre para la nueva columna que contiene la ID de transacción.
Elementos
Introduzca un nombre para la nueva columna que contiene los nombres de los elementos.
Reglas coincidentes
Introduzca un nombre para la nueva columna que contiene las reglas coincidentes.
Elemento(s) Lhs
Introduzca etiquetas separadas por comas para los elemen tos que deberían aparecer a la izquierda de las reglas o de los conjuntos de elementos.
Elemento(s) Rhs
Introduzca etiquetas separadas por comas para los elemen tos que deberían aparecer a la derecha de las reglas o de los conjuntos de elementos.
Ambos elementos
Introduzca etiquetas separadas por comas para los elemen tos que deberían aparecer a ambos lados de las reglas o de los conjuntos de elementos.
Ningún elemento(s)
Introduzca etiquetas separadas por comas que indiquen los elementos que no deben aparecer en las reglas o en los con juntos de elementos.
Apariencia predeterminada
Introduzca la apariencia predeterminada de los elementos que no se mencionen específicamente.
Tipo de ordenación:
Seleccione la opción de ordenación para ordenar los elemen tos por frecuencia.
Criterios de filtro
Introduzca un valor numérico que indique el modo de filtrar los elementos sin usar de las transacciones. El valor predeter minado es 0,1.
Usar estructura de árbol
Para organizar transacciones según un árbol de prefijos, se leccione True.
Usar ordenación por montículos
Para usar la ordenación por montículos en lugar de la ordena ción rápida para ordenar las transacciones, seleccione True.
Optimizar memoria
Para minimizar el uso de memoria en lugar de maximizar la velocidad, seleccione True.
194
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Propiedad
Descripción
Cargar la transacción a la memoria
Para cargar las transacciones en la memoria, seleccione True.
15.1.8
Clasificación
15.1.8.1
KNN HANA
Propiedades que se pueden configurar para el algoritmo HANA KNN.
Sintaxis Use este componente para clasificar objetos según los datos de ejemplo formados. En KNN, los objetos se clasifican por la mayoría de votos de sus vecinos.
Nota No se admite la creación de modelos mediante el algoritmo KNN de HANA.
Propiedades de KNN de HANA Tabla 100: Propiedades del algoritmo Propiedad
Descripción
Características
Seleccione las columnas de entrada con las que desee realizar el análisis.
Recuento de vecinos
Introduzca el número de vecinos a tener en cuenta para bus car distancias. El valor predeterminado es 5.
Tipo de voto
Seleccione el tipo de voto para el cálculo de la cuenta de ve cino.
Valores faltantes
Seleccione el método para manejar los valores perdidos. ●
Omitir: El algoritmo omite los registros que contienen va lores faltantes en las características o variables meta.
●
Conservar: El algoritmo conserva los valores faltantes.
Nombre de esquema
Introduzca el nombre de esquema que contiene los datos for mados.
Nombre de tabla
Introduzca el nombre de la tabla que contiene los datos for mados.
Columnas independientes
Introduzca las columnas de entrada que desea tener en cuenta para formar los datos.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
195
Propiedad
Descripción
Columna dependiente
Introduzca las columnas de salida que desea tener en cuenta para formar los datos.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene los valores de clasificación.
Número de subprocesos
Escriba el número de subprocesos que desea que el algoritmo ejecute. El valor predeterminado es 1.
15.1.8.2
Análisis ABC de HANA
Propiedades que se pueden configurar para el algoritmo Análisis ABC de HANA.
Sintaxis Use este algoritmo para clasificar objetos (como clientes, empleados o productos) basándose en un indicador específico (como volumen de negocios o beneficio). Sugiere que los inventarios de una organización no son del mismo valor. Además, los inventarios pueden agruparse en tres categorías (A, B y C) según su importancia estimada. Los elementos "A" son muy importantes para una ogranización. Los elementos "B" tienen una importancia media, es decir, son menos importantes que los elementos "A" pero más que los "C". Los elementos "C" son los de menor importancia. Un ejemplo de clasificación ABC sería: ●
Elementos A: 20% de las cuentas de elementos para el 70% del valor de consumo anual de todos los elementos.
●
Elementos B: 30% de las cuentas de elementos para el 25% del valor de consumo anual de todos los elementos.
●
Elementos C: 50% de las cuentas de elementos para el 5% del valor de consumo anual de todos los elementos.
Propiedades de Análisis ABC de HANA Tabla 101: Propiedades del algoritmo Propiedad
Descripción
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
196
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Propiedad
Descripción
Valores faltantes
Seleccione el método para manejar los valores perdidos. Métodos posibles: ●
Omitir: El algoritmo omite los registros que contienen va lores faltantes en las características o variables meta.
●
Conservar: el algoritmo conserva el registro que contiene los valores faltantes durante el cálculo.
Desglose de porcentaje de A
Introduzca el porcentaje de elementos que desee clasificar en el grupo A. El valor por defecto es 40. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes de los elementos de los grupos A, B y C sea igual a 100%.
Desglose de porcentaje de B
Introduzca el porcentaje de elementos que desee clasificar en el grupo B. El valor por defecto es 30. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes de los elementos de los grupos A, B y C sea igual a 100%.
Desglose de porcentaje de C
Introduzca el porcentaje de elementos que desee clasificar en el grupo C. El valor por defecto es 30. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes de los elementos de los grupos A, B y C sea igual a 100%.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 30.
Nombre de columna prevista
Introduzca un nombre para la columna recién añadida que contiene los valores previstos.
15.1.8.3
Análisis de puntuaciones ponderadas de HANA
Propiedades que se pueden configurar para el algoritmo Análisis de puntuaciones ponderadas de HANA.
Sintaxis Una tabla de puntuaciones ponderadas es un método para evaluar alternativas cuando la importancia de los criterios es diferente. En una tabla de puntuaciones ponderadas, cada alternativa recibe una puntuación para cada criterio. Estas puntuaciones se ponderan por la importancia de cada criterio. Todas las puntuaciones ponderadas de una alternativa se suman para calcular la puntuación ponderada total. La alternativa con la puntuación total más alta sería la mejor alternativa. Puede utilizar tablas de puntuaciones ponderadas para predecir el comportamiento futuro de los clientes. Cree un modelo basado en datos históricos en la aplicación de minería de datos y aplique el modelo a los nuevos datos para realizar la predicción. Esta predicción (el resultado del modelo), se denomina puntuación. Puede crear una sola puntuación para sus clientes teniendo en cuenta diferentes dimensiones. Una función definida por tablas de puntuaciones ponderadas es una combinación lineal de funciones de una variable. f(x1,…,xn) = w1× f 1(x1) + … + wn× f n(xn)
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
197
Análisis de puntuaciones ponderadas de HANA Tabla 102: Propiedades del algoritmo Propiedad
Descripción
Nombre de columna
Seleccione la columna de entrada con la que desea realizar el análisis.
Tipo
Seleccione el tipo "Discreta" si la columna tiene datos categó ricos o "Continua" si los datos son numéricos.
Pesos
Introduzca las ponderaciones para la columna seleccionada. El valor predeterminado es 0.0.
Claves y puntuaciones
Introduzca los valores para las claves y puntuaciones.
Valores faltantes
Seleccione el método para manejar los valores perdidos. ●
Omitir: El algoritmo omite los registros que contienen va lores faltantes en las características o variables meta.
●
Conservar: El algoritmo conserva valores faltantes.
Número de subprocesos
Escriba el número de hilos que el algoritmo debe ejecutar. El valor predeterminado es 1.
Nombre de columna prevista
Introduzca un nombre para la nueva columna que contiene los valores previstos.
15.1.8.4
HANA Naive Bayes
Propiedades que se pueden configurar para el algoritmo Naive Bayes de HANA.
Sintaxis Naive Bayes es un algoritmo de clasificación basado en el teorema de Bayes. Estima la probabilidad condicional de clase asumiendo que los atributos son condicionalmente independientes uno de otro. A pesar de su simplicidad, Naive Bayes funciona bastante bien en áreas como la colasificación de documentos y y filtrado de spam, y solo requiere una pequeña cantidad de datos de formación para estimar los parámetros necesarios para la clasificación.
Propiedades de HANA Naive Bayes Tabla 103: Propiedades del algoritmo Propiedad
Descripción
Modo de salida
Seleccione el modo en el que desea usar la salida de este algo ritmo.
Características
Seleccione las columnas de entrada con las que desea realizar la regresión.
198
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Propiedad
Descripción
Variable de destino
Seleccione la columna de destino para la que desea realizar el análisis.
Nombre de columna prevista
Introduzca un nombre para la columna recién creada que con tiene los valores previstos.
Suavizado de Laplace
Introduzca la constante de suavizado para las observaciones de suavizado. La constante de suavizado debe ser un valor do ble superior a 0. Introduzca 0 para deshabilitar el suavizado de Laplace.
Valores faltantes
Seleccione el método para manejar los valores perdidos.
Número de subprocesos
15.1.8.5
●
Omitir: El algoritmo omite los registros que contienen va lores faltantes en las características o variables meta.
●
Conservar: el algoritmo conserva los registros que con tiene los valores faltantes durante el cálculo.
Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1.
HANA Auto Classification
Propiedades que se pueden configurar para el algoritmo (Auto) Clasificación automática HANA.
Sintaxis El algoritmo Clasificación automática HANA se utiliza para la clasificación binaria/categórica. Este algoritmo detecta el tipo de modelo y algoritmo utilizado y que mejor se adapte basado en el destino disponible que seleccione. También decide si la entrada debe ser continua o categórica y determina la categorización más apropiada para las variables. Como resultado, puede reducir la preparación de datos y modelar las actividades de testing que realice en la construcción de un modelo predictivo. Además, también crea conjuntos de datos de validación y formación para evaluación de modelos. El algoritmo Autoclasificación HANA sólo está disponible en modo online (conectado con SAP HANA). Hay un algoritmo de autoclasificación similar disponible en modo fuera de línea. Para más información acerca de las funciones utilizadas en algoritmos automáticos online, véase el Manual de referencia de SAP Automated Predictive Library (APL) en http://help.sap.com/pa
Propiedades de clasificación automática HANA Tabla 104: Propiedades del algoritmo Propiedad
Descripción
Características
Seleccione las columnas de entrada con las que desea realizar el análisis.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
199
Propiedad
Descripción
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis.
Nombre de columna prevista
Introduzca un nombre para una nueva columna que contiene los valores previstos.
15.1.8.6
Autoclasificación
Propiedades que se pueden configurar para el algoritmo (Auto) Clasificación automática.
Sintaxis El algoritmo Clasificación automática se utiliza para la clasificación binaria/categórica. Este algoritmo detecta el tipo de modelo y algoritmo utilizado y que mejor se adapte basado en el destino disponible que seleccione. También decide si la entrada debe ser continua o categórica y determina la categorización más apropiada para las variables. Como resultado, puede reducir la preparación de datos y modelar las actividades de testing que realice en la construcción de un modelo predictivo. Además, también crea conjuntos de datos de validación y formación para evaluación de modelos.
Propiedades de clasificación automática Tabla 105: Propiedades del algoritmo Propiedad
Descripción
Características
Seleccione las columnas de entrada con las que desea realizar el análisis.
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis.
Nombre de columna prevista
Introduzca un nombre para una nueva columna que contiene los valores previstos.
15.1.8.7
Máquina de vectores de soporte de HANA
Propiedades que se pueden configurar para el algoritmo de la máquina de vectores de soporte de HANA.
Sintaxis Las máquinas de vectores de soporte (SVMs) son un conjunto de modelos de aprendizaje supervisado que utilizan el concepto de vector de soporte. En comparación con otros muchos modelos de aprendizaje supervisado, las SVMs presentan ventajas, tales como que la producción de modelos tanto lineales como no lineales. Estas últimas se alcanzan mediante una técnica denominada función Kernel.
200
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Como ocurre con la mayoría de modelos supervisados, en las SVMs existe una fase de entrenamiento y otra de evaluación. Durante la fase de entrenamiento, se aprende que una función f(x):->y donde f(∙), es una función (puede ser no lineal) que asigna un ejemplo en un DESTINO. El entrenamiento consiste en pares indicados mediante {xi, yi}, donde x indica un ejemplo que se representa con distintos atributos, y y indica un DESTINO (información supervisada). Durante la fase de evaluación, el f(∙) aprendido se utiliza después para asignar un ejemplo con un DESTINO desconocido en su DESTINO predicho. En la implementación actual en PAL se pueden utilizar las SVMs para las tres tareas siguientes: ●
Clasificación de vectores de soporte (SVC) La clasificación es una de las tareas más frecuentes de muchos campos, tales como el aprendizaje de máquinas, la minería de datos, la visión de ordenadores o el análisis de datos empresariales. En comparación con clasificadores lineales tales como la regresión logística, la SVC es capaz de producir un límite de decisión no lineal que lleve a una mejor precisión en algunos conjuntos de datos del mundo real. En un supuesto de clasificación, f(∙) indicaría una función de decisión y OBJETIVO una "etiqueta" representada por un número real.
●
Regresión de vectores de soporte (SVR) La SVR consiste en otro método de análisis de regresión. En comparación con métodos de regresión lineales clásicos como la regresión de mínimos cuadrados, la función de regresión en la SVR puede ser no lineal. En un supuesto de regresión, f(∙) indicaría una función de regresión y OBJETIVO una "respuesta" representada por un número real.
●
Clasificación de vectores de soporte Esto implementa un algoritmo emparejado de "aprendizaje de clasificación" que aprende una función de clasificación a partir de diversos conjuntos (que se distinguen gracias al ID de consulta) de ejemplos clasificados. En un supuesto de clasificación, f(∙) indicaría una función de clasificación y OBJETIVO una puntuación según se haya realizado la clasificación final. Para la clasificación emparejada, se aprendef(∙) con el fin de que se considere la relación emparejada que expresa la clasificación de los ejemplos dentro de cada conjunto.
Ya que la función Kernel (además de los conjuntos de datos) alcanza la no linealidad, se deben especificar también el tipo de kernel y los parámetros.
Propiedades de la máquina de vectores de soporte de HANA Tabla 106: Propiedades del algoritmo Propiedad
Descripción
Tipo de algoritmo
Seleccione el tipo de análisis debe ejecutar el algoritmo. ●
Clasificación
●
Regresión
●
Clasificación
Modo de salida
Seleccione el modo en el que desea usar la salida de este algo ritmo.
Características
Seleccione las columnas de entrada con las que desea realizar el análisis.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
201
Propiedad
Descripción
Variable de destino
Seleccione la columna de destino en la que desea realizar el análisis.
ID de consulta
Seleccione una columna de ID de consulta para la clasifica ción.
Valores faltantes
Seleccione el método para manejar los valores perdidos. Valores posibles: ●
Omitir: el algoritmo omite los registros que contienen va lores faltantes en las columnas independientes o depen dientes.
●
Conservar: el algoritmo conserva los registros que con tienen los valores faltantes durante el cálculo.
Tipo de kernel
Seleccione el tipo de kernel.
Gamma
Introduzca el coeficiente gamma para el kernel RBF.
Margen máximo
Introduzca un valor de intercambio que desee tener en cuenta entre el error de entrenamiento y margen.
Grado
Indique un grado para el kernel polinomial. El valor predeter minado es 3.
Coeficiente lineal
Introduzca un valor para el coeficiente lineal.
Constante de coeficiente
Introduzca un valor para la constante de coeficiente.
Validación cruzada
Seleccione esta opción para usar la validación cruzada para el cálculo.
Tipo de normalización
Seleccione el tipo de normalización.
Número de subprocesos
Introduzca el número de subprocesos que debe usar el algo ritmo para la ejecución. El valor predeterminado es 1.
Nombre de columna prevista
Introduzca un nombre para la columna creada recientemente que contiene los valores previstos.
15.2 Componentes de preparación de datos Use los componentes de preparación de datos para preparar los datos para el análisis. Estos componentes son opcionales.
15.2.1
Fórmula
Propiedades que se pueden configurar para el componente de preparación de fórmulas.
202
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Sintaxis Utilice este componente para aplicar funciones y operadores predefinidos en los datos. Todas las funciones y expresiones, excepto las funciones de manipulación de datos, añaden una nueva columna con el resultado de la fórmula.
Nota Cuando se introduce una cadena literal que contiene comillas simples, cada comilla de la cadena literal debe ir precedida con un carácter de barra inversa (\). Por ejemplo, si desea escribir la palabra "Customer's", deberá escribir "Customer\'s".
Nota Cuando se introduce un nombre de columna que contiene corchetes, cada corchete en el interior del nombre de la columna debe ir precedido con un carácter de barra inversa (\). Por ejemplo, si desea escribir [Cliente[Edad]], deberá escribir [Cliente\[Edad\]].
Propiedades de las fórmulas Tabla 107: Propiedades del componente de preparación de datos Propiedad
Descripción
Nombre de fórmula
Introduzca un nombre para la nueva columna creada me diante la aplicación de una fórmula.
Expresión
Escriba la fórmula que desea aplicar. Por ejemplo, Prome dio([Edad]).
Ejemplo Calcula el promedio de edad de los empleados Tabla de empleados: ID del empleado
Nombre del
Fecha de
empleado
nacimiento
1
Laura
11/11/1986
2
Desi
3 4
Edad
Fecha de
Fecha de
incorporación
confirmación
25
12/9/2005
27/11/2005
12/5/1981
30
24/6/2000
10/7/2000
Álex
30/5/1978
33
10/10/1998
24/12/1998
Juan
6/6/1979
32
2/12/1999
20/12/1999
Para calcular el promedio de edad de los empleados, realice los siguientes pasos: 1.
Arrastre el componente Fórmula al editor de análisis.
2.
En la vista Propiedades, introduzca un nombre para la fórmula. Por ejemplo, Promedio_Edad.
3.
En el campo Expresión, introduzca la fórmula: PROMEDIO([Edad])
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
203
4.
Seleccione Validar para validar la sintaxis de la fórmula.
5.
Seleccione Fin.
Tabla de salida: ID del empleado
Nombre del
Fecha de
empleado
nacimiento
1
Laura
11/11/1986
2
Desi
3 4
Edad
Fecha de
Fecha de
incorporación
confirmación
Promedio_Edad
25
12/9/2005
27/11/2005
30
12/5/1981
30
24/6/2000
10/7/2000
30
Álex
30/5/1978
33
10/10/1998
24/12/1998
30
Juan
6/6/1979
32
2/12/1999
20/12/1999
30
Funciones admitidas Categoría
Función (Función cuando se aplica a la
Descripción
tabla Empleado)
Fecha
DÍASENTRE
Devuelve el número de días entre dos fechas.
FECHAACTUAL
Devuelve la fecha actual del sistema.
MESESENTRE
Devuelve el número de meses entre dos fechas. Por ejemplo, la nueva columna contiene 2,0,2,0 cuando se aplica MESESENTRE([Fecha de incorporación],[Fecha de confirmación]) a la tabla Empleado.
NOMBREDELDÍA
Devuelve el nombre del día en formato de cadena. Por ejemplo, la nueva columna contendrá lunes, sábado, sábado, jueves cuando se aplique NOMBREDELDÍA([Fecha de incorporación]) a la tabla Empleado.
NÚMERODEDÍADELMES
Devuelve el número del día de un mes determinado. Por ejemplo, la fecha 12/11/1980 devuelve el número 12.
NÚMERODEDÍADELASEMANA
Devuelve el número de día de una semana. Por ejemplo, domingo=1, lunes=2.
NÚMERODEDÍADELAÑO
204
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Devuelve el número de día de un año.
Manual de usuario de Expert Analytics Propiedades de los componentes
Categoría
Función (Función cuando se aplica a la
Descripción
tabla Empleado)
Por ejemplo, el 1 de enero=1, 1 de febrero=32, 3 de febrero=34. ÚLTIMODÍADELASEMANA
Devuelve la fecha del último día de la semana. Por ejemplo, la fecha 12/9/2005 devuelve 17/9/2005
ÚLTIMODÍADELMES
Devuelve la fecha del último día del mes. Por ejemplo, la fecha 12/9/2005 devuelve 30/9/2005
NÚMERODEMESDELAÑO
Devuelve el número del mes en una fecha. Por ejemplo, enero=1, febrero=2, marzo=3.
NÚMERODESEMANADELAÑO
Devuelve el número de semana en un año. Por ejemplo, 12/9/2005 devuelve 38.
NÚMERODETRIMESTREDELAFECHA
Devuelve el número del trimestre en una fecha. Por ejemplo, 12/9/2005 devuelve 3.
Cadena
CONCAT
Concatena dos cadenas. Por ejemplo, la expresión CONCAT('EE.UU.','Australia') devuelve EE.UU.Australia.
ENLACADENA
Devuelve el resultado True si se encuentra la cadena buscada en la cadena fuente. Por ejemplo, la expresión ENLACADENA('EE.UU.','EU') devuelve el resultado True.
SUBCADENA
Devuelve una subcadena de una cadena fuente. Por ejemplo, la expresión SUBCADENA('EE.UU.',1,2) devuelve EE.
Matemáticas
Manual de usuario de Expert Analytics Propiedades de los componentes
LONGCAD
Devuelve el número de caracteres que contiene la cadena fuente. Por ejemplo, la expresión LONGCAD('Australia') devuelve 9.
MAX
Devuelve el valor máximo de una columna.
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
205
Categoría
Función (Función cuando se aplica a la
Descripción
tabla Empleado)
Manipulación de datos
MIN
Devuelve el valor mínimo de una columna.
CONTAR
Devuelve el número de valores de una columna.
SUMA
Devuelve la suma de los valores de una columna.
PROMEDIO
Devuelve el promedio de los valores de una columna.
@REEMPLAZAR
Realiza un reemplazo in situ de una cadena. Por ejemplo, @REEMPLAZAR([país], 'EE.UU.','NORTEAMÉRICA') reemplazará la palabra EE.UU. por NORTEAMÉRICA en la columna de país.
@ENBLANCO
Reemplaza los valores en blanco con un valor específico. Por ejemplo, @ENBLANCO([país],'EE.UU.') sustituye todos los valores en blanco por la cadena EE.UU. en la columna de país.
@SELECT
Selecciona las filas que cumplen una condición determinada. Puede utilizar cualquier operador condicional para especificar la condición. Por ejemplo, @SELECT([país]=='EE.UU.') selecciona las filas en las que el país sea igual a EE.UU.
Expresión condicional
IF(condición) THEN(expresión de cadena/expresión matemática/ expresión condicional) ELSE(expresión de cadena/expresión matemática/ expresión condicional)
Comprueba si se cumple la condición y devuelve un valor si se cumple ("true") y otro si no se cumple ("false"). Por ejemplo, IF([Fecha de incorporación]>12/9/2005) THEN ('Empleado incorporado después del 12 de septiembre de 2005') ELSE ('Empleado incorporado el o antes del 12 de septiembre de 2005')
Nota Las expresiones matemáticas que contienen funciones que devuelve un valor numérico no son compatibles. Por ejemplo, la expresión NÚMERODEDÍADELMES(FECHAACTUAL())+2 no es compatible porque NÚMERODEDÍADELMES devuelve un valor numérico.
206
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Operadores matemáticos Use operadores matemáticos para crear fórmulas para columnas numéricas y/o números. Por ejemplo, la expresión[Edad] + 1 añade una nueva columna con los valores 26, 31, 34 y 33. Operadores matemáticos
Descripción
+
Operador de adición
-
Operador de sustracción
*
Operador de multiplicación
/
Operador de división
()
Paréntesis
^
Operador de potencia
%
Operador de porcentaje
E
Operador exponencial
Operadores condicionales Use los operadores condicionales para crear expresiones IF THEN ELSE o SELECT. Operadores condicionales
Descripción
==
Igual a
!=
No igual a
<
Menor que
>
Mayor que
<=
Menor o igual a
>=
Mayor o igual a
Operadores lógicos Use los operadores lógicos para comparar dos condiciones y obtener un resultado de "true" o "false". Por ejemplo, IF([Fecha de incorporación]>12/9/2005 && [Edad] >=25 ) THEN ('True') ELSE ('False') añade una nueva columna con los valores True, False, False, False. Operadores lógicos
Descripción
&&
Y
||
O
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
207
15.2.2 Muestra Propiedades que se pueden configurar para el componente de preparación de muestras.
Sintaxis Utilice este componente para seleccionar un subconjunto de datos de conjuntos de datos mayores. El componente Muestra es compatible con los siguientes tipos de muestra: ●
Primeros N: selecciona los primeros registros N del conjunto de datos.
●
Últimos N: selecciona los últimos registros N del conjunto de datos.
●
Cada N: Selecciona cada registro N del conjunto de datos, donde N es un intervalo. Por ejemplo, si N=2, se seleccionarán los registros 2, 4, 6, 8, etc.
●
Aleatorización simple: selecciona registros aleatoriamente del tamaño N o un porcentaje de N de los registros de un conjunto de datos.
●
Aleatorización sistemática: en este tipo de muestra, se crean intervalos simples o depósitos según el tamaño del depósito. El componente Muestra selecciona un registro N aleatoriamente del primer depósito y de cada depósito posterior.
Propiedades de muestra Tabla 108: Propiedades del componente de preparación de datos Propiedad
Descripción
Tipo de muestra
Seleccione el tipo de muestreo.
Limitar filas por
Seleccione el método para limitar las filas.
Número de filas
Introduzca el número de filas que desee seleccionar.
Porcentaje de filas
Introduzca el porcentaje de filas que desee seleccionar.
Tamaño del depósito
Introduzca el tamaño del depósito en el que desee seleccionar una fila aleatoria.
Tamaño de paso
Introduzca el intervalo entre las filas que desee seleccionar.
Filas máximas
Introduzca el número máximo de filas que desee seleccionar.
Ejemplo Seleccionar un subconjunto de datos de un conjunto de datos determinado ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
1
Laura
11/11/1986
25
2
Desi
12/5/1981
30
3
Álex
30/5/1978
33
4
Juan
6/6/1979
32
208
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
5
Tomás
4/7/1987
24
6
Tobías
30/6/1970
41
7
Anna
24/6/1965
46
8
Valeria
6/7/1990
21
9
María
19/9/1985
26
10
Martín
21/11/1986
25
Salida de muestras: 1.
2.
3.
4.
5.
Primeros N: donde N=5 ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
1
Laura
11/11/1986
25
2
Desi
12/5/1981
30
3
Álex
30/5/1978
33
4
Juan
6/6/1979
32
5
Tomás
4/7/1987
24
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
7
Anna
24/6/1965
46
8
Valeria
6/7/1990
21
9
María
19/9/1985
26
10
Martín
21/11/1986
25
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
3
Álex
30/5/1978
33
6
Tobías
30/6/1970
41
9
María
19/9/1985
26
Últimos N: donde N=4
Cada N: Intervalo=3
Aleatorización simple: para un número de filas=2 El resultado pueden ser dos filas cualesquiera. ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
7
Anna
24/6/1965
46
8
Valeria
6/7/1990
21
Aleatorización sistemática: tamaño del depósito=4
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
209
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
2
Desi
12/5/1981
30
6
Tobías
30/6/1970
41
10
Martín
21/11/1986
25
ID del empleado
Nombre del empleado
Fecha de nacimiento
Edad
1
Laura
11/11/1986
25
5
Tomás
4/7/1987
24
9
María
19/9/1985
26
o
15.2.3 Definición del tipo de datos Propiedades que se pueden configurar para el componente de preparación de definición del tipo de datos.
Sintaxis Use este componente para cambiar el nombre, el tipo de datos y el formato de fecha desde la columna de origen. Definir los tipos de datos ayuda a preparar los datos para que sean adecuados para un futuro análisis. Por ejemplo: ●
Si el nombre de la columna del origen de datos es "des", es posible que no sea claro durante el análisis. Cambie el nombre de la columna a "Designation" en el análisis, de modo que los usuarios finales puedan comprenderlo fácilmente.
●
Si la fecha está almacenada con el formato mmddaa (120201, sin separador de fecha), el sistema puede considerarlo como un valor entero. Mediante el componente Definición de tipo de datos, puede cambiar el formato de fecha a cualquier formato válido, como mm/dd/aaaa o dd/mm/aaaa, etc.
Para cambiar el nombre, el tipo de datos y el formato de fecha de la columna de origen, realice los siguientes pasos: 1.
Agregue el componente de definición de tipo de datos al análisis.
2.
En el menú contextual de los componentes, seleccione Configurar propiedades.
3.
Para cambiar el nombre de la columna, introduzca un alias para la columna de origen necesaria.
4.
Para cambiar el tipo de datos de la columna, seleccione el tipo de datos necesario para la columna de origen.
5.
Seleccione Fin.
15.2.4 Filtro Propiedades que se pueden configurar para el componente de preparación de filtros.
210
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Sintaxis Utilice este componente para filtrar filas y columnas basándose en una condición específica.
Nota El componente Filtro in-DB no es compatible con las funciones y las expresiones avanzadas.
Nota Si modifica la fuente de datos después de configurar el componente de filtro, éste seguirá conservando los filtros de fila definidos con anterioridad.
Propiedades de los filtros Tabla 109: Propiedades del componente de preparación de datos Propiedad
Descripción
Columnas seleccionadas
Seleccione las columnas para el análisis.
Condición del filtro
Introducir la condición del filtro.
Ejemplo Filtrar la columna "Tienda" de los datos fuentes y aplicar la condición "Beneficio >2000". Tienda
Ingresos
Beneficio
Hito
10000
1000
Ferrero
20000
4500
Soler
25000
8000
1.
Deseleccione la columna "Tienda" de las columnas seleccionadas.
2.
En el panel Filtro de fila, seleccione la columna Beneficio.
3.
En la opciónSeleccionar desde rango, introduzca 2000 en el cuadro de texto Desde. El cuadro de texto Hasta debe quedar vacío.
4.
Seleccione Aceptar.
5.
Elija Guardar y cerrar.
6.
Ejecute el análisis.
Tabla de salida: Ingresos
Beneficio
20000
4500
25000
8000
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
211
Sintaxis Nota El componente de filtro solo es compatible con expresiones que devuelvan un resultado booleano. Por ejemplo, en la tabla Empleado que aparece a continuación: ID del empleado
Nombre del
Fecha de
empleado
nacimiento
1
Laura
11/11/1986
2
Desi
3 4
Edad
Fecha de
Fecha de
incorporación
confirmación
25
12/9/2005
27/11/2005
12/5/1981
30
24/6/2000
10/7/2000
Álex
30/5/1978
33
10/10/1998
24/10/1998
Juan
6/6/1979
32
2/12/1999
20/12/1999
●
La expresión DÍASENTRE([Fecha de incorporación],[Fecha de confirmación]) no es una expresión de filtro válida, ya que devuelve un valor numérico. El uso correcto de la expresión DAYSBETWEEN en el filtro es DAYSBETWEEN([Fecha de incorporación],[Fecha de confirmación]) == 14. Esta expresión selecciona las filas en las que el número de días entre "Fecha de incorporación" y "Fecha de confirmación" es 14. En la tabla anterior de empleados, se selecciona la tercera fila.
●
En cambio, NOMBREDELDÍA([Fecha de incorporación]) == 'Sábado' selecciona la segunda y la tercera fila de la tabla Empleado.
Nota Cuando se introduce una cadena literal que contiene comillas simples, cada comilla de la cadena literal debe ir precedida con un carácter de barra inversa (\). Por ejemplo, si desea escribir la palabra "Customer's", deberá escribir "Customer\'s".
Nota Cuando se introduce un nombre de columna que contiene corchetes, cada corchete en el interior del nombre de la columna debe ir precedido con un carácter de barra inversa (\). Por ejemplo, si desea escribir [Cliente[Edad]], deberá escribir [Cliente\[Edad\]].
Funciones admitidas Nota El componente de filtro no es compatible con las funciones de manipulación de datos.
212
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Categoría
Función (Función cuando se aplica a la
Descripción
tabla Empleado)
Fecha
DÍASENTRE
Devuelve el número de días entre dos fechas.
FECHAACTUAL
Devuelve la fecha actual del sistema.
MESESENTRE
Devuelve el número de meses entre dos fechas. Por ejemplo, la nueva columna contiene 2,0,2,0 cuando se aplica MESESENTRE([Fecha de incorporación],[Fecha de confirmación]) a la tabla Empleado.
NOMBREDELDÍA
Devuelve el nombre del día en formato de cadena. Por ejemplo, la nueva columna contendrá lunes, sábado, sábado, jueves cuando se aplique NOMBREDELDÍA([Fecha de incorporación]) a la tabla Empleado.
NÚMERODEDÍADELMES
Devuelve el número del día de un mes determinado. Por ejemplo, la fecha 12/11/1980 devuelve el número 12.
NÚMERODEDÍADELASEMANA
Devuelve el número de día de una semana. Por ejemplo, domingo=1, lunes=2.
NÚMERODEDÍADELAÑO
Devuelve el número de día de un año. Por ejemplo, el 1 de enero=1, 1 de febrero=32, 3 de febrero=34.
ÚLTIMODÍADELASEMANA
Devuelve la fecha del último día de la semana. Por ejemplo, la fecha 12/9/2005 devuelve 17/9/2005
ÚLTIMODÍADELMES
Devuelve la fecha del último día del mes. Por ejemplo, la fecha 12/9/2005 devuelve 30/9/2005
NÚMERODEMESDELAÑO
Devuelve el número del mes en una fecha. Por ejemplo, enero=1, febrero=2, marzo=3.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
213
Categoría
Función (Función cuando se aplica a la
Descripción
tabla Empleado)
NÚMERODESEMANADELAÑO
Devuelve el número de semana en un año. Por ejemplo, 12/9/2005 devuelve 38.
NÚMERODETRIMESTREDELAFECHA
Devuelve el número del trimestre en una fecha. Por ejemplo, 12/9/2005 devuelve 3.
Cadena
CONCAT
Concatena dos cadenas. Por ejemplo, la expresión CONCAT('EE.UU.','Australia') devuelve EE.UU.Australia.
ENLACADENA
Devuelve el resultado True si se encuentra la cadena buscada en la cadena fuente. Por ejemplo, la expresión ENLACADENA('EE.UU.','EU') devuelve el resultado True.
SUBCADENA
Devuelve una subcadena de una cadena fuente. Por ejemplo, la expresión SUBCADENA('EE.UU.',1,2) devuelve EE.
Matemáticas
Expresión condicional
MAX
Devuelve el valor máximo de una columna.
MIN
Devuelve el valor mínimo de una columna.
CONTAR
Devuelve el número de valores de una columna.
SUMA
Devuelve la suma de los valores de una columna.
PROMEDIO
Devuelve el promedio de los valores de una columna.
IF(condición) THEN(expresión de cadena/expresión matemática/ expresión condicional) ELSE(expresión de cadena/expresión matemática/ expresión condicional)
Comprueba si se cumple la condición y devuelve un valor si se cumple ("true") y otro si no se cumple ("false"). Por ejemplo, IF([Fecha de incorporación]>12/9/2005) THEN ('Empleado incorporado después del 12 de septiembre de 2005') ELSE ('Empleado incorporado el o antes del 12 de septiembre de 2005')
214
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Nota Las expresiones matemáticas que contienen funciones que devuelve un valor numérico no son compatibles. Por ejemplo, la expresión NÚMERODEDÍADELMES(FECHAACTUAL())==2 no es compatible porque NÚMERODEDÍADELMES devuelve un valor numérico.
Operadores matemáticos Use operadores matemáticos para crear fórmulas para columnas numéricas y/o números. Por ejemplo, la expresión[Edad] + 1 añade una nueva columna con los valores 26,31,34 y 33. Operadores matemáticos
Descripción
+
Operador de adición
-
Operador de sustracción
*
Operador de multiplicación
/
Operador de división
()
Paréntesis
^
Operador de potencia
%
Operador de porcentaje
E
Operador exponencial
Operadores condicionales Use los operadores condicionales para crear expresiones IF THEN ELSE o SELECT. Operadores condicionales
Descripción
==
Igual a
!=
No igual a
<
Menor que
>
Mayor que
<=
Menor o igual a
>=
Mayor o igual a
Operadores lógicos Use los operadores lógicos para comparar dos condiciones y obtener un resultado de "true" o "false". Por ejemplo, IF([Fecha de incorporación]>12/9/2005 && [Edad] >=25 ) THEN ('True') ELSE ('False') añade una nueva columna con los valores True, False, False, False.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
215
Operadores lógicos
Descripción
&&
Y
||
O
15.2.5 Normalización Propiedades que se pueden configurar para el componente de preparación de normalizaciones.
Sintaxis Use este componente para normalizar los datos de atributo. Los atributos con un valor mayor tienden a tener un peso mayor. La normalización intenta transformar los datos de un rango más grande a uno más pequeño, por ejemplo, [0,1], [-1,1].
Nota La normalización solo muestra las columnas con valores numéricos. El componente de normalización admite los siguientes métodos de normalización: ●
Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza cada uno de ellos para ajustarlo a un rango específico. Al realizar la normalización mínima-máxima puede especificar el Nuevo valor máximo y el Nuevo valor mínimo. Esta normalización es útil para asegurar que los valores extremos están limitados dentro de un rango fijo.
Nota ○ ●
Nuevo valor máximo debe ser superior que el Nuevo valor mínimo.
Normalización del resultado Z: Cálculo basado en el medio y la desviación estándar de cada atributo. Esta normalización es útil para determinar si un valor específico está por encima o por debajo del promedio, y por cuánto.
●
Normalización de escalado decimal: La coma decimal del valor de cada atributo se desplaza conforme a su valor absoluto máximo.
Propiedades de normalización Tabla 110: Propiedades del componente de preparación de datos Propiedad
Descripción
Seleccionar una columna
Seleccione la columna que desee normalizar.
Tipo de normalización
Seleccione el tipo de normalización.
Nuevo máximo
Indique el valor del nuevo máximo. El valor predeterminado es 1.
216
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Propiedad
Descripción
Nuevo mínimo
Indique el valor del nuevo mínimo. El valor predeterminado es 0.
Ejemplo Normalizar el tiempo utilizado para cubrir una distancia en concreto. Tabla: Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
66
Desi
500
360
Álex
500
201
Juan
500
78
Tomás
500
504
Para normalizar la columna de tiempo con la normalización Mínima-Máxima, realice los pasos siguientes: 1.
En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos.
2.
Arrastre el componente Normalización al editor de análisis o haga doble clic en Normalización.
3.
Desde el menú contextual del componente de normalización, seleccione Configurar propiedades.
4.
Seleccione la columna que desea normalizar de la lista desplegable Seleccionar una columna.
Nota Solo puede seleccionar las columnas con valores numéricos. Por ejemplo, Tiempo (en segundos). 5.
Desde la lista desplegable Método de normalización, seleccione Mín-Máx.
6.
Indique los valores para el Nuevo máximo y el Nuevo mínimo. En este ejemplo, los valores son 0 y 1 respectivamente.
7.
Seleccione Finalizado y, a continuación, Ejecutar.
Tabla de salida: Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
0.05
Desi
500
0.30
Álex
500
0.17
Juan
500
0.06
Tomás
500
0.42
Lleve a cabo los mismos pasos para la normalización del resultado Z y para la normalización del escalado decimal, tal y como se menciona en la normalización Mín-Máx. Sin embargo, en el caso de la normalización del resultado Z y de la normalización del escalado decimal, no es necesario indicar los valores de Nuevo máximo ni de Nuevo mínimo. Salida de la normalización del resultado Z:
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
217
Tabla de salida: Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
-0.49
Desi
500
1.77
Álex
500
0.55
Juan
500
-0.40
Tomás
500
2.88
Salida de la normalización del escalado decimal: Tabla de salida: Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
0.01
Desi
500
0.04
Álex
500
0.02
Juan
500
0.01
Tomás
500
0.05
15.2.6 Categorización de HANA Propiedades que se pueden configurar para el componente de preparación de categorización de HANA.
Sintaxis La categorización, también conocida como discretización, suaviza un valor de datos ordenado. Divide el rango de una variable numérica en conjuntos de subrangos, denominados almacenajes, y reemplaza cada valor por su número de almacenaje. Realizar el almacenaje de datos antes de ejecutar determinados algoritmos, como el algoritmo de árbol de decisiones, ayuda a reducir la complejidad del modelo. Existen cuatro métodos de categorización: ●
Anchos iguales basados en el número de agrupamientos
●
Anchos iguales basados en el ancho del agrupamiento
●
Igual profundidad
●
Desviación del medio
Y tres métodos para el suavizado: ●
Suavizado por medios de agrupamiento: cada valor de un agrupamiento se reemplaza por un valor de agrupamiento del medio.
●
Suavizado por medianas de almacenaje: cada valor de almacenaje se reemplaza por la mediana de almacenaje.
●
Suavizado por límites de agrupamiento: los valores máximos y mínimos de un agrupamiento dado se identifican como los límites de agrupamiento. A continuación, cada valor de agrupamiento se reemplaza por el valor de límite más cercano.
218
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Propiedades de la categorización de HANA Tabla 111: Propiedades del componente de preparación de datos Propiedad
Descripción
Columna independiente
Seleccione la columna de origen de entrada en la que desea realizar la categorización.
Valores faltantes
Seleccione el método para manejar los valores perdidos. Métodos posibles: ●
Omitir: el algoritmo omite los registros que contienen va lores faltantes en las columnas independientes o depen dientes.
●
Conservar: conserva los valores que faltan.
Método de categorización
Seleccione el método de categorización.
Número de agrupamientos
Introduzca el número de agrupamientos necesarios.
Método de suavizado
Seleccione el método de suavizado.
Nombre de columna agrupada
Introduzca un nombre para la nueva columna que contiene números de agrupación.
Nombres de columna de valores suavizada
Introduzca el nombre de la columna nueva que contiene los valores suavizados.
Ejemplo Realizar la categorización de datos en un conjunto de datos Ciudad
Temperatura
Amsterdam
6
Fráncfort
12
Cantón
13
Ciudad de El Cabo
15
Waldorf
10
Bangalore
23
Bombay
24
Miami
30
Río de Janeiro
32
Sídney
25
Dubai
38
Para realizar el agrupamiento de la columna Temperatura por anchos iguales basado en el número de anchos y aplicar métodos de suavizado por medios, lleve a cabo los siguientes pasos: 1.
Arrastre el componente Categorización de HANA al editor de análisis.
2.
Haga doble clic en Categorización de HANA o pase el cursor del ratón por encima de Categorización de HANA y seleccione Configurar propiedades.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
219
3.
En la lista desplegable Columna independiente, elija una columna, por ejemplo, Temperatura.
Nota Solo se pueden seleccionar las columnas que tengan valores en forma de dígito numérico. 4.
En la lista desplegable Valores faltantes, seleccione Omitir.
5.
En Método de categorización, seleccione Anchos iguales basados en el número de agrupamientos.
6.
En el número de agrupamientos, introduzca 4.
7.
Seleccione Suavizado obligatorio.
8.
En los métodos de suavizado, seleccione Medio de agrupamiento.
9.
En Introducir nombre para la columna agregada recientemente, en Nombre de columna agrupada, introduzca Agrupamiento de temperatura.
Nota Puede dar un nombre a la columna según sus preferencias o requisitos de análisis. Esta columna contiene el valor agrupado. 10. En Introducir nombre para la columna agregada recientemente, en Columna suavizada, introduzca Suavizado de temperatura.
Nota Puede dar un nombre a la columna según sus preferencias o requisitos de análisis. Esta columna contiene el valor suavizado. Tabla de salida: Ciudad
Temperatura
Agrupamiento de temperatura
Suavizado de temperatura
Amsterdam
6
1
8.0
Fráncfort
12
2
13.33333
Cantón
13
2
13.33333
Ciudad de El Cabo
15
2
13.33333
Waldorf
10
1
8.0
Bangalore
23
3
25.5
Bombay
24
3
25.5
Miami
30
3
25.5
Río de Janeiro
32
4
35.0
Sídney
25
3
25.5
Dubai
38
4
35.0
15.2.7 Normalización de HANA Propiedades que se pueden configurar para el componente de preparación de normalización de HANA.
220
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Sintaxis Use este componente para normalizar los datos de atributo. La normalización de HANA escala los grandes datos de atributo de valor para que entren en un rango específico, como -1.0 a 1.0, o 0.0 a 1.0. Puede usar este componente para el análisis en base de datos. La normalización de datos es útil para los algoritmos de clasificación que implican redes neurales, o medidas de distancia, como la clasificación y agrupamiento en clúster de los vecinos más cercanos.
Nota Si desea que los datos procesados reemplacen la columna existente, seleccione Reemplazar columna. El componente de normalización admite los siguientes métodos de normalización: ●
Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza cada uno de ellos para ajustarlo a un rango específico. Al realizar la normalización mínima-máxima puede especificar el Nuevo valor máximo y el Nuevo valor mínimo. Esta normalización es útil para asegurar que los valores extremos están limitados dentro de un rango fijo.
Nota ○ ●
Nuevo valor máximo debe ser mayor que Nuevo valor mínimo.
Normalización del resultado Z: cálculo basado en el medio y la desviación estándar de cada atributo. Esta normalización es útil para determinar si un valor específico está por encima o por debajo del promedio, y por cuánto.
●
Normalización de escalado decimal: La coma decimal de los valores de cada atributo se desplaza conforme a su valor absoluto máximo.
Nota Puede seleccionar Reemplazar columna, si desea que los datos normalizados reemplacen los datos de la columna existentes, en los que se lleva a cabo la normalización.
Ejemplo Normalizar el tiempo utilizado para cubrir una distancia en concreto. Tabla: Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
66
Desi
500
360
Álex
500
201
Juan
500
78
Tomás
500
504
Para normalizar la columna de tiempo con la normalización Mínima-Máxima, realice los pasos siguientes: 1.
En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos.
2.
Arrastre el componente Normalización HANA al editor de análisis o haga doble clic en Normalización HANA.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
221
3.
Haga doble clic en Normalización de HANA o pase el puntero del ratón por encima de Normalización de HANA y seleccione Configurar propiedades.
4.
Seleccione las columnas que desee normalizar.
Nota Solo puede seleccionar las columnas con valores numéricos. Por ejemplo, Tiempo (en segundos). 5.
Desde la lista desplegable Tipo de normalización, seleccione Mín-Máx.
6.
Introduzca los valores para Nuevo máximo y Nuevo mínimo.
7.
Seleccione Finalizado y, a continuación, Ejecutar.
Tabla de salida: Nombre
Distancia (en metros)
Tiempo (en segundos)
Tiempo (en segundos)_Normalizado
Laura
500
66
0.05
Desi
500
360
0.30
Álex
500
201
0.17
Juan
500
78
0.06
Tomás
500
504
0.42
Lleve a cabo los mismos pasos para la normalización del resultado Z y para la normalización del escalado decimal, tal y como se menciona en la normalización Mín-Máx. Sin embargo, en el caso de la normalización del resultado Z y de la normalización del escalado decimal, no es necesario indicar los valores de Nuevo máximo ni de Nuevo mínimo. Salida de la normalización del resultado Z: Tabla de salida: Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
-0.49
Desi
500
1.77
Álex
500
0.55
Juan
500
-0.40
Tomás
500
2.88
Salida de la normalización del escalado decimal: Tabla de salida: Nombre
Distancia (en metros)
Tiempo (en segundos)
Laura
500
0.01
Desi
500
0.04
Álex
500
0.02
Juan
500
0.01
222
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Nombre
Distancia (en metros)
Tiempo (en segundos)
Tomás
500
0.05
15.2.8 Partición HANA Propiedades que se pueden configurar para el componente de preparación de partición de HANA.
Sintaxis El componente de partición HANA divide un conjunto de datos de entrada en tres subconjuntos discontinuos llamados conjuntos de formación, comprobación y validación. La proporción de cada subconjunto se define como un parámetro. La unión de tres subconjuntos no tiene que ser el conjunto inicial de datos completo. Usted puede dividir el conjunto de datos utilizando los siguientes métodos de partición: ●
Partición aleatoria, que divide todos los datos aleatoriamente.
●
Partición estratificada, que divide cada subcategoría aleatoriamente.
En el segundo caso, el conjunto de datos debe tener como mínimo un atributo categórico (por ejemplo, de tipo varchar). El conjunto de datos inicial se subdivide según los diferentes valores categóricos de este atributo. Cada subconjunto mútuamente exclusivo se divide de forma aleatoria para obtener conjuntos de formación, comprobación y validación. Esto garantiza que todos los "valores categóricos" o "estratificaciones" estén presentes en el subconjunto de ejemplo.
Propiedades de partición HANA Tabla 112: Propiedades del componente de preparación de datos Propiedad
Descripción
Método de partición
Seleccione el método para efectuar la partición de datos en conjuntos de formación, comprobación y validación. ●
Aleatorio
●
Estratificado
Muestreo aleatorio
Introduzca un muestreo aleatorio que desee utilizar para reali zar el cálculo.
Efectuar partición de filas según
Seleccione el método para efectuar la partición de filas. ●
Porcentaje de filas
●
Número de filas
Conjunto de formación
Introduzca el número de filas o el porcentaje de filas para el conjunto de formación.
Conjunto de comprobación
Introduzca el número de filas o el porcentaje de filas para el conjunto de comprobación.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
223
Propiedad
Descripción
Conjunto de validación
Introduzca el número de filas o el porcentaje de filas para el conjunto de validación.
Nombre de columna de partición
Introduzca un nombre para la columna nueva que contiene los valores con partición.
Número de subprocesos
Escriba el número de subprocesos que debe usar el algoritmo para la ejecución.
15.3 Grabadores de datos Use los grabadores de datos para almacenar los resultados de los análisis en archivos planos o bases de datos para su análisis posterior.
15.3.1
CSV Writer
Propiedades que se pueden configurar para CSV Writer.
Sintaxis Use este componente para escribir datos en archivos planos como archivos CSV, TEXT y DAT.
Propiedades de CSV Writer Tabla 113: Propiedades del grabador de datos Propiedad
Descripción
Nombre de archivo
Seleccione la ruta de archivos e introduzca el nombre del ar chivo .csv, .dat o .txt.
Sobrescribir si existe
Seleccione esta opción para sobrescribir un archivo existente.
Separador de columnas
Seleccione un delimitador de columnas que separe los tokens de datos del archivo.
Introducir carácter de comillas sencillas
Seleccione el carácter para reemplazar los separadores de columna mientras escribe los datos.
Incluir encabezados de columna
Seleccione esta opción para usar la primera fila como encabe zado de columna.
Codificación
Seleccione el método de codificación de texto para escribir los datos.
224
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Propiedad
Descripción
Separador de decimales
Seleccione el carácter para la representación decimal en la agrupación de dígitos.
Separador de agrupaciones
Seleccione el carácter para el separador de miles.
Formato de número
Introduzca el formato de número que desea aplicar a los da tos numéricos.
Formato de fecha y hora
Seleccione el formato de fecha que desea aplicar a las fechas.
15.3.2 JDBC Writer Propiedades que se pueden configurar para JDBC Writer.
Sintaxis Use este componente para escribir datos en bases de datos relacionales, como MySQL, MS SQL Server, DB2, Oracle, SAP MaxDB y SAP HANA.
Propiedades de JDBC Writer Tabla 114: Propiedades del grabador de datos Propiedad
Descripción
Tipo de base de datos
Seleccione el tipo de base de datos.
Ruta del controlador de base de datos
Introduzca la ubicación de la ruta del controlador JDBC. Por ejemplo, para escribir en la base de datos de Oracle, debe es pecificar la ubicación del archivo jar JDBC de Oracle (C:
\ojdbc6.jar) Nombre de base de datos de equipo
Introduzca el nombre del equipo en el que está instalada la base de datos.
Número de puerto
Introduzca el número de puerto de la base de datos o del ser vicio.
Nombre de base de datos
Introduzca el nombre de la base de datos.
Nombre de usuario
Introduzca el nombre de usuario de la base de datos.
Contraseña
Introduzca la contraseña para el usuario de la base de datos.
Tipo de tabla
Introduzca el tipo de tabla. Esta propiedad se aplica al escribir en la base de datos de SAP HANA.
Nombre de tabla
Introduzca el nombre de la tabla.
Sobrescribir si existe
Seleccione esta opción para sobrescribir la tabla si ya existe.
Manual de usuario de Expert Analytics Propiedades de los componentes
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
225
15.3.3 HANA Writer Propiedades que se pueden configurar para HANA Writer.
Sintaxis Use este componente para escribir datos en tablas de bases de datos SAP HANA.
Componente HANA Writer Tabla 115: Propiedades del grabador de datos Propiedad
Descripción
Nombre de esquema
Seleccione un esquema.
Tipo de tabla
Seleccione el tipo de tabla para la tabla en la que desea escri bir los datos.
Nombre de tabla
Indique un nombre para la tabla.
Sobrescribir si existe
Seleccione esta opción para sobrescribir la tabla si ya existe.
15.4 Modelos Los modelos que cree guardando el estado de los algoritmos se muestran en forma de lista en la sección Modelos de la lista Componentes. Expert Analytics no contiene modelos predefinidos. Por tanto, a no ser que ya haya grabado un algoritmo configurado como modelo, la sección Modelos estará vacía.
Información relacionada Crear un modelo [página 130]
226
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
Manual de usuario de Expert Analytics Propiedades de los componentes
Limitaciones de responsabilidad y aspectos legales
Ejemplos de codificación Cualquier codificación de software y/o líneas de códigos / cadenas ("Código") incluidas en esta documentación son solo ejemplos y no se prevé que se utilicen en un entorno de sistema productivo. El Código tiene el único propósito de explicar y permitir la visualización de las reglas de sintaxis y de asignación de frases de cierta codificación. SAP no ofrece garantías respecto a la exactitud y la integridad del Código disponibilizado en este documento y no será responsable de errores o daños causados por el uso del Código, a menos que los daños sean causados por SAP de forma intencional o por una imprudencia grave por parte de SAP.
Accesibilidad La información contenida en la documentación de SAP representa la visión actual de SAP de los criterios de accesibilidad a partir de la fecha de publicación. No se prevé que sea una directriz vinculante sobre cómo garantizar la accesibilidad de los productos de software. SAP renuncia a cualquier responsabilidad en relación con este documento. Sin embargo, este documento no se aplica en casos de un error deliberado o una negligencia grave por parte de SAP. Además, este documento no supone ningún compromiso u obligación contractual directos o indirectos.
Lenguaje neutro respecto al género Siempre que sea posible, la documentación de SAP es neutra respecto al género. Dependiendo del contexto, se trata al lector directamente de "usted" o se utiliza un nombre neutro respecto al género (como "vendedor/a" o "días laborables"). Sin embargo, si al referirse a los miembros de ambos sexos, no se puede evitar el uso de la tercera persona del singular o no existe un nombre neutro respecto al género, SAP se reserva los derechos para utilizar la forma masculina del nombre o pronombre. Esto es para garantizar que la documentación sea comprensible.
Hipervínculos de Internet La documentación de SAP puede contener hipervínculos a Internet. Se prevé que estos hipervínculos sirvan como un consejo acerca de dónde encontrar la información relacionada. SAP no garantiza la disponibilidad y la exactitud de esta información relacionada o la capacidad que esta información sirva un objetivo en particular. SAP no es responsable de ningún daño causado por el uso de la información relacionada a menos que los daños se hayan causado por una imprudencia grave o por una conducta fraudulenta dolosa por parte de SAP. Todos los enlaces están categorizados para su transparencia (consulte: http://help.sap.com/disclaimer).
Manual de usuario de Expert Analytics Limitaciones de responsabilidad y aspectos legales
PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos.
227
www.sap.com/contactsap
© 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Queda prohibida la reproducción o transmisión de cualquier parte de esta publicación, en cualquier forma o para cualquier fin, sin el permiso expreso de SAP SE o de una empresa filial de SAP. La información que aquí se incluye puede modificarse sin previo aviso. Algunos productos de software comercializados por SAP SE y sus distribuidores contienen componentes de software con derechos de autor de otros proveedores de software. Las especificaciones de productos en cada país pueden ser diferentes. SAP SE o una empresa filial de SAP SE proporcionan estos materiales con fines meramente informativos, sin manifestación ni garantía de ningún tipo. Ni SAP SE ni sus empresas filiales se hacen responsables de los errores u omisiones en relación con los materiales. Las únicas garantías para los productos y servicios de SAP SE o de sus empresas filiales son aquellas especificadas en las cláusulas expresas de garantía que acompañan a dichos productos y servicios, si las hubiera. Nada de lo que se incluye en este documento debe interpretarse como garantía adicional. SAP y los productos y servicios de SAP mencionados, así como sus respectivos logotipos, son marcas comerciales o marcas registradas de SAP SE (o de una empresa filial de SAP) en Alemania y en otros países. Todos los nombres y servicios de productos son las marcas comerciales de sus respectivas empresas. Consulte http://www.sap.com/corporate-en/legal/copyright/ index.epx para obtener información y avisos adicionales sobre marcas comerciales.