Preview only show first 10 pages with watermark. For full document please download

Pa20 Expert User Es

   EMBED


Share

Transcript

PUBLIC SAP Predictive Analytics 2.0 2015-02-10 Manual de usuario de Expert Analytics Contenido 1 Recursos de documentación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2 Novedades en Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3 Acerca de este manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.1 Contenido de este manual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.2 Audiencia de destino. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 4 Expert Analytics Resumen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9 5 Introducción a Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 5.1 Conceptos básicos de Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 5.2 Iniciar Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 5.3 Entender Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12 Vista Diseñador. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Vista Resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 5.4 Utilizar Expert Analytics de principio a fin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5.5 Configurar funciones avanzadas de Expert Analytics. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 6 Adquirir datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 6.1 Adquirir datos de un origen de datos para crear un conjunto de datos. . . . . . . . . . . . . . . . . . . . . . . . . . 17 Ver una conexión de fuente de datos y sus documentos asociados. . . . . . . . . . . . . . . . . . . . . . . . . 18 Adquirir datos a partir de un libro de MS Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Adquirir datos de un archivo de texto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Adquirir datos copiados en el Portapapeles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22 Adquirir datos a partir de vistas de SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 Adquirir datos de universo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28 Adquirir datos mediante consulta con SQL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Descargar datos de la base de datos SAP BW . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Tratar un conjunto de datos adquirido. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Objetos ocultos de la lista de objetos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 Editar el archivo de sugerencias de mejoras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 7 Preparar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 7.1 Preparar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Preparar espacio: Visualización, limpieza y manipulación de datos. . . . . . . . . . . . . . . . . . . . . . . . . 42 Editar y limpiar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 Crear indicadores y jerarquías. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 Crear un indicador o una dimensión calculados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Contenido Trabajo con conjuntos de datos múltiples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 8 Crear análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 8.1 Crear un análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Aplicar Componentes de procesamiento previo a datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 Aplicar algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 Opcional: Almacenar resultados del análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 8.2 Ejecutar el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 8.3 Guardar el análisis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 8.4 Eliminación de análisis desde el documento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 8.5 Ver resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .78 8.6 Exportación de un análisis como un procedimiento almacenado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 9 Agregar componentes personalizados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 9.1 Componente R personalizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .80 Asistente de creación de componentes R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Crear un componente R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 9.2 Componente PAL personalizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Asistente de creación de componentes PAL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Crear un componente PAL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 10 Análisis de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 10.1 Analizar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 10.2 Gráfico de matriz de dispersión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92 10.3 Gráfico de resumen estadístico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .92 10.4 Coordenadas paralelas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 10.5 Árbol de decisiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 10.6 Gráfico de tendencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 10.7 Gráfico de clúster. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 10.8 Gráfico de nube de etiquetas a priori. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 10.9 Matriz de confusión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 10.10 Gráfico de componentes R personalizados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 11 Visualizar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 11.1 Visualizar datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .99 Crear gráficos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .102 Ordenación de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 Filtrado de datos de gráfico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 Aplicar formato condicional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 Datos jerárquicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Buscar indicadores, dimensiones y valores de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Indicadores asociados con dimensiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 Tipos de agregaciones admitidas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Manual de usuario de Expert Analytics Contenido PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 3 12 Crear guiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 12.1 Guiones y datos visualizados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .120 Elementos de página. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Creación de un guión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Guardar un guión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Modificar un guion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126 Explorar una visualización en una historia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Actualizar datos en una página de infográfico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 13 Compartir datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128 13.1 Publicar en SAP Lumira Server. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Publicación de guiones y conjuntos de datos en SAP Lumira Server. . . . . . . . . . . . . . . . . . . . . . . .128 14 Trabajar con modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 14.1 Crear un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 14.2 Exportar un modelo como PMML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .130 14.3 Exportar un modelo a un archivo .spar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 14.4 Exportar un modelo de SAP HANA como procedimiento almacenado. . . . . . . . . . . . . . . . . . . . . . . . . 131 Eliminar el procedimiento almacenado exportado de SAP HANA. . . . . . . . . . . . . . . . . . . . . . . . . . 132 14.5 Importar un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 14.6 Eliminar un modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .133 15 Propiedades de los componentes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 15.1 Algoritmos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 Regresión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .134 Valores atípicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 Serie temporal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Árboles de decisiones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 Red neuronal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Agrupación en clústeres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 Asociación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 Clasificación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 15.2 Componentes de preparación de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 Fórmula. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202 Muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .208 Definición del tipo de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 Filtro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 Normalización. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 Categorización de HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 Normalización de HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 Partición HANA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 15.3 4 Grabadores de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Contenido CSV Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 JDBC Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 HANA Writer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 15.4 Modelos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 Manual de usuario de Expert Analytics Contenido PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 5 1 Recursos de documentación En la tabla siguiente se proporciona la lista de manuales disponibles para SAP Predictive Analytics: Tabla 1: ¿Qué es lo que se desea hacer? Entonces vaya aquí... Obtenga ayuda inmediata sobre cómo usar Expert Analytics o busque información sobre una función o un flujo de trabajo. La Ayuda en pantalla está disponible dentro del conjunto de herramientas Expert Analytics del siguiente modo: Obtenga ayuda instantánea sobre cómo usar Automated Analytics o encuentre información sobre una función o un flujo de trabajo. ● Haga clic en el icono de ayuda (?) en un cuadro o ventana de diálogo. ● Seleccione Ayuda Ayuda . La Ayuda en pantalla está disponible dentro del conjunto de herramientas Automated Analytics del siguiente modo: ● Pulse F1. ● Seleccione Ayuda Ayuda . Obtenga documentación completa sobre cómo usar SAP Predictive Analytics (en inglés). SAP Predictive Analytics Página de inicio Obtenga documentación completa sobre cómo usar SAP Predictive Analytics en un idioma distinto. Página Todos los productos de SAP Nota Seleccione un idioma, luego SAP Predictive Analytics y la ver­ sión necesaria de las listas desplegables. La documentación en otros idiomas distintos al inglés sólo está disponible para ciertos manuales. Obtenga la información más actualizada sobre el soporte de base de datos y del software para SAP Predictive Analytics. 6 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. SAP Product Availability Matrix Manual de usuario de Expert Analytics Recursos de documentación 2 Novedades en Expert Analytics Hay disponible una lista de las nuevas funciones con Expert Analytics y una descripción de cada función. Las siguientes Expert Analytics funciones nuevas están disponibles en esta versión de SAP Predictive Analytics: Tabla 2: Novedades de esta versión Descripción Soporte fuera de línea BW (Business Warehouse) Puede conectarse a un sistema BW (en ejecución en SAP HANA o cualquier otra base de datos) y descargar la fecha para el análisis fuera de línea. Ambos InfoSitios y consultas BEx se soportan con o sin variables. Se soportan nuevos algoritmos de APL (Automated Predictive Library) online Los siguientes algoritmos APL online se soportan y pueden utilizarse en análisis: ● HANA Auto Classification Identifica el mejor modelo de clasificación binaria que predice la categoría para datos invisibles. Esto se realiza automáticamente seleccionando un algoritmo de clasifi­ cación y variables de entrada clave para generar el mejor modelo. ● HANA Auto Clustering Descubre segmentos en los datos con referencia a una variable destino. Esto se realiza automáticamente selec­ cionando un algoritmo de clúster y variables de entrada clave para generar el mejor modelo. ● HANA Auto Regression Identifica automáticamente el mejor modelo de regre­ sión que mejor explica las relaciones entre las variables de entrada independientes y la variable destino. Manual de usuario de Expert Analytics Novedades en Expert Analytics PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 7 3 Acerca de este manual 3.1 Contenido de este manual Este manual ofrece: ● Un resumen de Expert Analytics ● Cómo adquirir datos desde varios orígenes de datos ● Cómo realizar operaciones de manipulación de datos, limpieza de datos y operaciones de mejoras semánticas en el espacio Preparar ● Información acerca de los distintos algoritmos y componentes disponibles en Expert Analytics ● Información sobre cómo crear análisis y modelos ● Información sobre cómo analizar datos mediante técnicas de visualización predictiva ● Cómo crear cuadros de historias ● Cómo compartir gráficos y conjuntos de datos Nota Expert Analytics hereda la funcionalidad de adquisición de datos y de manipulación de datos de SAP Lumira. Por lo tanto, para obtener información acerca de los flujos de trabajo que no se tratan en este manual, consulte el Manual de usuario de SAP Lumira disponible en: http://help.sap.com/lumira. Nota La información acerca de cómo instalar y configurar la aplicación y de cómo instalar R se cubre en el SAP Predictive AnalyticsManual de instalación de desktop. 3.2 Audiencia de destino Esta guía está destinada a analistas profesionales de datos, usuarios empresariales, estadísticos y científicos de datos que desean usar la aplicación Expert Analyticspara analizar y visualizar datos usando algoritmos predictivos. Nota Para usar Expert Analytics, debe familiarizarse con los algoritmos estadísticos y de minería de datos y tener un conocimiento básico acerca del uso de estos algoritmos. 8 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Acerca de este manual 4 Expert Analytics Resumen Expert Analytics es una solución de análisis estadístico y minería de datos que permite elaborar modelos predictivos para descubrir perspectivas y relaciones ocultas en los datos, desde los que puede realizar predicciones sobre eventos futuros. Expert Analytics es un conjunto de herramientas de la aplicación SAP Predictive Analytics. Con Expert Analytics, puede realizar varios análisis en los datos, incluida la previsión de series de tiempo, la detección de valores atípicos, el análisis de tendencias, el análisis de clasificación, el análisis de segmentación y el análisis de afinidad. Esta aplicación permite analizar datos mediante distintas técnicas de visualización, como gráficos de matriz de dispersión, coordenadas paralelas, gráficos de clúster y árboles de decisiones. Expert Analytics ofrece una gama de algoritmos de análisis predictivo, admite el uso del idioma de análisis estadístico de origen abierto R y ofrece capacidades de minería de datos en la memoria para gestionar de forma eficaz análisis de datos de gran volumen. Nota Expert Analytics hereda la funcionalidad de adquisición de datos y de manipulación de datos de SAP Lumira. SAP Lumira es una herramienta de manipulación y visualización de datos. Con SAP Lumira, puede conectarse a varios orígenes de datos, como archivos sin procesar, bases de datos relacionales, bases de datos en memoria y universos de SAP BusinessObjects, y puede trabajar en distintos volúmenes de datos, desde una pequeña matriz de datos de un archivo CSV hasta un conjunto de datos muy grande de SAP HANA, puede seleccionar y limpiar los datos, y manipular los datos. Manual de usuario de Expert Analytics Expert Analytics Resumen PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 9 5 Introducción a Expert Analytics 5.1 Conceptos básicos de Expert Analytics Conceptos importantes relevantes al utilizar Expert Analytics. Componente Un componente es la unidad de proceso básica de Expert Analytics. Cada componente contiene uno y/o varios puntos de conexión de salida. Estos puntos de conexión sirven para conectar componentes mediante conectores. Cuando se conectan componentes entre sí, los datos se transmiten de los componentes predecesores a sus componentes sucesores. Expert Analytics se compone de los siguientes componentes: ● Preprocesadores ● Algoritmos ● Grabadores de datos Puede obtener acceso a los componentes desde la vista Diseñador del espacio Predecir. Una vez que haya agregado componentes al editor de análisis, el icono de estado de los componentes permite identificar sus estados. Los estados de un componente pueden ser: ● Sin icono de estado: este estado se muestra cuando se arrastra un componente al editor de análisis. Indica que el componente tiene que configurarse antes de ejecutar el análisis. ● (Configurado): este estado se muestra cuando se han configurado para el componente todas las propiedades necesarias. ● ● 10 (Correcto): este estado se muestra tras la ejecución correcta del análisis. (Error): este estado se muestra si la ejecución del análisis no finaliza correctamente debido al componente. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Introducción a Expert Analytics Análisis Un análisis es una serie de componentes diferentes conectados entre sí en un orden determinado con conectores, que definen la dirección del flujo de datos. Modelo Un modelo es un componente reutilizable creado para enseñar a un algoritmo a usar datos históricos. Modo de trabajo en base de datos (In-DB) En base de datos (In-DB) es un modo de ejecución de análisis en el que el proceso de datos se realiza en la base de datos de SAP HANA usando las capacidades de minería de datos. En este modo, los datos nunca se extraen de la base de datos para su proceso y, por ello, la velocidad de proceso es muy elevada. Este modo se puede usar para procesar conjuntos de datos grandes. SAP HANA admite la minería de datos en base de datos mediante la integración R y la biblioteca de Predictive Analysis (PAL). Este tipo de análisis también es conocido como análisis online. Nota Para obtener información acerca del tamaño de la base de datos SAP HANA para realizar análisis en BD, consulte la nota SAP 1514966. Modo de trabajo en proceso (In-proc) En proceso (In-Proc) es un modo de ejecución de análisis en el que el proceso de los datos se realiza extrayendo los datos de la base de datos en un espacio de proceso de análisis predictivo. En este modo no puede utilizar los algoritmos PAL de SAP HANA para el análisis. No obstante, puede trabajar con algoritmos R y SAP. Este tipo de análisis también es conocido como análisis fuera de base de datos u offline. Nota Para obtener información acerca de los requisitos de hardware necesarios para realizar análisis en proceso, consulte Product Availability Matrix en SAP Product Availability Matrix Manual de usuario de Expert Analytics Introducción a Expert Analytics PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 11 5.2 Iniciar Expert Analytics Para iniciar Expert Analytics, seleccione Predictive Analytics Desktop 5.3 Inicio Todos los programas SAP Predictive Analytics SAP Business Intelligence SAP Expert Analytics . Entender Expert Analytics Aparece la página de inicio al iniciar Expert Analytics. La página de inicio contiene información que le ayuda a comenzar con la aplicación. También muestra la opción Probar con ejemplos. Esta opción le permite probar las funciones de Expert Analytics utilizando conjuntos de datos de muestra. También puede ver documentos de modelo de Expert Analytics en SAP Lumira utilizando su clave de licencia de prueba de SAP Predictive Analytics. Para comenzar con el análisis de datos utilizando Expert Analytics, necesita realizar las siguientes tareas: ● Conéctese al origen de datos y adquiera los datos para el análisis ● Preparar los datos para el análisis mediante la aplicación de funciones de manipulación de datos y de limpieza de datos ● Analizar datos mediante la aplicación de algoritmos de minería de datos y de análisis estadísticos ● Compartir conjuntos de datos y gráficos con colaboradores externos 5.3.1 Vista Diseñador La vista Diseñador del espacio Predecir le permite diseñar y ejecutar análisis y crear modelos predictivos. 12 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Introducción a Expert Analytics 5.3.2 Vista Resultados La vista Resultados del espacio Predecir le permite comprender los datos y los resultados de análisis mediante diferentes técnicas de visualización y gráficos intuitivos. Manual de usuario de Expert Analytics Introducción a Expert Analytics PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 13 5.4 Utilizar Expert Analytics de principio a fin A continuación, se facilita información general del proceso que puede seguir para crear un gráfico basado en un conjunto de datos. El proceso no es lineal y puede ir de un paso a uno anterior para ajustar el gráfico o los datos. Tabla 3: Pasos para trabajar con los datos Descripción Conéctese al origen de datos. Si el origen de datos es: 14 ● RDBMS: introduzca las credenciales, conéctese al servidor de base de datos, exa­ mine y seleccione el origen de datos; por ejemplo, si se está conectando a SAP HANA, seleccione una vista y un cubo para crear el gráfico. ● Archivo plano: elija las columnas que desea adquirir, reducir o mostrar y ocultar. ● Universo: introduzca las credenciales de universo, conéctese al repositorio del Ser­ vidor de administración central y seleccione un universo para crear el gráfico. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Introducción a Expert Analytics Pasos para trabajar con los datos Descripción Vea y organice las columnas y las di­ Puede ver los datos adquiridos como columnas o restricciones. Puede organizar los da­ mensiones. tos mostrados para facilitar la creación de gráficos realizando estas acciones del modo siguiente: Analice los datos usando algoritmos de análisis predictivo. ● Crear filtros y ocultar las columnas no necesarias ● Crear indicadores, jerarquías temporales y geográficas ● Limpiar y organizar los datos en columnas usando un rango de herramientas de manipulación ● Crear columnas con fórmulas usando una amplia selección de funciones disponi­ bles Cuando disponga de los datos pertinentes en el espacio Preparar, cambie al espacio Predecir y cree un análisis para descubrir patrones en los datos y predecir los resulta­ dos futuros. En el espacio Predecir puede hacer lo siguiente: Guardar el análisis 5.5 ● Crear un análisis ● Crear modelos predictivos ● Ver resultados de análisis ● Ver visualizaciones de modelos ● Crear gráficos Dar nombre y guardar el análisis que incluye los gráficos. Los análisis se guardan en un documento con el formato de archivo .lums en la carpeta de la aplicación Documentos de la ruta del perfil. Configurar funciones avanzadas de Expert Analytics Puede configurar las funciones avanzadas de Expert Analytics, como la optimización del rendimiento y la habilitación de soporte de tipo de datos para algoritmos PAL mediante el archivo SAPPredictiveAnalysis.ini. 1. Cierre la aplicación SAP Predictive Analytics. 2. Vaya a \Desktop. 3. Abra el archivo SAPPredictiveAnalysis.ini. 4. Establezca los valores para los parámetros siguientes en true para habilitar la función correspondiente. Establezca en valor en false para deshabilitar la función. Tabla 4: Parámetro Descripción -Dpa.batch.sql Este parámetro optimiza el rendi­ True miento de Expert Analytics mediante la ejecución de lote de SQLs. Manual de usuario de Expert Analytics Introducción a Expert Analytics Valor predeterminado PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 15 Parámetro Descripción Valor predeterminado -Dpa.decimal.enabled Este parámetro habilita el soporte de tipo de datos decimal para algoritmos PAL. El soporte de tipo de datos deci­ mal está disponible a partir de SAP HANA 7.1 y anterior. False 5. Grabe y cierre el archivo SAPPredictiveAnalysis.ini. 6. Reinicie SAP Predictive Analytics. 16 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Introducción a Expert Analytics 6 Adquirir datos 6.1 Adquirir datos de un origen de datos para crear un conjunto de datos Se adquieren datos al copiarlos de un origen de datos a un conjunto de datos local. Al adquirir datos la aplicación muestra una vista previa de ellos, analiza los datos sintácticamente y analiza columnas para determinar su tipo de datos. Se proponen los objetos que representan columnas como dimensiones o indicadores. Puede ocultar manualmente algunos tipos de columnas en función del nombre de columna y propiedades de datos. Nota La cantidad máxima de celdas que se puede adquirir está limitada por la capacidad de su equipo. Recibirá una advertencia cuando una adquisición incluya 30 millones de celdas para sistemas operativos de 64 bits o 15 millones de celdas para sistemas operativo de 32 bits. Según el origen de datos, los datos se pueden adaptar antes de su adquisición para incluir o eliminar columnas, dimensiones, indicadores o variables y parámetros de entrada. Algunas fuentes de datos tienen opciones adicionales, como datos de formato, columnas de nombre y de recorte o especifican prefijos de nombre de columna. Tabla 5: Orígenes de datos disponibles Origen de datos Descripción Portapapeles Crea un conjunto de datos que se copió en el portapapeles. Microsoft Excel Carga una hoja de trabajo Excel como set de datos Archivo de texto Carga un archivo de texto (.csv o .txt) como set de datos SAP HANA Descarga datos desde el modo SAP HANA (sin conexión) Se conecta al modo SAP HANA (en línea) Universo SAP BusinessObjects Descarga datos desde archivos de universo SAP BusinessObjects (.unv y .unx) Consulta con SQL Ejecuta SQL manual en una base de datos para descargar un set de datos Tras adquirir un set de datos, puede añadir o eliminar columnas, dimensiones, medidas y variables. Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 17 Información relacionada Adquirir datos de un archivo de texto [página 21] Adquirir datos a partir de vistas de SAP HANA [página 24] Adquirir datos a partir de un libro de MS Excel [página 18] Adquirir datos mediante consulta con SQL [página 30] Conectar con un origen de datos de universo [página 28] Tratar un conjunto de datos adquirido [página 39] Objetos ocultos de la lista de objetos [página 39] 6.1.1 Ver una conexión de fuente de datos y sus documentos asociados Puede ver todas las conexiones definidas para la aplicación y los documentos asociados con cada conexión y modificar la fuente de datos de destino para conexiones definidas en la página inicial. 1. En la página inicial, seleccione Conexiones. Si se abre un documento en el espacio Preparar o Compartir, deberá guardar y cerrarlo antes de que pueda ir a la página inicial. El panel CONEXIONES aparece en la derecha y ofrece una lista de todas las conexiones de fuentes de datos disponibles. Seleccione una conexión para visualizar una lista de documentos asociados con la misma. El panel DOCUMENTO PARA aparece a la derecha del panel CONEXIONES y los documentos asociados con cada conexión. 2. Seleccione una conexión local de la lista para mostrar la fuente de datos de destino. Puede seleccionar otra fuente de datos en caso necesario. 3. (Opcional) Para cambiar la conexión de una o varias fuentes de datos para un documento, realice las siguientes acciones: a. Seleccione la conexión a cambiar. b. Seleccione el documento para el que desea modificar la fuente de datos en el panel DOCUMENTO PARA. c. Seleccione una nueva fuente de datos para el documento en el panel CONEXIONES y seleccione Aplicar. 6.1.2 Adquirir datos a partir de un libro de MS Excel 1. En la página inicial, seleccione Adquirir datos. 2. En el diálogo Set de datos nuevo, seleccione Microsoft Excel y luego, Siguiente. 3. Elija uno o más ficheros Excel y seleccione Abrir. Los datos de ficheros Excel se previsualizan en la ventana de diálogo Set de datos nuevo. 4. (Opcional) Modificar las opciones de Excel para adquirir datos. 5. Seleccione Crear. Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar. 18 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos 6.1.2.1 Nuevas opciones de diálogo de set de datos para Excel Puede adquirir datos desde uno o varios libros de Microsoft Excel. Seleccione qué filas y columnas desea adquirir. También puede adquirir datos de las tablas de referencias. Tabla 6: Nuevas opciones de diálogo de set de datos para Excel Opción Descripción Nombre de set de datos Escriba un nombre para el set de datos nuevo. Archivo(s) Seleccione los libros de Excel que serán la fuente de datos para el set de datos nuevo. Hoja Si un libro de Excel contiene múltiples hojas de trabajo, seleccione la hoja de trabajo que desea adquirir para el set de datos. Agregar todas las hojas Marque esta casilla de selección para añadir todas las hojas de tra­ bajo en el libro para el set de datos. Si se agregan las columnas co­ munes, las columnas distintas se agregan como columnas nuevas. Establecer la primera fila como nombres de columna Marque esta casilla de selección para establecer los primeros valo­ res de fila en la hoja de cálculo como nombres de columna en el set de datos. Tipo de cabecera de tabla Seleccione Tabla estándar (sin transformaciones) o Tabla de referencias. Seleccionar todo Marque esta casilla de selección para añadir todas las columnas en la hoja de cálculo para el set de datos. Mostrar recuento de registro Seleccione esta casilla de selección para mostrar el número de co­ lumnas y el número de líneas en el set de datos. Opciones avanzadas Mostrar columnas ocultas Marque esta casilla de selección para mostrar columnas de hoja de Opciones avanzadas Mostrar filas ocultas Marque esta casilla de selección para mostrar filas de hoja de tra­ Opciones avanzadas Detectar celdas fusionadas Marque esta casilla de selección para destacar celdas de hoja de Opciones avanzadas Selección de rango Si una hoja de trabajo contiene uno o varios rangos con nombre, se­ trabajo ocultas como cabeceras de columna en el set de datos. bajo ocultas en el set de datos. cálculo fusionadas en el set de datos. leccione el rango que va a aplicar a las columnas adquiridas para el set de datos. El set de datos está restringido a las columnas defini­ das en este rango. Opciones avanzadas Columna Manual de usuario de Expert Analytics Adquirir datos Para tablas cruzadas, especifique el número de columnas a usar para el encabezado izquierdo. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 19 Opción Descripción Opciones avanzadas 6.1.2.2 Fila Especifique el número de filas a usar para el encabezado superior. Adquirir datos a partir de libros múltiples de MS Excel Al adquirir datos de libros múltiples de Excel, el formato de fecha y el tipo de datos deben ser los mismos en todos los libros. 1. En la página inicial, seleccione Adquirir datos. 2. En el diálogo Set de datos nuevo, seleccione Microsoft Excel y luego, Siguiente. 3. Elija uno o más ficheros Excel y seleccione Abrir. Los datos de ficheros Excel se previsualizan en la ventana de diálogo Set de datos nuevo. 4. (Opcional) En el cuadro Nombre de set de datos, indique un nombre para el set de datos. 5. Junto a Archivo/s, seleccione Añadir archivos y examine y seleccione la hoja de cálculo de Excel de la que adquirir los datos. Puede utilizar comodines para buscar un nombre de hoja de cálculo. Por defecto, el primer archivo en la vía de acceso se considera como el archivo de referencia al que se adjuntan los datos desde el resto de hojas de cálculo adquiridas. Por ejemplo, indique C:\data\monthly updates\*.xls(x) para buscar todos los archivos .xls(x) en la vía de acceso. 6. En la lista Hoja, seleccione una hoja de trabajo. Dicha hoja de trabajo es la hoja de referencia a la que se adjuntan los datos de otras hojas de trabajo. El recuento de registros se actualiza para reflejar el número de archivos de todos los datos adquiridos. Se añade una columna "Archivo de origen" al set de datos, que lista cada nombre de fuente de datos. Si ha marcado la casilla de selección Adjuntar todas las hojas, se adjuntarán todas las hojas de trabajo a la hoja de cálculo de Excel en el set de datos. Aparecerán los datos de la hoja de trabajo en el panel de vista previa del diálogo Set de datos nuevo. 7. (Opcional) Para visualizar filas o columnas ocultas de la hoja de trabajo en el set de datos, seleccione Opciones avanzadas. 8. (Opcional) Para visualizar columnas de hoja de trabajo ocultas en los datos adquiridos, marque la casilla de selección Mostrar columnas ocultas e indique el rango de columna a visualizar en la lista Selección de rango. 9. (Opcional) Para visualizar filas de hoja de trabajo ocultas en los datos adquiridos, marque la casilla de selección Mostrar filas ocultas e indique el rango de fila a visualizar en la lista Selección de rango. 10. Seleccione Crear. Los datos se adquieren y aparecen en el espacio Preparar. 20 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos 6.1.3 Adquirir datos de un archivo de texto Puede adquirir datos de uno o más ficheros de texto si los datos se almacenan con delimitadores o en columnas con ancho fijo. Un ejemplo de fichero de texto usando delimitadores es un fichero con valores separados por comas.csv). Un archivo .csv almacena números y texto en formato de texto plano. Cada registro se compone de campos que suelen estar separados con una coma o una tabulación y registros separados por saltos de línea. Aquí hay un ejemplo de un fichero .csv con datos separados por comas: "Product","Country","Year","Quantity","Margin" "Skis","Italy","2013","1,297","1,929" "Computers","China","2014","609","10,659" Adquirir datos de este archivo .csv resulta en cinco columnas en el conjunto de datos: "Producto," "País," "Año," "Cantidad," y "Margen." Columna 2, en este ejemplo, contiene los valores "País" "Italia" y "China". Este es un ejemplo de un fichero de texto con los datos almacenado en columnas de ancho fijo: Product Country Skis Italy Computers China Year 2013 2014 Quantity 1,297 609 Margin 1,929 10,659 Puede adquirir datos de varios orígenes de datos de archivos múltiples. Los ficheros deben tener el mismo formato y tipo de datos. Tabla 7: Nuevas opciones de diálogo de set de datos para archivos de texto Opción Descripción Nombre de set de datos El nombre del conjunto de datos Archivo(s) El archivo o archivos que contiene datos para el conjunto de datos. Puede importar datos de uno o varios archivos. Para especificar varios archivos separe las rutas de archivo en el campo Archivo(s) con puntos y comas o seleccione Añadir archivos y elija uno o más archi­ vos para añadir a la selección. Separador Seleccione si los datos en sus archivos los separan los delimitadores o si se introducen en columnas con ancho fijo. Los delimitadores son símbolos, como comas, fichas o espacios, que separan campos en la fuente de datos y que especifican columnas en el conjunto de datos en SAP Lumira. Establecer la primera fila como Marque esta casilla de selección para usar la primera fila de datos como nombres de co­ nombres de columna lumna en el conjunto de datos. Desmarque esta casilla de selección para asignar el nombre estándar de las columnas ("Columna1," "Columna2," etc). Opciones avanzadas El formato para columnas numéricas en el set de datos Formato de números Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 21 Opción Descripción El formato para columnas de fecha en el set de datos Opciones avanzadas Formato de fecha Opciones avanzadas Salto de columna Al adquirir datos almacenados como columnas con ancho fijo, analice el fichero de datos y sugiera anchos de columna en caracteres para separar datos en columnas en el conjunto de datos. Si los anchos sugeridos no son adecuados, puede modificar los anchos introduciendo valo­ res separados por comas. Por ejemplo, si sus datos están en tres columnas y el ancho de columna es cinco, diez y quince caracteres, debe escribir 5,10,15 en el campo Salto de columna y seleccionar Aplicar para ver una vista preliminar del conjunto de datos resul­ tante. Opciones avanzadas Eliminar espacios en blanco Marque esta casilla de selección para eliminar valores principales y secundarios de núme­ ros y texto en el set de datos, de modo que no aparezcan las cabeceras de columna como campos vacíos. Por ejemplo, si una entrada "Producto" tiene un espacio principal (" Pro­ ducto"), el espacio se elimina y aparece "Producto" como la cabecera de columna. 1. En la página inicial, seleccione Adquirir datos. 2. En el diálogo Set de datos nuevo, seleccione Texto y luego, Siguiente. 3. Elija uno o más ficheros Excel y seleccione Abrir. Los datos de ficheros Excel se previsualizan en la ventana de diálogo Set de datos nuevo. 4. (Opcional) Ajuste las opciones del conjunto de datos en el diálogo según sea necesario. 5. Seleccione Crear. Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar. 6.1.4 Adquirir datos copiados en el Portapapeles Los datos basados en texto se pueden copiar en el portapapeles de un fichero basado en texto (por ejemplo, Microsoft Excel) o de una página Web. Tabla 8: Nuevas opciones de diálogo de conjunto de datos para datos copiados desde el portapapeles Opción Descripción Nombre de set de datos El nombre del conjunto de datos Separador Seleccione si los datos en el portapapeles los separa los delimitadores o si se introducen en columnas con ancho fijo. Los delimitadores son símbolos, como comas, fichas o espa­ cios, que separan campos en la fuente de datos y que especifican columnas en el conjunto de datos en la aplicación. 22 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos Opción Descripción Establecer la primera fila como Marque esta casilla de selección para usar la primera fila de datos como nombres de co­ nombres de columna lumna en el set de datos. Desmarque esta casilla de selección para asignar el nombre estándar de las columnas ("Columna1," "Columna2," etc). El formato para columnas numéricas en el set de datos Opciones avanzadas Formato de números El formato para columnas de fecha en el set de datos Opciones avanzadas Formato de fecha Opciones avanzadas Salto de columna Al adquirir datos almacenados como columnas con ancho fijo, analice el fichero de datos y sugiera anchos de columna en caracteres para separar datos en columnas en el conjunto de datos. Si los anchos sugeridos no son adecuados, puede modificar los anchos introduciendo valo­ res separados por comas. Por ejemplo, si sus datos están en tres columnas y el ancho de columna es cinco, diez y quince caracteres, debe escribir 5,10,15 en el campo Salto de columna y seleccionar Aplicar para ver una vista preliminar del conjunto de datos resul­ tante. Opciones avanzadas Eliminar espacios en blanco Marque esta casilla de selección para eliminar valores principales y secundarios de núme­ ros y texto en el set de datos, de modo que no aparezcan las cabeceras de columna como campos vacíos. Por ejemplo, si una entrada "Producto" tiene un espacio principal (" Pro­ ducto"), el espacio se elimina y aparece "Producto" como la cabecera de columna. Nota El navegador web de Microsoft Internet Explorer (IE) tiene un problema conocido al copiar texto al portapapeles. Si se encuentra con ese problema, utilice en su lugar el navegador diferente soportado. 1. En la página inicial, seleccione Adquirir datos. 2. En la ventana de diálogo Set de datos nuevo, haga clic en Copiar desde portapapeles y seleccione Siguiente. 3. Copiar texto en el portapapeles. 4. En la aplicación, crear un documento nuevo. 5. En la ventana de diálogo Set de datos nuevo, haga clic en Copiar desde portapapeles y seleccione Siguiente. 6. (Opcional) Seleccione Espacios de corte para eliminar espacios principales y secundarios de números y texto en el set de datos. 7. (Opcional) Seleccione Cortar fila para eliminar líneas en blanco desde el conjunto de datos. 8. Seleccione Continuar. Los datos de ficheros Excel se previsualizan en la ventana de diálogo Set de datos nuevo. 9. (Opcional) Ajuste las opciones del conjunto de datos en el diálogo según sea necesario. 10. Seleccione Crear. Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 23 Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar. 6.1.5 Adquirir datos a partir de vistas de SAP HANA Puede adquirir datos desde vistas analíticas o de cálculo SAP HANA. Los datos de la base de datos SAP HANA están accesibles en una "vista": una agrupación virtual predefinida de columnas de tabla que permite el acceso de datos para un requisito empresarial particular. Las vistas son específicas de un tipo o tablas para el tipo de cálculos que se aplican a las columnas. Por ejemplo, la vista de atributos se estructura en tablas de dimensión, las vistas analíticas se estructuran en una tabla de hechos y en la vista de atributos, y la vista de cálculo ejecuta una función en columnas al acceder a la vista. Puede conectarse a las vistas de SAP HANA de dos formas: ● Al descargar datos desde SAP HANA Los datos se copian localmente y se pueden manipular y editar antes de visualizarlos en gráficos. ● Al visualizar datos en SAP HANA Los datos son solo de lectura (es decir, no puede editarlos), pero puede visualizarlos en gráficos. Después de conectarse con una vista, se presentan los datos como columnas, facetas, indicadores, dimensiones, y jerarquías en la aplicación. Información relacionada Descargar datos desde SAP HANA [página 26] Conectarse a SAP HANA [página 25] Acceder a datos de SAP BW en vistas de SAP HANA [página 27] Especificar valores para variables de SAP HANA y parámetros de entrada de string [página 27] 6.1.5.1 Restricciones para conexiones SAP HANA One Tabla 9: Restricciones para conectar al origen de datos SAP HANA One Restricción Descripción Solo está disponible un nivel Solo se puede utilizar un solo atributo a la vez al crear una jerarquía geográfica. para las jerarquías geográfi­ cas. Medidas con dimensioens nu­ Las medidas se detectan desde la vista analítica SAP HANA. Deben crearse en la vista SAP méricas o de candena no pue­ HANA antes de que la aplicación pueda adquirirlas automáticamente. den crearse. 24 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos Restricción Descripción No se pueden publicar sets de datos en SAP HANA. No se soportan algunas fun­ ciones. Las siguientes funciones SAP HANA no se soportan: ● AddMonthToDate ● AddYearToDate ● LastDayOfMonth ● DayOfYear ● Semana ● LastWord ● ExceptLastWord Algunas características no es­ Si una vista analítica utiliza una vista de cálculo (por ejemplo, si una vista de atributo con la tás disponibles para vistas analísticas que usan una vista de cálculo. vista analítica tiene una medida calculada o una o varias columnas calculadas): ● La vista en cuadrícula no está disponible en el espacio Preparar. ● Las facetas no muestran valores cuando una medida se ha seleccionado en el espacio Preparar. ● 6.1.5.2 No es posible ordenar por medidas en el espacio Visualizar. Conectarse a SAP HANA Al conectarse a SAP HANA, podrá visualizar datos y crear visualizaciones de un cubo SAP HANA . Debe conocer su nombre de servidor SAP HANA, número de puerto, nombre de usuario y contraseña. Para obtener más información, póngase en contacto con su administrador SAP HANA. 1. En la página inicial, seleccione Adquirir datos. 2. En el diálogo Set de datos nuevo, seleccione Conectar con SAP HANA One y luego, en Siguiente. 3. Seleccione el servidor al que conectarse en la lista Servidor. 4. Introduzca el número de puerta al que conectarse en el cuadro Instance/Puerta. 5. Conectarse al servidor SAP HANA: Opción Descripción Si se conecta introduciendo las credenciales Introduzca su nombre de usuario y su contraseña, y luego haga clic en Conectar. Si se conecta mediante un inicio de sesión Seleccione la casilla de selección Autenticar mediante sistema único (SSO) operativo (SSO) y seleccione Conectar. 6. Seleccione Siguiente. Aparece una ventana Set de datos nuevo: Aparece el diálogo Vistas SAP HANA, que muestra vistas SAP HANA disponibles. 7. Amplíe la vista SAP HANA que contiene los datos a visualizar, y seleccione el cubo que contiene los datos. Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 25 8. Selección de los datos a adquirir: ○ Para adquirir dimensiones y medidas particulares en los datos, seleccione Siguiente, elija las dimensiones y medidas y seleccione Aceptar. ○ Para adquirir todos los datos, seleccione Crear. Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar. Información relacionada Especificar valores para variables de SAP HANA y parámetros de entrada de string [página 27] Restricciones para conexiones SAP HANA One [página 24] 6.1.5.3 Descargar datos desde SAP HANA Usted puede manipular los datos y crear visualizaciones a partir de un cubo de SAP HANA. Debe conocer su nombre de servidor SAP HANA, número de puerto, nombre de usuario y contraseña. Para obtener más información, póngase en contacto con su administrador SAP HANA. 1. En la página inicial, seleccione Adquirir datos. 2. En el diálogo Set de datos nuevo, seleccione Descargar de SAP HANA One y luego, Siguiente. 3. Seleccione el servidor al que conectarse en la lista Servidor. 4. Introduzca el número de puerta al que conectarse en el cuadro Instance/Puerta. 5. Conectarse al servidor SAP HANA: Opción Descripción Si se conecta introduciendo las credenciales Introduzca su nombre de usuario y su contraseña, y luego haga clic en Conectar. Si se conecta mediante un inicio de sesión Seleccione la casilla de selección Autenticar mediante sistema único (SSO) operativo (SSO) y seleccione Conectar. 6. Seleccione Siguiente. Aparece una ventana Set de datos nuevo: Aparece el diálogo Vistas SAP HANA, que muestra vistas SAP HANA disponibles. 7. Amplíe la vista SAP HANA que contiene los datos a visualizar, y seleccione el cubo que contiene los datos. 8. Selección de los datos a adquirir: ○ Para adquirir dimensiones y medidas particulares en los datos, seleccione Siguiente, elija las dimensiones y medidas y seleccione Aceptar. ○ Para adquirir todos los datos, seleccione Crear. Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar. 26 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos Información relacionada Adquirir datos a partir de vistas de SAP HANA [página 24] Especificar valores para variables de SAP HANA y parámetros de entrada de string [página 27] 6.1.5.4 Acceder a datos de SAP BW en vistas de SAP HANA Puede acceder a datos de SAP Business Warehouse (BW) que se encuentran disponibles en las vistas analítica o de cálculo de SAP HANA. En sistema SAP BW en SAP HANA, puede utilizar el modelador SAP HANA para importar modelos SAP BW (por ejemplo, cubos optimizados para SAP HANA, objetos DataStore (DSO) e instantáneas de query BW) como vistas analíticas y de cálculo. Una vez que se activan los modelos, la aplicación puede consumirlos conectándose con un cubo SAP HANA. Para obtener información sobre la implementación de un sistema SAP BW en SAP HANA y sobre cómo hacer que sean disponibles datos para SAP HANA, véanse las Preguntas frecuentes: documento BW en HANA en http:// www.experiencesaphana.com/community/solutions/net-weaver-bw/bwonhanafaq . Información relacionada Descargar datos desde SAP HANA [página 26] 6.1.5.5 Especificar valores para variables de SAP HANA y parámetros de entrada de string El sistema le pide que indique un valor para una variable SAP HANA o un parámetro de entrada de string cuando adquiere una vista analítica en modo Descargar de SAP HANA One y al crear un documento en una vista analítica en modo Conectar a SAP HANA One. Cada variable de SAP HANA define un filtro en una dimensión de una vista. Introduce un valor para cada dimensión antes de adquirir datos y aparece el valor como una fila de restricción después de adquirir. Introduce un valor para cada parámetro de entrada de SAP HANA cuando adquiere datos y SAP Lumira pasa el valor a un cálculo como una fórmula para una medida calculada. Cuando se introduce un valor para un parámetro de entrada de string, tiene que introducir un enunciado SQL, utilizando comillas simples para indicar el inicio y el final del string de enunciado. Por ejemplo, introduzca BUKRS='CALP' para buscar CALP. 1. Conéctese a una instancia SAP HANA en modo Descargar desde SAP HANA Oneo Conectar a SAP HANA One. 2. Selección de los datos a adquirir: ○ Para elegir qué datos adquirir, seleccione una vista analítica, seleccione Previsualizar y seleccionar datos, seleccione Seleccionar, elija valores de dimensión e indicadores, y marque Editar variables. Si no hay variables o parámetros de entrada definidos en la vista, el botón Editar variables no está disponible. Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 27 ○ Para adquirir todos los datos disponibles en una vista analítica, elija la vista y seleccione Crear. Aparece un cuadro Variables HANA, que recoge las variables y parámetros de entrada definidos para la vista analítica. Las variables van precedidas de "VAR" y los parámetros de entrada van precedidos de "IP". 3. Elija una variable o un parámetro de entrada. El valor de dimensión o de parámetro de entrada se muestra en el panel derecho. 4. Elija uno o más valores y seleccione Agregar. Para elegir valores individuales múltiples, mantenga pulsada la tecla Ctrl y seleccione cada valor. Para elegir un rango de valores, mantenga pulsada Mayús y seleccione el primer y el último valor en el rango. Los valores seleccionados aparecen en el panel inferior. 5. Seleccione OK. 6. Si está adquiriendo datos a través de Vista previa y selección de datos, seleccione Crear para iniciar la adquisición de datos. Los datos aparecen en el espacio Preparar y cada variable aparece como una faceta con los valores de petición seleccionados. El botón de Variables aparece en la parte superior del área de ventana de las restricciones. Seleccione el botón para ver los valores para las variables de SAP HANA . 6.1.6 Adquirir datos de universo Puede adquirir datos desde archivos de universo SAP BusinessObjects. Los archivos universo (.unx) para acceso BW SAP NetWeaver se crean con SAP Information Design Tool que está instalado con la plataforma para SAP BusinessObjects Business Intelligence. Para obtener información sobre la herramienta en diseño de información, véase http://help.sap.com/businessobject/product_guides/sbo41/en/ sbo41sp1_info_design_tool_en.pdf. Para obtener más información sobre federación de datos, consulte http://help.sap.com/businessobject/ product_guides/sbo41/en/sbo41_dfat_guide_en.pdf. Para obtener una lista completa de universos soportados y opciones de acceso de base de datos, véase Product Availability Matrix en el SAP Service Marketplace en SAP Product Availability Matrix . 6.1.6.1 Conectar con un origen de datos de universo 1. En la página inicial, seleccione Adquirir datos. 2. En el diálogo Set de datos nuevo, seleccione Universo y luego, Siguiente. 3. En el panel Credenciales de universo: a. Introduzca el nombre o la dirección IP del servidor que aloja su Servidor de administración central (CMS). Si se está conectando a un CMS que pertenece a un dominio de red diferente, debe asegurarse de que el archivo de hosts que se encuentra en C:\Windows\System32\drivers\etc tiene la entrada del nombre de host correspondiente (por ejemplo, x.x.x.x). b. 28 Introduzca el nombre de usuario CMS, contraseña y tipo de autenticación. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos c. Para usar la autenticación Windows AD para conectarse al CMS, agregue las siguientes dos entradas al archivo SAPLumira.ini que se encuentra en: \SAPLumira\Desktop: -Djava.security.auth.login.config=\bscLogin.conf -Djava.security.krb5.conf=\krb5.ini -Djava.security.auth.login.config=C:\Windows\bscLogin.conf -Djava.security.krb5.conf=C:\Windows\krb5.ini a. Seleccione Conectar. Aparece una lista de universos disponibles en el CMS. 4. Seleccione un universo y después Seleccionar. 5. Seleccione los objetos necesarios en el árbol de universos y seleccione Adquirir. Antes de adquirir datos, puede obtener una presentación preliminar de los datos y aplicar filtros seleccionando la opción Vista previa y selección de datos. Si una consulta contiene contextos o mensajes, debe responder a ellos antes de que puedan adquirirse los datos. Al crear una consulta, puede establecer las siguientes propiedades de consulta: ○ Máx. filas recuperadas: el número máximo de filas que debe recuperar la consulta. ○ Tiempo de recuperación máx.: El tiempo máximo que se puede ejecutar una consulta (en segundos). ○ Recuperar filas duplicadas: Seleccione para recuperar las filas duplicadas. Se abre el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar un conjunto de datos, cambie a el espacio Preparar. 6.1.6.2 Sugerencias para solucionar problemas de conexiones de datos de universo Puede encontrar estos mensajes y causas posibles al trabajar con el origen de datos de universo. Tabla 10: Pasos para solucionar problemas de conexiones de datos de universo Mensaje Causa No se pudo conectar al Servidor de ● CMS no responde. administración central (CMS) ● Su nombre de usuario o contraseña incorrectos. ● El tipo de autenticación es incorrecto. ● Se ha producido un problema en la red. ● El universo está dañado. ● CMS no responde. ● La conexión con el universo no está configurada correc­ No se pudo cargar el universo seleccionado tamente. Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 29 Mensaje Causa No se pudo validar la consulta ● Existe un problema con la conexión con la base de datos. ● Los tipos de datos no coinciden con el objeto. ● Un resultado devuelto por el servidor ha alcanzado el lí­ mite fijado para parámetro de configuración Tamaño máximo de flujo de caracteres (MB) del servidor de infor­ mes SAP Web Intelligence. ● Uno o más objetos del universo no están configurados correctamente. La consulta no devuelve conjuntos de filas Una consulta para el objeto no ha devuelto datos. 6.1.7 Adquirir datos mediante consulta con SQL Puede crear su propio proveedor de datos al introducir manualmente el SQL para una fuente de datos de destino. Puede especificar las tablas de origen, las columnas y las funciones para adquirir los datos. Para obtener una lista completa de middleware de base de datos a los que pueda acceder la consulta con SQL, véase SAP Product Availability Matrix . Tabla 11: Controladores middleware de base de datos disponibles Opción middleware de base Cómo obtener el controlador de datos Apache Los controladores Amazon EMR y Apache Hive Simba están incluidos en SAP Lumira. Cloudera El controlador Cloudera Impala Simba está incluido en SAP Lumira. IBM DB2 Vaya a la página de descargas de conectividad de IBM DB2 en https://www.ibm.com/account/ profile/us?page=reghelpdesk . Seleccione el controlador adecuado para su base de datos, grabe el fichero de instalación comprimido en su ordenador, extraiga el fichero comprimido (db2jcc.jar) en un directorio local y ejecute el instalador desde su ordenador. En cambio, para versiones anteriores a 9.5 debe extraer db2cc.jar y db2jcc_license_cu.jar. Antes de poder descargar un controlador, debe registrarse indicando una dirección de correo electrónico de usuario reconocida por IBM como nombre de cuenta. Si no sabe qué versión del controlador utilizar, los dos controladores de la versión DB2 [DB2 versión 10.1 FP0 (GA) y ver­ sión 10] son adecuados para todas las versiones posteriores a la versión DB2 9.5. Para obtener más información, póngase en contacto con el administrador de su base de datos. IBM Netezza 30 Póngase en contacto con el administrador Netezza. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos Opción middleware de base Cómo obtener el controlador de datos Microsoft SQL Server Vaya a la página del centro de descargas de controladores de Microsoft 2005, 2008 y 2012 del servidor SQL en http://www.microsoft.com/en-us/download/driver.aspx?q=driver . Selec­ cione el controlador adecuado para su base de datos, grabe el fichero de instalación en su or­ denador y ejecute el instalador desde su ordenador. Si no sabe qué versión de controlador utilizar, Microsoft JDBC Driver 4.0 para SQL Server es válido para todas las versiones de servidor SQL admitidas. Si está instalando JDBC Driver 4.0 para SQL Server, el controlador para un sistema operativo Windows es sqljdbc_4.0.2206.100_enu.exe. El archivo de controlador sqljdbc4.jar se ex­ trae a \sqljdbc_4.0\enu\, en la carpeta de extracción especificada. Oracle Vaya a la página de descargas de controladores JDBC Oracle en http://www.oracle.com/tech­ network/database/features/jdbc/index-091264.html Antes de poder descargar un controlador, debe crear una cuenta de usuario gratuita. Si no sabe qué versión del controlador utilizar, el controlador ojdbc14.jar es válido para todas las versiones soportadas de Oracle 10 y 11. Sybase El controlador Sybase (jconn4.jar) se instala por defecto. No precisa instalarlo. Se encuen­ tra en \\\Program Files\SAP Lumira\Desktop\plugins \com.businessobjects.connectionserver.standalone_3.1.3.v20120603 -0404\ConnectionServer\jdbc\drivers\IQ15. Teradata Vaya a la página de descarga de conectividad de Teradata en http://downloads.teradata.com/ download/connectivity/jdbc-driver . Seleccione el controlador adecuado para su base de datos, grabe el fichero de instalación comprimido en su ordenador, extraiga el fichero compri­ mido en un directorio local y ejecute el instalador desde su ordenador. Antes de poder descargar un controlador, debe crear una cuenta de usuario gratuita. Si no sabe qué versión de controlador usar, Teradata JDBC Driver 14 es válido para todas las versio­ nes de Teradata soportadas. Para Windows, utilice TeraJDBC__indep_indep. 14.00.00.14.zip. Una vez extraídos, los ficheros de controlador son tdgssconfig.jar y terajdbc4.jar. Tabla 12: Controladores JDBS disponibles para el middleware de base de datos típico Middleware de base de datos Nombre de archivo de controlador JDBC Oracle ojdbc14.jar Microsoft SQL Server sqljdbc4.jar Teradata terajdbc4.jar y tdgssconfig.jar Sybase jconn4.jar Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 31 Middleware de base de datos Nombre de archivo de controlador JDBC IBM DB2 db2jcc.jar o db2cc.jar y db2jcc_license_cu.jar para versiones anteriores a 9.5 IBM Netezza nzjdbc.jar Información relacionada Instalar controladores de acceso a datos [página 32] Conectarse a un origen de datos Query with SQL [página 35] Propiedades de conexión SQL [página 34] 6.1.7.1 Instalar controladores de acceso a datos El controlador de acceso a datos de Sybase IQ 15 se instala automáticamente con la aplicación. Si utiliza otras bases de datos, tendrá que instalar el controlador de acceso a datos JDBC para el middleware de su base de datos antes de utilizar Query with SQL. ● Debe familiarizarse con su base de datos y con el idioma SQL. ● Debe instalarse el controlador de acceso de datos correcto para su middleware de base de datos. Un controlador de acceso a datos es el software que proporciona un proveedor de base de datos para permitir que una aplicación cliente se conecte al middleware y acceda a los datos de una base de datos. Copie el controlador de acceso de datos para su middleware desde el sitio web de soporte de proveedor de base de datos en una carpeta local, y luego seleccione el controlador en la aplicación y luego conéctese a la base de datos. Nota La instalación de controladores de acceso a datos desde un sitio de proveedor puede ser una tarea problemática debido a las diferentes versiones de controladores y formatos de archivo. Si no está familiarizado con su versión de base de datos o el sitio web de proveedor, contacte con su administrador de base de datos. Siga los pasos generales siguientes para obtener un controlador de acceso de datos: 1. Descargue el controlador de acceso de datos (un archivo .jar) desde la página del proveedor de la base de datos y copie el archivo en una carpeta local. 2. Registre la vía de acceso del controlador seleccionado el controlador en la aplicación. 3. Seleccione un query con un origen de datos Query SQL desde la ficha Controladores SQL en las preferencias de la aplicación. Puede seleccionar un controlador SQL instalado o instalar el controlador necesario. 1. Seleccione 32 Archivo Preferencias Controladores SQL . PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos La página Instalación de controlador enumera los nombres de middleware de base de datos y el status de los controladores: 2. ○ Cuando la marca de verificación es verde, el controlador se ha instalado correctamente y puede empezar a usar Query con SQL. ○ Si la marca es roja, el controlador no se ha instalado correctamente para ese middleware y debe instalarlo. ○ Si la marca de status es amarilla, hay un controlador compatible disponible para el middleware, pero la aplicación debe reiniciarse antes de que esté disponible. Una vez reiniciado el software, puede utilizar Query with SQL. Seleccione una fuente de datos y realice una de las acciones siguientes: Opción Descripción Si el origen de datos middleware tiene una marca Seleccione Siguiente, introduzca la información de conexión middle­ de verificación verde ware y después, Crear. El controlador de acceso de datos está instalado. No necesita reali­ zar el resto de pasos de esta tarea. Si el origen de datos middleware tiene una marca Reinicie la aplicación y repita el paso 1. de verificación amarilla Si el origen de datos middleware tiene una marca Vaya al paso 3. de verificación roja 3. Si el controlador de middleware no está configurado, seleccione Instalar, elija el controlador de base de datos y seleccione Instalar controladores, en la parte superior de la lista de base de datos. 4. En el cuadro de selección que aparece, a partir de la disponibilidad local del middleware, realice una de las acciones siguientes: Opción Descripción Si el archivo .jar correcto está dispo­ nible Vaya al paso 6. Si el archivo .jar correcto no está dis­ ponible Descargue el controlador del sitio de soporte del proveedor, instale el contro­ lador, seleccione Cancelar para cerrar el cuadro de selección y descargue e instale el archivo .jar correcto. Es necesario que acceda a la página web que enumera los controladores de acceso a datos JDBC para el proveedor de middleware. Dependiendo de la base de datos, hay disponibles diferentes tipos de archivos de controladores. Normalmente hay un archivo comprimido que contiene los controladores, o un archivo ejecutable para instalar los controladores automáticamente. Para la aplicación sólo tiene que descargar el archivo comprimido. 5. En el sitio Web de soporte de su proveedor, descargue el fichero de controlador JDBC comprimido (por ejemplo, un fichero .tar, .gz, or .zip) para su versión de middleware de base de datos. 6. En su ordenador, seleccione la carpeta que contiene los archivos de controladores JDBC extraídos para el middleware de su base de datos. La lista completa de controladores JDBC soportados se incluye en Product Availablity Matrix, disponible en el sitio del SAP Service Marketplace en https://support.sap.com/pam . 7. Reinicie la aplicación. La lista de controladores middleware de la base de datos disponible está actualizada. Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 33 Cuando utilice Query with SQL para crear un documento nuevo en la aplicación, el middleware de base de datos de destino se muestra en una lista con una marca de verificación verde que indica que el controlador está disponible para acceder a la base de datos. 6.1.7.2 Propiedades de conexión SQL Puede crear su propio proveedor de datos introduciendo manualmente el SQL para un origen de datos de destino para adquirir datos para la tabla. Cuando utiliza Query with SQL debe introducir información de conexión para la base de datos de destino y, además, puede especificar parámetros de conexión para optimizar la obtención de datos. Tabla 13: Parámetros de inicio de sesión Parámetros de inicio de se­ Descripción sión Nombre del usuario Contraseña Server (:) Nombre y puerto del servidor que aloja la base de datos. Base de datos Nombre de la base de datos Tabla 14: Parámetros de optimización Parámetros avanzados Descripción Modo de conjunto de conexiones Si utiliza un conjunto de conexiones, éste es el método que se usará para mantener la co­ nexión del modo de conjunto de conexiones activa. Tiempo de espera de conjunto Si define el Modo de conjunto de conexiones en Mantener la conexión activa durante, éste es el período de tiempo, en minutos, que se mantendrá abierta la conexión. Tamaño Array fetch El número máximo de filas autorizado con cada recuperación desde la base de datos. Por ejemplo, si introduce 20 y la consulta devuelve 100 filas, la conexión recupera los datos en cinco recuperaciones de 20 filas cada una. Para desactivar cualquier array fetch, intro­ duzca un tamaño array fetch de 1. Los datos se recuperan fila por fila. Al desactivar el tamaño de array fetch, puede aumentar la eficiencia de la recuperación de datos, pero reducir el rendimiento del servidor. Cuanto mayor sea el valor de tamaño array fetch, más rápido se recuperarán las filas. Sin embargo, asegúrese de que su sistema cliente tiene la memoria adecuada. Tamaño Array Bind Tamaño del Array bind antes de su transmisión a la base de datos. Por lo general, mien­ tras mayor sea el array bind, más filas (n) se podrán cargar en una operación y mejor será el rendimiento. Tiempo de espera de inicio de El número de minutos antes de que un intento de conexión supere el tiempo de espera y sesión se muestre un mensaje de error. 34 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos Parámetros avanzados Descripción Propiedades del controlador de Valores para propiedades del controlador JDBC. Puede definir el valor de varias propieda­ JDBC des separándolos con comas. Por ejemplo, el siguiente valor oracle.jdbc.defaultNChar=true,defaultNChar=true para propiedades del controlador JDBC define las propiedades de los controladores oracle.jdbc.defaultNChar y defaultNChar: 6.1.7.3 Editor SQL para Query with SQL Use un editor de SQL para escribir SQL y crear un origen de datos de Query with SQL a partir de una base de datos conectada. Al editor de SQL se accede desde la opción de conexión a Query with SQL al crear un documento nuevo. Solo la declaración SELECT está autorizada en el editor de SQL para adquirir datos de tablas de bases de datos. Use estas opciones de editor SQL para seleccionar tablas para el origen de datos: Tabla 15: Opciones del editor de Descripción SQL Catálogo Las cuentas disponibles para la base de datos conectada. Expanda cada nodo para ver las tablas disponibles. Haga doble clic en una tabla para añadir la tabla en la consulta SQL. Consulta La consulta SELECT para obtener las tablas. (Solamente se admite SELECT). Puede agregar nom­ bres de tabla haciendo doble clic en la tabla, en el nodo de cuenta del panel izquierdo. Historial de SQL Mantiene un registro de las declaraciones SELECT usadas en el panel de consultas. Seleccione una declaración para incluirla en la consulta. Vista previa de datos Seleccione esta opción para obtener una vista previa de las tablas que adquiere SELECT. Seleccionar todo/ Seleccionar todo o sin columnas, o seleccionar columnas individuales para adquisición. ninguno Información relacionada Conectarse a un origen de datos Query with SQL [página 35] 6.1.7.4 Conectarse a un origen de datos Query with SQL Puede conectarse directamente a una base de datos para especificar qué datos desea adquirir y establecer parámetros para optimizar la conexión a la base de datos. Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 35 ● Debe familiarizarse con su base de datos y con el idioma SQL. ● Debe instalarse el controlador de acceso de datos correcto para su middleware de base de datos. Un controlador de acceso a datos es el software que proporciona un proveedor de base de datos para permitir que una aplicación cliente se conecte al middleware y acceda a los datos de una base de datos. Copie el controlador de acceso de datos para su middleware desde el sitio web de soporte de proveedor de base de datos en una carpeta local, y luego seleccione el controlador en la aplicación y luego conéctese a la base de datos. Nota La instalación de controladores de acceso a datos desde un sitio de proveedor puede ser una tarea problemática debido a las diferentes versiones de controladores y formatos de archivo. Si no está familiarizado con su versión de base de datos o el sitio web de proveedor, contacte con su administrador de base de datos. Debe instalar un controlador de acceso a datos JDBC para el middleware de su base de datos antes de usar Query with SQL. El controlador de acceso a datos es un archivo .jar que puede descargar del sitio de un proveedor de bases de datos y copiarlo en la carpeta de controladores de la ruta de instalación de la aplicación. Consulte la información sobre cómo encontrar e instalar el controlador de acceso a datos correcto para el middleware de su base de datos. 1. En la página inicial, seleccione Adquirir datos. 2. En el diálogo Set de datos nuevo, seleccione Query con SQL y luego, Siguiente. Se muestra una lista de middleware de bases datos. 3. ○ Cuando aparece una marca de verificación verde junto al nombre de middleware, el middleware se instala y ya puede empezar a usar Query con SQL. ○ Cuando aparece una cruz roja junto al nombre de middleware, el controlador de acceso de datos para middleware no está instalado, debe instalarlo. Seleccione el middleware de la base de datos para la base de datos de destino: Opción Descripción Si el middleware está disponible Seleccione el middleware y Siguiente. Si el middleware no está disponible Seleccione Instalar e instale el middleware. 4. Introduzca sus credenciales de inicio en la ficha Iniciar sesión y, si es necesario, introduzca los parámetros del controlador en la ficha Avanzadas . 5. Seleccione Crear. Se abre el Editor de SQL. 6. Introduzca el SQL para obtener las tablas que desee, obtenga una presentación preliminar de la consulta SQL y seleccione Crear. Aparece el espacio Visualizar y puede empezar a crear gráficos y analizar datos. Si primero desea modificar el conjunto de datos, cambie a el espacio Preparar. Información relacionada Propiedades de conexión SQL [página 34] Editor SQL para Query with SQL [página 35] 36 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos Instalar controladores de acceso a datos [página 32] 6.1.8 Descargar datos de la base de datos SAP BW Puede conectarse directamente con sistemas SAP Business Warehouse (BW) utilizando la conectividad Business Intelligence Consumer Services (BICS). Eso le permite descargar conjuntos de ejemplo de formación para formación de modelo fuera de línea. No sólo puede conectarse con InfoSitios SAP BW, sino que también puede ejecutar consultas BEx y ajustar valores para variables definidas en las consultas. Esto elimina la necesidad de descargar o exportar datos manualmente desde SAP BW para realizar previsiones de los datos. Puede ver un resumen de la arquitectura para la conexión BW fuera de línea aquí: Información relacionada Crear conjuntos de datos BW offline [página 38] Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 37 6.1.8.1 Crear conjuntos de datos BW offline Aprenda cómo conectar con BEx Queries o InfoSitios, seleccionar dimensiones e indicadores y fijar valores para variables (para BEx queries). Esto permite delimitar el conjunto train para ejecutar predicciones en los datos. Antes de conectar al sistema SAP Business Warehouse (BW) es necesario estar registrado mediante SAP GUI para Windows en el mismo ordenador. Es recomendable verificar la conectividad del sistema BW registrado mediante SAP Logon antes de usarla Expert Analytics. Consulte la documentación SAP GUI para Windows en SAP Help Portal en http://help.sap.com para configurar un sistema nuevo. Para descargar SAP GUI for Windows, puede dirigirse a SAP Service Marketplace . 1. Para crear un conjunto de datos nuevo, primero elija una fuente seleccionado Archivo Nuevo . 2. En el diálogo que aparece, seleccione la opción Descargar desde SAP Business Warehouse y elija Siguiente. 3. Introduzca los detalles de conexión BW como ID de cliente, Idioma, Usuario y Contraseña y elija Conectar. Nota La lista de servidores BW disponibles deriva desde SAP Logon. 4. Seleccione BEx Query desde los queries disponibles y seleccione Crear. Puede buscar su BEx Query o InfoSitio usando la vista Roles o InfoSitios. O bien puede buscar palabras claves en el cuadro Buscar. 5. Introduzca los valores para las variables obligatorias de BEx Query. 6. Si los queries tienen variables de jerarquía definidas, necesita seleccionar una jerarquía. 7. Seleccione valores dentro de la jerarquía que se han filtrado según el nodo seleccionada para la variable previa y seleccione Aceptar. 8. Finalmente, seleccione dimensiones e indicadores teniendo en cuenta el uso predictivo. Estos se descargan cuando seleccione Crear. El conjunto se añade en el espacio Predecir y puede aplicar algoritmos al conjunto de datos para generar predicciones. 6.1.8.2 Recomendaciones de BEx Query Algunas recomendaciones y prácticas recomendadas para usar BEx Queries al descargar datos desde SAP Business Warehouse (BW) con Expert Analytics. Recomendación ● Durante la adquisición de datos, es posible definir valores de filtro para las características de las BEx Queries solo si se especifican como parámetros de entrada durante la creación de BEx Query. También hay una opción para seleccionar un subconjunto de características y ratios del BEx Query subyacente para informes durante la adquisición de datos. ● Las jerarquías se aplanan durante la adquisición de datos para asegurar que los datos tienen el formato correcto para el procesamiento de algoritmo predictivo. ● Expert Analytics respeta las opciones de visualización para la clave y el texto para las características en el BEx Query subyaciente. Como resultado es importante asegurar que los BEx Queries están configurados de manera que los usuarios puedan aprovechar las descripciones para los valores de dimensión. 38 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos ● La información de moneda y de unidad para los ratios solo está disponible en la visualización de tabla de Expert Analytics. Según esto, puede ofrecer a los usuarios la opción de seleccionar una unidad o moneda usando las variables BEx como parte del BEx Query subyacente o configurar la unidad o moneda como valor fijo en el BEx Query. También es recomendable que se configure la misma unidad o moneda para todos los ratios para evitar cualquier confusión. ● Expert Analytics respeta las condiciones (N superiores) definidas en el BEx Query subyacente, pero los usuarios no reciben ninguna información acerca de las condiciones configuradas. Como resultado, no recomendamos usar las condiciones en queries ideados para usar con algoritmos predictivos. ● Los factores de escala no se respetan en Expert Analytics. Cualquier factor de escala que se aplique se eliminará en la adquisición de datos y se mostrará el valor real del ratio. ● Recomendamos que evite queries con ambos cálculos de lista y supresión cero al usar BEx Queries con Expert Analytics. Esto no es obvio para un usuario durante la adquisición de datos, y por tanto, podría tener resultados inesperados. ● Por defecto, los BEx Queries omiten valores de datos maestros sin contabilizaciones. Si tales posiciones son necesarias durante el procesamiento del algoritmo asegúrese de que se realizan las opciones adecuadas en el query. 6.1.9 Tratar un conjunto de datos adquirido Una vez que se ha adquirido un conjunto de datos, se puede tratar. Puede editar esta información en conjuntos de datos adquiridos: ● Agregue nuevas columnas que se habían eliminado del origen de datos cuando se adquirió originalmente. ● Eliminar columnas incluidas en la fuente de datos original ● Modifique los valores seleccionados para variables y parámetros de entrada de SAP HANA . 1. Abra un conjunto de datos que ya se ha adquirido en la aplicación. 2. Seleccione 3. Realice una o más de las siguientes acciones: 4. Datos Editar origen de datos . ○ Marque una casilla de selección de nombre de columna para añadir una columna nueva. ○ Desmarque la casilla de selección de nombre de columna para eliminar una columna. ○ Seleccione o desmarque las casillas de selección para añadir o eliminar dimensiones e indicadores. ○ Para modificar variables SAP HANA y parámetros de entrada, haga clic en Editar variables, indique o borre valores para variables o parámetros de entrada, y seleccione OK. Seleccione OK. El conjunto de datos se actualiza con las columnas, dimensiones, indicadores, o variables agregados o eliminados. 6.1.10 Objetos ocultos de la lista de objetos Utilice el archivo de sugerencias de mejoras para evitar que ciertas columnas se propongan como indicadores en la aplicación cuando se adquieren los datos. Para evitar que las columnas específicas se propongan como indicadores cuando se adquieren datos, la aplicación usa el archivo enrichment_suggestions..txt para identificar columnas que no Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 39 se deben proponer como indicadores. La primera vez que cree un documento, este archivo se graba en su directorio @user.home/.sapvi (por ejemplo C:\Users\\.sapvi). Por defecto, los nombres de columnas en el archivo de sugerencias de mejoras están en inglés. Sin embargo, puede definir nombres en otros idiomas, especificar nombres de columna para ocultar de lista de objetos y evitar que los objetos se consideren objetos de tiempo o geográficos. Las mejoras se procesarán si ha seleccionado detección automática de mejoras en las preferencias de la aplicación. Cuando actualiza la aplicación, se guarda una nueva versión de las sugerencias de mejoras sin sobrescribir su archivo original. Puede utilizar el archivo original como una referencia para modificar el nuevo archivo de sugerencias. La aplicación usará el nombre del archivo que corresponde a la versión instalada de la aplicación. 6.1.11 Editar el archivo de sugerencias de mejoras Edite el archivo de sugerencias de mejoras para identificar qué objetos no deberían proponerse como atributos de indicadores, de tiempo o geográficos en el panel Medidas y dimensiones . Puede definir todas las reglas que necesite en el mismo archivo enrichment_suggestions..txt. Para cada regla, debe declarar cuatro propiedades. La sintaxis es Java regex y los metadatos no distinguen entre mayúsculas y minúsculas. Tabla 16: Las propiedades necesarias para cada regla en el archivo de sugerencias de mejoras Propiedad necesaria atributo objectName Patrón que se corresponde con el nombre del objeto (cabecera de columna). Se puede utilizar cualquier carácter. Cuando se utiliza .*DAY.*, cualquier objeto que contenga la cadena DAY se incluye en la regla (MONDAY, TUESDAY, etc.). dataType Lista de tipos de datos Los tipos de datos reconocidos son: ● entero ● entero grande ● doble ● cadena ● fecha ● booleano Cualquier nombre de columna, con cualquier tipo de datos se considerará para ser excluido del panel de propuestas. Si no se declarado ningún dataType se tendrán en cuenta todos los tipos de datos. mejoras Evita que aparezcan objetos. Los valores son MEASURE o TIME (objetos de jerar­ quía de tiempo) o GEO (objetos de jerarquía geográfica). regla El valor predeterminado es hide. No modifique este valor. El siguiente ejemplo muestra el archivo de mejoras por defecto. { 40 "version":"1.0", "policies":{ PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Adquirir datos } }, "suggestionRules":[ { "objectName":"(?i).*year.*|.*month.*|.*quarter.* |.*week|.*day|.*semester.*|.*hour|.*minute|.*second", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*zip.*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*_id\\d*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*key.*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"MEASURE", "rule":"hide" }, { "objectName":"(?i).*zip.*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"TIME", "rule":"hide" }, { "objectName":"(?i).*_id\\d*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"TIME", "rule":"hide" }, { "objectName":"(?i).*key.*", "dataTypes":["integer", "biginteger", "double"], "enrichment":"TIME", "rule":"hide" } ] 1. Abra el archivo enrichment_suggestions..txt en un editor de textos. 2. Para cada objeto, defina el tipo(s) de datos y mejoras, y, si es necesario, defina otras propiedades. Debe mantener "rule" fijado en "hide". 3. Guarde el archivo con el mismo nombre. Manual de usuario de Expert Analytics Adquirir datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 41 7 Preparar datos 7.1 Preparar datos Cuando la aplicación adquiere los datos por primera vez, son datos preliminares que a menudo se formatean de forma inconsistente, y no es fácil que los usuarios empresariales los interpreten. Antes de crear los gráficos para visualizar los datos, suele ser necesario preparar los datos para que se puedan presentar y comprender. La preparación de datos se puede realizar en la vista Cuadrícula o Facetas mediante la utilización del panel de Herramientas de manipulación a la derecha del espacio Preparar. Las tareas de edición se pueden aplicar a todos los valores de una columna o a valores seleccionados. Información relacionada Editar y limpiar datos [página 46] Convertir datos a otro tipo [página 50] Crear una jerarquía geográfica o de tiempo [página 51] Crear un indicador a partir de una columna o dimensión [página 54] Agregación de un conjunto de datos [página 71] Alternar a otro set de datos [página 72] Fusionar conjuntos de datos (JOIN) [página 72] 7.1.1 Preparar espacio: Visualización, limpieza y manipulación de datos Antes de crear gráficos, utilice las herramientas del espacio Preparar para ver y preparar los datos. El espacio Preparar muestra datos para la fuente de datos conectada y se divide en tres partes. 42 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Tabla 17: Partes del espacio Preparar Parte Descripción Panel Datos La parte central muestra los datos en filas y columnas (vista Tabla) o en facetas (vista Facetas). Es donde se ven los datos y se pueden aplicar las siguientes herramientas (si están disponibles) a los valores de columna: ● Modificar agregación ● Ordenar ● Filtrar ● Visualizar formato ● Convertir a número ● Convertir a fecha ● Convertir a texto ● Crear un indicador ● Crear una jerarquía de tiempo ● Crear una jerarquía geográfica ● Crear una jerarquía personalizada ● Cambiar nombre ● Eliminar ● Fusionar la columna ● Ocultar columna ● Ajustar a contenido ● Crear dimensión calculada ● Duplicar Panel Indicadores y El panel situado a la izquierda de la zona de datos enumera los indicadores y las dimensiones que la dimensiones aplicación haya detectado en los datos. Utilice las herramientas del panel Indicadores y dimensiones para editar o definir nuevos indicadores y para crear jerarquías temporales y geográficas. Panel Herramientas Un panel situado a la derecha de la parte de datos para editar texto y convertir valores de una celda o de manipulación columna de datos concreta, para crear nuevas columnas con fórmulas y para cambiar el nombre de columnas, duplicarlas y eliminarlas. Información relacionada Panel de indicadores y de dimensiones [página 44] Panel de datos [página 44] Panel de herramientas de manipulación [página 45] Preparar datos [página 42] Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 43 7.1.1.1 Panel de indicadores y de dimensiones el panel Indicadores y dimensiones está ubicado en la parte izquierda del generador de gráficos. Muestra una lista de los indicadores, dimensiones, jerarquías, y dimensiones inferidas del conjunto de datos. Tabla 18: Objetos en el panel Indicadores y dimensiones Objetos del panel Indica­ Descripción dores y de dimensiones Indicador Se asigna a datos agregados en una columna o cálculo. Utilice los indicadores para obtener el re­ sultado calculado al combinar columnas. Por ejemplo, un indicador llamado Ingresos de ventas puede representar a la columna Ingresos de ventas, y contiene la suma de los ingresos por ven­ tas. Los indicadores se detectan y listan automáticamente. Jerarquía Hace referencia a más de una columna relacionada en un conjunto de datos, y las columnas tie­ nen relaciones jerárquicas. Por ejemplo, un objeto Tiempo puede incluir las columnas Año, Tri­ mestre y Mes organizadas en una estructura jerárquica bajo el objeto principal Tiempo. Atributo Se asignan a las columnas del conjunto de datos. Dimensión inferida Una o varias columnas creadas a partir de datos geográficos o de tiempo disponibles en la aplica­ ción (para soportar una jerarquía) Información relacionada Preparar datos [página 42] Crear una jerarquía geográfica o de tiempo [página 51] Creación de indicadores [página 54] Crear indicadores y jerarquías [página 50] 7.1.1.2 Panel de datos El panel Datos es el panel central que muestra sus datos en el espacio Preparar. Puede usar el panel Datos para ver, organizar y preparar los datos para la visualización. Tabla 19: Opciones en la parte superior del panel Datos Opción Descripción Lista Selección de fuente de Lista las fuentes de datos conectadas a la sesión actual. Utilice esta herramienta para cam­ datos biar de un conjunto de datos a otro y para añadir un conjunto de datos nuevo a la sesión ac­ tual. Filtros de datos 44 Seleccione para definir restricciones para filtrar los datos de las columnas. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Opción Descripción Cuadrícula Seleccione para presentar datos en columnas y filas. Se muestran todas las filas. Facetas Seleccione para presentar datos en columnas, con sólo valores únicos. No se muestran los valores repetidos de las columnas. Utilizar aspectos puede ayudar si un conjunto d edatos incluye muchos valores repetidos. Mostrar/ocultar columnas Seleccione para mostrar u ocultar columnas en un conjunto de datos. Cálculo Seleccione para agregar dimensiones o indicadores calculados. Combinar Seleccione para fusionar o adjuntar datos a un conjunto de datos. Puede fusionar datos de múltiples conjuntos de datos en el conjunto de datos actual, pero los datos deben ser com­ patibles. Puede adjuntoar otro conjunto de datos al actual. Los datos en columnas comunes se anexan al conjunto de datos actual, pero los datos en columnas únicas se agregan a co­ lumnas nuevas. Actualizar los datos de Seleccione para actualizar el/los conjunto/s de datos utilizado/s en el documento. documento Deshacer/Rehacer Seleccione para deshacer la última acción o repetirla. Información relacionada Editar y limpiar datos [página 46] Filtrar datos en columnas y gráficos [página 49] Agregación de un conjunto de datos [página 71] Fusionar conjuntos de datos (JOIN) [página 72] Alternar a otro set de datos [página 72] Crear un indicador o una dimensión calculados [página 55] 7.1.1.3 Panel de herramientas de manipulación El panel de Herramientas de manipulación, a la derecha del espacio Preparar, contiene herramientas que le permiten editar y dar formato a los valores. En función del tipo de datos de la columna seleccionada, puede: ● Duplicar, cambiar el nombre y eliminar columnas ● Crear dimensiones calculadas ● Encontrar, reemplazar y cambiar valores de cadena ● Rellenar prefijos y sufijos ● Convertir, reducir y agrupar valores ● Editar cadenas de texto Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 45 7.1.2 Editar y limpiar datos Puede usar el panel Herramientas de manipulación (situado a la derecha del panel central) para editar y dar formato a los valores de una columna. El panel está disponible en las vistas Cuadrícula y Facetas. Es posible acceder a algunas de las acciones de datos en el panel Herramientas de manipulación seleccionando la flecha del nombre de la columna, o haciendo clic en el botón derecho en el nombre de la columna. Tabla 20: Acciones de datos para columnas Acción de da­ Descripción Disponible en el menú tos del nombre de la co­ Disponible para Carácter Fecha Número Sí Sí Sí Sí Cambiar el nombre de la columna. Sí Sí Sí Sí Crear una nueva columna con valores de cadena No Sí No No lumna (o en el menú de contexto) Crear una Crear una columna nueva columna nueva Duplicar Crear una nueva columna que sea una copia de la columna seleccionada. Cambiar nombre Dividir que se muestran detrás de un punto de separación definido. La separación puede ser un signo de pun­ tuación como, por ejemplo, una coma o una ca­ dena de texto. Eliminar Eliminar la columna seleccionada. Sí Sí Sí Sí Convertir Cambiar los valores de cadena a minúsculas o ma­ No Sí No No caso yúsculas. Reemplazar Encontrar una cadena y sustituirla por una nueva. No Sí No No Relleno Especifica un carácter que se antepondrá o pos­ No Sí No No Sí No No Sí Sí Sí No No Sí Sí No No pondrá a una cadena en una longitud de caracte­ res definida. Convertir a Insertar una copia de una columna con valores texto convertidos a texto. Convertir a Insertar una copia de una columna con valores número convertidos a números. Convertir a Seleccione un formato de fecha y valídelo. Se in­ fecha serta una copia de la columna con los valores con­ vertidos a fechas. 46 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Acción de da­ Descripción Disponible en el menú tos del nombre de la co­ Disponible para Carácter Fecha Número No Sí No No No Sí Sí Sí No No Sí Sí No Sí No No lumna (o en el menú de contexto) Convertir Seleccione Minúsculas o Mayúsculas para cambiar caso el texto a minúsculas o mayúsculas. Reducir Elimine caracteres que se encuentran detrás o de­ lante de un signo de puntuación o un carácter es­ pecificado. Agrupación Cree una nueva columna donde pueda crear nue­ vos grupos de filas (por ejemplo, grupo 1, grupo 2...) para organizar las filas. Las filas que no están en un grupo específico pueden organizarse en un grupo llamado "Otros" o pueden quedarse sin agrupar. Crear Cree una columna nueva para tipos de número y dimensión fecha que aplican una función a los valores. Por calculada ejemplo, una función "Límite inferior" puede apli­ carse a una columna "Margen" para crear una nueva columna de valores de margen, redondea­ dos por defecto al siguiente número entero más cercano. Selección Haga doble clic en la vista Rejilla o doble clic lento interna de en la vista Facetas para seleccionar un intervalo de celda caracteres en una palabra. Puede realizar las ac­ ciones siguientes en los caracteres o palabra: ● Eliminar, sustituir porciones de texto ● Crear una columna nueva con las mismas filas pero limpias (por ejemplo: eliminar "recurso" de valores). ● Mover el texto seleccionado al inicio del valor de fila 1. Realice una de las siguientes acciones: Opción Descripción Editar todos los valores de una única columna Seleccione la cabecera de la columna. Editar todos los valores en varias columnas Pulse Ctrl y seleccione todas las cabeceras de columna. Editar un valor concreto Seleccione una celda. Editar varios valores en una columna Pulse Ctrl y seleccione todas las celdas. Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 47 Opción Descripción Editar un intervalo de caracteres o una palabra en una celda (selección dentro de celda) (Solo valores de carácter) Haga doble clic en la vista de Rejilla o haga doble clic lento en la vista de Facetas y seleccione un inter­ valo de caracteres o una palabra. 2. Abra el panel Herramientas de manipulación en la parte derecha del panel Datos. Los valores de columna únicos se muestran en un cuadro Valores en la parte superior del panel. Puede seleccionar uno o varios valores para editarlos en este cuadro, o introducir una cadena de búsqueda en el cuadro Buscar. Las selecciones en el panel del editor sustituyen las selecciones de valores realizadas directamente en una columna. Las acciones de datos disponibles para una columna dependen del tipo de datos de la columna y en si se ha seleccionado una columna, celda o intervalo de caracteres dentro de una celda. 3. Seleccione una opción de edición en el panel Herramientas de manipulación, modifique los valores si es necesario, y seleccione Aplicar. 7.1.2.1 Utilizar el panel de filtros El panel de filtros se utiliza para definir un filtro. El panel de filtros no soporta el idioma de fórmula SAP Lumira o expresiones regulares (regex). Para crear un filtro más complejo puede que tenga que añadir una medida calculada o dimensión. Tabla 21: Opciones en el panel de filtro Opción Descripción Buscar Indique el valor que desea buscar. Valores Seleccione uno o más valores en los que filtrar la columna o dimensión. Ver registros Seleccione esta opción para ver el número de apariciones para cada valor de columna. Conservar solo Seleccione esta opción para incluir los valores seleccionados en la columna o la dimen­ sión. No se visualizan otros valores. Excluir valores Seleccione esta opción para excluir los valores seleccionados en la columna o la dimen­ sión. No se visualizan otros valores. 1. Para abrir el panel de filtro, seleccione el icono Opciones dimensión o medida, y seleccione Filtro. en una cabecera de columna o para una 2. En el panel de filtros, en caso necesario, seleccione opciones para datos basados en texto: Para seleccionar valores múltiples, mantenga pulsada la tecla Ctrl y seleccione cada valor. 3. 48 Seleccione OK. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Información relacionada Crear un indicador o una dimensión calculados [página 55] 7.1.2.1.1 Filtrar datos en columnas y gráficos Un filtro es una restricción impuesta en un conjunto de datos para limitar los valores que se muestran. Aparecen filtros en la barra de filtros situada en la parte superior del panel Datos. Puede editar los filtros directamente desde la barra de filtros. Tabla 22: Filtros en la barra de filtros en el panel Datos Alcance Descripción Filtro de conjunto de datos Defina un filtro en una columna. El filtro se aplica a los datos en la columna y a gráficos que utilicen dichos datos. Filtro de nivel de visualización Defina un filtro en un gráfico. El filtro sólo se aplica al gráfico, no a nivel de conjunto de datos. Ejemplo Si un gráfico muestra los ingresos por productos vendidos entre los años 1995 y 2012, pero sólo quiere ver los ingresos de los años 2010 a 2012, puede crear un filtro en la dimensión Año para limitar los valores que se muestran para este periodo. Información relacionada Filtrar datos en columnas y restricciones [página 49] Utilizar el panel de filtros [página 48] Filtrado de datos de gráfico [página 112] 7.1.2.1.2 Filtrar datos en columnas y restricciones Cree un filtro en una columna o faceta desde una cabecera de columna. El filtro aparece en la barra de filtro encima de la cuadrícula de datos. 1. Seleccione el icono Cuadrícula 2. Seleccione el icono Opciones 3. Utilice las opciones del panel de filtro para definir el filtro. Manual de usuario de Expert Analytics Preparar datos para visualizar las columnas para la fuente de datos. en una cabecera de columna y seleccione Filtro. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 49 Información relacionada Utilizar el panel de filtros [página 48] 7.1.2.2 Convertir datos a otro tipo Puede convertir datos de un tipo de datos a otro. Por ejemplo, puede convertir texto en fechas o números en texto. 1. 2. Realice una de las siguientes acciones: ○ En el panel Medidas y dimensiones, seleccione el icono Opciones ○ En el panel Datos, seleccione la fecha en la cabecera de una columna de número o fecha. junto a una dimensión. En el diálogo de conversión de datos, seleccione las opciones que necesite y seleccione OK. 7.1.2.3 Aplicar formato a números y fechas Puede seleccionar el formato de visualización para columnas de números y fechas en la sala Preparar o Visualizar. Por ejemplo, los números se pueden visualizar como porcentajes o utilizar notaciones científicas, y los números negativos pueden representarse entre paréntesis. 1. En la sala Preparar, seleccione el icono Opciones al lado de una medida o dimensión en el panel Medidas y dimensiones o en la cabecera de una columna de números o fechas en el panel Datos y después seleccionar Formato de la visualización. 2. En el diálogo de formato de visualización, seleccione las opciones de formato que necesite y seleccione OK. 7.1.3 Crear indicadores y jerarquías Puede enriquecer los datos agregando indicadores y jerarquías de geografía y tiempo. Los indicadores le permiten manipular fácilmente los cálculos y las jerarquías le permiten usar una agrupamiento natural de columnas relacionadas. Al adquirir datos, SAP Lumira detecta jerarquías e indicadores potenciales. Los indicadores detectados se visualizan en el panel Indicadores y dimensiones, y las dimensiones identificadas como jerarquías potenciales se marcan con un interrogante. Puede seleccionar el icono Opciones manualmente. 50 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. para que una dimensión cree jerarquías Manual de usuario de Expert Analytics Preparar datos Información relacionada Crear una jerarquía geográfica o de tiempo [página 51] Creación de indicadores [página 54] 7.1.3.1 Crear una jerarquía geográfica o de tiempo Las jerarquías de tiempo, geográficas y personalizadas enriquecen un conjunto de datos. Las jerarquías de tiempo y geográficas se detectan automáticamente al adquirir un conjunto de datos, pero puede crear jerarquías en cualquier momento. Las jerarquías de tiempo se pueden crear en columnas de tipo numérico y de fecha. Las jerarquías de geografía solo se pueden crear en columnas que contienen valores compatibles con valores de datos de geografía de la base de datos NAVTEQ que usa la aplicación. Utilice los menús contextuales de dimensiones o cabeceras de columnas para crear jerarquías. 1. Seleccione el icono Opciones junto a una dimensión y luego, Crear una jerarquía geográfica Por nombres o Crear una jerarquía de tiempo. Aparecerán opciones de enriquecimiento de columna o dimensión para la jerarquía. 2. Seleccione qué columnas asignar a la jerarquía: ○ Para la jerarquías de tiempo, seleccione las columnas por asignar para los niveles Año, Trimestre, Mes, y Día. ○ Para las jerarquías geográficas, seleccione las columnas que desea asignar para algunos o todos los niveles País, Región, Subregión y Ciudad. Estas columnas se exploran para detectar coincidencias con la base de datos de geografía interna que usa la aplicación. Seleccione Columnas borradas para visualizar columnas detectadas como posibles coincidencias en listas desplegables para el nivel. Si no se detecta ninguna columna, las listas se muestran vacías. Seleccione Todas las columnas para incluir todas las columnas en listas desplegables para el nivel. Para jerarquías de tiempo, las nuevas columnas seleccionadas como niveles se agregan automáticamente al conjunto de datos, y la nueva jerarquía de tiempo se muestra en la ficha semántica Jerarquías. Para jerarquías geográficas, aparece la ventana de diálogo Datos geográficos, que muestra columnas coincidentes con la base de datos interna en verde, las columnas con coincidencia ambigua en naranja, y columnas que no coinciden en rojo. Para dimensiones inferidas, se crean columnas para las jerarquías. 3. (Opcional para jerarquías geográficas) En el diálogo Datos geográficos, por cada coincidencia propuesta, seleccione la fila de propuesta y luego, Seleccionar para aceptar la ubicación, o No existe para eliminar la fila, y seleccione Confirmar. Las nuevas columnas de geografía seleccionadas como niveles se agregan automáticamente al conjunto de datos y la nueva jerarquía de geografía se muestra en el panel Indicadores y dimensiones. Puede cambiar el color de los niveles coincidentes de una jerarquía geográfica en cualquier momento. (Seleccione el icono Opciones junto al nombre de jerarquía, luego, Editar reconciliación, cambie las coincidencias propuestas y luego, Aceptar). Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 51 Información relacionada Crear una jerarquía geográfica con datos de latitud y longitud [página 52] Crear una jerarquía personalizada [página 53] 7.1.3.2 Crear una jerarquía geográfica con datos de latitud y longitud Si el conjunto de datos contiene datos de latitud y longitud, puede personalizar una jerarquía geográfica para usar estos datos. La aplicación crea un indicador para cada columna durante la adquisición de datos. Los datos de latitud y longitud deben ser numéricos. Si no es así, deberá convertir los valores de columna usando una fórmula de conversión, (por ejemplo ToNumber()). Si las columnas no son numéricas, deberá definir las dimensiones de conversión numérica como indicadores. La aplicación calcula automáticamente niveles jerárquicos sobre y bajo la dimensión de geografía seleccionada. Puede aceptar estos niveles calculados en su jerarquía, o sustituirlos con niveles definidos por el usuario en función de los datos de latitud y longitud. Nota La aplicación no soporta crear jerarquías geográficas con datos de latitud y longitud de fuentes de datos SAP HANA. 1. Compruebe que se han creado los indicadores para las columnas de latitud y longitud. Si se han creado indicadores, siga al paso 4. 2. Si no se han creado indicadores, convierta las columnas de latitud y longitud en un tipo de datos numérico: a. Seleccione el icono Opciones en la cabecera de la dimensión o columna de latitud, y luego, Crear dimensión calculada. El cuadro de diálogo Nueva dimensión calculada se abre con el nombre de columna ya en la fórmula (por ejemplo, {column_1}). b. Haga doble clic en la función ToNumber () para insertarla en la fórmula. c. Mueva el nombre de columna que aparece en el paso b a la función ToNumber(). La fórmula entera debería ser ToNumber({column_1}). 3. 4. d. Escriba un nombre para la dimensión calculada y haga clic en Aceptar. e. Repita los pasos a-d en la dimensión o columna de longitud. Defina las nuevas dimensiones numéricas de latitud y longitud como indicadores: a. Haga clic en Opciones indicador. b. Seleccione el icono Opciones Seleccione el icono Opciones para obtener la nueva dimensión numérica de latitud y seleccione Crear un para la nueva dimensión de longitud numérica y luego, Crear un inicador. en la cabecera de la columna o dimensión de geografía para utilizarla como base de la jerarquía y luego, Crear una jerarquía geográfica Por latitud/longitud . Aparece el diálogo Datos geográficos. El panel Nombre de nivel desglosa los niveles de jerarquía calculados por la aplicación. La dimensión original se muestra en rojo, y el resto de niveles de jerarquía calculados, en 52 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos verde. Puede aceptar la jerarquía propuesta en función de los datos de latitud/longitud, o personalizar los niveles de la jerarquía. Seleccione un nivel para ver sus propiedades en el panel izquierdo. Tabla 23: Propiedades de un nivel calculado en una jerarquía Propiedad de nivel Descripción Categoría Definición del nivel, ya sea calculado automáticamente en base a datos de latitud/longitud o definido por el usuario (seleccione la columna en la que basar el nivel) Para un nivel definido por usuario, seleccione una columna Columna para utilizar en el nivel. Para un nivel definido por usuario, seleccione los datos de Latitud latitud. Para un nivel definido por usuario, seleccione los datos de Longitud longitud. Tipo de nivel El nombre del nivel en la jerarquía 5. Para aceptar los niveles calculados propuestos, seleccione Aceptar y vaya al paso 7. 6. Para seleccionar las columnas en las basar los niveles, para cada nivel que desee definir en la jerarquía, seleccione Definido por usuario en la lista Categoría, y luego, propiedades para el nivel en el resto de listas. Utilice las flechas a la izquierda para moverla hacia arriba o hacia abajo en la jerarquía. Añada un nivel a la jerarquía seleccionando Añadir nivel, o elimine un nivel seleccionando el icono X a la izquierda del nivel. 7. Seleccione Aceptar. La nueva jerarquía geográfica se agrega a la categoría Jerarquías en el panel semántico. Puede cambiar el color de los niveles de una jerarquía en cualquier momento. (Seleccione el icono Opciones junto al nombre de jerarquía, luego, Editar reconciliación, y seleccione la columna en la que basar el nivel, luego, Aceptar). Información relacionada Crear una jerarquía geográfica o de tiempo [página 51] Crear un indicador o una dimensión calculados [página 55] 7.1.3.3 Crear una jerarquía personalizada Puede crear una jerarquía mediante cualquier combinación de dimensiones disponibles. 1. Seleccione el icono Opciones. para la dimensión que debe utilizarse como base para la jerarquía. 2. Seleccione Crear una jerarquía personalizada. Aparecerá el cuadro de diálogo Crear jerarquía. Las dimensiones disponibles en el panel Indicadores y dimensiones están desglosadas en la parte izquierda del panel. Puede introducir una cadena de búsqueda para encontrar una dimensión (por ejemplo, las primeras letras del nombre una dimensión). Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 53 3. Añadir dimensiones a la jerarquía en el panel derecho. Sugerencias Puede hacer doble clic sobre dimensiones para moverlas entre paneles. 4. (Opcional) Utilice las flechas junto a la lista de jerarquías para mover una dimensión seleccionada arriba o abajo en la jerarquía. 5. Especifique el nombre de la jerarquía y haga clic en Crear. Aparece la nueva jerarquía personalizada en el panel Indicadores y dimensiones. Se crean columnas nuevas para cada nivel de la nueva jerarquía. 7.1.3.4 Creación de indicadores Los indicadores enriquecen los conjuntos de datos. Puede crearlos manualmente en cualquier momento directamente desde una columna o dimensión o utilizando el idioma de fórmula para crear un indicador calculado, o puede permitir que la aplicación los detecte automáticamente en tipos de datos de columna numéricos al adquirir un conjunto de datos. Nota Cuando usa una fuente de datos Conectarse a SAP HANA, no puede crear un indicador con una dimensión numérica o de cadena. Los indicadores en fuentes de datos Conectarse a SAP HANA se detectan directamente desde la vista analítica de SAP HANA. Se deben crear indicadores en la vista de SAP HANA antes de que se puedan adquirir automáticamente en la aplicación. Información relacionada Crear un indicador a partir de una columna o dimensión [página 54] Crear un indicador o una dimensión calculados [página 55] 7.1.3.4.1 Crear un indicador a partir de una columna o dimensión Puede crear un indicador a partir de casi cualquier columna o dimensión. Sin embargo, existen estas excepciones: ● Si el tipo de datos de columna es Numérico, puede usar cualquier función de agrupamiento para el indicador. ● Si el tipo de datos de la columna es Fecha o Cadena, ni Totalizar ni Media pueden utilizarse. ● El agrupamiento se realiza cuando el indicador se usa en la vista Restricciones. No está disponible en la vista de Cuadrícula. 54 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos 1. Seleccione el icono Opciones sobre una cabecera de columna o la dimensión a utilizar ocmo base para el indicador, y luego, Crear un indicador. Se crea un indicador en la sección Indicadores del panel Indicadores y dimensiones. 2. Seleccione el icono Opciones para el indicador nuevo, seleccione Modificar agregación y luego, una de las siguientes funciones agregadas siguientes: Opción Descripción Suma Devuelve la suma de un indicador Mín Devuelve el valor más pequeño de un conjunto de valores Máx Devuelve el valor más grande en un conjunto de valores Recuento (distintivo) Devuelve el número de valores distintivos de un conjunto de valores. Recuento (todo) Devuelve el número de valores en un conjunto de valores Promedio Devuelve el promedio de un indicador Ninguno Para permitir que una dimensión numérica sea utilizada como indicador, sin agregación. Este tipo de indicador permite que cualquier valor se visualice en un gráfico, que puede ser útil para determinados tipos de gráficos. Por ejemplo, para una nube de puntos que visualiza margen y valores de cantidad vendida, utilizando Ninguno se visualizan todos los puntos en la nube de puntos y se mues­ tra la distribución de valores individuales que no serían aparentes con una función de agregación. Para ver el indicador aplicado a los datos del conjunto de datos, haga clic en la vista Restricciones. Para ver cambios en los valores de datos causados por agregación, seleccione un indicador. 7.1.4 Crear un indicador o una dimensión calculados Ahora puede crear indicadores y dimensiones calculadas usando el lenguaje de la fórmula deSAP Lumira. Dispone de las siguientes características que admite el editor de fórmulas: ● Combinar dos columnas en el conjunto de datos ● Aplicar funciones de un conjunto predefinido de funciones numéricas, de fecha y de texto ● Utilice las cláusulas "si", "entonces" "sino" ● Use la finalización automática para mejorar la velocidad de la edición ● Use un selector de calendario para los parámetros de fecha ● Copie y pegue texto y sintaxis en la definición de función 1. Haga clic en el botón Cálculo y seleccione Nueva dimensión calculada o Nuevo indicador calculado. Sugerencias Como alternativa, cree un indicador o dimensión calculados con el icono Opciones junto a un indicador o una dimensión, o seleccionando Crear dimensión calculada en el panel Herramientas de manipulación. 2. Indique el nombre del indicador o de la dimensión. 3. Haga doble clic en indicadores o dimensiones, y en funciones para introducirlas en el cuadro de sintaxis Fórmula. Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 55 4. Introduzca los parámetros de la función y la información asociada según la tarea de la función. Debe escribir los nombres de las columnas que se usan en la fórmula. La compleción automática sugerirá un nombre de columna después de escribir la primera letra. 5. Si está entrando información de calendario, haga clic en el botón Seleccionar una fecha en la parte inferior de la lista de funciones para seleccionar fechas. 6. Haga clic en Aceptar para aplicar la fórmula. Se crea un nuevo indicador o dimensión. Ejemplo Si desea crear una fórmula que multiplique los valores en la columna por 100, y redondea al siguiente entero. 1. Haga clic en el botón Cálculo y seleccione Nueva dimensión calculada. 2. En el diálogo Nueva dimensión calculada, haga doble clic sobre un objeto o función de dimensión para introducir la dimensión o función en la casilla Fórmula. Por ejemplo, haga doble clic en Ceil(num) . 3. Edite la fórmula y agregue otros objetos de dimensión según sea necesario. Se crea una nueva columna con el nombre de fórmula predeterminado. Por ejemplo, añada Ceil(margin_gross_percent )*100 a la fórmula para crear una columna llamada Ceil(margin_gross_percent )*100. 4. Escriba un nombre para la nueva dimensión calculada y haga clic en Aceptar. Se crea la nueva columna en el Panel Datos y aparece en el panel Indicadores y dimensiones. 7.1.4.1 Referencia para funciones Puede definir qué funciones estarán dipsonibles en la barra de fórmulas. Tabla 24: Categorías o funciones Categoría Descripción Agregación Agrega datos (por ejemplo sumando o haciendo el promedio Las funciones agregadas se implementan en la definición de de un conjunto de valores) un indicador. Carácter Manipula cadenas de caracteres Fecha y hora Devuelve datos de la fecha o la hora Numéricos Devuelve datos numéricos Lógicos Devuelve true o false Varios Las funciones que no encajan en ninguna otra categoría 56 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Información relacionada Crear un indicador a partir de una columna o dimensión [página 54] Funciones de caracteres [página 57] Funciones de fecha y hora [página 62] Funciones numéricas [página 66] Funciones lógicas [página 69] Funciones varias [página 70] 7.1.4.1.1 Funciones de caracteres Utilice una función de caracteres para manipular las cadenas de caracteres de una fórmula. La entrada es una columna de su conjunto de datos y las funciones se aplican a los contenidos de las celdas. Tabla 25: Funciones de caracteres Función como Sintaxis ● ● Uso matchExpr: Expresión de string a Se utiliza para determinar si una cadena buscar de caracteres se corresponde con un pa­ pattern: Constante de string de trón específico. La búsqueda no distin­ patrón a buscar para gue entre mayúsculas y minúsculas. El patrón puede incluir caracteres nor­ males y los siguientes caracteres espe­ ciales: ● "_" equivale a un único carácter ● "%" equivale a cero o muchos ca­ racteres Antes de poder utilizar un carácter espe­ cial como carácter normal, debe evitarlo con una antibarra "\". Nota "[", "^", "-", y "]" se reservan a un uso futuro. Por ejemplo: "Hiking is fun" like "H% is _un" devuelve true Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 57 Función Concatenate(str1, str2) Sintaxis Uso ● str1: primera cadena Se utiliza para concatenar dos cadenas ● str2: segunda cadena en una única cadena. El operador + también permite concate­ nar strings. Por ejemplo: Concatenate("Mr", "Brown") devuelve "MrBrown" Contener(whereStr, whatStr) ● ● whereStr: Cadena en la que se Se utiliza para devolver repeticiones de lleva a cabo la búsqueda una cadena dentro de otra cadena. La whatStr: Subcadena que es el ob­ búsqueda no distingue entre mayúscu­ jeto de la búsqueda las y minúsculas. Por ejemplo: Contain("Cats are grey", "aRe") devuelve true ExceptFirstWord(cad, sep) ● str: cadena de entrada Se utiliza para devolver una copia de una ● sep: un separador cadena sin la primera palabra. Por ejemplo: ExceptFirstWord("Level 3, Standford Street", ", ") devuelve "Standford Street" ExceptLastWord(cad, sep) ● str: cadena de entrada Se utiliza para devolver una copia de una ● sep: un separador cadena sin la última palabra. Por ejemplo: ExceptLastWord("james.bro [email protected]", "@") devuelve "james.brown" 58 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Función FirstWord(cad, sep) Sintaxis Uso ● str: cadena de entrada Se utiliza para devolver la primera pala­ ● sep: un separador bra de una cadena. Por ejemplo: FirstWord("Senior Developer", " ") devuelve "Senior" LastWord(cad, sep) ● str: cadena de entrada Se utiliza para devolver la última palabra ● sep: un separador de una cadena. Por ejemplo: LastWord("Red/Purple", "/") devuelve "Purple" Length(cadena) Se utiliza para devolver la longitud de str: cadena de entrada una cadena. Por ejemplo: Length("How long") devuelve 8 LowerCase(cadena) Se utililza para devuelve una copia de str: cadena de entrada una cadena, con todos los caracteres convertidos a minúsculas. Por ejemplo: LowerCase("GOOD JOB") devuelve "good job" Lpad(cad, longitud, alm) ● str: cadena de entrada ● length: número de caracteres es­ una cadena a la que se añaden caracte­ res delante hasta completar la longitud perado. ● pad: Secuencia de caracteres a añadir Se utiliza para devuelve una copia de total especificada. Por ejemplo: Lpad("Incomplete field", 20, "#") devuelve "####Incomplete field" Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 59 Función Sintaxis Uso Replace(cad, destino, ● str: cadena de entrada Se utiliza para devolver una cadena con sustituto) ● target: Cadena a reemplazar todas las apariciones de una cadena es­ ● replacement: Valor de cadena a introducir pecífica con otra cadena específica. Por ejemplo: Replace("Very good song", "o" , "u") devuelve "Very guud sung" Rpad(cad, longitud, alm) ● str: cadena de entrada ● length: número de caracteres es­ cadena a la que se añaden caracteres perado. ● pad: Secuencia de caracteres a añadir Se utiliza para devolver una copia de una detrás hasta completar la longitud total especificada. Por ejemplo: Rpad("Incomplete field", 20, "#") devuelve "Incomplete field####" SubString(cad, inicio) ● str: La cadena a partir de la que se Se utiliza para devolver una subcadena calcula la subcadena. ● de una cadena. start: Posición inicial de la subca­ Por ejemplo: dena de entrada. SubString("Wong", 3) devuelve "ng" SubString(cad, inicio, ● longitud) ● str: La cadena para la que se cal­ Se utiliza para devolver una subcadena cula la subcadena de una cadena. start: La posición inicial de la sub­ Por ejemplo: cadena de entrada. ● length: La longitud de la subca­ dena que se debe devolver ToText(parámetro) param: Parámetro a convertir SubString("Wong", 2, 2) devuelve "on" Se utiliza para convertir un parámetro en una cadena. Todos los parámetros son válidos y los números se truncan en los 0 espacios decimales. 60 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Función Trim(cad, cortar) Sintaxis Uso ● str: cadena de entrada Se utiliza para devolver una copia de la ● toTrim: Carácter a eliminar cadena con las repeticiones iniciales y secundarias de un carácter eliminado. Esta función distingue entre mayúsculas y minúsculas. Por ejemplo: Trim("Aurora", "a") devuelve "Auror" TrimLeft(cad, cortar) ● str: cadena de entrada Se utiliza para devolver una copia de la ● toTrim: Carácter a eliminar cadena con la repetición inicial de un ca­ rácter eliminado. Esta función distingue entre mayúsculas y minúsculas. Por ejemplo: TrimLeft("Above", "A") devuelve "bove" TrimRight(cad, cortar) ● str: cadena de entrada Se utiliza para devolver una copia de la ● toTrim: Carácter a eliminar cadena con las repeticiones iniciales de un carácter eliminado. Esta función dis­ tingue entre mayúsculas y minúsculas. Por ejemplo: TrimRight("Laura", "a") devuelve "Laur" UpperCase(cad) str: cadena de entrada Se utililza para devolver una copia de una cadena, con todos los caracteres convertidos a mayúsculas. Por ejemplo: UpperCase("Little Boy") devuelve "LITTLE BOY" Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 61 Función Sintaxis Uso ToDate(cadena, formato) El formato de fecha es una combinación Se utiliza para convertir una cadena de de los siguientes tokens reservados se­ entrada de un conjunto de datos en una parados por delimitadores: fecha en un formato específico, cuando ● d o dd: día del mes (1-31) ● M o MM: mes del año (1-12) ● y o yy: Año abreviado sin siglo (00-99) yyyy: Año con siglo (1956, 2012, 2014, etc.) El resto de secuencias se consideran de­ limitadores ● string: String de entrada a con­ ● format: constante de la cadena de las fechas de una columna de una fuente de datos original están en formato de ca­ dena. Por ejemplo: ToDate(Obj, 'yyyy/dd/MM') convierte una cadena en el formato aaaa/dd/MM a una fecha: vertir formato de fecha. Tabla 26: Ejemplo de la función Trim(str, toTrim): Trim ({Name},"a") Nombre Cadena recortada Aurora Auror Auror Auror auror uror aurora uror uror uror Esta fórmula devuelve "Auror": Recortar("Aurora", "a"). 7.1.4.1.2 Funciones de fecha y hora Las funciones de fecha y hora devuelven los datos de fecha o de hora. Tenga en cuenta que puede que necesite convertir el formato de sus datos de origen en la aplicación. 62 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Tabla 27: Funciones de fecha y hora Función Sintaxis Uso AddMonthToDate(#date#,perio ● #date#: Fecha original Se utiliza para devolver una fecha que se ds) ● periods: La cantidad de períodos obtiene añadiendo una cantidad deter­ a agregar minada de meses a una fecha específica. Por ejemplo: AddMonthToDate(#2012-01-0 1#,1) devuelve 2012-02-01 AddWeekToDate(#date#,period ● #date#: Fecha original Se utiliza para devolver una fecha que se s) ● periods: Cantidad de períodos a obtiene añadiendo una cantidad deter­ agregar minada de semanas a una fecha. Por ejemplo: AddWeekToDate(#2012-01-01 #,1) devuelve 08.01.12 AddYearToDate(#date#,period ● #date#: Fecha original Se utiliza para devolver una fecha que se s) ● periods: Cantidad de períodos a obtiene añadiendo una cantidad deter­ agregar minada de años a una fecha específica. Utilice números negativos para eliminar un año. Por ejemplo: AddYearToDate(#2012-01-01 #,1) devuelve 01.01.13 Se utiliza para devolver la fecha actual FechaActual() como fecha. Por ejemplo: CurrentDate() devuelve DateDiffInDays(#start#,#end ● #) ● #start#: Fecha de inicio del inter­ Se utiliza para devolver la cantidad de valo días entre dos fechas. #end#: Fecha de fin del intervalo Por ejemplo: DateDiffInDays(#2012-03-2 3#,#2012-01-30#) devuelve -53 Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 63 Función DateDiffInMonths(#start#,#e Sintaxis ● nd#) ● Uso #start#: Fecha de inicio del inter­ Se utiliza para devolver la cantidad de valo meses entre dos fechas específicas. #end#: Fecha de fin del intervalo Por ejemplo: DateDiffInMonths(#2013-02 -01#,#2014-01-01#) devuelve 11 Day(#date#) #date#: una fecha. Se utiliza para devolver el día del mes como un número del 1 al 31. Por ejemplo: Day(#2012-03-23#) devuelve 23 DayOfWeek(#date#) #date#: una fecha. Se utiliza para devolver el día de la se­ mana como un número del 1 (domingo) al 7 (sábado). Por ejemplo: DayOfWeek(#2012-03-23#) devuelve 6 DayOfYear(#date#) #date#: una fecha. Se utiliza para devolver el día del año como un número. Por ejemplo: DayOfYear(#2012-03-23#) devuelve 83 LastDayOfMonth(#date#) #date#: una fecha. Se utiliza para devolver la fecha resul­ tante al calcular el último día del mes de la fecha específica. Por ejemplo: LastDayOfMonth(#2012-03-2 3#) devuelve la fecha 2012-03-31 64 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Función Sintaxis Uso LastDayOfWeek(#date#) #date#: Una fecha Se utiliza para devolver la fecha resul­ tante al calcular el último día de la se­ mana de una fecha específica. Por ejemplo: LastDayOfWeek(#2012-03-23 #) devuelve la fecha 24.03.12 MakeDate(year,month,day) ● ● ● year: Un número que representa Se utiliza para devolver una fecha que se un año crea a partir del año, el mes y el día es­ month: Un número que representa pecíficos. un mes Por ejemplo: day: Un número que representa un día del mes MakeDate(2011,6,12) devuelve la fecha 12.06.11 Month(#date#) #date#: Una fecha Se utiliza para devolver el mes del año como un número del 1 al 12. Por ejemplo: Month(#2012-03-23#) devuelve 3 Quarter(#date#) #date#: Una fecha Se utiliza para devolver un número que representa el trimestre de una fecha es­ pecífica. Por ejemplo: Quarter(#2012-03-23#) devuelve 1 Week(#date#) #date#: Una fecha Se utiliza para devolver un número que representa la semana de una fecha es­ pecífica. Por ejemplo: Week(#2012-03-23#) devuelve 12 Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 65 Función Sintaxis Uso Year(#date#) #date#: Una fecha Esta sintaxis devuelve el año de una fe­ cha específica. Por ejemplo: Year(#2012-03-23#) devuelve 2012 7.1.4.1.3 Funciones numéricas Utilice funciones numéricas para devolver valores numéricos en una fórmula. Tabla 28: Funciones numéricas Función Sintaxis Uso Ceil(num) num: un número. Se utiliza para devolver el entero más pequeño superior o igual a un número determinado. Por ejemplo: Ceil(14.2) devuelve 15 Floor(num) num: un número. Se utiliza para devolver el entero mayor que no sea superior a un número deter­ minado. Por ejemplo: Floor(14.8) devuelve 14 Log(num) num: un número. Se utiliza para devolver el logaritmo na­ tural de un número especificado. Por ejemplo: Log(100) devuelve 4,605 66 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Función Sintaxis Uso Log10(num) num: un número. Se utiliza para devolver el logaritmo base 10 de un número especificado. Por ejemplo: Log10(100) devuelve 2 Mod(número, divisor) ● num: un número. Sirve para devolver el resto de la división ● divisor: el divisor. de un número entre otro número. Por ejemplo: Mod(15,2) devuelve 1 Power(número, exponente) ● num: un número. Se utiliza para elevar un número a una ● exponent: el exponente. potencia. Se puede usar el operador ^ en vez de esta función. Por ejemplo: Power(2,3) devuelve 8 Round(número, dígitos) ● num: un número. Se utiliza para devolver un valor numé­ ● digits: El número de decimales rico redondeado a un número de deci­ para redondear. males determinado. Por ejemplo: Round(14.81, 1) devuelve 14,8 Sign(número) num: un número. Se utiliza para devolver -1 si un número determinado es negativo, 0 si el número es cero, o +1 si el número es positivo. Por ejemplo: Sign(-2) devuelve -1 Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 67 Función ToText(número, dígitos) Sintaxis Uso ● num: un número. Se utiliza para convertir un número de­ ● digits: Número de decimales terminado en una cadena. El número se para usar. Este parámetro es opcio­ trunca a un número especificado de de­ nal, el valor predeterminado es 0. cimales. Por ejemplo: ToText(12.1451, 2) devuelve 12,14 Truncate(número, dígitos) ● num: un número. Se utiliza para devolver un valor numé­ ● digits: Número de decimales rico, truncado en un número de decima­ para truncar les determinado. Por ejemplo: Truncate(12.281, 1) devuelve 12,200 Tabla 29: Ejemplo de la función ToText(num, digits): ToText({Temperature},2) Temperatura Texto -2.01 -2.0 -1.06 -1.1 0.08 0.1 1.07 1.1 2.08 2.1 3.99 4.0 5.00 5.0 Esta fórmula devuelve 12,14: ToText(12.1451, 2). Tabla 30: Ejemplo de la función Truncate(num, digits): Truncate({Temperature},1) Temperatura truncada -2.01 -2.00 -1.06 -1.00 0.08 0.00 1.07 1.00 2.08 2.00 3.99 3.90 5.00 5.00 Esta fórmula devuelve 12.200: Truncar(12.281, 1). 68 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos 7.1.4.1.4 Funciones lógicas Las funciones lógicas se pueden utilizar en una fórmula para devolver true o false. Tabla 31: Funciones lógicas Función Sintaxis Uso IsNotNull(obj) obj: Objeto de usuario (columna) Utilícelo para devolver un valor booleano que indica si un campo proporcionado no contiene un valor nulo. Cuando un campo contiene un valor nulo, la función devuelve false. Para todos los demás valores, la función devuelve true. IsNull(obj) obj: Objeto de usuario (columna) Utilícelo para devolver un valor booleano que indica si el campo proporcionado contiene un valor nulo. Cuando un campo contiene un valor nulo, la función devuelve true. Para todos los demás valores, la función devuelve false. y ● izquierda: Operando izquierdo Sirven para devolver la conjunción lógica ● derecha: Operando derecho de sus entradas booleanas. Esta función devuelve false: true y false. o ● izquierda: Operando izquierdo Sirven para devolver la disyunción lógica ● derecha: Operando derecho de sus entradas booleanas. Esta función devuelve true: true o false. ● cond: Condición booleana a verifi­ Sirven para seleccionar una de las dos car alternativas basándose en una condición ● alt1: Alternativa 1 booleana. La segunda alternativa es op­ ● alt2: Alternativa 2 en ● testExpr: Expresión a probar Se utiliza para determinar si una primera ● candidateList: Lista de candi­ entrada coincide con un valor en una se­ datos que coinciden gunda lista de entrada. if then else cional y se evalúa como null cuando falta. Por ejemplo: 3 in [2, 4, 6] devuelve false Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 69 Función Sintaxis Uso not bool: Un booleano Se utiliza para negar una entrada boo­ leana. Por ejemplo: not false devuelve true Tabla 32: Ejemplo de la función y Izquierda Derecha Resultado de <{Left}> y <{Right}> True True true True False false False True false False False false Esta función devuelve false: true y false. Tabla 33: Ejemplo de la función o Izquierda Derecha Resultado de <{Left}> o <{Right}> True True true True False true False True true False False false Esta función devuelve true: true o false. 7.1.4.1.5 Funciones varias Estas funciones se pueden utilizar en una fórmula, pero no encajan en una categoría estándar para familias de funciones. 70 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Tabla 34: Funciones varias Función Sintaxis ● GroupValues(columna, Uso column: Objeto de usuario para aplicar la agrupación a ListOfValues, newValue) ● Por ejemplo: ListOfValues: Lista de valores que se debe agrupar ● Utilizar para agrupar una lista de valores. newValue: Valor que debe susti­ tuir a los valores agrupados GroupValues(CountryColumn , ["USA", "India", "France"], "My Countries") devuelve "My Countries" cuando la columna CountryColumn contiene "USA", "India", o "France" ToNumber(parámetro) param: Parámetro a convertir Utilizar para convertir cualquier tipo de parámetro a un valor numérico. Los nú­ meros se cortan en las 0 posiciones de­ cimales. 7.1.5 Trabajo con conjuntos de datos múltiples Puede agregar un conjunto de datos a los conjuntos de datos disponibles, moverse entre conjuntos de datos y fusionar o anexar dos conjuntos de datos. Al combinar conjuntos de datos, dos conjuntos de datos se fusionan con el operador JOIN, y dos conjuntos de datos coincidentes se fusionan con el operador UNION. Los conjuntos de datos anexados son compatibles y tienen un número de columnas equivalente en la tabla fusionada. Información relacionada Agregación de un conjunto de datos [página 71] Alternar a otro set de datos [página 72] Fusionar conjuntos de datos (JOIN) [página 72] Agregar conjuntos de datos (UNION) [página 73] Eliminación de un conjunto de datos [página 73] 7.1.5.1 Agregación de un conjunto de datos Puede abrir varios conjuntos de datos en el mismo documento, y puede agregar un conjunto de datos a un documento. 1. En la lista de conjuntos de datos situada en la parte superior del panel Datos, seleccione Añadir conjunto de datos. Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 71 2. En el diálogo Conjunto de datos nuevo, seleccione un conjunto d datos en el panel Seleccionar una fuente o Todas las utilizadas recientemente, y luego, Siguiente. 3. Introduzca la información de la conexión y seleccione Crear. Los datos del conjunto de datos se adquieren en el documento. 7.1.5.2 Alternar a otro set de datos Puede tener múltiples conjuntos de datos abiertos en un documento a la vez y cambiar de uno a otro, cosa que resulta útil al preparar una fusión entre dos conjuntos de datos. En la lista de conjuntos de datos situada en la parte superior del panel Datos, seleccione el conjunto de datos al que debe cambiarse. El conjunto de datos seleccionado es ahora el conjunto de datos activo. 7.1.5.3 Fusionar conjuntos de datos (JOIN) Utilice el operador JOIN para fusionar dos conjuntos de datos. ● El conjunto de datos que se quiere fusionar debe tener una columna clave. ● Sólo pueden fusionarse columnas con el mismo tipo de datos. ● La fusión combina todas las columnas. Las columnas del segundo conjunto de datos se comparan con una columna clave en el conjunto de datos original. La aplicación propone coincidencias de columna potenciales y la probabilidad de cada una de ellas. Nota Una vez que el conjunto de datos se ha fusionado con otro, estos se convierten en una unidad. No puede eliminarse ninguno de los dos. 1. Seleccione el icono Combinar como. en la barra de menú, y luego, Fusionar. 2. En el diálogo Fusionar datos, seleccione la columna clave que debe utilizarse como la columna identificativa para las coincidencias. 3. Realice una de las siguientes acciones: Opción Descripción Si el conjunto de datos por fusionar ya está disponible Seleccione el conjunto de datos en la lista sobre el panel dere­ en el documento cho. Si el conjunto de datos por fusionar no está abierto Seleccione Añadir conjunto de datos nuevo, y luego, la fuente de datos para fusionar. Las columnas que pueden coincidir en base a la columna clave en el conjunto de datos original se desglosan en Conjunto de datos de búsqueda. 4. Seleccione Fusionar. Las columnas en el segundo conjunto de datos se añaden al conjunto de datos original. 72 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Preparar datos Información relacionada Agregar conjuntos de datos (UNION) [página 73] 7.1.5.4 Agregar conjuntos de datos (UNION) Utilice el operador UNION para adjuntar dos conjuntos de datos. Ambas tablas en la unión deben contener una cantidad equivalente de columnas y tipos de datos compatibles. Sólo un conjunto de datos compatible con el de destino puede adjuntarse. Una vez que un conjunto de datos se ha fusionado con otro, estos se convierten en una unidad y no pueden separarse. 1. Seleccione el icono Combinar.en la barra de menú, y luego, Adjuntar. 2. En el cuadro de diálogo Adjuntar datos, lleve a cabo una de las acciones siguientes: Opción Descripción Si el conjunto de datos por adjuntar ya está disponi­ Seleccione el conjunto de datos en la lista sobre el panel derecho. ble en el documento Si el conjunto de datos por adjuntar no está abierto Seleccione Añadir conjunto de datos nuevo, y luego, la fuente de datos para adquirir y adjuntar. Si el conjunto de datos por adjuntar es compatible con el conjunto de datos original, las columnas de dimensión se desglosan en Conjunto de datos de búsqueda en la parte derecha del panel. En la columna Ejemplo de valores únicos se muestra un ejemplo de los valores únicos para cada dimensión seleccionada. 3. Para seleccionar una dimensón de fuente diferente para la unión con la dimensión destino coincidente, seleccione otra dimensión de la lista. Si la dimensión seleccionada contiene un tipo de datos compatible, puede adjuntarse. Si aparece un mensahe La unión no es posible en rojo, la dimensión seleccionada no contenía un tipo de datos compatible y debe seleccionar una dimensión compatible. 4. Seleccione Adjuntar. Los dos conjuntos de datos se combinan. El conjunto de datos combinado conserva los nombres de columna del conjunto de datos de destino. 7.1.5.5 Eliminación de un conjunto de datos Puede eliminar un conjunto de datos de un documento, si no se ha adjuntado o fusionado con otro conjunto de datos: 1. En la lista de conjuntos de datos situada en la parte superior del panel Datos, seleccione el conjunto de datos que debe eliminarse. 2. Seleccione el icono Eliminar conjunto de datosjunto al conjunto de datos. El conjunto de datos y cualquier visualización basada en él se borran. Manual de usuario de Expert Analytics Preparar datos PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 73 8 Crear análisis 8.1 Crear un análisis Puede usar Expert Analytics para realizar minería y análisis estadísticos de datos mediante la ejecución de los datos con una serie de componentes. Los componentes de la serie están conectados entre sí con conectores, lo que define la dirección del flujo de datos. Este proceso recibe el nombre de análisis. Un documento es el punto de inicio al usar Expert Analytics. Debe crear un documento para empezar a analizar los datos y crear nuevos análisis. Puede abrir documentos guardados que están almacenados localmente para ver o modificar análisis y conjuntos de datos existentes. Cada documento es un archivo que contiene: ● Parámetros de conexión para el origen de datos, si el origen es un RDBMS. ● Conjunto de datos: los datos de la columna usada para crear gráficos. ● Análisis y modelos y sus resultados. ● Los gráficos se crean a partir de los datos y se guardan como visualizaciones. Para crear un análisis, realice los siguientes pasos: 1. Adquiera datos de un origen de datos. 2. Opcional: Prepare los datos para el análisis (por ejemplo, filtrando los datos). 3. Aplique algoritmos. 4. Opcional: Almacene los resultados de los análisis para realizar análisis posteriores. Para agregar múltiples análisis al documento, seleccione el botón herramientas de análisis. (Añadir análisis) de la barra de Información relacionada Preparar datos [página 42] Aplicar Componentes de procesamiento previo a datos [página 74] Aplicar algoritmos [página 75] Opcional: Almacenar resultados del análisis [página 77] 8.1.1 Aplicar Componentes de procesamiento previo a datos Puede aplicar componentes de procesamiento previo a sus datos, por ejemplo, filtros, antes de ejecutar el análisis. Este paso es opcional. 74 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Crear análisis Es posible que, en muchos casos, los datos sin procesar del origen de datos no sean adecuados para el análisis. Para obtener resultados precisos, es posible que tenga que preparar y procesar los datos antes del análisis. Puede encontrar las funciones de manipulación de datos en el espacio Preparar y las funciones de preparación de datos en el espacio Predecir. En el espacio Preparar puede trabajar en datos estáticos o preliminares que se importa a Expert Analytics. En el espacio Predecir, puede trabajar con datos transitorios mediante componentes de preprocesadores. La preparación de datos implica la comprobación de los datos para la precisión y los campos faltantes, el filtrado de datos según valores de rango, el muestreo de datos para investigar un subconjunto de datos y la manipulación de datos. Puede procesar los datos mediante componentes de preparación de datos. 1. En el espacio Predecir, haga doble clic en el componente de algoritmo necesario en la lista de componentes a la derecha. El componente de preprocesador se agrega al editor de análisis y se crea una conexión automática al componente de fuente de datos. 2. Desde el menú contextual del componente de preprocesador, seleccione Configurar propiedades. 3. En el cuadro de diálogo de propiedades de componente, introduzca los detalles necesarios para las propiedades del componente de preprocesador. 4. Seleccione Fin. 5. Para ver los resultados del análisis, seleccione (Ejecutar análisis). Información relacionada Componentes de preparación de datos [página 202] 8.1.2 Aplicar algoritmos Cuando disponga de los datos pertinentes para el análisis, tendrá que aplicar los algoritmos adecuados para descubrir los patrones de los datos. Saber qué algoritmo se tiene que usar en cada caso no es evidente. Puede usar una combinación de algoritmos para analizar los datos. Por ejemplo, primero puede usar algoritmos de series temporales para suavizar los datos y después usar algoritmos de regresión para averiguar las tendencias. En la tabla siguiente, se proporciona información sobre qué algoritmos elegir en determinados casos: Finalidad Algoritmo Realizar predicciones basadas en tiempo Algoritmos de series temporales Predicción de variables continuas basadas en otras variables del conjunto de datos Manual de usuario de Expert Analytics Crear análisis ● Suavizado exponencial sencillo ● Suavizado exponencial doble ● Suavizado exponencial triple Algoritmos de regresión PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 75 Finalidad Algoritmo Localizar patrones frecuentes de conjuntos de elementos en grandes conjuntos de datos transaccionales para generar reglas de asociaciones Agrupar observaciones en grupos de conjuntos de datos similares Clasificar y predecir una o más variables discretas sobre la base de otras variables del conjunto de datos Detectar valores atípicos del conjunto de datos Predicción, clasificación y reconocimiento de patrón estadístico ● Regresión lineal ● Regresión exponencial ● Regresión geométrica ● Regresión algorítmica ● Regresión lineal múltiple ● Regresión polinómica ● Regresión logística Algoritmos de asociación ● Apriori ● AprioriLite Algoritmos de agrupación en clúster ● K-Means Árboles de decisiones ● HANA C 4.5 ● Árbol CNR R ● CHAID Algoritmos de detección de valores atípicos ● Rango intercuartil ● Valor atípico de vecino más próximo ● Detección de anomalías ● Prueba de varianza Algoritmos de red neuronal ● Red neuronal NNet R ● Red neuronal MONMLP R Si no ha encontrado un algoritmo relevante, puede crear su propio componente personalizado con el script de R en Expert Analytics y realizar en el análisis en los datos que haya adquirido. Para obtener más información sobre cómo añadir un componente adicional, consulte: Asistente de creación de componentes R [página 80] 1. En el espacio Predecir, haga doble clic en el componente de algoritmo necesario en la lista de componentes a la derecha. El componente de algoritmo se agrega al editor de análisis y se conecta al componente anterior del análisis. 2. Desde el menú contextual del componente de logaritmos, seleccione Configurar propiedades. 3. En el cuadro de diálogo de propiedades de componente, introduzca los detalles necesarios para las propiedades del componente de algoritmo. 4. Seleccione Fin. 5. Para ver los resultados del análisis, seleccione 76 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. (Ejecutar análisis). Manual de usuario de Expert Analytics Crear análisis Información relacionada Algoritmos [página 134] 8.1.3 Opcional: Almacenar resultados del análisis Puede almacenar los resultados del análisis en archivos planos o en bases de datos para analizarlos posteriormente usando componentes grabadores de datos. Solo se almacena la vista de tabla en el componente grabador de datos. 1. En el espacio Predecir, haga doble clic en el componente de algoritmo necesario en la lista de componentes a la derecha. El componente grabador de datos se agrega al editor de análisis y se conecta al componente anterior del análisis. 2. Desde el menú contextual del componente grabador de datos, seleccione Configurar propiedades. 3. En el cuadro de diálogo de propiedades del componente, introduzca los detalles necesarios para las propiedades del componente grabador de datos. 4. Seleccione Fin. 5. Para ver los resultados del análisis, seleccione (Ejecutar análisis). Información relacionada Grabadores de datos [página 224] 8.2 Ejecutar el análisis Tras haber preparado los datos y aplicado los algoritmos necesarios, puede ejecutar un análisis. ● Para ejecutar el análisis, seleccione ● Si su análisis es muy grande y complejo, puede ejecutar el análisis componente por componente y analizar los datos. Para ejecutar una parte del análisis, seleccione Ejecutar hasta aquí desde el menú contextual del componente hasta el que quiere realizar la ejecución. Manual de usuario de Expert Analytics Crear análisis (Ejecutar análisis) en la barra de herramientas del editor de análisis. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 77 8.3 Guardar el análisis Después de crear un análisis, puede guardarlo para volverlo a usar en el futuro. En Expert Analytics, debe guardar el documento para guardar el análisis que cree. El documento guardado contiene el conjunto de datos, los análisis, resultados y visualizaciones. El documento se guarda con el formato de archivo .lums Para guardar un análisis en un documento, realice los siguientes pasos: 1. Seleccione Archivo Guardar . 2. Introduzca un nombre para el documento. 3. Seleccione Guardar. Si crea varios análisis con el mismo conjunto de datos, todos los análisis se guardan en el mismo documento. Puede acceder a todos los análisis de un documento mediante la lista desplegable Análisis. 8.4 Eliminación de análisis desde el documento Puede eliminar un análisis si ya no lo necesita. Para eliminar un análisis existente del documento, pase el puntero del ratón sobre la imagen del análisis de la barra de análisis y seleccione 8.5 Ver resultados Para ver los resultados de componentes en un análisis, una vez ejecutado, cambie a la vista Resultados o, en el menú contextual del componente, seleccione Ver resultados. 8.6 Exportación de un análisis como un procedimiento almacenado Puede exportar un análisis SAP HANA como procedimiento almacenado a la base de datos SAP HANA. Cualquier usuario de SAP HANA puede utilizar ese análisis en SAP HANA Studio para realizar más análisis. Antes de exportar un análisis como un procedimiento almacenado a una base de datos SAP HANA, asegúrese de que su cuenta está definida en SAP HANA. 1. Crear un análisis. 2. Ejecutar el análisis. 3. Seleccione el último componente de algoritmo en el análisis y desde el menú contextual, seleccione Exportar como un procedimiento almacenado. 78 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Crear análisis 4. Seleccione el nombre de esquema. 5. Escriba un nombre para el procedimiento. 6. Si desea sobrescribir el procedimiento existente con un procedimiento creado recientemente, seleccione la opción Sobrescribir, si existe. 7. Opcional: Introduzca un nombre para la vista: 8. Seleccione Exportar. El procedimiento exportado y los objetos asociados aparecen en el esquema seleccionado en la base de datos SAP HANA. Los siguientes objetos se creadn en la base de datos SAP HANA bajo el esquema seleccionado: ● Procedimiento con nombre especificado. ● Si ha decidido crear una vista, entonces una vista de columna con nombre especificado. ● Uno o varios procedimientos para cada componente en la cadena de análisis. ● Una vista de columna por cada componente en la cadena. ● Tipos de tabla necesarios para algoritmos SAP HANA. ● Tablas necesarias para dichos algoritmos que puedan contener parámetros de entrada. Ejemplo Utilizar el procedimiento almacenado Sugerencias El siguiente snippet SQL le muestra cómo puede utilizar el procedimiento almacenado exportado: CREATE TABLE ResultTable like "TestProc_OUT_TYPE"; call "TEST80"."TestProc"(ResultTable) WITH OVERVIEW; select * from ResultTable ; TestProc_OUT_TYPE es el mismo que el tipo de tabla que TestProc prevé como parámetro de salida. Utilizar la vista de columna Sugerencias Hay una función adicional disponible con la que el usuario puede crear vistas de columna sobre el procedimiento almacenado: Select * from VIEW_TESTPROC Información relacionada Exportar un modelo de SAP HANA como procedimiento almacenado [página 131] Manual de usuario de Expert Analytics Crear análisis PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 79 9 Agregar componentes personalizados 9.1 Componente R personalizado Como usuario experto, podrá crear y añadir un componente mediante secuencias de comandos R. El nuevo componente R añadido se clasifica en Componentes R personalizados Algoritmos en la lista de componentes de la derecha, dependiendo del tipo de componente creado. Puede clasificarse por ejemplo como algoritmo, componente de procesador o grabador de datos. Puede utilizar componentes personalizados para realizar un análisis del conjunto de datos adquirido. R es un lenguaje y entorno de programación de software para computación estadística y gráficos. Expert Analytics le proporciona un entorno para utilizar scripts R (dentro de un formato de función R válido) y crear un componente, que puede utilizarse para su análisis del mismo modo que para otro componente existente. Durante la creación de un componente R, puede proporcionar un nombre para el componente que aparece en la Algoritmos clasificación 9.1.1 Componentes R personalizados de la lista de componentes de la derecha. Asistente de creación de componentes R Puede especificar propiedades para el componente R personalizado. Propiedades del asistente de creación de componentes R Tabla 35: General Propiedad Descripción Nombre de componente Introduzca un nombre para el componente. Nota No puede cambiar el nombre de un componente personali­ zado existente. Tipo de componente Seleccione el tipo de componente. Descripción de los componentes Indique una descripción del componente. Ésta aparecerá como información en pantalla del componente creado. Tabla 36: Secuencia de comandos Propiedad Descripción Cargar script R Haga clic para cargar una secuencia de comandos R. 80 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Agregar componentes personalizados Propiedad Descripción Editor de secuencia de comandos Copie y pegue o escriba el script R en la caja de texto. Nombre de la función principal Seleccione el nombre de la función que desee ejecutar. Marco de datos de entrada Seleccione el Marco de datos de entrada de la lista de pará­ metros. Marco de datos de salida Indique un nombre para la variable que desee utilizar como Marco de datos de salida. Nombre de la variable de modelo Indique un nombre para la variable que desee utilizar como variable de modelo. Mostrar visualización Seleccione esta opción para visualizar los resultados de la eje­ cución de componente personalizado en formato de gráfico. Mostrar resumen Seleccione esta opción para visualizar el resumen del algo­ ritmo tras la ejecución del componente personalizado. Opción para guardar el modelo Seleccione esta casilla de verificación para permitir la opción Guardar como modelo para el componente personalizado. Nota Si selecciona Opción para guardar el modelo, se habilita el campo Nombre de variable de modelo y aparece detalles de la función de puntaje modelo Opción para exportar como PMML Seleccione esta casilla de verificación para permitir la opción Exportar como PMML para el componente personalizado. Nota Solo se habilita la casilla de selección Opción de exportar como PMML si selecciona Opción para guardar el modelo. Nombre de la función Definición de puntaje de modelo Seleccione el nombre de la función de puntaje modelo que de­ see ejecutar. Nota Los campos de función de puntaje modelo solo son visibles si selecciona la casilla de verificación Opción para guardar el modelo. Marco de datos de entrada Seleccione el Marco de datos de entrada de la lista de pará­ metros. Marco de datos de salida Indique un nombre para la variable que desee utilizar como Marco de datos de salida. Nombre de la variable de modelo de entrada Seleccione el Nombre de variable modelo de entrada de la lista de parámetros. Manual de usuario de Expert Analytics Agregar componentes personalizados PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 81 Tabla 37: Configuración Propiedad Descripción Función principal: Definición de tabla de salida Tenga en cuenta todas las columnas del componente anterior, Seleccione incluir o excluir respectivamente la columna pre­ o más vista del componente principal en la salida del componente personalizado. Tipo de datos Seleccione el tipo de datospara la columna prevista del com­ ponente personalizado. Nuevo nombre de columna prevista Introduzca un nombre para la columna prevista. Ésta es la co­ lumna de salida del componente personalizado. Función principal: Definición de vista de propiedad Parámetros de función Parámetros definidos. Nombre de visualización de la propiedad Indique el nombre de la Columna independientey de la Columna dependiente que aparecerá en la vista de propieda­ des del componente personalizado. Tipo de control Seleccione el Tipo de controlde la Columna independientey de la Columna dependiente. Puntaje de modelo: Definición de tabla de salida Tenga en cuenta todas las columnas del componente anterior, Seleccione incluir o excluir respectivamente la columna pre­ o más vista del componente principal en la salida del puntaje mo­ delo. Tipo de datos Seleccione el Tipo de datospara la columna prevista del pun­ taje modelo. Nuevo nombre de columna prevista Introduzca un nombre para la columna prevista. Ésta es la co­ lumna de salida del puntaje modelo. Puntaje de modelo: Definición de vista de propiedad Parámetros de función Parámetros definidos. Nombre de visualización de la propiedad Introduzca el nombre de la columna que aparece en la vista de propiedades del modelo guardado. Tipo de control Seleccione el Tipo de controlde la Columna independientey de la Columna dependiente. Información relacionada Crear un componente R [página 82] 9.1.2 Crear un componente R Cómo crear un componente R personalizado para su uso en análisis. Antes de crear un componente R, debe asegurarse de que cumple los siguientes requisitos: 82 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Agregar componentes personalizados ● La secuencia de comandos R está escrita en un formato de función R válido. ● La secuencia de comandos R se ejecuta en la consola de GUI de R. ● La secuencia de comandos R al menos tiene una función principal. ● Los paquetes necesarios para ejecutar la secuencia de comandos R deben estar instalados en su máquina o en el servidor de SAP HANA. ● La secuencia de comandos R escrito para el análisis en la base de datos devuelve un marco de datos. Debe tener en cuenta los siguientes procedimientos recomendados al escribir la secuencia de comandos R: ● La secuencia de comandos R escrito para el análisis en proceso devuelve un marco de datos. ● Se recomienda la conversión de tipo, por ejemplo, si una columna tiene valores numéricos, indíquela como as.numeric(output) ● Para variables de categoría utilizadas en la secuencia de comandos R, especifique la variable con el comando as.factor. 1. En el espacio Predecir, en la lista de componentes de la derecha, seleccione Aparece un asistente Crear nuevo componente R personalizado. 2. En la página General, introduzca la siguiente información: a. Componente R En el cuadro de texto Nombre de componente, escriba Mi componente. b. En la lista desplegable Tipo de componente, seleccione Algoritmo. c. En el cuadro de texto Descripción de componente, escriba Componente R para regresión lineal sencilla. 3. Seleccione Siguiente. Aparecerá la página Comando. 4. En la página Secuencia de comandos, seleccione Cargar secuencia de comandos para seleccionar un archivo a cargar. Nota Puede escribir o copiar y pegar el siguiente comando R de muestra en el cuadro de texto. Nota Consulte los comentarios en la siguiente función R para poder entender y escribir su propio comando R. #This is a sample script for a simple linear regression component. #The script should be written in a valid R function format. #Function name and variable name in R script can be user-defined, which are supported in R. #The following is the argument description for the primary function SLR: #InputDataFrame - Dataframe in R that contains the output of the parent component. #The following two parameters are fetched from the user from the property view: #IndepenentColumns - Column names that you want to use as independent variables for the component. #DependentColumn - Column name that you want to use as a dependent variable for the component. SLR<-function(InputDataFrame,IndepenentColumn,DependentColumn) { finalString<-paste(paste(DependentColumn,"~" ), IndepenentColumn); # Formatting the final string to #pass to "lm" function Manual de usuario de Expert Analytics Agregar componentes personalizados PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 83 slr_model<-lm(finalString); # calling the "lm" function and storing the output model in "slr_model" #To get the predicted values for the training data set, call the "predict" function withthis model and #input dataframe, which is represented by "InputDataFrame". result<-predict(slr_model, InputDataFrame); # Storing the predicted values in the "result" variable. output<- cbind(InputDataFrame, result);#combining "InputDataFrame" and "result" to get the final table. plot(slr_model); #Plotting model visualization. # returnvalue - function must always return a list that contains results("out"), and model variable #("slrmodel"), if present. #The output variable stores the final result. #The model variable is used for model scoring. return (list(slrmodel=slr_model,out=output)) } #The following is the argument description for the model scoring function "SLRModelScoring": #MInputDataFrame - Dataframe in R that contains the output of the parent component. #MIndepenentColumns - Column names to be used as independent variables for the component. #Model - Model variable that is used for scoring. SLRModelScoring<-function (MInputDataFrame, MIndependentColumn, Model) { #Calling "predict" function to get the predictive value with "Model " and "MInputDataFrame". predicted<-predict (Model, data.frame(MInputDataFrame [, MIndependentColumn]), level=0.95); # returnvalue - function should always return a list that contains the result ("model result"), # The output variable stores the final result return(list(modelresult=predicted)) } A continuación se ofrecen dos ejemplos para convertir un script R a un formato de función R válido, reconocidos por Expert Analytics: Secuencia de comandos R dataFrame<-read.csv("C:\\CSVs\ \Iris.csv") attach(dataFrame) set.seed(4321) kmeans_model Calcetines [compatibilidad = 0,5, confianza= 0,1] Nota No se admite la creación de modelos mediante el algoritmo Apriori de HANA. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 189 Propiedades de Apriori de HANA Tabla 96: Propiedades del algoritmo Propiedad Descripción Tipo a priori Seleccione Apriori. Columna de elementos Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo.. Columna de ID de transacción Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo. Valores faltantes Seleccione el método para manejar los valores perdidos. Valores posibles: ● Omitir: el algoritmo omite los registros que contienen va­ lores faltantes en las columnas independientes o depen­ dientes. ● Conservar: el algoritmo conserva los valores faltantes para su procesamiento. Compatibilidad Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es 0,1. Confianza Introduzca un valor para la confianza mínima de reglas/ asociación. El valor predeterminado es 0,8. Recuento máximo de elementos Introduzca la longitud de los elementos iniciales y de los ele­ mentos dependientes de la salida. El valor predeterminado es 5. Número de subprocesos Escriba el número de hilos que el algoritmo debe ejecutar. El valor predeterminado es 1. 15.1.7.2 HANA Apriori Lite Propiedades que se pueden configurar para el algoritmo HANA AprioriLite . Sintaxis Use este algoritmo para buscar patrones frecuentes de conjuntos de elementos en conjuntos de datos transaccionales grandes para generar reglas de asociación. Apriori Lite también admite el muestreo dentro del algoritmo. Nota 190 ● Puede usar HANA Apriori Lite desde las propiedades del algoritmo de HANA Apriori al seleccionar AprioriLite como el Tipo Apriori. ● No se admite la creación de modelos mediante el algoritmo AprioriLite de HANA. ● Solo calcula dos conjuntos de elementos de gran tamaño. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Propiedades de AprioriLite de HANA Tabla 97: Propiedades del algoritmo Propiedad Descripción Tipo a priori Haga clic en AprioriLite. Columna de elementos Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo.. Columna de ID de transacción Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen va­ lores faltantes en las columnas independientes o depen­ dientes. ● Conservar: el algoritmo conserva los valores faltantes para su procesamiento. Compatibilidad Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es 0,1. Confianza Introduzca un valor para la confianza mínima de reglas/ asociación. El valor predeterminado es 0,8. Ejemplo obligatorio Seleccione esta opción si desea ejemplificar los datos. Ejemplificación de porcentaje Introduzca el porcentaje de ejemplificación. Recálculo obligatorio Seleccione esta opción si desea recalcular el soporte y la con­ fianza de cada iteración. Número de subprocesos Introduzca el número de subprocesos que se usarán para la ejecución. 15.1.7.3 HANA R Apriori Propiedades que se pueden configurar para el algoritmo HANA R-Apriori. Sintaxis Utilice este algoritmo para encontrar patrones en los conjuntos de elementos frecuentes en conjuntos de datos grandes para generar reglas de asociación mediante el paquete de R "arules". Este algoritmo sirve para averiguar qué productos y servicios suelen comprar simultáneamente los clientes. Si se analizan las tendencias de compra de los clientes con un análisis de asociación, se puede realizar una predicción de sus comportamientos en el futuro. Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines [compatibilidad = 0,5, confianza= 0,1] Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 191 Propiedades de HANA R Apriori Tabla 98: Propiedades del algoritmo Propiedad Descripción Modo de salida Seleccione el modo en el que desea usar la salida de este algo­ ritmo. Formato de entrada Seleccione el formato de los datos de entrada. Columnas de elementos Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo.. Columna de ID de transacción Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo. Compatibilidad Introduzca un valor para el soporte mínimo de un elemento. Confianza Introduzca un valor para la confianza mínima de reglas/ asociación. Reglas Introduzca un nombre para la nueva columna que contiene las reglas a priori para un conjunto de datos determinado. Valores compatibles Introduzca un nombre para la nueva columna que contiene la compatibilidad para las reglas correspondientes. Valores de confianza Introduzca un nombre para la columna nueva que contiene los valores de confianza de las reglas correspondientes. Valores de elevación Introduzca un nombre para la nueva columna que contiene los valores de elevación para las reglas correspondientes. ID de transacción Introduzca un nombre para la nueva columna que contiene la ID de transacción. Elementos Introduzca un nombre para la nueva columna que contiene los nombres de los elementos. Reglas coincidentes Introduzca un nombre para la nueva columna que contiene las reglas coincidentes. Elemento(s) Lhs Introduzca etiquetas separadas por comas para los elemen­ tos que deberían aparecer a la izquierda de las reglas o de los conjuntos de elementos. Elemento(s) Rhs Introduzca etiquetas separadas por comas para los elemen­ tos que deberían aparecer a la derecha de las reglas o de los conjuntos de elementos. Ambos elementos Introduzca etiquetas separadas por comas para los elemen­ tos que deberían aparecer a ambos lados de las reglas o de los conjuntos de elementos. Ningún elemento(s) Introduzca etiquetas separadas por comas que indiquen los elementos que no deben aparecer en las reglas o en los con­ juntos de elementos. Apariencia predeterminada Introduzca la apariencia predeterminada de los elementos que no se mencionen específicamente. Tipo de ordenación: Seleccione la opción de ordenación para ordenar los elemen­ tos atendiendo a su frecuencia. 192 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Propiedad Descripción Criterios de filtro Introduzca un valor numérico que indique el modo de filtrar los elementos sin usar de las transacciones. El valor predeter­ minado es 0,1. Usar estructura de árbol Para organizar transacciones según un árbol de prefijos, se­ leccione True. Usar ordenación por montículos Para usar la ordenación por montículos en lugar de la ordena­ ción rápida para ordenar las transacciones, seleccione True. Optimizar memoria Para minimizar el uso de memoria en lugar de maximizar la velocidad, seleccione True. Cargar transacciones a la memoria Para cargar las transacciones en la memoria, seleccione True. 15.1.7.4 Apriori R Propiedades que se pueden configurar para el algoritmo R-Apriori. Sintaxis Utilice este algoritmo para encontrar patrones en los conjuntos de elementos frecuentes en conjuntos de datos grandes para generar reglas de asociación mediante el paquete de R "arules". Este algoritmo sirve para averiguar qué productos y servicios suelen comprar simultáneamente los clientes. Si se analizan las tendencias de compra de los clientes con un análisis de asociación, se puede realizar una predicción de sus comportamientos en el futuro. Por ejemplo, si contamos con la información de que un cliente que compra zapatos es más probable que compre calcetines en esa misma compra, ésta se puede representar con una regla de asociación (con un mínimo dado de compatibilidad y un mínimo de confianza)como: Zapatos=> Calcetines [compatibilidad = 0,5, confianza= 0,1] Propiedades de R-Apriori Tabla 99: Propiedades del algoritmo Propiedad Descripción Modo de salida Seleccione el modo en el que desea usar la salida de este algo­ ritmo. Formato de entrada Seleccione el formato de los datos de entrada. Columnas de elementos Seleccione las columnas que contengan los elementos a los que desea aplicar el algoritmo.. Columna de ID de transacción Seleccione la columna que contenga los ID de transacción a los que desea aplicar el algoritmo. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 193 Propiedad Descripción Compatibilidad Introduzca un valor para el soporte mínimo de un elemento. El valor predeterminado es 0,1. Confianza Introduzca un valor para la confianza mínima de reglas/ asociación. El valor predeterminado es 0,8. Reglas Introduzca un nombre para la nueva columna que contiene las reglas a priori para un conjunto de datos determinado. Valores compatibles Introduzca un nombre para la nueva columna que contiene la compatibilidad para las reglas correspondientes. Valores de confianza Introduzca un nombre para la columna nueva que contiene los valores de confianza de las reglas correspondientes. Valores de elevación Introduzca un nombre para la nueva columna que contiene los valores de elevación para las reglas correspondientes. ID de transacción Introduzca un nombre para la nueva columna que contiene la ID de transacción. Elementos Introduzca un nombre para la nueva columna que contiene los nombres de los elementos. Reglas coincidentes Introduzca un nombre para la nueva columna que contiene las reglas coincidentes. Elemento(s) Lhs Introduzca etiquetas separadas por comas para los elemen­ tos que deberían aparecer a la izquierda de las reglas o de los conjuntos de elementos. Elemento(s) Rhs Introduzca etiquetas separadas por comas para los elemen­ tos que deberían aparecer a la derecha de las reglas o de los conjuntos de elementos. Ambos elementos Introduzca etiquetas separadas por comas para los elemen­ tos que deberían aparecer a ambos lados de las reglas o de los conjuntos de elementos. Ningún elemento(s) Introduzca etiquetas separadas por comas que indiquen los elementos que no deben aparecer en las reglas o en los con­ juntos de elementos. Apariencia predeterminada Introduzca la apariencia predeterminada de los elementos que no se mencionen específicamente. Tipo de ordenación: Seleccione la opción de ordenación para ordenar los elemen­ tos por frecuencia. Criterios de filtro Introduzca un valor numérico que indique el modo de filtrar los elementos sin usar de las transacciones. El valor predeter­ minado es 0,1. Usar estructura de árbol Para organizar transacciones según un árbol de prefijos, se­ leccione True. Usar ordenación por montículos Para usar la ordenación por montículos en lugar de la ordena­ ción rápida para ordenar las transacciones, seleccione True. Optimizar memoria Para minimizar el uso de memoria en lugar de maximizar la velocidad, seleccione True. 194 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Propiedad Descripción Cargar la transacción a la memoria Para cargar las transacciones en la memoria, seleccione True. 15.1.8 Clasificación 15.1.8.1 KNN HANA Propiedades que se pueden configurar para el algoritmo HANA KNN. Sintaxis Use este componente para clasificar objetos según los datos de ejemplo formados. En KNN, los objetos se clasifican por la mayoría de votos de sus vecinos. Nota No se admite la creación de modelos mediante el algoritmo KNN de HANA. Propiedades de KNN de HANA Tabla 100: Propiedades del algoritmo Propiedad Descripción Características Seleccione las columnas de entrada con las que desee realizar el análisis. Recuento de vecinos Introduzca el número de vecinos a tener en cuenta para bus­ car distancias. El valor predeterminado es 5. Tipo de voto Seleccione el tipo de voto para el cálculo de la cuenta de ve­ cino. Valores faltantes Seleccione el método para manejar los valores perdidos. ● Omitir: El algoritmo omite los registros que contienen va­ lores faltantes en las características o variables meta. ● Conservar: El algoritmo conserva los valores faltantes. Nombre de esquema Introduzca el nombre de esquema que contiene los datos for­ mados. Nombre de tabla Introduzca el nombre de la tabla que contiene los datos for­ mados. Columnas independientes Introduzca las columnas de entrada que desea tener en cuenta para formar los datos. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 195 Propiedad Descripción Columna dependiente Introduzca las columnas de salida que desea tener en cuenta para formar los datos. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores de clasificación. Número de subprocesos Escriba el número de subprocesos que desea que el algoritmo ejecute. El valor predeterminado es 1. 15.1.8.2 Análisis ABC de HANA Propiedades que se pueden configurar para el algoritmo Análisis ABC de HANA. Sintaxis Use este algoritmo para clasificar objetos (como clientes, empleados o productos) basándose en un indicador específico (como volumen de negocios o beneficio). Sugiere que los inventarios de una organización no son del mismo valor. Además, los inventarios pueden agruparse en tres categorías (A, B y C) según su importancia estimada. Los elementos "A" son muy importantes para una ogranización. Los elementos "B" tienen una importancia media, es decir, son menos importantes que los elementos "A" pero más que los "C". Los elementos "C" son los de menor importancia. Un ejemplo de clasificación ABC sería: ● Elementos A: 20% de las cuentas de elementos para el 70% del valor de consumo anual de todos los elementos. ● Elementos B: 30% de las cuentas de elementos para el 25% del valor de consumo anual de todos los elementos. ● Elementos C: 50% de las cuentas de elementos para el 5% del valor de consumo anual de todos los elementos. Propiedades de Análisis ABC de HANA Tabla 101: Propiedades del algoritmo Propiedad Descripción Características Seleccione las columnas de entrada con las que desea realizar la regresión. 196 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Propiedad Descripción Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: El algoritmo omite los registros que contienen va­ lores faltantes en las características o variables meta. ● Conservar: el algoritmo conserva el registro que contiene los valores faltantes durante el cálculo. Desglose de porcentaje de A Introduzca el porcentaje de elementos que desee clasificar en el grupo A. El valor por defecto es 40. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes de los elementos de los grupos A, B y C sea igual a 100%. Desglose de porcentaje de B Introduzca el porcentaje de elementos que desee clasificar en el grupo B. El valor por defecto es 30. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes de los elementos de los grupos A, B y C sea igual a 100%. Desglose de porcentaje de C Introduzca el porcentaje de elementos que desee clasificar en el grupo C. El valor por defecto es 30. El rango posible es 0-100%. Asegúrese de que la suma de los porcentajes de los elementos de los grupos A, B y C sea igual a 100%. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 30. Nombre de columna prevista Introduzca un nombre para la columna recién añadida que contiene los valores previstos. 15.1.8.3 Análisis de puntuaciones ponderadas de HANA Propiedades que se pueden configurar para el algoritmo Análisis de puntuaciones ponderadas de HANA. Sintaxis Una tabla de puntuaciones ponderadas es un método para evaluar alternativas cuando la importancia de los criterios es diferente. En una tabla de puntuaciones ponderadas, cada alternativa recibe una puntuación para cada criterio. Estas puntuaciones se ponderan por la importancia de cada criterio. Todas las puntuaciones ponderadas de una alternativa se suman para calcular la puntuación ponderada total. La alternativa con la puntuación total más alta sería la mejor alternativa. Puede utilizar tablas de puntuaciones ponderadas para predecir el comportamiento futuro de los clientes. Cree un modelo basado en datos históricos en la aplicación de minería de datos y aplique el modelo a los nuevos datos para realizar la predicción. Esta predicción (el resultado del modelo), se denomina puntuación. Puede crear una sola puntuación para sus clientes teniendo en cuenta diferentes dimensiones. Una función definida por tablas de puntuaciones ponderadas es una combinación lineal de funciones de una variable. f(x1,…,xn) = w1× f 1(x1) + … + wn× f n(xn) Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 197 Análisis de puntuaciones ponderadas de HANA Tabla 102: Propiedades del algoritmo Propiedad Descripción Nombre de columna Seleccione la columna de entrada con la que desea realizar el análisis. Tipo Seleccione el tipo "Discreta" si la columna tiene datos categó­ ricos o "Continua" si los datos son numéricos. Pesos Introduzca las ponderaciones para la columna seleccionada. El valor predeterminado es 0.0. Claves y puntuaciones Introduzca los valores para las claves y puntuaciones. Valores faltantes Seleccione el método para manejar los valores perdidos. ● Omitir: El algoritmo omite los registros que contienen va­ lores faltantes en las características o variables meta. ● Conservar: El algoritmo conserva valores faltantes. Número de subprocesos Escriba el número de hilos que el algoritmo debe ejecutar. El valor predeterminado es 1. Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores previstos. 15.1.8.4 HANA Naive Bayes Propiedades que se pueden configurar para el algoritmo Naive Bayes de HANA. Sintaxis Naive Bayes es un algoritmo de clasificación basado en el teorema de Bayes. Estima la probabilidad condicional de clase asumiendo que los atributos son condicionalmente independientes uno de otro. A pesar de su simplicidad, Naive Bayes funciona bastante bien en áreas como la colasificación de documentos y y filtrado de spam, y solo requiere una pequeña cantidad de datos de formación para estimar los parámetros necesarios para la clasificación. Propiedades de HANA Naive Bayes Tabla 103: Propiedades del algoritmo Propiedad Descripción Modo de salida Seleccione el modo en el que desea usar la salida de este algo­ ritmo. Características Seleccione las columnas de entrada con las que desea realizar la regresión. 198 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Propiedad Descripción Variable de destino Seleccione la columna de destino para la que desea realizar el análisis. Nombre de columna prevista Introduzca un nombre para la columna recién creada que con­ tiene los valores previstos. Suavizado de Laplace Introduzca la constante de suavizado para las observaciones de suavizado. La constante de suavizado debe ser un valor do­ ble superior a 0. Introduzca 0 para deshabilitar el suavizado de Laplace. Valores faltantes Seleccione el método para manejar los valores perdidos. Número de subprocesos 15.1.8.5 ● Omitir: El algoritmo omite los registros que contienen va­ lores faltantes en las características o variables meta. ● Conservar: el algoritmo conserva los registros que con­ tiene los valores faltantes durante el cálculo. Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1. HANA Auto Classification Propiedades que se pueden configurar para el algoritmo (Auto) Clasificación automática HANA. Sintaxis El algoritmo Clasificación automática HANA se utiliza para la clasificación binaria/categórica. Este algoritmo detecta el tipo de modelo y algoritmo utilizado y que mejor se adapte basado en el destino disponible que seleccione. También decide si la entrada debe ser continua o categórica y determina la categorización más apropiada para las variables. Como resultado, puede reducir la preparación de datos y modelar las actividades de testing que realice en la construcción de un modelo predictivo. Además, también crea conjuntos de datos de validación y formación para evaluación de modelos. El algoritmo Autoclasificación HANA sólo está disponible en modo online (conectado con SAP HANA). Hay un algoritmo de autoclasificación similar disponible en modo fuera de línea. Para más información acerca de las funciones utilizadas en algoritmos automáticos online, véase el Manual de referencia de SAP Automated Predictive Library (APL) en http://help.sap.com/pa Propiedades de clasificación automática HANA Tabla 104: Propiedades del algoritmo Propiedad Descripción Características Seleccione las columnas de entrada con las que desea realizar el análisis. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 199 Propiedad Descripción Variable de destino Seleccione la columna de destino en la que desea realizar el análisis. Nombre de columna prevista Introduzca un nombre para una nueva columna que contiene los valores previstos. 15.1.8.6 Autoclasificación Propiedades que se pueden configurar para el algoritmo (Auto) Clasificación automática. Sintaxis El algoritmo Clasificación automática se utiliza para la clasificación binaria/categórica. Este algoritmo detecta el tipo de modelo y algoritmo utilizado y que mejor se adapte basado en el destino disponible que seleccione. También decide si la entrada debe ser continua o categórica y determina la categorización más apropiada para las variables. Como resultado, puede reducir la preparación de datos y modelar las actividades de testing que realice en la construcción de un modelo predictivo. Además, también crea conjuntos de datos de validación y formación para evaluación de modelos. Propiedades de clasificación automática Tabla 105: Propiedades del algoritmo Propiedad Descripción Características Seleccione las columnas de entrada con las que desea realizar el análisis. Variable de destino Seleccione la columna de destino en la que desea realizar el análisis. Nombre de columna prevista Introduzca un nombre para una nueva columna que contiene los valores previstos. 15.1.8.7 Máquina de vectores de soporte de HANA Propiedades que se pueden configurar para el algoritmo de la máquina de vectores de soporte de HANA. Sintaxis Las máquinas de vectores de soporte (SVMs) son un conjunto de modelos de aprendizaje supervisado que utilizan el concepto de vector de soporte. En comparación con otros muchos modelos de aprendizaje supervisado, las SVMs presentan ventajas, tales como que la producción de modelos tanto lineales como no lineales. Estas últimas se alcanzan mediante una técnica denominada función Kernel. 200 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Como ocurre con la mayoría de modelos supervisados, en las SVMs existe una fase de entrenamiento y otra de evaluación. Durante la fase de entrenamiento, se aprende que una función f(x):->y donde f(∙), es una función (puede ser no lineal) que asigna un ejemplo en un DESTINO. El entrenamiento consiste en pares indicados mediante {xi, yi}, donde x indica un ejemplo que se representa con distintos atributos, y y indica un DESTINO (información supervisada). Durante la fase de evaluación, el f(∙) aprendido se utiliza después para asignar un ejemplo con un DESTINO desconocido en su DESTINO predicho. En la implementación actual en PAL se pueden utilizar las SVMs para las tres tareas siguientes: ● Clasificación de vectores de soporte (SVC) La clasificación es una de las tareas más frecuentes de muchos campos, tales como el aprendizaje de máquinas, la minería de datos, la visión de ordenadores o el análisis de datos empresariales. En comparación con clasificadores lineales tales como la regresión logística, la SVC es capaz de producir un límite de decisión no lineal que lleve a una mejor precisión en algunos conjuntos de datos del mundo real. En un supuesto de clasificación, f(∙) indicaría una función de decisión y OBJETIVO una "etiqueta" representada por un número real. ● Regresión de vectores de soporte (SVR) La SVR consiste en otro método de análisis de regresión. En comparación con métodos de regresión lineales clásicos como la regresión de mínimos cuadrados, la función de regresión en la SVR puede ser no lineal. En un supuesto de regresión, f(∙) indicaría una función de regresión y OBJETIVO una "respuesta" representada por un número real. ● Clasificación de vectores de soporte Esto implementa un algoritmo emparejado de "aprendizaje de clasificación" que aprende una función de clasificación a partir de diversos conjuntos (que se distinguen gracias al ID de consulta) de ejemplos clasificados. En un supuesto de clasificación, f(∙) indicaría una función de clasificación y OBJETIVO una puntuación según se haya realizado la clasificación final. Para la clasificación emparejada, se aprendef(∙) con el fin de que se considere la relación emparejada que expresa la clasificación de los ejemplos dentro de cada conjunto. Ya que la función Kernel (además de los conjuntos de datos) alcanza la no linealidad, se deben especificar también el tipo de kernel y los parámetros. Propiedades de la máquina de vectores de soporte de HANA Tabla 106: Propiedades del algoritmo Propiedad Descripción Tipo de algoritmo Seleccione el tipo de análisis debe ejecutar el algoritmo. ● Clasificación ● Regresión ● Clasificación Modo de salida Seleccione el modo en el que desea usar la salida de este algo­ ritmo. Características Seleccione las columnas de entrada con las que desea realizar el análisis. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 201 Propiedad Descripción Variable de destino Seleccione la columna de destino en la que desea realizar el análisis. ID de consulta Seleccione una columna de ID de consulta para la clasifica­ ción. Valores faltantes Seleccione el método para manejar los valores perdidos. Valores posibles: ● Omitir: el algoritmo omite los registros que contienen va­ lores faltantes en las columnas independientes o depen­ dientes. ● Conservar: el algoritmo conserva los registros que con­ tienen los valores faltantes durante el cálculo. Tipo de kernel Seleccione el tipo de kernel. Gamma Introduzca el coeficiente gamma para el kernel RBF. Margen máximo Introduzca un valor de intercambio que desee tener en cuenta entre el error de entrenamiento y margen. Grado Indique un grado para el kernel polinomial. El valor predeter­ minado es 3. Coeficiente lineal Introduzca un valor para el coeficiente lineal. Constante de coeficiente Introduzca un valor para la constante de coeficiente. Validación cruzada Seleccione esta opción para usar la validación cruzada para el cálculo. Tipo de normalización Seleccione el tipo de normalización. Número de subprocesos Introduzca el número de subprocesos que debe usar el algo­ ritmo para la ejecución. El valor predeterminado es 1. Nombre de columna prevista Introduzca un nombre para la columna creada recientemente que contiene los valores previstos. 15.2 Componentes de preparación de datos Use los componentes de preparación de datos para preparar los datos para el análisis. Estos componentes son opcionales. 15.2.1 Fórmula Propiedades que se pueden configurar para el componente de preparación de fórmulas. 202 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Sintaxis Utilice este componente para aplicar funciones y operadores predefinidos en los datos. Todas las funciones y expresiones, excepto las funciones de manipulación de datos, añaden una nueva columna con el resultado de la fórmula. Nota Cuando se introduce una cadena literal que contiene comillas simples, cada comilla de la cadena literal debe ir precedida con un carácter de barra inversa (\). Por ejemplo, si desea escribir la palabra "Customer's", deberá escribir "Customer\'s". Nota Cuando se introduce un nombre de columna que contiene corchetes, cada corchete en el interior del nombre de la columna debe ir precedido con un carácter de barra inversa (\). Por ejemplo, si desea escribir [Cliente[Edad]], deberá escribir [Cliente\[Edad\]]. Propiedades de las fórmulas Tabla 107: Propiedades del componente de preparación de datos Propiedad Descripción Nombre de fórmula Introduzca un nombre para la nueva columna creada me­ diante la aplicación de una fórmula. Expresión Escriba la fórmula que desea aplicar. Por ejemplo, Prome­ dio([Edad]). Ejemplo Calcula el promedio de edad de los empleados Tabla de empleados: ID del empleado Nombre del Fecha de empleado nacimiento 1 Laura 11/11/1986 2 Desi 3 4 Edad Fecha de Fecha de incorporación confirmación 25 12/9/2005 27/11/2005 12/5/1981 30 24/6/2000 10/7/2000 Álex 30/5/1978 33 10/10/1998 24/12/1998 Juan 6/6/1979 32 2/12/1999 20/12/1999 Para calcular el promedio de edad de los empleados, realice los siguientes pasos: 1. Arrastre el componente Fórmula al editor de análisis. 2. En la vista Propiedades, introduzca un nombre para la fórmula. Por ejemplo, Promedio_Edad. 3. En el campo Expresión, introduzca la fórmula: PROMEDIO([Edad]) Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 203 4. Seleccione Validar para validar la sintaxis de la fórmula. 5. Seleccione Fin. Tabla de salida: ID del empleado Nombre del Fecha de empleado nacimiento 1 Laura 11/11/1986 2 Desi 3 4 Edad Fecha de Fecha de incorporación confirmación Promedio_Edad 25 12/9/2005 27/11/2005 30 12/5/1981 30 24/6/2000 10/7/2000 30 Álex 30/5/1978 33 10/10/1998 24/12/1998 30 Juan 6/6/1979 32 2/12/1999 20/12/1999 30 Funciones admitidas Categoría Función (Función cuando se aplica a la Descripción tabla Empleado) Fecha DÍASENTRE Devuelve el número de días entre dos fechas. FECHAACTUAL Devuelve la fecha actual del sistema. MESESENTRE Devuelve el número de meses entre dos fechas. Por ejemplo, la nueva columna contiene 2,0,2,0 cuando se aplica MESESENTRE([Fecha de incorporación],[Fecha de confirmación]) a la tabla Empleado. NOMBREDELDÍA Devuelve el nombre del día en formato de cadena. Por ejemplo, la nueva columna contendrá lunes, sábado, sábado, jueves cuando se aplique NOMBREDELDÍA([Fecha de incorporación]) a la tabla Empleado. NÚMERODEDÍADELMES Devuelve el número del día de un mes determinado. Por ejemplo, la fecha 12/11/1980 devuelve el número 12. NÚMERODEDÍADELASEMANA Devuelve el número de día de una semana. Por ejemplo, domingo=1, lunes=2. NÚMERODEDÍADELAÑO 204 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Devuelve el número de día de un año. Manual de usuario de Expert Analytics Propiedades de los componentes Categoría Función (Función cuando se aplica a la Descripción tabla Empleado) Por ejemplo, el 1 de enero=1, 1 de febrero=32, 3 de febrero=34. ÚLTIMODÍADELASEMANA Devuelve la fecha del último día de la semana. Por ejemplo, la fecha 12/9/2005 devuelve 17/9/2005 ÚLTIMODÍADELMES Devuelve la fecha del último día del mes. Por ejemplo, la fecha 12/9/2005 devuelve 30/9/2005 NÚMERODEMESDELAÑO Devuelve el número del mes en una fecha. Por ejemplo, enero=1, febrero=2, marzo=3. NÚMERODESEMANADELAÑO Devuelve el número de semana en un año. Por ejemplo, 12/9/2005 devuelve 38. NÚMERODETRIMESTREDELAFECHA Devuelve el número del trimestre en una fecha. Por ejemplo, 12/9/2005 devuelve 3. Cadena CONCAT Concatena dos cadenas. Por ejemplo, la expresión CONCAT('EE.UU.','Australia') devuelve EE.UU.Australia. ENLACADENA Devuelve el resultado True si se encuentra la cadena buscada en la cadena fuente. Por ejemplo, la expresión ENLACADENA('EE.UU.','EU') devuelve el resultado True. SUBCADENA Devuelve una subcadena de una cadena fuente. Por ejemplo, la expresión SUBCADENA('EE.UU.',1,2) devuelve EE. Matemáticas Manual de usuario de Expert Analytics Propiedades de los componentes LONGCAD Devuelve el número de caracteres que contiene la cadena fuente. Por ejemplo, la expresión LONGCAD('Australia') devuelve 9. MAX Devuelve el valor máximo de una columna. PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 205 Categoría Función (Función cuando se aplica a la Descripción tabla Empleado) Manipulación de datos MIN Devuelve el valor mínimo de una columna. CONTAR Devuelve el número de valores de una columna. SUMA Devuelve la suma de los valores de una columna. PROMEDIO Devuelve el promedio de los valores de una columna. @REEMPLAZAR Realiza un reemplazo in situ de una cadena. Por ejemplo, @REEMPLAZAR([país], 'EE.UU.','NORTEAMÉRICA') reemplazará la palabra EE.UU. por NORTEAMÉRICA en la columna de país. @ENBLANCO Reemplaza los valores en blanco con un valor específico. Por ejemplo, @ENBLANCO([país],'EE.UU.') sustituye todos los valores en blanco por la cadena EE.UU. en la columna de país. @SELECT Selecciona las filas que cumplen una condición determinada. Puede utilizar cualquier operador condicional para especificar la condición. Por ejemplo, @SELECT([país]=='EE.UU.') selecciona las filas en las que el país sea igual a EE.UU. Expresión condicional IF(condición) THEN(expresión de cadena/expresión matemática/ expresión condicional) ELSE(expresión de cadena/expresión matemática/ expresión condicional) Comprueba si se cumple la condición y devuelve un valor si se cumple ("true") y otro si no se cumple ("false"). Por ejemplo, IF([Fecha de incorporación]>12/9/2005) THEN ('Empleado incorporado después del 12 de septiembre de 2005') ELSE ('Empleado incorporado el o antes del 12 de septiembre de 2005') Nota Las expresiones matemáticas que contienen funciones que devuelve un valor numérico no son compatibles. Por ejemplo, la expresión NÚMERODEDÍADELMES(FECHAACTUAL())+2 no es compatible porque NÚMERODEDÍADELMES devuelve un valor numérico. 206 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Operadores matemáticos Use operadores matemáticos para crear fórmulas para columnas numéricas y/o números. Por ejemplo, la expresión[Edad] + 1 añade una nueva columna con los valores 26, 31, 34 y 33. Operadores matemáticos Descripción + Operador de adición - Operador de sustracción * Operador de multiplicación / Operador de división () Paréntesis ^ Operador de potencia % Operador de porcentaje E Operador exponencial Operadores condicionales Use los operadores condicionales para crear expresiones IF THEN ELSE o SELECT. Operadores condicionales Descripción == Igual a != No igual a < Menor que > Mayor que <= Menor o igual a >= Mayor o igual a Operadores lógicos Use los operadores lógicos para comparar dos condiciones y obtener un resultado de "true" o "false". Por ejemplo, IF([Fecha de incorporación]>12/9/2005 && [Edad] >=25 ) THEN ('True') ELSE ('False') añade una nueva columna con los valores True, False, False, False. Operadores lógicos Descripción && Y || O Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 207 15.2.2 Muestra Propiedades que se pueden configurar para el componente de preparación de muestras. Sintaxis Utilice este componente para seleccionar un subconjunto de datos de conjuntos de datos mayores. El componente Muestra es compatible con los siguientes tipos de muestra: ● Primeros N: selecciona los primeros registros N del conjunto de datos. ● Últimos N: selecciona los últimos registros N del conjunto de datos. ● Cada N: Selecciona cada registro N del conjunto de datos, donde N es un intervalo. Por ejemplo, si N=2, se seleccionarán los registros 2, 4, 6, 8, etc. ● Aleatorización simple: selecciona registros aleatoriamente del tamaño N o un porcentaje de N de los registros de un conjunto de datos. ● Aleatorización sistemática: en este tipo de muestra, se crean intervalos simples o depósitos según el tamaño del depósito. El componente Muestra selecciona un registro N aleatoriamente del primer depósito y de cada depósito posterior. Propiedades de muestra Tabla 108: Propiedades del componente de preparación de datos Propiedad Descripción Tipo de muestra Seleccione el tipo de muestreo. Limitar filas por Seleccione el método para limitar las filas. Número de filas Introduzca el número de filas que desee seleccionar. Porcentaje de filas Introduzca el porcentaje de filas que desee seleccionar. Tamaño del depósito Introduzca el tamaño del depósito en el que desee seleccionar una fila aleatoria. Tamaño de paso Introduzca el intervalo entre las filas que desee seleccionar. Filas máximas Introduzca el número máximo de filas que desee seleccionar. Ejemplo Seleccionar un subconjunto de datos de un conjunto de datos determinado ID del empleado Nombre del empleado Fecha de nacimiento Edad 1 Laura 11/11/1986 25 2 Desi 12/5/1981 30 3 Álex 30/5/1978 33 4 Juan 6/6/1979 32 208 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes ID del empleado Nombre del empleado Fecha de nacimiento Edad 5 Tomás 4/7/1987 24 6 Tobías 30/6/1970 41 7 Anna 24/6/1965 46 8 Valeria 6/7/1990 21 9 María 19/9/1985 26 10 Martín 21/11/1986 25 Salida de muestras: 1. 2. 3. 4. 5. Primeros N: donde N=5 ID del empleado Nombre del empleado Fecha de nacimiento Edad 1 Laura 11/11/1986 25 2 Desi 12/5/1981 30 3 Álex 30/5/1978 33 4 Juan 6/6/1979 32 5 Tomás 4/7/1987 24 ID del empleado Nombre del empleado Fecha de nacimiento Edad 7 Anna 24/6/1965 46 8 Valeria 6/7/1990 21 9 María 19/9/1985 26 10 Martín 21/11/1986 25 ID del empleado Nombre del empleado Fecha de nacimiento Edad 3 Álex 30/5/1978 33 6 Tobías 30/6/1970 41 9 María 19/9/1985 26 Últimos N: donde N=4 Cada N: Intervalo=3 Aleatorización simple: para un número de filas=2 El resultado pueden ser dos filas cualesquiera. ID del empleado Nombre del empleado Fecha de nacimiento Edad 7 Anna 24/6/1965 46 8 Valeria 6/7/1990 21 Aleatorización sistemática: tamaño del depósito=4 Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 209 ID del empleado Nombre del empleado Fecha de nacimiento Edad 2 Desi 12/5/1981 30 6 Tobías 30/6/1970 41 10 Martín 21/11/1986 25 ID del empleado Nombre del empleado Fecha de nacimiento Edad 1 Laura 11/11/1986 25 5 Tomás 4/7/1987 24 9 María 19/9/1985 26 o 15.2.3 Definición del tipo de datos Propiedades que se pueden configurar para el componente de preparación de definición del tipo de datos. Sintaxis Use este componente para cambiar el nombre, el tipo de datos y el formato de fecha desde la columna de origen. Definir los tipos de datos ayuda a preparar los datos para que sean adecuados para un futuro análisis. Por ejemplo: ● Si el nombre de la columna del origen de datos es "des", es posible que no sea claro durante el análisis. Cambie el nombre de la columna a "Designation" en el análisis, de modo que los usuarios finales puedan comprenderlo fácilmente. ● Si la fecha está almacenada con el formato mmddaa (120201, sin separador de fecha), el sistema puede considerarlo como un valor entero. Mediante el componente Definición de tipo de datos, puede cambiar el formato de fecha a cualquier formato válido, como mm/dd/aaaa o dd/mm/aaaa, etc. Para cambiar el nombre, el tipo de datos y el formato de fecha de la columna de origen, realice los siguientes pasos: 1. Agregue el componente de definición de tipo de datos al análisis. 2. En el menú contextual de los componentes, seleccione Configurar propiedades. 3. Para cambiar el nombre de la columna, introduzca un alias para la columna de origen necesaria. 4. Para cambiar el tipo de datos de la columna, seleccione el tipo de datos necesario para la columna de origen. 5. Seleccione Fin. 15.2.4 Filtro Propiedades que se pueden configurar para el componente de preparación de filtros. 210 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Sintaxis Utilice este componente para filtrar filas y columnas basándose en una condición específica. Nota El componente Filtro in-DB no es compatible con las funciones y las expresiones avanzadas. Nota Si modifica la fuente de datos después de configurar el componente de filtro, éste seguirá conservando los filtros de fila definidos con anterioridad. Propiedades de los filtros Tabla 109: Propiedades del componente de preparación de datos Propiedad Descripción Columnas seleccionadas Seleccione las columnas para el análisis. Condición del filtro Introducir la condición del filtro. Ejemplo Filtrar la columna "Tienda" de los datos fuentes y aplicar la condición "Beneficio >2000". Tienda Ingresos Beneficio Hito 10000 1000 Ferrero 20000 4500 Soler 25000 8000 1. Deseleccione la columna "Tienda" de las columnas seleccionadas. 2. En el panel Filtro de fila, seleccione la columna Beneficio. 3. En la opciónSeleccionar desde rango, introduzca 2000 en el cuadro de texto Desde. El cuadro de texto Hasta debe quedar vacío. 4. Seleccione Aceptar. 5. Elija Guardar y cerrar. 6. Ejecute el análisis. Tabla de salida: Ingresos Beneficio 20000 4500 25000 8000 Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 211 Sintaxis Nota El componente de filtro solo es compatible con expresiones que devuelvan un resultado booleano. Por ejemplo, en la tabla Empleado que aparece a continuación: ID del empleado Nombre del Fecha de empleado nacimiento 1 Laura 11/11/1986 2 Desi 3 4 Edad Fecha de Fecha de incorporación confirmación 25 12/9/2005 27/11/2005 12/5/1981 30 24/6/2000 10/7/2000 Álex 30/5/1978 33 10/10/1998 24/10/1998 Juan 6/6/1979 32 2/12/1999 20/12/1999 ● La expresión DÍASENTRE([Fecha de incorporación],[Fecha de confirmación]) no es una expresión de filtro válida, ya que devuelve un valor numérico. El uso correcto de la expresión DAYSBETWEEN en el filtro es DAYSBETWEEN([Fecha de incorporación],[Fecha de confirmación]) == 14. Esta expresión selecciona las filas en las que el número de días entre "Fecha de incorporación" y "Fecha de confirmación" es 14. En la tabla anterior de empleados, se selecciona la tercera fila. ● En cambio, NOMBREDELDÍA([Fecha de incorporación]) == 'Sábado' selecciona la segunda y la tercera fila de la tabla Empleado. Nota Cuando se introduce una cadena literal que contiene comillas simples, cada comilla de la cadena literal debe ir precedida con un carácter de barra inversa (\). Por ejemplo, si desea escribir la palabra "Customer's", deberá escribir "Customer\'s". Nota Cuando se introduce un nombre de columna que contiene corchetes, cada corchete en el interior del nombre de la columna debe ir precedido con un carácter de barra inversa (\). Por ejemplo, si desea escribir [Cliente[Edad]], deberá escribir [Cliente\[Edad\]]. Funciones admitidas Nota El componente de filtro no es compatible con las funciones de manipulación de datos. 212 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Categoría Función (Función cuando se aplica a la Descripción tabla Empleado) Fecha DÍASENTRE Devuelve el número de días entre dos fechas. FECHAACTUAL Devuelve la fecha actual del sistema. MESESENTRE Devuelve el número de meses entre dos fechas. Por ejemplo, la nueva columna contiene 2,0,2,0 cuando se aplica MESESENTRE([Fecha de incorporación],[Fecha de confirmación]) a la tabla Empleado. NOMBREDELDÍA Devuelve el nombre del día en formato de cadena. Por ejemplo, la nueva columna contendrá lunes, sábado, sábado, jueves cuando se aplique NOMBREDELDÍA([Fecha de incorporación]) a la tabla Empleado. NÚMERODEDÍADELMES Devuelve el número del día de un mes determinado. Por ejemplo, la fecha 12/11/1980 devuelve el número 12. NÚMERODEDÍADELASEMANA Devuelve el número de día de una semana. Por ejemplo, domingo=1, lunes=2. NÚMERODEDÍADELAÑO Devuelve el número de día de un año. Por ejemplo, el 1 de enero=1, 1 de febrero=32, 3 de febrero=34. ÚLTIMODÍADELASEMANA Devuelve la fecha del último día de la semana. Por ejemplo, la fecha 12/9/2005 devuelve 17/9/2005 ÚLTIMODÍADELMES Devuelve la fecha del último día del mes. Por ejemplo, la fecha 12/9/2005 devuelve 30/9/2005 NÚMERODEMESDELAÑO Devuelve el número del mes en una fecha. Por ejemplo, enero=1, febrero=2, marzo=3. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 213 Categoría Función (Función cuando se aplica a la Descripción tabla Empleado) NÚMERODESEMANADELAÑO Devuelve el número de semana en un año. Por ejemplo, 12/9/2005 devuelve 38. NÚMERODETRIMESTREDELAFECHA Devuelve el número del trimestre en una fecha. Por ejemplo, 12/9/2005 devuelve 3. Cadena CONCAT Concatena dos cadenas. Por ejemplo, la expresión CONCAT('EE.UU.','Australia') devuelve EE.UU.Australia. ENLACADENA Devuelve el resultado True si se encuentra la cadena buscada en la cadena fuente. Por ejemplo, la expresión ENLACADENA('EE.UU.','EU') devuelve el resultado True. SUBCADENA Devuelve una subcadena de una cadena fuente. Por ejemplo, la expresión SUBCADENA('EE.UU.',1,2) devuelve EE. Matemáticas Expresión condicional MAX Devuelve el valor máximo de una columna. MIN Devuelve el valor mínimo de una columna. CONTAR Devuelve el número de valores de una columna. SUMA Devuelve la suma de los valores de una columna. PROMEDIO Devuelve el promedio de los valores de una columna. IF(condición) THEN(expresión de cadena/expresión matemática/ expresión condicional) ELSE(expresión de cadena/expresión matemática/ expresión condicional) Comprueba si se cumple la condición y devuelve un valor si se cumple ("true") y otro si no se cumple ("false"). Por ejemplo, IF([Fecha de incorporación]>12/9/2005) THEN ('Empleado incorporado después del 12 de septiembre de 2005') ELSE ('Empleado incorporado el o antes del 12 de septiembre de 2005') 214 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Nota Las expresiones matemáticas que contienen funciones que devuelve un valor numérico no son compatibles. Por ejemplo, la expresión NÚMERODEDÍADELMES(FECHAACTUAL())==2 no es compatible porque NÚMERODEDÍADELMES devuelve un valor numérico. Operadores matemáticos Use operadores matemáticos para crear fórmulas para columnas numéricas y/o números. Por ejemplo, la expresión[Edad] + 1 añade una nueva columna con los valores 26,31,34 y 33. Operadores matemáticos Descripción + Operador de adición - Operador de sustracción * Operador de multiplicación / Operador de división () Paréntesis ^ Operador de potencia % Operador de porcentaje E Operador exponencial Operadores condicionales Use los operadores condicionales para crear expresiones IF THEN ELSE o SELECT. Operadores condicionales Descripción == Igual a != No igual a < Menor que > Mayor que <= Menor o igual a >= Mayor o igual a Operadores lógicos Use los operadores lógicos para comparar dos condiciones y obtener un resultado de "true" o "false". Por ejemplo, IF([Fecha de incorporación]>12/9/2005 && [Edad] >=25 ) THEN ('True') ELSE ('False') añade una nueva columna con los valores True, False, False, False. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 215 Operadores lógicos Descripción && Y || O 15.2.5 Normalización Propiedades que se pueden configurar para el componente de preparación de normalizaciones. Sintaxis Use este componente para normalizar los datos de atributo. Los atributos con un valor mayor tienden a tener un peso mayor. La normalización intenta transformar los datos de un rango más grande a uno más pequeño, por ejemplo, [0,1], [-1,1]. Nota La normalización solo muestra las columnas con valores numéricos. El componente de normalización admite los siguientes métodos de normalización: ● Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza cada uno de ellos para ajustarlo a un rango específico. Al realizar la normalización mínima-máxima puede especificar el Nuevo valor máximo y el Nuevo valor mínimo. Esta normalización es útil para asegurar que los valores extremos están limitados dentro de un rango fijo. Nota ○ ● Nuevo valor máximo debe ser superior que el Nuevo valor mínimo. Normalización del resultado Z: Cálculo basado en el medio y la desviación estándar de cada atributo. Esta normalización es útil para determinar si un valor específico está por encima o por debajo del promedio, y por cuánto. ● Normalización de escalado decimal: La coma decimal del valor de cada atributo se desplaza conforme a su valor absoluto máximo. Propiedades de normalización Tabla 110: Propiedades del componente de preparación de datos Propiedad Descripción Seleccionar una columna Seleccione la columna que desee normalizar. Tipo de normalización Seleccione el tipo de normalización. Nuevo máximo Indique el valor del nuevo máximo. El valor predeterminado es 1. 216 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Propiedad Descripción Nuevo mínimo Indique el valor del nuevo mínimo. El valor predeterminado es 0. Ejemplo Normalizar el tiempo utilizado para cubrir una distancia en concreto. Tabla: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 66 Desi 500 360 Álex 500 201 Juan 500 78 Tomás 500 504 Para normalizar la columna de tiempo con la normalización Mínima-Máxima, realice los pasos siguientes: 1. En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos. 2. Arrastre el componente Normalización al editor de análisis o haga doble clic en Normalización. 3. Desde el menú contextual del componente de normalización, seleccione Configurar propiedades. 4. Seleccione la columna que desea normalizar de la lista desplegable Seleccionar una columna. Nota Solo puede seleccionar las columnas con valores numéricos. Por ejemplo, Tiempo (en segundos). 5. Desde la lista desplegable Método de normalización, seleccione Mín-Máx. 6. Indique los valores para el Nuevo máximo y el Nuevo mínimo. En este ejemplo, los valores son 0 y 1 respectivamente. 7. Seleccione Finalizado y, a continuación, Ejecutar. Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 0.05 Desi 500 0.30 Álex 500 0.17 Juan 500 0.06 Tomás 500 0.42 Lleve a cabo los mismos pasos para la normalización del resultado Z y para la normalización del escalado decimal, tal y como se menciona en la normalización Mín-Máx. Sin embargo, en el caso de la normalización del resultado Z y de la normalización del escalado decimal, no es necesario indicar los valores de Nuevo máximo ni de Nuevo mínimo. Salida de la normalización del resultado Z: Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 217 Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 -0.49 Desi 500 1.77 Álex 500 0.55 Juan 500 -0.40 Tomás 500 2.88 Salida de la normalización del escalado decimal: Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 0.01 Desi 500 0.04 Álex 500 0.02 Juan 500 0.01 Tomás 500 0.05 15.2.6 Categorización de HANA Propiedades que se pueden configurar para el componente de preparación de categorización de HANA. Sintaxis La categorización, también conocida como discretización, suaviza un valor de datos ordenado. Divide el rango de una variable numérica en conjuntos de subrangos, denominados almacenajes, y reemplaza cada valor por su número de almacenaje. Realizar el almacenaje de datos antes de ejecutar determinados algoritmos, como el algoritmo de árbol de decisiones, ayuda a reducir la complejidad del modelo. Existen cuatro métodos de categorización: ● Anchos iguales basados en el número de agrupamientos ● Anchos iguales basados en el ancho del agrupamiento ● Igual profundidad ● Desviación del medio Y tres métodos para el suavizado: ● Suavizado por medios de agrupamiento: cada valor de un agrupamiento se reemplaza por un valor de agrupamiento del medio. ● Suavizado por medianas de almacenaje: cada valor de almacenaje se reemplaza por la mediana de almacenaje. ● Suavizado por límites de agrupamiento: los valores máximos y mínimos de un agrupamiento dado se identifican como los límites de agrupamiento. A continuación, cada valor de agrupamiento se reemplaza por el valor de límite más cercano. 218 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Propiedades de la categorización de HANA Tabla 111: Propiedades del componente de preparación de datos Propiedad Descripción Columna independiente Seleccione la columna de origen de entrada en la que desea realizar la categorización. Valores faltantes Seleccione el método para manejar los valores perdidos. Métodos posibles: ● Omitir: el algoritmo omite los registros que contienen va­ lores faltantes en las columnas independientes o depen­ dientes. ● Conservar: conserva los valores que faltan. Método de categorización Seleccione el método de categorización. Número de agrupamientos Introduzca el número de agrupamientos necesarios. Método de suavizado Seleccione el método de suavizado. Nombre de columna agrupada Introduzca un nombre para la nueva columna que contiene números de agrupación. Nombres de columna de valores suavizada Introduzca el nombre de la columna nueva que contiene los valores suavizados. Ejemplo Realizar la categorización de datos en un conjunto de datos Ciudad Temperatura Amsterdam 6 Fráncfort 12 Cantón 13 Ciudad de El Cabo 15 Waldorf 10 Bangalore 23 Bombay 24 Miami 30 Río de Janeiro 32 Sídney 25 Dubai 38 Para realizar el agrupamiento de la columna Temperatura por anchos iguales basado en el número de anchos y aplicar métodos de suavizado por medios, lleve a cabo los siguientes pasos: 1. Arrastre el componente Categorización de HANA al editor de análisis. 2. Haga doble clic en Categorización de HANA o pase el cursor del ratón por encima de Categorización de HANA y seleccione Configurar propiedades. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 219 3. En la lista desplegable Columna independiente, elija una columna, por ejemplo, Temperatura. Nota Solo se pueden seleccionar las columnas que tengan valores en forma de dígito numérico. 4. En la lista desplegable Valores faltantes, seleccione Omitir. 5. En Método de categorización, seleccione Anchos iguales basados en el número de agrupamientos. 6. En el número de agrupamientos, introduzca 4. 7. Seleccione Suavizado obligatorio. 8. En los métodos de suavizado, seleccione Medio de agrupamiento. 9. En Introducir nombre para la columna agregada recientemente, en Nombre de columna agrupada, introduzca Agrupamiento de temperatura. Nota Puede dar un nombre a la columna según sus preferencias o requisitos de análisis. Esta columna contiene el valor agrupado. 10. En Introducir nombre para la columna agregada recientemente, en Columna suavizada, introduzca Suavizado de temperatura. Nota Puede dar un nombre a la columna según sus preferencias o requisitos de análisis. Esta columna contiene el valor suavizado. Tabla de salida: Ciudad Temperatura Agrupamiento de temperatura Suavizado de temperatura Amsterdam 6 1 8.0 Fráncfort 12 2 13.33333 Cantón 13 2 13.33333 Ciudad de El Cabo 15 2 13.33333 Waldorf 10 1 8.0 Bangalore 23 3 25.5 Bombay 24 3 25.5 Miami 30 3 25.5 Río de Janeiro 32 4 35.0 Sídney 25 3 25.5 Dubai 38 4 35.0 15.2.7 Normalización de HANA Propiedades que se pueden configurar para el componente de preparación de normalización de HANA. 220 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Sintaxis Use este componente para normalizar los datos de atributo. La normalización de HANA escala los grandes datos de atributo de valor para que entren en un rango específico, como -1.0 a 1.0, o 0.0 a 1.0. Puede usar este componente para el análisis en base de datos. La normalización de datos es útil para los algoritmos de clasificación que implican redes neurales, o medidas de distancia, como la clasificación y agrupamiento en clúster de los vecinos más cercanos. Nota Si desea que los datos procesados reemplacen la columna existente, seleccione Reemplazar columna. El componente de normalización admite los siguientes métodos de normalización: ● Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza cada uno de ellos para ajustarlo a un rango específico. Al realizar la normalización mínima-máxima puede especificar el Nuevo valor máximo y el Nuevo valor mínimo. Esta normalización es útil para asegurar que los valores extremos están limitados dentro de un rango fijo. Nota ○ ● Nuevo valor máximo debe ser mayor que Nuevo valor mínimo. Normalización del resultado Z: cálculo basado en el medio y la desviación estándar de cada atributo. Esta normalización es útil para determinar si un valor específico está por encima o por debajo del promedio, y por cuánto. ● Normalización de escalado decimal: La coma decimal de los valores de cada atributo se desplaza conforme a su valor absoluto máximo. Nota Puede seleccionar Reemplazar columna, si desea que los datos normalizados reemplacen los datos de la columna existentes, en los que se lleva a cabo la normalización. Ejemplo Normalizar el tiempo utilizado para cubrir una distancia en concreto. Tabla: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 66 Desi 500 360 Álex 500 201 Juan 500 78 Tomás 500 504 Para normalizar la columna de tiempo con la normalización Mínima-Máxima, realice los pasos siguientes: 1. En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos. 2. Arrastre el componente Normalización HANA al editor de análisis o haga doble clic en Normalización HANA. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 221 3. Haga doble clic en Normalización de HANA o pase el puntero del ratón por encima de Normalización de HANA y seleccione Configurar propiedades. 4. Seleccione las columnas que desee normalizar. Nota Solo puede seleccionar las columnas con valores numéricos. Por ejemplo, Tiempo (en segundos). 5. Desde la lista desplegable Tipo de normalización, seleccione Mín-Máx. 6. Introduzca los valores para Nuevo máximo y Nuevo mínimo. 7. Seleccione Finalizado y, a continuación, Ejecutar. Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Tiempo (en segundos)_Normalizado Laura 500 66 0.05 Desi 500 360 0.30 Álex 500 201 0.17 Juan 500 78 0.06 Tomás 500 504 0.42 Lleve a cabo los mismos pasos para la normalización del resultado Z y para la normalización del escalado decimal, tal y como se menciona en la normalización Mín-Máx. Sin embargo, en el caso de la normalización del resultado Z y de la normalización del escalado decimal, no es necesario indicar los valores de Nuevo máximo ni de Nuevo mínimo. Salida de la normalización del resultado Z: Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 -0.49 Desi 500 1.77 Álex 500 0.55 Juan 500 -0.40 Tomás 500 2.88 Salida de la normalización del escalado decimal: Tabla de salida: Nombre Distancia (en metros) Tiempo (en segundos) Laura 500 0.01 Desi 500 0.04 Álex 500 0.02 Juan 500 0.01 222 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Nombre Distancia (en metros) Tiempo (en segundos) Tomás 500 0.05 15.2.8 Partición HANA Propiedades que se pueden configurar para el componente de preparación de partición de HANA. Sintaxis El componente de partición HANA divide un conjunto de datos de entrada en tres subconjuntos discontinuos llamados conjuntos de formación, comprobación y validación. La proporción de cada subconjunto se define como un parámetro. La unión de tres subconjuntos no tiene que ser el conjunto inicial de datos completo. Usted puede dividir el conjunto de datos utilizando los siguientes métodos de partición: ● Partición aleatoria, que divide todos los datos aleatoriamente. ● Partición estratificada, que divide cada subcategoría aleatoriamente. En el segundo caso, el conjunto de datos debe tener como mínimo un atributo categórico (por ejemplo, de tipo varchar). El conjunto de datos inicial se subdivide según los diferentes valores categóricos de este atributo. Cada subconjunto mútuamente exclusivo se divide de forma aleatoria para obtener conjuntos de formación, comprobación y validación. Esto garantiza que todos los "valores categóricos" o "estratificaciones" estén presentes en el subconjunto de ejemplo. Propiedades de partición HANA Tabla 112: Propiedades del componente de preparación de datos Propiedad Descripción Método de partición Seleccione el método para efectuar la partición de datos en conjuntos de formación, comprobación y validación. ● Aleatorio ● Estratificado Muestreo aleatorio Introduzca un muestreo aleatorio que desee utilizar para reali­ zar el cálculo. Efectuar partición de filas según Seleccione el método para efectuar la partición de filas. ● Porcentaje de filas ● Número de filas Conjunto de formación Introduzca el número de filas o el porcentaje de filas para el conjunto de formación. Conjunto de comprobación Introduzca el número de filas o el porcentaje de filas para el conjunto de comprobación. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 223 Propiedad Descripción Conjunto de validación Introduzca el número de filas o el porcentaje de filas para el conjunto de validación. Nombre de columna de partición Introduzca un nombre para la columna nueva que contiene los valores con partición. Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo para la ejecución. 15.3 Grabadores de datos Use los grabadores de datos para almacenar los resultados de los análisis en archivos planos o bases de datos para su análisis posterior. 15.3.1 CSV Writer Propiedades que se pueden configurar para CSV Writer. Sintaxis Use este componente para escribir datos en archivos planos como archivos CSV, TEXT y DAT. Propiedades de CSV Writer Tabla 113: Propiedades del grabador de datos Propiedad Descripción Nombre de archivo Seleccione la ruta de archivos e introduzca el nombre del ar­ chivo .csv, .dat o .txt. Sobrescribir si existe Seleccione esta opción para sobrescribir un archivo existente. Separador de columnas Seleccione un delimitador de columnas que separe los tokens de datos del archivo. Introducir carácter de comillas sencillas Seleccione el carácter para reemplazar los separadores de columna mientras escribe los datos. Incluir encabezados de columna Seleccione esta opción para usar la primera fila como encabe­ zado de columna. Codificación Seleccione el método de codificación de texto para escribir los datos. 224 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Propiedad Descripción Separador de decimales Seleccione el carácter para la representación decimal en la agrupación de dígitos. Separador de agrupaciones Seleccione el carácter para el separador de miles. Formato de número Introduzca el formato de número que desea aplicar a los da­ tos numéricos. Formato de fecha y hora Seleccione el formato de fecha que desea aplicar a las fechas. 15.3.2 JDBC Writer Propiedades que se pueden configurar para JDBC Writer. Sintaxis Use este componente para escribir datos en bases de datos relacionales, como MySQL, MS SQL Server, DB2, Oracle, SAP MaxDB y SAP HANA. Propiedades de JDBC Writer Tabla 114: Propiedades del grabador de datos Propiedad Descripción Tipo de base de datos Seleccione el tipo de base de datos. Ruta del controlador de base de datos Introduzca la ubicación de la ruta del controlador JDBC. Por ejemplo, para escribir en la base de datos de Oracle, debe es­ pecificar la ubicación del archivo jar JDBC de Oracle (C: \ojdbc6.jar) Nombre de base de datos de equipo Introduzca el nombre del equipo en el que está instalada la base de datos. Número de puerto Introduzca el número de puerto de la base de datos o del ser­ vicio. Nombre de base de datos Introduzca el nombre de la base de datos. Nombre de usuario Introduzca el nombre de usuario de la base de datos. Contraseña Introduzca la contraseña para el usuario de la base de datos. Tipo de tabla Introduzca el tipo de tabla. Esta propiedad se aplica al escribir en la base de datos de SAP HANA. Nombre de tabla Introduzca el nombre de la tabla. Sobrescribir si existe Seleccione esta opción para sobrescribir la tabla si ya existe. Manual de usuario de Expert Analytics Propiedades de los componentes PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 225 15.3.3 HANA Writer Propiedades que se pueden configurar para HANA Writer. Sintaxis Use este componente para escribir datos en tablas de bases de datos SAP HANA. Componente HANA Writer Tabla 115: Propiedades del grabador de datos Propiedad Descripción Nombre de esquema Seleccione un esquema. Tipo de tabla Seleccione el tipo de tabla para la tabla en la que desea escri­ bir los datos. Nombre de tabla Indique un nombre para la tabla. Sobrescribir si existe Seleccione esta opción para sobrescribir la tabla si ya existe. 15.4 Modelos Los modelos que cree guardando el estado de los algoritmos se muestran en forma de lista en la sección Modelos de la lista Componentes. Expert Analytics no contiene modelos predefinidos. Por tanto, a no ser que ya haya grabado un algoritmo configurado como modelo, la sección Modelos estará vacía. Información relacionada Crear un modelo [página 130] 226 PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Manual de usuario de Expert Analytics Propiedades de los componentes Limitaciones de responsabilidad y aspectos legales Ejemplos de codificación Cualquier codificación de software y/o líneas de códigos / cadenas ("Código") incluidas en esta documentación son solo ejemplos y no se prevé que se utilicen en un entorno de sistema productivo. El Código tiene el único propósito de explicar y permitir la visualización de las reglas de sintaxis y de asignación de frases de cierta codificación. SAP no ofrece garantías respecto a la exactitud y la integridad del Código disponibilizado en este documento y no será responsable de errores o daños causados por el uso del Código, a menos que los daños sean causados por SAP de forma intencional o por una imprudencia grave por parte de SAP. Accesibilidad La información contenida en la documentación de SAP representa la visión actual de SAP de los criterios de accesibilidad a partir de la fecha de publicación. No se prevé que sea una directriz vinculante sobre cómo garantizar la accesibilidad de los productos de software. SAP renuncia a cualquier responsabilidad en relación con este documento. Sin embargo, este documento no se aplica en casos de un error deliberado o una negligencia grave por parte de SAP. Además, este documento no supone ningún compromiso u obligación contractual directos o indirectos. Lenguaje neutro respecto al género Siempre que sea posible, la documentación de SAP es neutra respecto al género. Dependiendo del contexto, se trata al lector directamente de "usted" o se utiliza un nombre neutro respecto al género (como "vendedor/a" o "días laborables"). Sin embargo, si al referirse a los miembros de ambos sexos, no se puede evitar el uso de la tercera persona del singular o no existe un nombre neutro respecto al género, SAP se reserva los derechos para utilizar la forma masculina del nombre o pronombre. Esto es para garantizar que la documentación sea comprensible. Hipervínculos de Internet La documentación de SAP puede contener hipervínculos a Internet. Se prevé que estos hipervínculos sirvan como un consejo acerca de dónde encontrar la información relacionada. SAP no garantiza la disponibilidad y la exactitud de esta información relacionada o la capacidad que esta información sirva un objetivo en particular. SAP no es responsable de ningún daño causado por el uso de la información relacionada a menos que los daños se hayan causado por una imprudencia grave o por una conducta fraudulenta dolosa por parte de SAP. Todos los enlaces están categorizados para su transparencia (consulte: http://help.sap.com/disclaimer). Manual de usuario de Expert Analytics Limitaciones de responsabilidad y aspectos legales PUBLIC © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. 227 www.sap.com/contactsap © 2015 SAP SE o una empresa filial de SAP. Reservados todos los derechos. Queda prohibida la reproducción o transmisión de cualquier parte de esta publicación, en cualquier forma o para cualquier fin, sin el permiso expreso de SAP SE o de una empresa filial de SAP. La información que aquí se incluye puede modificarse sin previo aviso. Algunos productos de software comercializados por SAP SE y sus distribuidores contienen componentes de software con derechos de autor de otros proveedores de software. Las especificaciones de productos en cada país pueden ser diferentes. SAP SE o una empresa filial de SAP SE proporcionan estos materiales con fines meramente informativos, sin manifestación ni garantía de ningún tipo. Ni SAP SE ni sus empresas filiales se hacen responsables de los errores u omisiones en relación con los materiales. Las únicas garantías para los productos y servicios de SAP SE o de sus empresas filiales son aquellas especificadas en las cláusulas expresas de garantía que acompañan a dichos productos y servicios, si las hubiera. Nada de lo que se incluye en este documento debe interpretarse como garantía adicional. SAP y los productos y servicios de SAP mencionados, así como sus respectivos logotipos, son marcas comerciales o marcas registradas de SAP SE (o de una empresa filial de SAP) en Alemania y en otros países. Todos los nombres y servicios de productos son las marcas comerciales de sus respectivas empresas. Consulte http://www.sap.com/corporate-en/legal/copyright/ index.epx para obtener información y avisos adicionales sobre marcas comerciales.