Bibliografía




descargar 140 Kb.
títuloBibliografía
página1/4
fecha de publicación17.01.2016
tamaño140 Kb.
tipoBibliografía
b.se-todo.com > Documentos > Bibliografía
  1   2   3   4




¿Quién quiere oro, cuando se tienen datos?

La evolución informativa parece no tener fin.




INTEGRANTES: Rodolfo González

Ítalo Jara

Tamara Navarrete

Ariel Mella






Data Mining, la búsqueda de formas de cómo interpretar datos de manera inteligente, es una poderosa alternativa para poder extraer información y a esta darle un uso a un nivel más alto. Preparando, escaneando y seleccionando, el Data Mining nos ofrece opciones muy útiles a la hora de hacer análisis de nuestros datos, siendo capaz de “ver lo que no se ve” debido a que esta técnica rescata de las bases de datos lo que está implícito en ellas, así se aprovecha mejor lo que estas contienen.

El proceso se desarrolla de manera detallada sin embargo rápidamente, comienza con una selección de datos, seguido del análisis de estos, y aquí entra de lleno el Data Mining, es en este paso donde se debe elegir una técnica de uso (especificadas en el interior de este informe) con la cual extraeremos conocimiento y tendremos evaluaciones de los datos

INDICE

Introducción……………………………………………………………………………4

Historia………………………………………………………………………………….5

¿Qué es el Data Mining?......................................................................................6

Descubrimiento del conocimiento (KDD)…………………………………………...8

Data Warehousing…………………………………………………………………….9

Herramientas del Data Mining……………………………………………………….10

Proceso de Extracción del Conocimiento…………………………………………..11

Sobre los Datos………………………………………………………………………...13

Tipos de Modelos de Minería………………………………………………………....14

Técnicas de Minería de Datos………………………………………………………..16

Extensiones del Data Mining…………………………………………………………19

Aplicaciones de la Minería de Datos…………………………………………………21

Proyecciones a futuro del Data Mining………………………………………………36

Conclusión……………………………………………………………………………...37

Bibliografía……………………………………………………………………………...38

INTRODUCCION

A medida que pasa el tiempo, las necesidades del ser humano van aumentando de una manera bastante alarmante. Solo basta con realizar un corto flash back hasta alguno de los periodos más trascendentales vividos por la humanidad como por ejemplo, la revolución industrial donde se estableció una gran cantidad de trasformaciones socioeconómicas y tecnológicas para aumentar los niveles en términos de producción y beneficios, además de poder sustentar las necesidades de las personas, que crecían conforme al aumento de la población. Así como en este periodo de la historia al igual que muchos otros, existe un factor común dentro de la industrialización, del cual no nos podemos exentar y siempre estamos expuestos, nos referimos a la infinidad de necesidades existentes sobre todo en el ámbito empresarial. En donde se requiere un uso adecuado de la información e inmensidad de datos presentes para que de esta manera se pueda optimizar los procesos y mejorar de esta manera el rendimiento a nivel industrial.

A continuación en el informe presentaremos una de las más sofisticadas herramientas de las cuales disponemos para generar y recolectar datos, la cual posee una gran importancia en materias de información, nos referimos al Data Mining.

UN POCO DE HISTORIA

Al hablar del Data Mining, no nos referimos a un concepto explícitamente contemporáneo, realmente las primeras ideas que se tienen acerca de este proceso se revocan ya hasta mediados los años setenta donde se buscaba encontrar correlaciones en bases de datos, pero no fue hasta finales de los ochenta cuando se comenzó a consolidad la idea de Data Mining y KDD (Knowledge Discovery and Data Mining).

Ya a mediados de la década de 1990 se hizo notar el impacto de grandes cantidades de datos acumulados y las dificultades de interpretarlos de un modo productivo, lo que llevó al desarrollo de novedosas técnicas de Data Mining y análisis inteligente de datos.

Ahora bien, actualmente es prioritario el uso de este tipo de herramientas en las empresas que necesitan identificar oportunidades y retener a sus clientes a partir del buen uso de la información, es más, hoy en día no sería exagerar el hecho de afirmar que más de la mitad de las empresas alrededor de todo el mundo utilizan este tipo de herramientas de análisis.

En fin, podemos observar que estamos frente a un proceso de gran importancia a nivel informático y que sin duda alguna será aun más relevante a medida que trascurre el tiempo.

¿QUE ES EL DATA MINING?

En la más pura base de la definición como concepto, podemos referirnos al termino Data Mining como un proceso de identificación de patrones que se encuentran ocultos en los datos, es decir, es una herramienta que recopila las ventajas de diversas áreas como lo son la estadística, la inteligencia artificial, la computación grafica y el procesamiento masivo, la cual usa como materia prima las bases de datos para encontrar patrones y relaciones dentro de los datos, permitiendo de esta manera la creación de modelos, representaciones abstractas de la realidad y la representación de los datos obtenidos.

¿Qué sucedería si adoptamos herramientas de bases de datos que nos digan que hacer, según las informaciones que ellas presentan?

Esta simple pregunta nos lleva a insertarnos en el concepto de Data Mining o minería de datos y a investigar las técnicas que este conlleva.

Para poder generar una idea general del significado y aplicación de esta herramienta, consideremos un problema el cual puede solucionarse a través de la información generada:

-Supongamos que usted es el gerente de mercadeo de una compañía de telefonía celular. El problema considera los siguientes aspectos claves:

  • La deserción de clientes es muy alta.

  • La producción (después de que el contrato expira) es del 40%.

  • Los clientes reciben un teléfono de regalo con el contrato.

  • Se le da un teléfono nuevo a cada persona cuyo contrato ha expirado, lo cual es muy caro y por ende poco rentable para la empresa.

  • Traer de regreso a un cliente después que se va, es difícil y caro.

Existen diversas soluciones que podemos aplicar a esta clase de problemáticas, las cuales no necesariamente pueden requerir el uso de él Data Mining para su resolución, pero ya que nuestro principal objetivo dentro de este trabajo es dar una orientación de la aplicación de esta herramienta en diversos procesos, nos referiremos solamente a la solución que es posible obtener a partir de su uso:

Posibles soluciones:

  • Se debe predecir que clientes abandonarán la compañía tres meses antes que el contrato expire.

  • Si queremos conservar a un cliente que creamos abandonara la empresa, se le debería ofrecer un nuevo teléfono.

  • Interactuar dinámicamente con el cliente.

Estas son algunas de las muchas resoluciones que pueden existir, ahora bien para todos los casos hábiles uno se pregunta, pero ¿De qué manera puedo llegar a tales conclusiones con el uso de esta herramienta? Dentro del desarrollo de este informe se irá explicando cada uno de los pasos a seguir para poder comprender el uso del Data Mining. A demás incluiremos una corta reseña sobre algunas técnicas en el proceso para optimizar los resultados.

Otro ejemplo del uso del Data Mining es:

Supongamos el siguiente contexto:

Un supermercado “Líder” en donde se requiere aumentar el nivel de consumo en los usuarios. Para este caso utilizaremos la minería de datos para obtener valiosa información que aplicaremos de la mejor manera posible para aumentar las ganancias de la empresa. Dado el caso logramos descubrir que un gran porcentaje de los usuarios al comprar artículos como lo son los confites, y acompañamientos de tipo coctel, llevan consigo a demás bebidas alcohólicas como lo son las cervezas.

Debido a esta valiosa información, a un ingeniero se le ocurre la idea de colocar un stand de cervezas junto al pasillo de artículos de coctel y confitería. A su vez el resultado no se hace esperar y al cabo de poco tiempo las ventas de bebidas alcohólicas aumentan en gran medida.

Cabe destacar que esta es una mirada bastante simple del Data Mining, no obstante nos detendremos para explicar cada una de las etapas que este conlleva, ya que como hemos mencionado e incluso podemos observar en los ejemplos, es una herramienta de gran utilidad si la aplicamos correctamente.

DESCUBRIMIENTO DEL CONOCIMIENTO (KDD)

Este se define como “La extracción no trivial de información potencialmente útil a partir de un gran volumen de datos, en el cual la información está implícita, en donde se trata de interpretar grandes cantidades de datos y encontrar relaciones o patrones, para conseguirlo harán falta técnicas de aprendizaje, estadística y bases de datos”. (Molina, 2001)

Las tareas comunes en KDD son la inducción de reglas, los problemas de clasificación y clustering, el reconocimiento de patrones, el modelado predictivo, la detección de dependencias, etc.

Este involucra un proceso iterativo e interactivo, de búsqueda de modelos, patrones o parámetros, los cuales descubiertos deben ser validos, novedosos para el sistema y potencialmente útiles. Todo esto a través de algoritmos.

Regularmente los algoritmos de Data Mining deben tener 3 componentes principales:

  • El modelo, que contiene parámetros que han de fijarse a partir de los datos de entrada.

  • El criterio de preferencia, que sirve para comparar modelos alternativos.

  • El algoritmo de búsqueda, que viene a ser como cualquier otro programa de inteligencia artificial.

El criterio de preferencia suele ser algún tipo de heurística y los algoritmos de búsqueda empleados suelen ser los mismos que en otros programas de inteligencia artificial. Las principales diferencias entre algoritmos de Data Mining se hallan en el modelo de representación escogido y la función del mismo, es decir, según el objetivo perseguido.

DATA WAREHOUSING

Antes de comenzar a indagar de lleno en el proceso del Data Mining, debemos hacer un pequeño repaso de este concepto, el cual nos ayudará a comprender de mejor manera el proceso que se lleva a cabo en la minería d datos.

El Data Warehouse es en si la base del Data Mining (aunque no siempre es así), el cual consiste en un almacén de datos categorizados, que concentra una gran cantidad de información de interés para toda una organización, la cual se distribuye por medio de diversas herramientas de consulta orientadas a la toma de decisiones.

Su principal propósito es el de agrupar los datos, de tal manera que luego al ser utilizados con un fin analítico, sean fáciles de manejar y acceder.

A este tipo de datos se les menciona normalmente como “Informativos” y son manejados por un sistema llamado OLAP (Online Analytical Processing).

En resumen podemos decir que un Data Warehouse “es una colección de datos orientados a temas, integrados, no-volátiles y variante en el tiempo, organizados para soportar necesidades empresariales.” (Bill Inmon, 1992.)

Las ventajas de un Data Warehouse son:

  • Gran poder de procesamiento de la información.

  • Facilita la toma de decisiones en los negocios.

  • Proporciona una mejor comunicación entre todos los departamentos de la empresa.

  • Proporciona información de gestión accesible, correcta, uniforme y actualizada.

  • Mejora el servicio hacia los clientes.

  • Permite el rediseño de los procesos.

HERRAMIENTAS DE DATA MINING

Las herramientas de Data Mining empleadas en el proceso de KDD se pueden clasificar en dos grandes grupos:

  • Técnicas de verificación, en las que el sistema se limita a comprobar una hipótesis suministrada por el usuario.

  • Métodos de descubrimiento, en los que se han de encontrar patrones potencialmente interesantes de forma automática, incluyendo en este grupo todas las técnicas de predicción.

El resultado obtenido con la aplicación de algoritmos de Data Mining pertenecientes al segundo grupo, el de técnicas de descubrimiento, puede ser de carácter descriptivo o predictivo. Las predicciones sirven para prever el comportamiento futuro de algún tipo de entidad mientras que una descripción puede ayudar a su comprensión

Regularmente las técnicas de Data Mining e grandes bases de datos persiguen los siguientes resultados:

  • Clasificación: Se trata de obtener un modelo que permita asignar un caso de clase desconocida a una clase concreta (como lo son los arboles de clasificación “CART”) cuyos resultados pueden expresarse mediante reglas ejecutables directamente por el método bayesiano.

  • Regresión: Se persigue la obtención de un modelo que permita predecir el valor numérico de alguna variable.

  • Agrupamiento: Hace corresponder cada caso a una clase, con la peculiaridad de que las clases se obtienen a partir de los datos de entrada utilizando medidas de similaridad.

  • Resumen: Se obtienen representaciones compactas para sub conjuntos de los datos de entrada.

  • Modelo de dependencias: Se obtienen descripciones de dependencia existente entre variables.

  • Análisis de secuencias: Se intenta modelar la evolución temporal de alguna variable, con fines descriptivos o predictivos.

PROCESOS DE EXTRACCION DE EL CONOCIMIENTO

1.- Integración y recopilación:

  • Primero se determinan las fuentes de información útiles.

  • Se unifican todas las fuentes de datos (Diseñar el Data Warehouse)

  • Los datos deben presentarse en una tabla plana llamada “vista minable”.

2.- Selección, Limpieza y Trasformación:

  • Selección de la vista minable.

  • Se eliminan todos los datos que quedan aislados.

  • Se realiza una nueva búsqueda para recopilar los datos faltantes.

  • Elección de las variables.

  • Discretización y Numeración. (La discretización es la conversión de un valor numérico en un valor nominal ordenado, en cambio la numeración es el proceso inverso a la discretización).

3.- Minería de Datos:

Esta fase del proceso se subdivide a su vez en 2 fases de gran importancia. Las cuales nombraremos sin entrar en más detalles en esta sección:

*Tareas:

  • Predictivas: clasificación y regresión.

  • Descriptivas: agrupamiento, reglas de asociación y correlaciones.

*Técnicas:

  • Inferencia Estadística.

  • Arboles de Decisión.

  • Redes Neuronales.

  • Introducción de reglas.

  • Aprendizaje Bayesiano.

  • Entre otras.

4.- Evaluación e Interpretación:

  • Técnicas de evaluación.

  • Combinación de modelos.

  • Interpretación, Difusión y uso de modelos.

5.- Obtención del conocimiento

  • Correcta aplicación de la información obtenida (Esta fase queda en manos de analistas de negocios bien entrenados)

Fin Proceso.
  1   2   3   4

similar:

Bibliografía icon3. Bibliografía citada en estos apuntes y bibliografía adicional

Bibliografía iconBibliografía. Consigna los libros de los cuales se extrajeron las...

Bibliografía icon7. Bibliografía Bibliografía citada

Bibliografía iconBibliografía

Bibliografía iconBibliografía

Bibliografía iconBibliografía

Bibliografía iconBibliografía 2

Bibliografía iconBibliografía

Bibliografía iconBibliografía. 72

Bibliografía iconBibliografía XL




Todos los derechos reservados. Copyright © 2015
contactos
b.se-todo.com