Minería de Datos para Control de Calidad en el Sector del Automóvil




descargar 29.23 Kb.
títuloMinería de Datos para Control de Calidad en el Sector del Automóvil
fecha de publicación26.10.2016
tamaño29.23 Kb.
tipoDocumentos
b.se-todo.com > Derecho > Documentos
EJEMPLO 1:
Minería de Datos para Control de Calidad en el Sector del Automóvil
NOMBRE DEL PROYECTO Aplicación de minería de datos para control de calidad de cajas de cambio
SECTOR Industria – Automóvil
OBJETIVO Desarrollo de un sistema de diagnóstico automático para detección de cajas de cambio defectuosas
DESCRIPCIÓN

Durante las pruebas de control de calidad de los productos fabricados industrialmente, se inspeccionan diferentes parámetros para detectar fallos del material, fallos de producción, fallos de ensamblaje o ruidos extraños durante el funcionamiento. En el caso de las cajas de cambio, todas las unidades producidas por un fabricante de automóviles son evaluadas acústicamente por especialistas humanos. Las pruebas acústicas de estos componentes permiten seleccionar los componentes válidos e identificar los componentes defectuosos por sus patrones acústicos característicos.

Debido a la compleja estructura de una caja de cambio, el elevado número de componentes móviles y la influencia de diferentes estados operativos, es necesario analizar un gran número de características acústicas, extraídas de las señales medidas. Para ayudar y, finalmente, automatizar la decisión del inspector humano, se ha desarrollado un sistema clasificador borroso.

El principal problema del diseño del clasificador es la cantidad de características a examinar (149). En estas condiciones, una aproximación basada en una implementación directa, “a mano”, del conocimiento de los expertos sería poco eficiente respecto al tiempo necesario y requeriría además entender muy bien el proceso. Pese a los inconvenientes, con esta opción pueden obtenerse soluciones válidas, pero los problemas de complejidad del diseño hacen que este método resulte inviable, en general, y que se opte por alternativas más eficientes.

Una aproximación alternativa consiste en aplicar técnicas de minería de datos para generar de forma automática el clasificador a partir de los datos extraídos de una serie de ejemplos. Analizando las señales de una muestra de objetos, que incluye ejemplos tanto de componentes en buen estado como defectuoso, es posible extraer una base de reglas de diagnóstico, sin necesidad de conocimiento del proceso.

En este caso, limitando las combinaciones a un máximo de 6 expresiones, el número total de reglas posibles es del orden de 1017, imposible de comprobar íntegramente. Aplicando métodos de minería de datos, se han analizado las características de 1060 ejemplos (1000 correspondientes a objetos en buen estado y 60 a casos defectuosos) para generar una base de varios miles de reglas con la que se clasifican correctamente todos los ejemplos. Mediante diferentes técnicas, esta base de reglas puede reducirse para obtener un sistema de diagnóstico de menor tamaño y más comprensible. El clasificador obtenido finalmente consta de menos de un centenar de reglas, manteniendo el porcentaje de diagnósticos correctos en el 100% para los casos utilizados como ejemplos y con un porcentaje de aciertos del 92% cuando se utiliza para clasificar datos nuevos.
Este sistema ha sido desarrollado por Daimler Benz AG y la Faculty of Electrical Engineering (University of Dortmund) utilizando Winrosa. Winrosa es distribuido en España por DAEDALUS – Data, Decisions and Language, S.A. Nuestro departamento de Ingeniería está a su disposición para desarrollar proyectos como éste.
Fuente bibliográfica

© DAEDALUS – Data, Decisions and Language, S.A.

Centro de Empresas La Arboleda - Ctra. N-III, Km. 7,300 Madrid - E-28041

Tel: (+34) 91.332.43.01 - Fax: (+34) 91.331.97.40

Email: info@daedalus.es - http://www.daedalus.es

C-55-EJ-6012-000

Caso 14
EJEMPLO 2:

Bioinformática

La Bioinformática se encuentra en la intersección entre las ciencias de la vida y de la información, proporciona las herramientas y recursos necesarios para favorecer la investigación biomédica. Como campo interdisciplinario, comprende la investigación y el desarrollo de sistemas útiles para entender el flujo de información desde los genes a las estructuras moleculares, su función bioquímica, su conducta biológica y, finalmente, su influencia en las enfermedades y en la salud.5

Los estímulos principales para el desarrollo de la Bioinformática son:

  • El enorme volumen de datos generados por los distintos proyectos denominados genoma (humano y de otros organismos).

  • Los nuevos enfoques experimentales, basados en biochips, que permiten obtener datos genéticos a gran velocidad, bien de genomas individuales (mutaciones, polimorfismos) de enfoques celulares (expresión génica).

  • El desarrollo de Internet, que permite el acceso universal a las bases de datos de información biológica.

La magnitud de la información que genera las investigaciones realizadas sobre el genoma humano es tal que, probablemente, supera la generada por otras investigaciones en otras disciplinas científicas.

Como se sabe, la vida es la forma más compleja de organización de la materia que se conoce. En estos momentos, los ordenadores no clasificados para uso civil más potentes del mundo (en Celera y en Oak Ridge National Laboratory, por ejemplo, con una capacidad de cálculo cercana a los 2 Teraflops, billones de operaciones por segundo) están dedicados a la investigación biológica, concretamente a la obtención y al análisis de las secuencias de nucleótidos de los genomas conocidos.

Ante tal situación, uno de los retos de la Bioinformática es el desarrollo de métodos que permitan integrar los datos genómicos –de secuencia, de expresión, de estructura, de interacciones, etc. – para explicar el comportamiento global de la célula viva, minimizando la intervención humana. Dicha integración, sin embargo, no puede producirse sin considerar el conocimiento acumulado durante decenas de años, producto de la investigación de miles de científicos, recogido en millones de comunicaciones científicas.

La Bioinformática se ocupa de la utilización y almacenamiento de grandes cantidades de información biológica, es decir, trata del uso de las computadoras para el análisis de la información biológica, entendida esta como la adquisición y consulta de datos, los análisis de correlación, la extracción y el procesamiento de la información. En otras palabras, la Bioinformática es un área del espacio que representa la biología molecular computacional, que incluye la aplicación de las computadoras y de las ciencias de la información en áreas como la geonómica, el mapeo, la secuencia y determinación de las secuencias y estructuras por métodos clásicos. Las metas fundamentales de la Bioinformática son la predicción de la estructura tridimensional de las proteínas a partir de su secuencia, la predicción de las funciones biológicas y biofísicas a partir de la secuencia o la estructura, así como simular el metabolismo y otros procesos biológicos basados en esas funciones. Muchos de los métodos de la computación y de las ciencias de la información sirven para estos fines, incluyendo el aprendizaje de las máquinas, las teorías de la información, la estadística, la teoría de los gráficos, los algoritmos, la inteligencia artificial, los métodos estocásticos, la simulación, la lógica, etc.

En la reunión Chips to Hits ’99, donde hubo representantes de compañías de software como Lion Biosciences, Informax, Molecular Applications Group o Gene Logic, de empresas farmacéuticas como Bristol-Myers y del National Cancer Institute del gobierno estadounidense, se comentó que actualmente uno de los cuellos de botella de los ensayos con tecnologías basadas en biochips se encuentra en la carencia de herramientas bioinformáticas adecuadas para el análisis y gestión de los datos, debido a los enormes volúmenes de datos que ellos generan. Asimismo, se resaltó la necesidad de emplear las técnicas de la minería de datos, como la mejor forma de obtener conocimientos a partir de los resultados experimentales.

“El reto en la construcción de bases de datos es el establecimiento de una arquitectura que permita la realización de búsquedas inteligentes, la comunicación con otras bases de datos y la unión con herramientas de análisis y de minería de datos, específicas, que permitan responder a problemas biológicos concretos. Los científicos, encargados de la  construcción de estas bases de datos, deben disponer de conocimientos previos que permitan determinar cuáles problemas científicos concretos necesitan una solución y cuál o cuáles métodos son los mejores para resolverlos”.  Así se declara en el artículo “Qué es la Bioinformática” publicado por BIOTIC. Y en la propia publicación del Instituto Carlos III de Madrid, España, se afirma: “Se necesitan herramientas para gestionar información genética en paralelo. Para ello se emplean nuevas tecnologías de extracción de conocimientos, minería de datos y visualización. Se aplican técnicas de descubrimiento de conocimientos a problemas biológicos como análisis de datos del genoma y el proteoma.”7 

En estos momentos, la mayoría de los proyectos que se desarrollan en el mundo en materia de genómica y proteómica, demandan la aplicación de técnicas de la minería de datos para poder determinar qué es realmente importante dentro del enorme volumen de información que se genera diariamente en el mundo. Considérese que el número total de letras (pares de bases químicas) del ADN humano ha resultado ser de 3.120 millones. El Proyecto Genoma Humano aseguró que, a los 10 años de su creación, ha terminado un primer borrador de la secuencia y completado el 85 % del ensamblaje. De los 3.120 millones de datos que componen el «libro de la vida», los científicos han encontrado que el 99,8 % son idénticos para todas las personas.

Como ha señalado Ignacio F. Bayo: “El principal escollo al que se enfrenta la proteómica, y en general la biología básica, es la carencia de sistemas informáticos apropiados para la inmensa cantidad de cálculos implicados en este tipo de investigaciones”.

El investigador del Consejo Superior de Investigaciones Científicas, Alfonso Valencia, quien se dedica al desarrollo de software para el análisis de proteínas en todos los niveles, análisis de genoma, determinación de secuencias y estructuras, así como a la comparación con bases de datos o predicción de funciones, señala: “Pese a todo, con los equipos más potentes se podría obtener mucha más información que la que se consigue, pero existe otro problema: la dispersión de los datos. Los investigadores y las empresas guardan celosamente los resultados de sus trabajos debido a la posibilidad de realizar patentes a partir de ellos. Incluso en los casos en que se coloca la información en la red es difícil trabajar con ellos porque no se han desarrollado mecanismos adecuados de búsqueda. «La base de datos de la National Library of Medicine de Estados Unidos es la mayor fuente accesible computadorizada y contiene 10 millones de referencias, pero sólo están los sumarios de los artículos técnicos, luego tiene uno que buscar lo que le interese en otros sitios...», se queja Valencia y añade: «Se trata de una información desestructurada, que no puede incorporarse directamente para estudiar la función de una proteína. Es, por así decir, una información muerta. Lo deseable sería poder cruzar datos de miles de genes o de proteínas para conseguir con rapidez indicios de su estructura y de su función que permitan avanzar en la investigación. Una posibilidad sería aplicar la tecnología que están utilizando los buscadores en el web para seleccionar cada vez con mayor precisión la información demandada, mediante análisis estadístico de las palabras claves introducidas. Ahora se empiezan a aplicar estas técnicas en el campo de la proteómica, pero aun así, resolver un proteoma, relativamente sencillo, llevará aún muchos años, decenios probablemente en el caso del proteoma humano.” Considérese, que si se analiza sólo desde el punto de vista cuantitativo, los componentes del DNA son cuatro nucleótidos y sin embargo, las proteínas la integran 20 aminoácidos. El aumento de volumen es evidente.

Fuente bibliográfica

http://bvs.sld.cu/revistas/aci/vol10_2_02/aci03202.htm
EJEMPLO 3

A nivel de aduanas también se está utilizando la minería de datos para identificar patrones de riesgo sospechosos, en muchos casos más complicados que los que un experto humano podría detectar, para identificar el fraude aduanero, por ejemplo, en América Latina, la Aduana del Perú (Superintendencia de Administración Tributaria, SUNAT) es la primera administración aduanera que ha utilizado con éxito la minería de datos para luchar contra el fraude aduanero logrando una mejor detección de la subvaloración de mercancías incrementando hasta 14 puntos porcentuales el éxito en los hallazgos en el }proceso de Selección de Canales de Control al utilizar un sistema informático de inteligencia de negocios, conocido como SAS, que hace uso de herramientas de minería de datos.
Esto se logro al cruzar la información de las oficinas de impuestos internos con las aduanas, lo que ha permitido generar un perfil de los evasores de impuestos así como de los importadores que subfacturan sus importaciones.
Otro ejemplo importante del uso de la minería de datos en aduanas lo constituye China que desde su incorporación a la Organización Mundial del Comercio a finales del 2001 ha visto incrementarse aceleradamente la cantidad de mercancías que la aduana debe revisar, alcanzando en el 2002 el quinto lugar a nivel mundial en intercambio comercial.
Este incremento del comercio internacional involucro un aumento del riesgo de defraudación por lo que la Aduana China opto por implementar un sistema informático, llamado EAS, que aplica técnicas estadísticas de minería de datos capaces de analizar la gran cantidad de información generada por el aumento de los despachos. De esta forma, el sistema EAS, ha incrementado los impuestos recuperados en los primeros dos años de su aplicación en $20 millones.
Otro tanto están poniendo en práctica las administraciones de aduanas de los balances occidentales (Albania, Macedonia y Serbia) que están poniendo a prueba un sistema de aseguramiento del riesgo aduanero llamado RACWEB basado en un enfoque de minería de datos que se espera complemente a los sistemas de aduanas y asista a los controladores humanos en la lucha contra el fraude en el trasiego de mercancías haciendo más eficientes el control aduanero por medio de una asignación de los criterios de riesgo basados en técnicas estadísticas de minería de datos.
En nuestro caso, la Dirección de Fiscalización , mediante el Área de Investigación y Desarrollo del Laboratorio Aduanero, ha empezado a utilizar técnicas de minería de datos, aplicándolas a la comprobación del origen de las mercancías, mediante el análisis de datos de composición fisicoquímica, obteniéndose resultados preliminares positivos en muestras de destilados alcohólicos tipo vodkas y varillas de construcción.
Como se ve la tendencia mundial, motivada por el incremento del comercio internacional, y la gran cantidad de datos que se procesan, está dirigida hacia el uso de sistemas inteligentes que puedan asistir a las administraciones aduaneras en el proceso del control aduanero de una manera más eficiente y creativa, permitiendo detectar nuevas y cada vez más sofisticadas formas de fraude aduanero.
Fuente bibliográfica
http://www.scribd.com/doc/11352087/Mineria-de-Datos-en-Aduanas

similar:

Minería de Datos para Control de Calidad en el Sector del Automóvil iconLogística inbound en el sector del automóvil: Factor de competitividad

Minería de Datos para Control de Calidad en el Sector del Automóvil iconParámetros del control de calidad del agua

Minería de Datos para Control de Calidad en el Sector del Automóvil iconParámetros del control de calidad del agua

Minería de Datos para Control de Calidad en el Sector del Automóvil iconEntre las herramientas utilizadas en la minería de datos (Data Mining)...

Minería de Datos para Control de Calidad en el Sector del Automóvil iconMinería de Datos aplicados a las ventas con Tarjeta de Crédito realizados...

Minería de Datos para Control de Calidad en el Sector del Automóvil iconElaboración del plan estratégico para mejorar la competitividad del sector forestal de paraguay

Minería de Datos para Control de Calidad en el Sector del Automóvil iconAvicultura, y otras producciones intensivas: alternativas de profilaxis...

Minería de Datos para Control de Calidad en el Sector del Automóvil iconSolución Nº2 : “Control de apertura por medio del control de atracción” 7

Minería de Datos para Control de Calidad en el Sector del Automóvil iconResumen Anclada en los enfoques clásicos de calidad, la política...

Minería de Datos para Control de Calidad en el Sector del Automóvil iconPara el estándar cero de comercio justo para oro y metales preciosos...




Todos los derechos reservados. Copyright © 2015
contactos
b.se-todo.com