Programa PROGRAMA DE CURSO CURSO
:
Minería de Datos / Data Mining
SIGLA
:
INP3430
CRÉDITOS
:
10 UC/6 SCT
CARÁCTER
:
Optativo
MÓDULOS
:
2
REQUISITOS
:
Curriculo 041501 o Alumno posgrado UC
DISCIPLINA
:
Autorización profesor.
I.
Ingeniería
DESCRIPCION Este curso busca dar a conocer las principales teorías y prácticas de la Minería de
Datos comprendiendo sus potencialidades y limitaciones. Los conocimientos adquiridos son aplicables a la creación de programas capaces de extraer conocimiento relevante desde bases de datos y permitirán conocer algunas de las principales aplicaciones en que estas técnicas han alcanzado una amplia aceptación. II.
OBJETIVOS 1.
Diseñar soluciones a problemas reales de minería de datos, mediante la
elaboración de modelos capaces de resolver problemas actuales que involucren el análisis de información. 2.
Conocer y aplicar herramientas de software gratuito a tareas concretas de
obtención de información desde bases de datos. III.
CONTENIDOS 1.
El concepto y proceso de Minería de Datos, tipos de problemas en que la Minería
de Datos es relevante. 2.
Data Warehouse y OLAP: Arquitecturas, implementaciones, aplicaciones en Minería
3.
Prepa
de Datos. transformaciones, integración e inconsistencias. 4.
Reducción de la Información (Análisis de las Componentes principales)
5.
Reglas de Asociación (Algoritmo Apriori, Fp-growth)
6.
Clasificación: 6.1. 6.2. Naive Bayes. 6.3. Razonamiento en Base a casos (KNN, Locally Weighted Regression.).
7.
Clustering 7.1. Clustering particional: K-Means, Mean Shift, EM-GMM, BIRCH y otros.
7.2. Medidas de similaridad para distintos tipos de datos. 7.3. Clustering aglomerativo. 8.
Selección de Modelos (Hold Out, Cross Validation, Bootstrapping.).
9.
Métodos de Selección de Variables: Filter, Wrappers, Correlation Based Feature
Selection, 10.
Relief and ReliefF algorithms. Toward Optimal Feature Selection..
11.
Métodos Avanzados y aplicaciones. 11.1. Visualización. 11.2. Minería de texto. 11.3. Detección de Anomalías.
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE DPTO. CIENCIA DE LA COMPUTACIÓN, ESCUELA DE INGENIERÍA / Diciembre 2012 1 IV.
V.
VI.
METODOLOGIA -
Clases expositivas.
-
Actividades prácticas.
-
Lecturas individuales.
EVALUACION -
2 Controles
60%
-
Actividades de laboratorio
40%
BIBLIOGRAFIA Berry, M. and Linoff, G.,
"
M
T
q
M
S
d
Customer S pp " W Berson, A., Thearling, K., and Smith, S.
"B
2004 (T
á
Data Mining Applicat
) CRM" M G
H 2000. Dyche, J.,
" -Data: Turning
I
W
" Addisson Wesley, 2000. Han, J and Kamber M.
"Data mining:Concepts
T
q " M
K
2005. Hastie T., Tibshirani R., and Friedman J. "T
S
L
Inference, P
" Sp
200 .
M
,
Inmon, W.H.,
"B
W
" J
Wiley and
Sons; 3th edition, 2005. Kimball, R. and Ross, M.
"T mode
Mitchell T. M.
p " J
W
S
2011.
"Machine Learning", McGraw Hill, 1997 (Texto
clásico) Witten, I H., Eibe,F., and Hall, M.
"Practical Machine Learning Tools and Techniques"
M Kauffman, 2011
PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE DPTO. CIENCIA DE LA COMPUTACIÓN, ESCUELA DE INGENIERÍA / Diciembre 2012 2