mineria-datos's People
mineria-datos's Issues
Agregar distorción para cada uno de los centros generados después del kmeansMod
- Calcular cuales son los centros que dan menor distorsión y retornarlo
- Mostrar en un archivo de texto cada uno de los centros con su distorsión
Convertir dataset de Artículo a dataset, para su mejor lectura
Implementación básica de algoritmo de K-means
Probablemente el de clase, aunque también podemos tomar bases de ejemplos ya hechos
Generador de centros random
Función que genere una lista del número indicado de centros con un número de coordenadas indicado
Debe retornar un numpy array
funcion generador(numero_centros,numero_coordenadas)
# codigo
# ejemplo de lo que debe retornar centros = [ [ 0,0,0], [1,1,1],[0,1,0]
return centros
Scope para data samples
Para el algoritmo de kmeansmod se debe obtener un subsample de toda la información, este subsample debe ser pequeño con un límite establecido y los elementos deben ser aleatorios.
Función que:
- Acepte la cantidad de elementos que debe ir en el subsample
- Regrese ese subsample
- No debe aceptar límites mayor a la longitud de la matriz original de información
Contadores de valores
Funciones que cuenten los valores necesarios para support, confidence y lift:
- Contar cuantos valores cumplen con ambas condiciones
- Contar cuantos valores cumplen con cada condición de forma independiente
- Función de support :
total_elements/elementos que cumplen con ambas condiciones
- Función de confidence:
elementos que cumplen con ambas condiciones/elementos que cumplen con la primera condición
- Función de lift
(elementos que cumplen con ambas condiciones/total elementos) / ( ( elementos cumplen con primera condición / total elementos) * (elementos que cumplen con segunda condición/total elementos) )
Nota :
Si es posible modular el programa, estaría mejor para que no estén todos juntos en el for, de igual manera, si ves una mejor forma de buscar con la combinatoria, im all ears
Función para imprimir matriz
Imprimir cualquier matriz en un archivo txt
- Acepta un nombre
- Acepta la matriz
El archivo debe tener:
Nombre que se paso a función
Matriz:
[matriz, que, se pasó]
Guardar función en un archivo utils.py
dentro de carpeta de refining
Aceptar k cantidad de centros por el usuario
Al inicio del programa preguntar al usuario la cantidad de centros que necesita.
- No debe aceptar más de la cantidad de elementos en la base de datos.
- Una vez que ingrese los centros, deben generarse aleatoriamente.
- La cantidad de elementos en cada centro es definida por la cantidad de variables que se estén analizando; es decir, el número de columnas que se estén analizando.
Nota: Se puede utilizar esta función input_normalized
Función de distorción
Se deben calcular las distancias entre los centros de kmeans y los centros de kmeansmod
Implementar algoritmo vanilla de refinamiento
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.