GithubHelp home page GithubHelp logo

chuantaoli / the-code-collection-with-data-mining Goto Github PK

View Code? Open in Web Editor NEW
1.0 2.0 0.0 19.42 MB

想在本科阶段把实践过的代码放在这个仓库里面,会进行分类及说明

Python 100.00%

the-code-collection-with-data-mining's Introduction

The-Code-Collection-with-Data-Mining

想把实践过的代码放进这个仓库里面,这里会把代码、结果和示例都收集起来。

LASSO回归
该文件夹里面存放LASSO回归特征筛选相关的程序文件以及示例数据、导出结果。运行LASSO.py可以计算LASSO特征筛选前后的方差膨胀因子、岭迹图的绘制、十折交叉验证选择最佳正则化系数以及导出数据集。
LASSO回归的步骤如下:

  1. 首先 绘制岭迹图,通过观察各回归系数的收敛情况进行合适的正则化系数搜索区间的选择。
  2. 接着,通过十折交叉验证进行最佳正则化系数的搜索。
  3. 最后,计算特征筛选前后的方差膨胀因子。
  4. 以及导出相应的文件。、

贝叶斯优化超参数寻优
该文件夹里面存放TPE过程的贝叶斯优化,损失函数为最大化准确率,可以根据需要进行分类器或回归器的调整,其在训练集里面进行十折交叉验证进行最佳超参数组合的搜索,最后导出最佳超参数组合以及最佳损失函数值。
LightGBM预测效果对比.py是调参前后对比用的。

过采样
该文件夹里面存放MAHAKIL的代码和示例。
MAHAKIL可以应对二分类或多分类问题的过采样,但是要考虑多重共线性的影响,如何计算出来的行列式为0就运行不了了,主函数入口是MAHAKIL.py,validation.py是辅助文件。
这里的代码对MAHAKIL之最新类不平衡过采样方法的改进,由于该方法提出是2018年,0.22版本的sklearn有很多库现在没有了,所以对删除的库进行的替换。
放进去的文献是MAHAKIL的开山之作。

后处理
该文件夹里面存放保序回归的代码和示例。
根据标签数量调整即可,运行便能出结果,适合二分类和多分类。

the-code-collection-with-data-mining's People

Contributors

chuantaoli avatar

Stargazers

 avatar

Watchers

Kostas Georgiou avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.