GithubHelp home page GithubHelp logo

1443690715 / yiqi-zombiecompanyclassifier Goto Github PK

View Code? Open in Web Editor NEW

This project forked from bil369/yiqi-zombiecompanyclassifier

0.0 0.0 0.0 6.5 MB

易企|僵尸企业分类系统 2020年第十一届**大学生服务外包创新创业大赛A09赛题——僵尸企业画像及分类 决策树、随机森林与XGBoost加权投票融合 支持Web端访问 Bootstrap+Django+PyEcharts

License: GNU General Public License v3.0

Python 10.57% CSS 0.36% HTML 8.23% Jupyter Notebook 80.84%

yiqi-zombiecompanyclassifier's Introduction

易企|僵尸企业分类系统

build build build build

本项目是2020年第十一届**大学生服务外包创新创业大赛A09赛题——僵尸企业画像及分类我们团队提交作品的源码。该项目主要任务是要根据给定的企业信息,进行二分类,判断是僵尸企业和非僵尸企业。

本项目分为两部分,第一部分是机器学习训练模型,业务与统计两个角度构造特征,使用RFECV作特征筛选,算法主要使用决策树、随机森林与XGBoost,网格搜索五折交叉参数调优,并使用VotingClassifier做了融合,权重使用遗传算法确定,并做了数据融合。第二部分是Web可视化界面,用于支持单个和批量企业信息的输入与结果输出,以及企业信息可视化,主要使用了Bootstrap、Django与PyEcharts。

首页 可视化分析

目录

安装

赛题数据

下载

依赖

  • Python >= 3.7
  • Pandas >= 1.0.0
  • Numpy >= 1.17.0
  • joblib >= 0.14.1
  • Scikit-learn >= 0.22.1
  • matplotlib >= 3.1.2
  • xgboost >= 1.0.2
  • Django >= 3.0.4
  • PyEcharts >= 1.7.1

使用

机器学习部分

data_merge.ipynb是将企业提供的训练集和验证集合并以重新划分,data_process.ipynb是数据预处理与特征工程,data_train.ipynb包含了网格搜索参数调优与多模型加权投票融合,遗传算法确定权重,data_iter.ipynb是数据融合,CompanyClassifier.ipynb包含了最终封装好的企业分类模型。详细内容请参考项目技术文档。

Web端

进入webclassifier目录下,命令行运行:

python manage.py runserver

访问localhost:8000即可。

项目整体结构

architecture

参考

  • 2020年第十一届**大学生服务外包创新创业大赛:http://www.fwwb.org.cn/news/show/278
  • 邹蕴涵. 我国僵尸企业的判别, 影响及对策建议[J]. **物价, 2016 (7): 80-82.
  • 李霄阳, 瞿强. **僵尸企业: 识别与分类[J]. 国际金融研究, 2017, 364(8): 3-13.
  • 黄少卿, 陈彦. **僵尸企业的分布特征与分类处置[J]. **工业经济, 2017, 3: 24-43.
  • 周琎, 冼国明, 明秀南. 僵尸企业的识别与预警—来自**上市公司的证据[J]. 财经研究, 2018, 44(4): 130-142.
  • 栾甫贵, 刘梅. 僵尸企业僵尸指数的构建及应用研究[J]. 经济与管理研究, 2018 (6): 12.

License

GPL © Bil369

yiqi-zombiecompanyclassifier's People

Contributors

bil369 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.