GithubHelp home page GithubHelp logo

henryisme / content_review_system Goto Github PK

View Code? Open in Web Editor NEW

This project forked from toolgood/toolgood.textfilter

0.0 0.0 0.0 7.16 MB

内容审核系统

License: GNU General Public License v3.0

JavaScript 2.52% Python 2.32% Java 4.22% Go 1.12% C# 85.94% CSS 2.77% HTML 1.02% Batchfile 0.11%

content_review_system's Introduction

《ToolGood 内容审核系统》

官网:https://toolgood.com/

《ToolGood 内容审核系统》由多组高性能算法组成:

  • (1)在ToolGood.Words高性能算法基础上再次改进,十几处修改,性能更高;
  • (2)优化繁体与简体全角半角英文大小写匹配性能;
  • (3)改良算法,在不减性能情况下,压缩字典量,减少内存使用量;
  • (4)加入多组敏感词检测,减少误杀;
  • (5)加入NLP分词功能减少误杀概率,NLP算法使用动态规划,功能增加性能不降多少;
  • (6)改良联系方式匹配,减少跳词的误测;

文件夹说明

  • src文件夹: ToolGood.TextFilter源码,C#语言。
  • dataBuilder文件夹: 程序数据包生成器源码,C#语言。
  • api文件夹: API接口源码,目前有C#JAVAPythonGO版本。
  • manager文件夹: 敏感词库管理工具源码,(开发中)

注:C#语言编译环境VS2022,核心源码只有C#语言版本,其他语言本人并不精通。

相关下载

领取【敏感词库】

  • 该敏感词库从70W多词组中整理出来的,外加18W多组常用分词、2W多字的拼音扩展、14066个左右拆字、4000组繁简转化,4850组同音同形字,1160组异形字……
  • 免费领取方法: 加QQ1665690808,发送申请人照片,要求手执【免费领取敏感词库】纸条,并且站在带公司Logo的墙前(或学校大门口)。
  • 如不想拍照,可花200元赞助【敏感词库】,并赠送【程序数据包】赞助网址
  • 为什么会有免费领取【敏感词库】?因为一套敏感词库无法满足各种场景,而每个公司使用的场景又不同。如**,在熟人环境下是正常词,在商品评价绝对是脏词,在游戏中绝大数为脏词

本人不是老师,加我QQ后,请不要提关于项目使用、加载等简单问题,也不要问词库有多少条敏感词(因为使用类正则,能匹配上十亿条)。

特别声明

  • 源码为GPL-3.0 许可,商业请购买商业许可

探讨敏感信息过滤:

敏感信息过滤研究会,Q群:128994346(已满)

本人不是老师,请不要提关于项目使用、加载等简单问题。

敏感词相关文章

1、敏感词过滤方案那些事

2、普通公司敏感词审核制度

3、新人小白过滤敏感词方案

4、网络常用敏感词过滤方法

5、ToolGood.Words算法过滤敏感词优化原理 (收费30元,一顿KFC)

6、ToolGood.TextFilter开源代码优化详解 (收费300元) 与IllegalWordsSearch算法进行对比,阐述了ToolGood.TextFilter过滤算法优化点,如何减少内存使用量。 还有一小部分未写好,心急的人可以先买,我会持续更新。

7、正则转DFA算法(C#版、JAVA版) (收费30元,一顿KFC) ToolGood.TextFilter的一个核心算法就使用到正则转DFA。(目前只有C#代码)

8、JAVA版ToolGood.TextFilter

9、C#版图片鉴黄(收费30元,一顿KFC)

LICENSE

您可以在GPLv3许可证下使用它。请参阅LICENSE。

content_review_system's People

Contributors

toolgood avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.