pwxcoo / chinese-xinhua Goto Github PK

:orange_book: 中华新华字典数据库。包括歇后语，成语，词语，汉字。

License: MIT License

Python 76.31% Jupyter Notebook 23.69%

data scraper chinese-traditional python3 chinese chinese-characters chinese-nlp chinese-language chinese-simplified json-dataset

chinese-xinhua's People

Contributors

Stargazers

Watchers

Forkers

leo4617 imaginationwork nianjingyang cc9801 lawsong e3gs husix huibiancheng sydneywusiyuan landsnail jdc08161063 bozzcq jimmy-walker zgia xilongpei chr1st0p itmedaniel allensmile huguanglong ericxsun yangpingyan professor98911 yibit xiaojie18 wuxiaobo chen-zhihui frfy mengjianhong fengqiaozhu unsigned- hua-zhang hcxiong ardwang smtlify crazybars xiaoniff zrmei youndoldman shwzhang1990 laowushi 809593092 scwork gaheadus powercen little1tow masonyang peeeng csshuai roundnone tongchunsheng123 hassyma devopsmi saubcy lu839684437 jalused xiaoheihei pentakill666 gs3170981 fendaq bingxue314159 shaodushu linzehua xingxiuyi wuleying ccw1996 0xff00ff00 awesome-archive gdh756462786 dulumao poemp jaysonzhang yangliu618 fcoctober guanlongtianzi redhobor 81867376 ancin upton liuquncn voidlin alphadl litetoooooom helianghit jacshuo liumedu binwone appleoct baifengbai ekin1106 linhx13 mingliumengshao dxn920128 sigmaquan dawc lejianwen eagleliu82 yqll goodweather0 transtone drzorm

chinese-xinhua's Issues

中文参数被encodeURI转码后返回数据为空

使用axios发送请求，例如查询成语‘兴高采烈’，查看控制台请求详情，汉字被encodeURI编码了，返回的数据为空，请问这个问题如何解决呢？我是新手，还望不吝赐教，非常感谢！

服务器端查询数据的代码能否展示一下?

如题

身无立锥拼音应该是 shen

项目错写为sheng

词语咋没有拼音

词语咋没有拼音？

download

下载下来,解压文件破损

能否增加 {汉字 -> 拼音} API ？

真是太棒了，但如果能增加 {汉字 -> 拼音} API 就更完美了。

给你个参考库，哈哈：
https://gitee.com/wei.chou/pinyin4j

词典里面很多常用词都没有

比如说今天，父母等

怎么这么难下载啊

一直卡着，这玩意很大吗

博主，你好，请问此字库不维护了吗？

博主，你好，

请问不维护字库了吗？

看日期已经有一些日子没有更新字库了。

PS：我已经拿过来准备弄一些平舌音的功能，免费开放出去，供学普通话者使用（-_-好多app此类收费真是贵，测试一次要4元RMB，我是真心穷）。但我发现有些常用字不存在、有些多音字分成了两条数据。取数据时有点麻烦。我准备合并成一条数据。希望博主一起维护吧。

成语json数据重复

数据表设置为一键时发现，大约有1000个左右
没有统计大概有：
因材施教
愚不可及
雨打风吹(四次重复)
与世沉浮
于虎某皮
玉不琢，不成器(三次重复)
狱货非宝
玉叶金枝
浴血奋战
还用很多很多很多
建议过滤一下

成语的出处全部缺少上引号

成语的json文件中的出处全部缺少了上引号，由于很多出处不是在右书名号后加上引号，而是应该在“回”后加上引号，导致本地修改异常麻烦，不知能否再完善一下？

为了增加你被抓走的可能性，我决定点个Star :)

好吧，其实你做了我之前有想过要做的事情，所以赞一个。

词典中包含很多不常用词，但缺少常用词。

有些词语，比如「萝卜」、「老板」之类的都找不到

数据请求次数

接口请求次数有限制吗？还有能不能支持模糊查询？

使用jquery jsonp调用接口在控制台为什么输出空白呢？在网络请求里可以看到返回的数据。

$.ajax({ type: "GET", url: "https://www.pwxcoo.com/dictionary?type=word&word=吴", dataType: "jsonp", success: function (result) { //成功的回调函数 console.log('新华字典'); console.log(result); } });

简直丧心病狂啊

能不能把这个几个转成SQL文件

能不能把这个几个转成SQL文件,json导入mysql 好多错误

没有词语的API吗？

好像没有说明词语的type

”蝚“字的拼音错误

{
    "word": "蝚",
    "oldword": "蝚",
    "strokes": "8",
    "pinyin": "kūn",
    "radicals": "",
    "explanation": "蝚kūn 1.虫的总名。今通作\"昆\"。",
    "more": "搜索与“蝚”有关的包含有“蝚”字的成语 查找以“蝚”打头的成语接龙"
},

”蝚“字的拼音不是"kūn"，应该为"róu"

成语拼音标注错误

在尝试写成语接龙程序中发现的拼音标注错误：

成语	原文标注	应为
独清独醒	dúu qīng dú xǐng	dú qīng dú xǐng
关东出相，关西出将	guēn dōng chū xiàng, guān xī	guān dōng chū xiàng, guān xī chū jiàng
关门闭户	guēn mén bì hù	guān mén bì hù
九回肠	jiǔì huí cháng	jiǔ huí cháng