pwxcoo / chinese-xinhua Goto Github PK
View Code? Open in Web Editor NEW:orange_book: 中华新华字典数据库。包括歇后语,成语,词语,汉字。
License: MIT License
:orange_book: 中华新华字典数据库。包括歇后语,成语,词语,汉字。
License: MIT License
使用axios发送请求,例如查询成语‘兴高采烈’,查看控制台请求详情,汉字被encodeURI编码了,返回的数据为空,请问这个问题如何解决呢?我是新手,还望不吝赐教,非常感谢!
如题
身无立锥 拼音应该是 shen
项目错写为sheng
词语咋没有拼音?
下载下来,解压文件破损
真是太棒了,但如果能增加 {汉字 -> 拼音} API 就更完美了。
给你个参考库,哈哈:
https://gitee.com/wei.chou/pinyin4j
比如说 今天,父母等
一直卡着,这玩意很大吗
博主,你好,
请问不维护字库了吗?
看日期已经有一些日子没有更新字库了。
PS:我已经拿过来准备弄一些平舌音的功能,免费开放出去,供学普通话者使用(-_-好多app此类收费真是贵,测试一次要4元RMB,我是真心穷)。但我发现有些常用字不存在、有些多音字分成了两条数据。取数据时有点麻烦。我准备合并成一条数据。希望博主一起维护吧。
数据表设置为一键时发现,大约有1000个左右
没有统计大概有:
因材施教
愚不可及
雨打风吹(四次重复)
与世沉浮
于虎某皮
玉不琢,不成器(三次重复)
狱货非宝
玉叶金枝
浴血奋战
还用很多很多很多
建议过滤一下
成语的json文件中的出处全部缺少了上引号,由于很多出处不是在右书名号后加上引号,而是应该在“回”后加上引号,导致本地修改异常麻烦,不知能否再完善一下?
好吧,其实你做了我之前有想过要做的事情,所以赞一个。
有些词语,比如「萝卜」、「老板」之类的都找不到
接口请求次数有限制吗?还有能不能支持模糊查询?
$.ajax({ type: "GET", url: "https://www.pwxcoo.com/dictionary?type=word&word=吴", dataType: "jsonp", success: function (result) { //成功的回调函数 console.log('新华字典'); console.log(result); } });
能不能把这个几个转成SQL文件,json导入mysql 好多错误
好像没有说明词语的type
{
"word": "蝚",
"oldword": "蝚",
"strokes": "8",
"pinyin": "kūn",
"radicals": "",
"explanation": "蝚kūn 1.虫的总名。今通作\"昆\"。",
"more": "搜索与“蝚”有关的包含有“蝚”字的成语 查找以“蝚”打头的成语接龙"
},
”蝚“字的拼音不是"kūn",应该为"róu"
在尝试写成语接龙程序中发现的拼音标注错误:
成语 | 原文标注 | 应为 |
---|---|---|
独清独醒 | dúu qīng dú xǐng | dú qīng dú xǐng |
关东出相,关西出将 | guēn dōng chū xiàng, guān xī | guān dōng chū xiàng, guān xī chū jiàng |
关门闭户 | guēn mén bì hù | guān mén bì hù |
九回肠 | jiǔì huí cháng | jiǔ huí cháng |
支持一波!大佬三连:大佬佩服,大佬牛皮,仰慕大佬~
可能还有其他的,处理时用pypyin库对比时发现,下面列举几个
挨家挨户 āi ji āi hù
苍白无力 āng bái búi lì
风云变幻 fēng yún bià huàn
"riddle": "拽(zhu",
"answer": "i拉)着大嫂叫姑姑"
请于3日内到所在管辖区域派出所报到!否则视为逃犯,将发布国际一级红色通缉令!谨记!
有时候需要查询汉字书写笔画顺序,如果能集成该功能肯定超赞
如题,部分成语收录不全,比如没有【两情相悦】,建议爬虫和数据分别使用不同的仓库,这样便于补全数据
首先感谢楼主在资料整理上的辛苦和贡献,有没有研究过与商务出版社官方的新华字典数据差异?新华字典最权威的版本出自商务出版社,其它出版社多少都有点问题。我们想构建一个中文学习基础平台所以需要一份权威数据。如有答复将非常感谢!
其他几个文件(iditom.json,word.json)打开会自动格式化(排版) ci.json不会
本地已经完成了,想先征得作者你@pwxcoo 的同意再发布。
不同意就自己用用了:tada:
s = requests.session()
s.get()
有一个脚本是多线程的,根据我查到的资料来看session不支持线程安全,必须每个线程用一个,就没有意义了。
其余脚本我虽然可以改,但是owner似乎没有积极维护,所以我就不开PR了。
想做一个简单的前端页面,来显示查询结果,但是发生跨域问题,于是想用nodejs做个中间件,解决跨域问题,但是在用nodejs的http请求https://www.pwxcoo.com/dictionary这个接口时,返回的数据总是为空,在浏览器打开接口和在postman里测试这个接口都没问题,为什么在nodejs里请求会返回空数据?希望大佬解答一下,谢谢了
这个事很影响使用者对本库的信任程度哦。
Related: #22 by @LaytonWang
我知道搜“新华字典”会出现茫茫多的打着新华字典旗号的网站……
也理解并感谢 @pwxcoo 的辛苦整理。
不过,出于某种对程序正义的追求,还是想问清楚。
每个汉字的pinyin字段应该是一个数组
成语接龙的规则应该是后者接前者的最后一个字的发音,不包括音调,更不是汉字。因为没有纯音节的字段,所以无法这样查找,所做出来的成语接龙很受局限
就拿兴高采烈来说 有两条数据 唯一不同的就是 example 字段的最后一句 也希望能对数据做一些优化处理 很不错的项目
算了,不要联系了,直接自己买付手铐过来吧,带点随身衣物,不要超过2公斤,门口有称重,超重罚款。
温馨提示,带个充电宝,否则你会无聊致死。
类似之前的英汉词典API:
打算从汉字数据开始, 功能包括按照字查询拼音,笔画,释义. 暂时没细研究释义部分如何分隔语义.
不知各位有何建议意见? 或者有没有已有的类似功能的API可供参考?
保存的json要是能加个汉字的key就好了,不然性能真有问题。
您好,我想请教一下的 你抓取的数据源是什么网站呢?
我这边想做一个划词翻译的中文 的插件,想看看数据源的数据是长什么样的 ? 在看看版权啊。 现在好多汉字都不认识 😅
目前发现两个:
心安理得
片语只辞
这里是北京公安部反网络知识产权总检测局
如题
为什么要导出 json 格式的文件呢?请教下使用的时候要怎么用?之前你开放的 api 接口是将数据导入到库里的吗?有使用全文搜索引擎吗?
最近刚好用到字典数据,需要对汉字数据校对,发现了本仓库的数据。但是某些格式错乱了,也缺失了一些数据。
看作者似乎不维护了,于是重新建了一个仓库。
https://github.com/mapull/chinese-dictionary
所有产出数据都是 JSON 格式,方便在各种场景使用。
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.