GithubHelp home page GithubHelp logo

98wubi-tables's Introduction

98五笔资源库

98五笔

单编码佳作

纯形方案中,有分主副字根的流派,比如「郑码」、「山人通用」、「徐码」等等,还有不分主副根的单编码类方案,五笔就是典型代表。

86、98、新世纪、这三版五笔中,98版是拆字最为和谐自洽,字根数量最多,击键协调性最好,对大字符集适应最好的一版。98五笔,堪称单编码方案类中的巅峰之作。

小狼毫前端的开发者「nameoverflow」,同文输入法作者「osfans」,都是大家比较熟悉的98五笔用户。另外,OpenResty 的作者章亦春,也是98五笔高手,而且非常喜爱鼠须管前端。

98五笔小组一直致力维护98五笔资源,包括不限于制作通用的98五笔输入法软件、发布98五笔码表、扩编98五笔字符集等等。

已无版权问题

https://www.bilibili.com/video/av54083952

98码表

OpenCC 资源

「98五笔拆分映射表」内的 txt 文件,是 OpenCC 纯文本词典。如果有需要,可以将之转化为 OpenCC 支持的 ocd2 格式。

单行单义表

文件名中标记为「单义」的码表,即「单行单义」表。 表体正文内容为:

词条+Tab+编码

一行之内,一个词条。

单行多义表

文件名中标记为「多义」的码表,即「单行多义」表。 表体正文内容为:

编码+空格+词条一+空格+词条二+空格+词条三……

一行之内,可容纳多个词条。

  • 单行多义表的间隔符为「空格」
  • 编码排序依照英文字母序,可避免某些输入法程序的检索问题

GB18030-27533.txt

这个文件是最常用的国标 GB 两万字集,是「单行单义」格式,每个单字对应的编码皆为98五笔全码。 该文件主要用于某些输入法程序的「反查」或「造词」。

Wubi98-Unicode15.1.txt

Unicode15.1 标准下全部汉字的拆分文件,基于该文件,可以制作一切98五笔码表资源。

完整收录Unicode15.1全部汉字:

文件 区位
cjk_A_6582.txt 中日韩统一表意文字扩展-A
cjk_A_ext_10.txt 中日韩统一表意文字扩展-A补充
cjk_base_20902.txt 中日韩统一表意文字
cjk_base_ext_90.txt 中日韩统一表意文字-补充
cjk_B_42711.txt 中日韩统一表意文字扩展-B
cjk_B_ext_9.txt 中日韩统一表意文字扩展-B补充
cjk_C_4149.txt 中日韩统一表意文字扩展-C
cjk_C_ext_5.txt 中日韩统一表意文字扩展-C补充
cjk_D_222.txt 中日韩统一表意文字扩展-D
cjk_E_5762.txt 中日韩统一表意文字扩展-E
cjk_F_7473.txt 中日韩统一表意文字扩展-F
cjk_G_4939.txt 中日韩统一表意文字扩展-G
cjk_H_4192.txt 中日韩统一表意文字扩展-H
cjk_I_622.txt 中日韩统一表意文字扩展-I
cjk_BuShou_ext_115.txt 中日汉字部首补充
cjk_HanZhiBiHua_36.txt 中日韩笔画
cjk_JianRongHanZhi_472.txt 中日韩兼容表意义字
cjk_JianRong_ext_542.txt 中日韩兼容表意义字补充
cjk_KangXiBuShou_214.txt 康熙字典部首
others.txt 日制文字

剔除PUA点位之后,计 99049 个汉字。

以此文件为基础,98五笔小组发布了一个用于演示、记录、分享基于 python 自动化处理并生成可用码表的新档:https://github.com/yanhuacuo/98wubi-unicode/tree/master

可以生成:

超集字体

学习文件

  • 《高频3500字详拆版.pdf》

98五笔的拆字与上手,过于简单,很多入坑的网友反馈翻翻这份《高频3500字详拆版.pdf》就上手了。特地于此存档一份,供参考。

  • 字根图

基于AI制作,转为点阵图的98五笔字根图,艺术成份很高。

98五笔成品软件

98五笔小组开发了「weasel-tool」、「rimetool」,可对「小狼毫」、「鼠须管」、「ibus-rime」、「fcitx5-rime」进行全面可视化的词库管理、上屏行为控制,可到 网盘 下载体验。

演示:

98wubi-tables's People

Contributors

cppxiaozhu avatar yanhuacuo avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

98wubi-tables's Issues

请问是否有全字根表?

不好意思,我想对规则进行一些微调,比如把鳄的鱼字头和"一"划分为鱼,那么键位就从 "qgkn" 变成了 "qkn",但丢失了k和n 之间的 "口 二",也无法保持4键位。我只好放弃了修改。
请问这个库有全字根表吗?或者说当前的工具有办法获取吗?谢谢。

拼音反查候选框超出屏幕

运行环境为opensuse tumbleweed,对 rime.sh 进行修改后成功安装。(apt一行修改成 sudo zypper in -y fcitx5-rime librime-lua )

安装后测试基本功能、字体、主题正常,但是使用拼音反查功能时,输入框左侧超出屏幕显示不全。

我尝试修改 $HOME/.local/share/fcitx5/rime/default.custom.yaml 文件,希望减少候选框长度,不过修改前后未发生变化:

customization:
  distribution_code_name: Weasel
  distribution_version: 0.99.0
  generator: "Rime::SwitcherSettings"
  modified_time: "Mon Jan  6 23:28:26 2020"
  rime_version: 1.7.3
patch:
  schema_list:
    - {schema: wubi98_ci}
    - {schema: wubi98_dz}
    - {schema: py}
  menu/page_size: 5

Screenshot_20230408_205654
Screenshot_20230408_205732

恳请作者不吝赐教!

分享我的五笔自用方案

谢谢五笔小组的工作。

这个方案我已用多年,作为解决五笔重码的一种尝试,应该是利大于弊。

五笔的基础规则没有改动,主要有三个变化:

1,一二字根 -> 首尾字根
2-3字词组的一二字根,改为首尾字根:
狐狸 QTQT -> QCQF
氤氲 RNRN -> RDRL
骨骼 MEME -> MEMK
考量 FTJG -> FNJF
都是 FTJG -> FBJH
特别是 TKJG -> TKJH
使用率 WEYX -> WEYF

这会产生一些新重码,比如 JEGD -> 明天 晴天,但不会出现那种 QTQT 有几页重码的情况

2,解决第一键频率过高
如果尾字根是单画(一 丨丿㇏乙 ),则使用第四键代替第一键
时事 JFGK -> JFGL
一旦 GGJG -> GSJS
文化 YYWX -> YOWX
大量 DDJG -> DOJF
大大 DDDD -> DODO

3,3字词的拆分法
如果可拆分,则拆分为 单字+双字词
彼一时 TGJF -> TCGJ
长时间 TJUJ -> TAJU
短时间 TJUJ -> TUJU
想当然 SIQD -> SNIQ

小狼毫0702版本无法切换界面风格

你好,我不知道是不是应该在这里提这个问题,但这里是我找得到的最有可能得到回复的地方。

如题,我在98五笔资源库中下载的2023/7/2上传的小狼毫最新版,安装成功后无法通过右击托盘中的图标->输入法设定->方案选单设定->界面风格设定来修改界面风格。

重新安装也不能解决这个问题。输入的功能是正常的。

不知该如何解决该问题?

脚本备份

#!/bin/bash
echo "下载码表,临时存放到当前目录"
curl -# -SL https://github.com/yanhuacuo/98wubi-squirrel/archive/98wb.zip|tar xz
echo "码表下载完成,清理鼠须管的旧码表"
echo "本次操作需要「管理员权限」,请输入密码"
sudo rm -rf /Library/Input\ Methods/Squirrel.app/Contents/SharedSupport/*
echo "接下来清理鼠须管的旧缓存数据"
rm -rf ~/Library/Rime/*
echo "将新的码表放到鼠须管主程序内"
sudo cp -rf 98wubi-squirrel-98wb/* /Library/Input\ Methods/Squirrel.app/Contents/SharedSupport
echo "向用户目录转移 YAML 文件"
cp -rf 98wubi-squirrel-98wb/*.yaml ~/Library/Rime
echo "向用户目录转移 Lua 文件"
cp -rf 98wubi-squirrel-98wb/rime.lua ~/Library/Rime
echo "重新部署,使新码表生效"
/Library/Input\ Methods/Squirrel.app/Contents/MacOS/Squirrel --reload
echo "清理本地的临时数据,即将完成"
rm -rf 98wubi-squirrel-98wb
echo "码表已更新,本地临时数据已删除,新表已生效"
echo "现在,我们做「字体支持」"
echo "98五笔已支持全部 unicode 13 中的近十万汉字"
echo "「字体支持」还将使你获得完整的98五笔拆分功能"
echo "将需要 3~5 分钟完成这个过程,稍安勿躁。"
curl -# -SL https://github.com/yanhuacuo/fonts/archive/98wb.zip|tar xz
echo "已成功下载到本地"
cd fonts-98wb
echo "解压字体包"
cat 98wb-fonts.tar.gza* | tar -xzv
echo "安装到用户字体目录"
cp -rf 98wb-fonts/*.otf ~/Library/Fonts
cd ..
echo "安装成功,清理临时数据"
rm -rf fonts-98wb
echo "做完,收工。"

你好,3个辅助工具的全局热键可以禁用吗?

你好,安装后发现3个辅助工具分别占用了:ctrl+alt+q,ctrl+alt+w,ctrl+alt+e全局热键,请问有设置或方法禁用吗?
这3个热键是本人常用的热键,被占用后,总是提示冲突,操作不方便。

加字 𦮼 不生效

我在 wubi98_ci_extended.dict.yaml 的末尾加了一行

𦮼 ffnn

但重新部署之后 ffnn 并没有列出这个字。用rimetool GUI 的无码加词功能添加这个字会导致 GUI 程序崩溃。
该如何添加这个字?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.