23 / 03 / 28

利用Python优化学习流程

需求背景

在日常英文阅读中,我经常使用的软件的“英阅阅读器”,这款软件可以帮我快速查词、摘录这个词所在句段并标注书籍来源。虽然这个App可以在其内部学习单词,但我个人一直在用的,还是欧路词典。于是,需求产生了,如何能将我在“英阅阅读器”里收集的词汇,“贴”进欧路词典呢?

思路1

  1. “英阅阅读器”自带支持导出txt文档,利用该功能导出文档,并传至电脑
  2. 打开txt文档,打开欧路词典
  3. 搜索对应单词,鼠标右键,添加笔记
  4. ....
  5. 一个单词一个单词的输入
  6. Done

这个办法,行是行,但不把人当人~全是重复操作,那这些步骤是否可以通过简单流程解决呢?

思路2

  1. “英阅阅读器”自带支持导出txt文档,利用该功能导出文档,并传至电脑
  2. 用EmEditor打开txt文档,发现格式有一定规律
  3. 参考欧路词典“导入其他软件的生词本”功能提示“通txt格式中“单词”与“释义”是以英文逗号分隔,若“单词”或者“释义”中有逗号的请使用中文逗号代替。txt格式中若无英文逗号符,则默认为”单词“并且"释义”为空。txt格式样例: hello,你好world,世界。自定义的“释义”可以在生词本中我的笔记里查看到。一般而言我们会尝试猜测上传文件的编码,这在大部分情况下是可以猜对的,如果出现乱码,请尝试对文件修改为utf8编码再上传”
  4. 按照欧路词典建议,对原有文档进行通替
  5. 发现单词存在多种写法(第三人称单数、复数、过去分词),需要手动调整
  6. 上传至欧路词典服务器端
  7. 同步本地生词本
  8. Done

这个办法相较于思路1,有一定进步,最起码不用一个单词一个单词手动输入了。但是仍然比较繁琐,需要人工通替规则。此外,因为是直接上传,摘录的单词可能是第三人称单数、复数、过去分词等等,仍然需要手动更改。

思路3

  1. “英阅阅读器”自带支持导出txt文档,利用该功能导出文档,并传至电脑
  2. 考虑到原有流程中,手动对齐原有txt文档和欧路词典目标txt文档的规则很固定。考虑写批任务,但又想起曾经自学过一点点Python,决定这个用Python来写。
  3. 写完并跑完Python之后,手动调整单词写法
  4. 上传至欧路词典服务器端
  5. 同步本地生词本
  6. Done

这个办法相较于思路2,再次进步,不用每次手动对齐文档要求,进一步节约时间。但是手动调整单词写法,仍然让人头疼。

思路4

  1. “英阅阅读器”自带支持导出txt文档,利用该功能导出文档,并传至电脑
  2. 借助ChatGPT,重写Python代码。实现自动单词词性识别,调整单词。
  3. 写完并跑完Python
  4. 上传至欧路词典服务器端
  5. 同步本地生词本
  6. Done

所有主要需求均已解决~后续无非就是导出,跑Python,上传。如果再改进,似乎可以考虑服务器端?但目前暂时不考虑了。

思路3和思路4的代码如下,有兴趣的小伙伴,可以拿去自用。 https://github.com/stevenash120/Eudic-Ereader

Powered by Gridea