Typefully
@jarodise
Log in
我的PDF阅读工作流
Share
•
3 years ago
•
View on X
PDF是一个让我又爱又恨的电子书格式。 爱它是因为很多冷门的,年代比较久远的好书都是以扫描版PDF的形式存在的,例如首版和最后一版的《Whole Earth Catelog》,以及很多稀有漫画资源。
恨它是因为它固定的排版格式对于小屏阅读并不友好,而扫描版的PDF也有如铁板一块,让你无法轻易对书中的文字进行查询和高亮处理。 而且绝大多数情况下,尝试将PDF转换成其它诸如Epub/Mobi等格式都是一场噩梦。
经过一段时间的摸索,我总算找到了驯服PDF这头怪兽的阅读工作流: 1.扫描版PDF先使用基于Tesseract的AI工具进行OCR处理成为文字版。 2. 在iPad上使用“PDF Viewer”阅读文字版PDF文件,并对其进行高亮和笔记。
3.使用“Highlights”打开已经阅读完毕的PDF文件,将高亮和笔记以Markdown格式导出。 4. 将导出的.md文件导入到
@Logseq
中继续提炼加工/存档。 当然,如过你习惯在电脑屏幕上面读书的话,直接把文字版PDF导入
@Logseq
中进行阅读也是一个不错的选择。