稍后再读

2022/10/27 12:35:08

MetWord 的理念是在阅读中学习单词,而阅读能带来的不仅仅是学习单词。基于这一点,MetWord 还力求成为一款好用的稍后阅读工具。遇到想读的文章,现在没时间读,或者读到了好的文章,想着以后随时找出来再读一遍,只需要点一下 ☆ 按钮,就可以把文章加入到你的收藏夹了。

这听起来就像是把文章链接加入到浏览器书签,确实是这样的。而 MetWord 区别于浏览器书签或者其他稍后再读应用的一点在于,我们提供了最好用的搜索工具 —— 正文搜索 —— 来帮助你快速找到收藏夹里的内容。当书签积累到一定数量的时候,如果你把书签当作稍后再读的阅读列表,那么里面的文章可能会变成「再也不读」;如果你把书签当作收藏夹,那么当想从里边再次找到某篇文章的时候,那一定变得很困难。究其原因,不论是我们把文章加入到收藏夹,还是想从收藏夹找出某个文章的时候,其实有的都只是有关于这篇文章的一个念头,或者说是一个关键词。而靠着这个念头和浏览器提供的书签搜索能力,不足以让我们快速找到这篇文章。因为浏览器的书签工具只提供按照标题搜索的能力,而我们此刻想到的关于这篇文章的关键字,可能并不包含在书签标题里。但它肯定包含在文章的正文里。因此我们把你加入到收藏夹的文章全部抓取下来,提取其中的标题和正文部分,索引到数据库,那么只需要一个念头,或者一个关键字,就肯定能找到你想要的文章。

正文搜索

为了能够正确地提取到文章正文,而不被网页中其它不相关的元素干扰,我们开发了一个准确的正文识别算法。举例来讲,在索引一篇新闻的时候,它应该只提取这篇新闻的内容,而忽略掉文章正文之后可能有的相似内容推荐的部分;而在另一些网页中,可能并不包含大段的正文,比如 StackOverflow 中的问题回答或者 GitHub Issues 中的评论,关键字可能就在这些回复中。我们的算法能够应对这些情况。只需几次简单的尝试,你就会发现,仅凭借着脑海里的一个念头,你总能通过我们的搜索工具找到你收藏了的内容。

重复查询一个单词能够加深记忆,而重复阅读一篇文章可能能带来新的理解,正所谓「温故而知新,可以为师矣」。借助正文搜索,你可以把 MetWord 当作一个更好的阅读列表,或者个人知识库的搜索引擎。