Feep! search:一款面向程序员的搜索引擎,收录信息超2900万页!
新智元报导
编纂:Cris 好困
【新智元导读】想让检索代码不再「大海捞针」?就用「Feep! search」。
一款专门面向法式员的搜刮引擎,2021年9月才开工,却收录了超越2900万页信息。如许的「编程神器」,你情愿测验考试吗?
那两天,草根开发者浮士德发布了一款名为「Feep! search」的搜刮引擎。只要在检索框中输进你想找的法式名称,分分钟便能检索出成百上千条成熟代码。
固然那款「编程神器」还存在着很多问题,却已经令很多苦兮兮的法式猿、法式媛们心驰憧憬,堪称本年「1024」更好的礼品。
Feep! search
「Feep! search」是一款法式员公用的收集搜刮引擎,次要用于编程资本的查找。
固然名称摘用了与雅虎(Yahoo!)类似的构造,但与美国门户网站的明贬实褒(Yahoo原意为乡巴佬)差别,「Feep」在《新黑客词典》中特指「末端发出的温和电子铃声」,尾部的「!」则代表了想要为用户供给令人难忘的办事。
目前,「Feep! search」可以检索的信息源,包罗DevDocs、Hacker News、Kiwix、Stack Exchange等,以至还包罗一些已索引但未爬网的链接,信息总量超越2900万页——那以至比谷歌1998年推出的第一款搜刮引擎还要多(2600万页)。
据网站做者浮士德介绍,「Feep! search」在检索时会查找它所存储的所有信息,对一些数据停止少量排序,并填充到搜刮网站的成果页中。
数据混洗位次要用Node.js编写,许多shell脚本将所有内容粘在一路,排名和全文搜刮则由ElasticSearch供给撑持。那一切都在他家客厅的HP微型办事器里运行。
位于浮士德客厅的「Feep! search」办事器
以法式员们最典范的上手法式「hello word」为例,仅用时27毫秒,「Feep! search」那简洁而不简单的界面便检索出超1万条成果。你能够从中轻松找出许多可以现实运行的成熟代码。
并且,搜刮成果的信息来源,也是相当丰富的。
在浮士德的帖子下,很多网友表达「Feep! search」实乃法式员的福音:
「很棒的做品。(我)在统一主题差别变体的三次搜刮中得到了一些好的谜底和有用的链接。」
也有部门网友在体验后发现了问题:
「好主意,但如今的搜刮很蹩脚。对『django signals』停止检索,第一页得到了非官方的成果,第二页(1)上的所有链接都断了。搜刮『go cobra』则底子没有官方文档。」还在最初提出了一些改进定见。
美中不敷
就连做者本身也认可,因为尚未设置任何搜刮运算符或高级搜刮语法,招致引擎的搜刮成果相当多变,搜刮成果的排名不克不及很好地获得展现。
不外,关于一些检索时的常见问题,做者也在「Query help」页面停止了备注:
单词被词干化(例如「walking」、「walk」等都将被转换为「walk-」),并逐个搜刮。目前还没有任何办法能够封闭那个功用,或者搜刮完全的短语;
非字母数字字符将被漠视(那意味着你不克不及搜刮符号运算符之类的工具。那关于一个专门为法式员设想的搜刮引擎来说十分为难。那也是我要着重处理的问题之一);
语句的理解十分浅薄:它不觅觅同义词,也不睬解统一个词在差别的上下文中可能有差别的含义(那与谷歌截然相反,即便你有十分详细的设法,谷歌也会尽量揣测你的其他意思。哪种办法最有用取决于你觅觅的体例)。改动查询的措辞可能会得到一组完全差别的成果;
假设没有搜刮到你要找的内容,请测验考试添加或删除单词。有时看似细小的调整城市产生浩荡的差别。您需要的成果可能就在某个处所,即便可能很难找到;
有时候,好的成果有些被藏匿了。 定见您多阅读几页,看看要找的内容是不是在后面。
值得一提的是,每页检索成果的末端还供给了Google、DuckDuckGo、Bing和Marginalia四种其他搜刮引擎的链接,一键即可进进对应词汇在各大引擎中的检索成果。
做者特殊向我们选举了一款独立的DIY搜刮引擎Marginalia Search。与「Feep! search」类似,那是一款专注于选举「你可能不晓得网站」的搜刮引擎。那个搜刮引擎中的软件都是定造而成,所有的爬网和索引都在内部完成的。
小人物的大梦想
「Feep! search」的做者沃尔夫冈·浮士德(Wolfgang Faust)是一名专业软件开发商和业余喜好者。
通过浮士德的小我网站我们能够领会到,固然曾颁发过大大小小上百项法式,但他却是一名不折不扣的草根开发者。
正如浮士德小我网站的Slogan「我做了良多差别的工作」所言,2011年至今,他在GitHub上共更新了111条做品,但账号目前也只要25个粉丝。一款名为「yaml-multiline」的开源软件,总计获得过216颗星和16次引用——那已是浮士德开发作涯的扛鼎之做。
不外,他在两大论坛Hacker News和Reddit上却别离收获了4,004和3,712次「好事」,具有极强的表达欲看,也能够说十分勤奋了。
不管怎么讲,能造造出一款收录接近3000万页信息的搜刮引擎,都是一项非常了不得的成就。
事实昔时Google刚推出时,也同样问题重重。
参考材料:
/
/