磁力链接中含有一个BT种子的独一身份标识,通过那个标识能够在DHT收集中搜刮到拥有那个种子资本的其他peer。
一个实现了DHT协议的BT客户端或是办事器叫做节点,在DHT收集中存在着许多节点,节点按照DHT协议停止通信,有四种通信内容:“你在吗?”、“你晓得离某节点(逻辑上,非天文上)很近的其他节点吗?”、“你晓得有人鄙人载某种子吗?”、“我起头下载那个种子了。”
一个DHT爬虫就是一个功用完好的DHT节点,它在收到第三种和第四种动静时,会记录下那个种子的标识,如许就获得了一条磁力链接。
接下来爬虫会去找出那条磁力链接对应的种子,从中解析出磁力链接所代表的文件内容。有的爬虫间接到一些网站上去获取,另一些则本身实现了一部门BT协议,能够从其他peer那里得到种子。
DHT爬虫在DHT协议的实现上能够玩一些魔术,以让更多更广的节点能认识本身,如许它就能收到更多的恳求,拿到更多的种子标识。那种魔术玩得好的爬虫,获取信息的速度就要优于其它爬虫。
0