如何利用TeleportUltra解决网页采集不完整的问题?

2023-02-19 07:54:56    来源:家具学院


(资料图片仅供参考)

关注我,有你好看!

Teleport Ultra是一款用于采集网页的软件,可以快速、准确地抓取所需的网页内容。它具有强大的采集功能,可以抓取单独的文章、整个网站或多个网站,以及抓取各种格式的文件。但是,有时Teleport Ultra会遇到采集网页不全的情况,这时候就需要补充采集了。

首先,补充采集前需要了解Teleport Ultra的界面(如图所示)。要想补充采集,就必须打开“Projects”选项卡,然后在“Actions”中选择“Resume Collection”。这样就可以对已有的采集作出修改。

其次,将Teleport Ultra设置为重新采集模式。进入“Options”选项卡后,在“Resuming Collection”中勾选“Re-collect pages already collected”选项卡,然后单击“OK”按钮保存设置。这样就可以让Teleport Ultra重新采集已有内容,并补充之前遗漏的内容。

此外,使用Teleport Ultra进行补充采集时也要注意一些实用功能。例如在“Options”选项卡中勾选“Follow links in the same domain only (no external links)”和“Do not update existing pages if their content has not changed since the last collection run.”这样就可以避免Teleport Ultra重复采集已有内容了。

关键词: