1、定位:通過在高級選項中循環(huán)文本列表模式,可以循環(huán)輸入文本,實現(xiàn)搜索大量關(guān)鍵詞的功能。
2、適用情況:需要在輸入框中搜索關(guān)鍵字來收集數(shù)據(jù),例如
3、收集器可以自動輸入關(guān)鍵字并完成搜索。
(資料圖片)
4、下面的文本循環(huán)演示:
5、采集步驟如下:
6、第一步:打開網(wǎng)頁拖動一個循環(huán)框到規(guī)則中修改循環(huán)高級選項輸入文本。
7、注意:流程圖左側(cè)有一排工具欄。如上圖所示,工具欄中每個步驟都有簡化圖標。
8、從上到下依次是:打開網(wǎng)頁,點擊一個元素,提取數(shù)據(jù),輸入文本,識別驗證碼,切換下拉選項,循環(huán),判斷條件,鼠標移過元素,結(jié)束循環(huán),結(jié)束流程。
9、在該示例中,使用了從上到下的第七個循環(huán)。鼠標點擊圖標拖動到流程中,放在打開網(wǎng)頁的步驟下。選擇循環(huán)框,修改高級選項,選擇循環(huán)模式一欄的文本列表,將關(guān)鍵詞粘貼到下面的文本列表中,每個關(guān)鍵詞用換行符分開,即回車。
10、輸入文本的步驟是點擊輸入框并選擇輸入文本。這時候采集器彈出一個界面讓你輸入文字。如果你需要輸入一個關(guān)鍵詞,你不需要循環(huán)戴昆。在此輸入關(guān)鍵字,點擊保存,實現(xiàn)輸入。在這個例子中,我們需要輸入多個關(guān)鍵字。
11、所以你可以不填文本保存,然后把輸入文本的步驟拖到之前設(shè)置的循環(huán)框中,選擇用當(dāng)前循環(huán)的文本填充輸入框,這樣就可以循環(huán)輸入循環(huán)步驟中的文本。
12、第二步:點擊搜索步驟提取數(shù)據(jù)步驟。
13、注:本地采集后,我們可以看到上述網(wǎng)頁過程在連續(xù)輸入我們指定的關(guān)鍵字完成搜索的基礎(chǔ)上,成功完成了循環(huán)輸入,采集的數(shù)據(jù)是正確的。
14、文字流轉(zhuǎn)可以結(jié)合列表模式的收集,搜索收集淘寶、視頻網(wǎng)站、房產(chǎn)網(wǎng)站等信息。列表模式的采集可以參考采集單個列表頁面的教程。
15、在本文的最后,我們將對循環(huán)框中的高級選擇進行大致介紹:
16、操作名是周期的名稱,可以修改,方便以后修改規(guī)則;
17、執(zhí)行前等待是操作前的等待時間。如果執(zhí)行前等待時間設(shè)置為5秒,則翻頁完成后會等待5秒,以回收提取的元素。如果您想在收集每部電影的信息之前等待,您可以在執(zhí)行提取步驟之前等待。
18、或者將出現(xiàn)元素與執(zhí)行前等待結(jié)合使用,當(dāng)元素出現(xiàn)時,輸入元素的XPath可以結(jié)束執(zhí)行前等待,例如,我們在執(zhí)行設(shè)置循環(huán)文本的步驟之前等待10秒,或者將出現(xiàn)的元素設(shè)置為電影標題,那么在翻頁操作之后,
19、如果標題在第11秒加載,收集器將嘗試在第10秒提取循環(huán),而如果標題在第8秒加載,收集器將在標題在第8秒加載后等待嘗試提取循環(huán),然后結(jié)束循環(huán)的執(zhí)行。
20、Iframe選項中的元素適用于需要在循環(huán)中收集的內(nèi)容。在網(wǎng)頁中是框架,新手教程暫時不涉及。讓我們不要按桌子。
21、循環(huán)方法包括單元素、固定元素列表、非固定元素列表、URL列表和文本列表。其中,單個元素是指只循環(huán)一個元素,一個循環(huán)中點擊下一頁大多使用該操作;固定元素列表表示循環(huán)的一些固定部分,
22、不固定元素列表表示循環(huán)的一些不固定部分。在這個例子中,如果我們只在一個循環(huán)中收集第一個和第二個網(wǎng)頁的內(nèi)容,我們大多使用非固定元素列表,而我們在例子中使用的非固定元素列表是用于輸入定位的Xpath。
23、Xpath找到的所有元素都將出現(xiàn)在循環(huán)列表中;
24、URL列表多用于打開多個網(wǎng)頁收集內(nèi)容,可以放入多個網(wǎng)頁鏈接進行循環(huán)打開操作;
25、文本列表多用于需要輸入文本的網(wǎng)頁,將列表中的多個文本輸入到網(wǎng)頁輸入框中進行查詢。本文給出了具體的例子。
26、滿足以下條件時退出循環(huán)可以設(shè)定循環(huán)次數(shù),例如設(shè)定循環(huán)2次后退出,則循環(huán)提取步驟只會采集列表中前兩條信息,如果循環(huán)翻頁中設(shè)置循環(huán)2次后退出,則會循環(huán)采集前兩頁內(nèi)容。
本文到此結(jié)束,希望對大家有所幫助。