Selenium

什麼是Selenium?

Selenium是一系列工具和函式庫的總括項目,可實現和支援Web瀏覽器的自動化。

Selenium有許多功能,但其核心是一個用於Web瀏覽器自動化的工具集,它使用可用的最佳技術來遠端控制瀏覽器實例並模擬使用者與瀏覽器的互動。

下面為您介紹如何將Thordata與Selenium集成。

1

安裝Selenium

安裝 Selenium Wire來擴充 Selenium的Python綁定,因為使用預設的Selenium模組來實現需要身份驗證的代理程式會使整個過程變得複雜。您可以使用pip指令來完成此操作:pip install selenium-wire

此整合的另一個推薦包是 webdriver-manager。它是一個簡化不同瀏覽器二進位驅動程式管理的套件。在這種情況下,無需在每次更新後手動下載新版本的 Web 驅動程式。

2

指定您的使用者憑證以使代理程式正常運作

USERNAME = "td-customer-USERNAME"

PASSWORD = "PASSWORD"

ENDPOINT = "t.pr.thordata.net:9999"

3

檢查代理狀態

通過訪問ipinfo.thordata.com檢查代理是否正常運作。如果一切正常 - 它將傳回您正在使用的代理程式的 IP 位址。

try:
    driver.get("https://ipinfo.thordata.com/")
    return f'\nYour IP is: {driver.find_element(By.CSS_SELECTOR, "pre").text}'
finally:
    driver.quit()

完整代碼示例:

from selenium.webdriver.common.by import By
from seleniumwire import webdriver
# A package to have a chromedriver always up-to-date.
from webdriver_manager.chrome import ChromeDriverManager

USERNAME = "td-customer-USERNAME"
PASSWORD = "PASSWORD"
ENDPOINT = "t.pr.thordata.net:9999"

def chrome_proxy(user: str, password: str, endpoint: str) -> dict:
    wire_options = {
        "proxy": {
            "http": f"http://{user}:{password}@{endpoint}",
            "https": f"https://{user}:{password}@{endpoint}",
        }
    }

    return wire_options

def execute_driver():
    options = webdriver.ChromeOptions()
    options.add_argument('--headless')
    proxies = chrome_proxy(USERNAME, PASSWORD, ENDPOINT)
    driver = webdriver.Chrome(
    ChromeDriverManager(driver_version='<VERSION>').install(), options=options, seleniumwire_options=proxies
    )
    try:
        driver.get("https://ipinfo.thordata.com/")
        return f'\nYour IP is: {driver.find_element(By.CSS_SELECTOR, "pre").text}'
    finally:
        driver.quit()


if __name__ == '__main__':
    print(execute_driver())

Last updated

Was this helpful?