Selenium crawring scraping

pythonのパッケージのひとつのseleniumを使ったクローリングとスクレイピングです。chromeのwebdriverを取得して保存しておいてください。

このサイトをクローリング

このブログのホームページからホームページのタイトルを取得するスクリプトです。ちなみに「elements」だと同じクラス名に該当する要素をすべて取得しますので文字列を取得するときはインデックスを指定してください。

from selenium import webdriver
import time

chromeOptions = webdriver.ChromeOptions()

prefs = {"download.default_directory" : "DLフォルダを設定"}
chromeOptions.add_experimental_option("prefs",prefs)

#Chrome diriverのパス

chromedriver = "webドライバーのフォルダを指定"
driver = webdriver.Chrome(executable_path=chromedriver, chrome_options=chromeOptions)

#  ホームページにアクセス
url_login = "https://datasciencehenomiti.com/"
driver.get(url_login)

# データ取得+取得したテキスト
time.sleep(1)
element = driver.find_elements_by_xpath('//a[@class="header-logo__link"]')
time.sleep(1)

t = element[0].text
print(t)