pythonのパッケージのひとつのseleniumを使ったクローリングとスクレイピングです。chromeのwebdriverを取得して保存しておいてください。
このサイトをクローリング
このブログのホームページからホームページのタイトルを取得するスクリプトです。ちなみに「elements」だと同じクラス名に該当する要素をすべて取得しますので文字列を取得するときはインデックスを指定してください。
from selenium import webdriver
import time
chromeOptions = webdriver.ChromeOptions()
prefs = {"download.default_directory" : "DLフォルダを設定"}
chromeOptions.add_experimental_option("prefs",prefs)
#Chrome diriverのパス
chromedriver = "webドライバーのフォルダを指定"
driver = webdriver.Chrome(executable_path=chromedriver, chrome_options=chromeOptions)
# ホームページにアクセス
url_login = "https://datasciencehenomiti.com/"
driver.get(url_login)
# データ取得+取得したテキスト
time.sleep(1)
element = driver.find_elements_by_xpath('//a[@class="header-logo__link"]')
time.sleep(1)
t = element[0].text
print(t)