欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

python爬取豆瓣电影名称与评分进行分析

发布时间:2024/8/1 python 48 豆豆
生活随笔 收集整理的这篇文章主要介绍了 python爬取豆瓣电影名称与评分进行分析 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

通过使用python进行豆瓣网上的数据爬取,进行分析,得到电影名称与评分。可直接运行。

import time import os import numpy as np import pandas as pd import matplotlib.pyplot as plt from selenium import webdriver from selenium.common.exceptions import NoSuchElementException import datetime ## 爬取剧集列表,并输出成为excel表格 driver = webdriver.Chrome(executable_path = "D:\\work\\python\\chromedriver.exe") driver.maximize_window() #driver.close() driver.switch_to_window(driver.window_handles[0]) url = 'https://movie.douban.com/tag/#/?sort=U&range=2,10&tags=%E7%94%B5%E5%BD%B1,2010%E5%B9%B4%E4%BB%A3,%E4%B8%AD%E5%9B%BD%E5%A4%A7%E9%99%86' js='window.open("'+url+'")' driver.execute_script(js) driver.close() driver.switch_to_window(driver.window_handles[0])'''测试 i_pag = 0 while i_pag < 3:try:js="var q=document.documentElement.scrollTop=10000000" driver.execute_script(js)driver.find_element_by_class_name('more').click()time.sleep(2)i_pag = i_pag + 1except:break '''while True:try:js="var q=document.documentElement.scrollTop=10000000" driver.execute_script(js)driver.find_element_by_class_name('more').click()time.sleep(2)except:break name = [k.text for k in driver.find_elements_by_class_name('title')] score = [k.text for k in driver.find_elements_by_class_name('rate')] url = [k.get_attribute('href') for k in driver.find_elements_by_class_name('item')] pd.DataFrame({'name':name,'score':score,'url':url}).to_excel('电影名称.xlsx')

仅用于学习使用!

总结

以上是生活随笔为你收集整理的python爬取豆瓣电影名称与评分进行分析的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。