
qq:800819103
在线客服,实时响应
qq群
在线客服,实时响应
客服电话
13318873961代理IP如何帮助爬虫爬取猫眼电影影片?想要获取最近热映影片,当然是用爬虫来爬取。今天我们就来看下,爬虫是如何爬取猫眼电影热映影片信息的。首先我们先打开猫眼电影的热映榜单页面,右键检查分析页面,查找目标信息位置。
具体代码如下:
import requests
import re
url = 'http://maoyan.com/board'
headers = {'User-Agent': '具体agent信息'}
response = requests.get(url, headers=headers)
pattern = re.compile(r'
([\d\D]*?)
') # 只显示一个
dd_list = pattern.findall(response.text)
for dd in dd_list:
# 电影名字
title_pattern = re.compile(r'
name = title_pattern.findall(dd)
print(name[0].strip())
# 电影主演
people_pattern = re.compile(r'
([\d\D]*?)
')
people = people_pattern.findall(dd)
print(people[0].strip())
# 上映时间
time_pattern = re.compile(r'
([\d\D]*?)
')
time = time_pattern.findall(dd)
print(time[0])
# 评分
score_pattern1 = re.compile(r'([\d\D]*?)')
score_first = score_pattern1.findall(dd)[0]
score_pattern2 = re.compile(r'([\d\D]*?)')
score_last = score_pattern2.findall(dd)[0]
print(score_first + score_last)
通过上述代码,我们就可以获取到猫眼电影热映影片的电影名字、主演、上映时间和评分信息了。黑洞代理服务器爬虫代理,数据采集服务服务提供商,为您提供更快,更可靠的服务。
相关文章内容简介
1 代理IP如何帮助爬虫爬取猫眼电影影片?
代理IP如何帮助爬虫爬取猫眼电影影片?想要获取最近热映影片,当然是用爬虫来爬取。今天我们就来看下,爬虫是如何爬取猫眼电影热映影片信息的。首先我们先打开猫眼电影的热映榜单页面,右键检查分析页面,查找目标信息位置。 具体代码如下: import∵requests import∵re url∵=∵'http://maoyan.com/board' headers∵=∵{'User-Agent':... [阅读全文]
最新标签
推荐阅读
17
2019-01
服务器托管和自建机房的区别和优势是什么?
随着网络数据年代的发展趋势,越来越多的网络资源需要专业的管理和安全使用。数据型公司是托管服务器,还是自建主机房更有优势呢?今天就来看看彼此之间有什么样的区别。
20
2018-10
使用黑洞代理IP资源的正确姿势
常用网络的用户肯定是遇到过访问网址受限制的情况,这也许并不是你使用的原因,而是因为大部分的网站都限定了每个IP用户的注册次数以及访问次数。
26
2018-10
被网站限制了IP怎么处理
几乎所有的网站都会设置用户访问参数,特别是IP的限制,如果频繁访问网站,对方肯定是采取措施的,那么如果被网站限制了IP怎么处理?
11
2019-01
在网站建设中独立ip有多重要你了解吗?
据不完全统计,市面上百分之四十以内的公司会为了省钱,选用经济的空间和网络服务器,而这些空间和网络服务器往往全部都是与别的企业拼租的,虽说价格便宜,可是问题也特别大。那么,
热门文章