乐易论坛-乐易网易语言培训教程火山PC视窗中文编程交流论坛

 找回密码
 立即注册

手机号登录

用手机号号登陆

微信登录

微信扫码,快速开始

QQ登录

用QQ账号登陆

办理VIP,定制软件,报名培训联系QQ[重磅]2024年实地培训高清培训目录火山PC版乐易模块使用教程
有了火山,易语言是否还有必要学习吗?易语言0基础入门课程火山PC视窗0基础入门课程
乐易论坛官方QQ群一览表易语言外挂0基础入门课程火山PC视窗火山HOOK入门课程
易语言误报处理课程QQ空间POST课程2022年火山PC易语言POST系列课程
Android逆向Jeb动态调试0基础课程QQ邮箱网页POST课程WeChat个微Hook实战课程
百日Js加密分析实战课程(无密下载)QQ群POST课程h5游戏WebSocket逆向视频
JavaScript加密特训课程易语言汇编快速入门课程破解实战系列课程
手游模拟器脚本0基础课程易语言加密防破解0基础入门课程广告位招租联系QQ1615457736
查看: 12347|回复: 0

[交流/分享] Python 爬取电影网站的信息

[复制链接]

[交流/分享] Python 爬取电影网站的信息

[复制链接]
已绑定手机
已实名认证
艾鱼
等级头衔

等級:顶级Vip

Rank: 14Rank: 14Rank: 14Rank: 14

积分成就
易币
贡献
主题
精华
金钱
积分
2357
注册时间
2016-10-26
最后登录
1970-1-1

勋章墙

2018-10-30 09:05:05 | 显示全部楼层 |阅读模式

据统计90%查看本帖的人,都已经注册本站了哦

您需要 登录 才可以下载或查看,没有账号?立即注册

×
本帖最后由 艾鱼 于 2018-10-30 09:19 编辑

自学Python一段时间了,写的代码比较紊乱,也不多,大佬勿喷。

  1. #!/usr/bin/env python
  2. # -*- coding: utf-8 -*-
  3. # @Date    : 2018-07-30 17:14:11
  4. # @Author  : --Eruy-- (yl8923@qq.com)
  5. # @Link    : https://www.leybc.com/
  6. # @Version : $Id$
  7. #请求库
  8. import requests

  9. #解析库 bs4  css pyquery Json xpath re
  10. from lxml import etree

  11. #        类
  12. class MiNiMp4(object):

  13.         """docstring for GetMovies"""
  14.        
  15.         def GetMovies(self, page):
  16.                 url = 'http://www.minimp4.com/movie/?page={}'.format(page)
  17.                 html = requests.get(url)               

  18.                 htmll = etree.HTML(html.text)        #初始化xml
  19.                 hrefs = htmll.xpath('//div[@class="meta"]/h1/a/@href')

  20.                 # print(hrefs)
  21.                 for url in hrefs:
  22.                         html = requests.get(url)

  23.                         dat = etree.HTML(html.text)
  24.                         movieName = dat.xpath('//div[@class="movie-meta"]/h1/text()')
  25.                         print(movieName)

  26.                         self.saveMovies(movieName)
  27.                 # return url
  28.                 #
  29.         @staticmethod
  30.         def saveMovies(data):
  31.                 with open('movies.txt','a',encoding='utf-8') as fp:
  32.                         fp.write(data[0]+'\n')




  33. if __name__ == "__main__":
  34.         minimp4 = MiNiMp4()

  35.         for n in range(10):
  36.                 minimp4.GetMovies(n)


复制代码

评分

参与人数 1易币 +10 金钱 +20 收起 理由
揰掵佲 + 10 + 20 感谢楼主开源,绝对顶你!

查看全部评分

回复

使用道具 举报

如果懒得打字,请选择右侧内容快捷回复 提醒:以任何方式进行『恶意灌水』的行为,进行封号处理
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

热点推荐上一条 /5 下一条

QQ|网站地图|手机版|小黑屋|乐易论坛-乐易网 | 湘ICP备19007035号

拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表乐易立场!

娄底市乐易网络科技有限公司声明:乐易原创培训课程版权均为我公司所有,未经许可,不得擅自翻录,盗版,破解本站课课程,我们将保留法律诉讼的权利

GMT+8, 2024-4-20 02:08 , Processed in 0.037462 second(s), 36 queries .

Powered by Discuz! X3.4

Copyright © Tencent Cloud.

快速回复 返回顶部 返回列表