数据获取—Spider()
找目标网站,该网站是你看小说的网站,分析该网站的结构方便你对内容的抓取

这里我获取最新章节的时间、标题以及标题的连接

这里获取内容
编写spider方法,确定他的返回值,这里我返回的是一个list,包括更新的时间、标题、内容
- 方法中需要导入的包 requests bs4 re
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
| def spider(): list = [] response = requests.get('https://www.xbiquge6.com/13_13134/') response.encoding = ('utf-8') html = response.text html = BeautifulSoup(html, 'html.parser') time = html.select('div#info p:nth-of-type(3)').__getitem__(0).text[5:] title = html.select('div#info p:nth-of-type(4) a[href]').__getitem__(0).text href = html.select('div#info p:nth-of-type(4) a[href]').__getitem__(0) pattern = re.compile(r'href="(.+?)"') href = re.findall(pattern, href.__str__()).__getitem__(0) href = "https://www.xbiquge6.com" + href response = requests.get(href) response.encoding = ('utf-8') html = BeautifulSoup(response.text, 'html.parser') content = html.select('div#content') list.append(title) list.append(content) list.append(time) return list
|
邮件发送—smtp()
首先先在你的邮箱中设置打开smtp服务
比如我的QQ邮箱,先进入邮箱->点击设置->点击账户->下滑找到smtp服务->点击开启服务->生成授权码(就是你在smtp方法中用到的password)
![PCO_6AO93%@2W$B}GFGHI0 (1).png
编写smtp方法,向我的邮箱发送小说,确定返回值是bool类型,成功为True,失败为False
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
| def mail(): list = spider(); ret = True try: mail_msg = list.__getitem__(1).__str__() msg = MIMEText(mail_msg, 'html', 'utf-8') msg['From'] = formataddr(['huzai', my_sender]) msg['To'] = formataddr(['huzai', receiver]) msg['Subject'] = list.__getitem__(0) server = smtplib.SMTP_SSL('smtp.qq.com', 465) server.login(my_sender, my_pwd) server.sendmail(my_sender, [receiver], msg.as_string()) server.quit() except Exception: ret = False return ret
|
上传脚本到服务器
使用xftp将写好的smtp.py上传到你的云服务器上

直接拖进去就行
这里注意保证你的服务器上的python版本和你本机一致,且需要的包已经安装
- 如果你的服务器上的版本是2.*的可以运行下面代码安装python3
1 2 3
| sudo apt-get remove python sudo apt-get install python3 sudo apt autoremove
|
用xshell进入服务器试着运行

在服务器端设置定时执行
确保你安装了crontab(ubuntu默认安装)
cron命名解析:执行的时间 + 执行的用户 + 执行的命令

查看原有的cron

编辑你的程序
编写你的命令,每天14:58给我发送邮件,这里根据你看的小说的更新时间设置,一天几更在大约什么时间等等
1
| 58 14 * * * root python3 smtp.py
|
编辑好了再次查看cron是否已经写入,我这里已经写入

重启crontab服务
静静的等待14:58的到来,查看邮箱
- 邮件收到了最新更新的哦
