2020年10月17日

python

import requests 
from lxml import etree

抓取网站

  1. 模拟浏览器访问指定网站[通过requests模块,发送get或post请求]
    1. response=requests.get(url=,params=,headers=)
  2. 抓取指定内容[通过etree.HTML(response.text)得到一个可用xpath语法解析的obj,然后解析其中的数据]
    1. e_obj=etree.HTML(response.text)
    2. e_obj.xpath(xpath表达式)
  3. 将抓取的数据本地化存储e_obj
每日学习总结
JSRUN前端笔记, 是针对前端工程师开放的一个笔记分享平台,是前端工程师记录重点、分享经验的一个笔记本。JSRUN前端采用的 MarkDown 语法 (极客专用语法), 这里属于IT工程师。