python入门学习:采集搜狗下拉联想词

主要学习:

  1. 1)输入与输出的使用:input()接受输入,print()将内容输出到终端;
  2. 2)打开网页,获取源代码:urllib.request相关操作:
    • quote(keyword),将关键词进行URL编码;
    • urlopen(URL)打开指定URL的网页;
    • read()读取打开网页的内容;
    • decode(‘GBK’)按照指定编码进行解码;
  3. 3)正则表达式模块re相关操作:
    • r'”(\D.*?)”‘ 编写正则匹配规则;
    • re.compile(rule)将匹配规则进行编译;
    • re.findall()查找匹配的字符串;
  4. 4)文件相关操作:
    • open(‘keywords.txt’,’w’,encoding=’utf-8′)以写入的方式打开文件,不存在则创建;
    • write(),将内容写入文件;
    • close(),关闭文件;
  5. 4)for循环的使用:for ky in word: 遍历数组;
  6. 6)if语句的使用,if len(ky)>= 4,len()函数返回字符串长度。

Python入门学习:Beautiful Soup 4检查页面TDKH标签

Python入门学习:模拟浏览器查询百度获取结果

Python入门学习:应用random函数随机生成HTTP请求headers信息

Python入门学习:使用http.cookiejar生产Cookie模拟用户登陆