python教程

您现在的位置：首页 > 网站教程 > python教程

Python爬虫练习：爬取800多所大学学校排名、星级等

python教程 51源码 2022-11-30 共人阅读

Python爬虫练习：爬取800多所大学学校排名、星级等[Python常见问题]

前言

国内大学最新排名，北大反超，浙大仅第四，中科大跌至第八

时隔五年，“双一流”大学即将迎来首次大考，这也是继改变高校评断标准之后，第一次即将以官方对外发布，自然是引来了许多人的关注。最近，有许多不同机构发布的国内高校排名，但彼此之间的差异很大，网友之间的争议也很大。

很多人学习python，不知道从何学起。
很多人学习python，掌握了基本语法过后，不知道在哪里寻找案例上手。
很多已经做案例的人，却不知道如何去学习更加高深的知识。
那么针对这三类人，我给大家提供一个好的学习平台，免费领取视频教程，电子书籍，以及课程的源代码！
QQ群：961562169

项目目标

爬取高三网大学排名，并保存

目标网址

http://m.gaosan.com/gaokao/265440.html

基本环境配置

python 3.6
pycharm

爬虫代码

导入工具

import requests
import parsel
import csv

请求网页数据

url = "http://m.gaosan.com/gaokao/265440.html"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36"
}
response = requests.get(url=url, headers=headers)
response.encoding = response.apparent_encoding

爬取数据

selector = parsel.Selector(response.text)
trs = selector.css("#page tr")

for tr in trs:
    dit = {}
    ranking = tr.css("td:nth-child(1)::text").get()
    dit["名次"] = ranking
    school = tr.css("td:nth-child(2)::text").get()
    dit["学校名称"] = school
    score = tr.css("td:nth-child(3)::text").get()
    dit["综合得分"] = score
    star = tr.css("td:nth-child(4)::text").get()
    dit["星级排名"] = star
    level = tr.css("td:nth-child(5)::text").get()
    dit["办学层次"] = level
    csv_writer.writerow(dit)

保存数据

f = open("排名.csv", mode="a", encoding="utf-8", newline="")
csv_writer = csv.DictWriter(f, fieldnames=["名次", "学校名称", "综合得分", "星级排名", "办学层次"])
f.close()

运行代码，效果如下图

文章来源：

标签爬虫星级所大学

上一篇：python3 之天天生鲜项目（初学者）3

下一篇：返回列表

栏目分类

python教程

Python爬虫练习：爬取800多所大学学校排名、星级等

前言

项目目标

目标网址

基本环境配置

爬虫代码

导入工具

请求网页数据

爬取数据

保存数据

运行代码，效果如下图

python教程

pbootcms教程

帝国cms教程

wordpress教程

织梦CMS教程

ecshop教程

phpcms教程

极致CMS

php教程

discuz教程

视频教程

网站安装