博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
BeautifulSoup基本用法
阅读量:5044 次
发布时间:2019-06-12

本文共 671 字,大约阅读时间需要 2 分钟。

BeautifulSoup是可以从HTML或者XML文件中提取数据的Python库

一般配合requests使用

一、引入

from bs4 import BeautifulSoup

 

BeautifulSoup 所支持的解析器

 

 Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString , BeautifulSoup , Comment

    Tag对象:对象与XML或HTML原生文档中的tag相同

    每个tag 都有自己的名字,Tag.name 来获取,tag可能有很多个属性. tag <b class="boldest"> 有一个 “class” 的属性,值为 “boldest” . tag的属性的操作方法与字典相同: tag['class'] = "boldest"

    可以遍历字符串,字符串常被包含在tag内.Beautiful Soup用 NavigableString 类来包装tag中的字符串,tag.string

 

 

 

 

————————————————
版权声明:本文为CSDN博主「maverick17」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/maverick17/article/details/79610050

转载于:https://www.cnblogs.com/whisperbb/p/11398872.html

你可能感兴趣的文章
使用 resizableImageWithCapInsets 方法实现可伸缩图片
查看>>
2015—全新的起点,新的自己
查看>>
linux内核container_of宏定义分析
查看>>
总结 <stdlib.h>头文件 在算法中可能会用到的一些函数
查看>>
Parkside's Triangle poj3173
查看>>
假期周进度报告08
查看>>
Java Struts2 (四)
查看>>
bzoj2190 [SDOI2008]仪仗队
查看>>
Tyvj1209
查看>>
单利设计模式
查看>>
github里,star和fork操作,该如何选择?
查看>>
在VS2010下如何使用头文件unistd.h
查看>>
java实现快速排序
查看>>
log4net的应用
查看>>
Android -- EventBus解析
查看>>
转载:C# this.invoke()作用 多线程操作UI 理解二
查看>>
Vim安装及配置
查看>>
奥东......C# Base Coding
查看>>
JavaScript中清空数组的三种方式
查看>>
HTML5学习
查看>>