bs函数python python abs函数

Python中字典的内建函数用法是什么?

创新互联建站是一家集网站建设,农安企业网站建设,农安品牌网站建设,网站定制,农安网站建设报价,网络营销,网络优化,农安网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。

点击上方 "Python人工智能技术" 关注,星标或者置顶

22点24分准时推送,第一时间送达

后台回复“大礼包”,送你特别福利

编辑:乐乐 | 来自:pypypypy

上一篇:

正文

大家好,我是Pythn人工智能技术。

内置函数就是Python给你提供的,拿来直接用的函数,比如print.,input等。

截止到python版本3.6.2 ,python一共提供了68个内置函数,具体如下

abs() dict() help() min() setattr()

all() dir() hex() next() slice()

any() divmod() id() object() sorted()

ascii() enumerate() input() oct() staticmethod()

bin() eval() int() open() str()

bool() exec() isinstance() ord() sum()

bytearray() filter() issubclass() pow() super()

bytes() float() iter() print() tuple()

callable() format() len() property() type()

chr() frozenset() list() range() vars()

classmethod() getattr() locals() repr() zip()

compile() globals() map() reversed() __import__()

complex() hasattr() max() round()

delattr() hash() memoryview() set()

本文将这68个内置函数综合整理为12大类,正在学习Python基础的读者一定不要错过,建议收藏学习!

和数字相关 1. 数据类型

bool : 布尔型(True,False)

int : 整型(整数)

float : 浮点型(小数)

complex : 复数

2. 进制转换

bin() 将给的参数转换成二进制

otc() 将给的参数转换成八进制

hex() 将给的参数转换成十六进制

print(bin(10)) # 二进制:0b1010

print(hex(10)) # 十六进制:0xa

print(oct(10)) # 八进制:0o12

3. 数学运算

abs() 返回绝对值

divmode() 返回商和余数

round() 四舍五入

pow(a, b) 求a的b次幂, 如果有三个参数. 则求完次幂后对第三个数取余

sum() 求和

min() 求最小值

max() 求最大值

print(abs(-2)) # 绝对值:2

print(divmod(20,3)) # 求商和余数:(6,2)

print(round(4.50)) # 五舍六入:4

print(round(4.51)) #5

print(pow(10,2,3)) # 如果给了第三个参数. 表示最后取余:1

print(sum([1,2,3,4,5,6,7,8,9,10])) # 求和:55

print(min(5,3,9,12,7,2)) #求最小值:2

print(max(7,3,15,9,4,13)) #求最大值:15

和数据结构相关 1. 序列

(1)列表和元组

list() 将一个可迭代对象转换成列表

tuple() 将一个可迭代对象转换成元组

print(list((1,2,3,4,5,6))) #[1, 2, 3, 4, 5, 6]

print(tuple([1,2,3,4,5,6])) #(1, 2, 3, 4, 5, 6)

(2)相关内置函数

reversed() 将一个序列翻转, 返回翻转序列的迭代器

slice() 列表的切片

lst = "你好啊"

it = reversed(lst) # 不会改变原列表. 返回一个迭代器, 设计上的一个规则

print(list(it)) #['啊', '好', '你']

lst = [1, 2, 3, 4, 5, 6, 7]

print(lst[1:3:1]) #[2,3]

s = slice(1, 3, 1) # 切片用的

print(lst[s]) #[2,3]

(3)字符串

str() 将数据转化成字符串

print(str(123)+'456') #123456

format() 与具体数据相关, 用于计算各种小数, 精算等.

s = "hello world!"

print(format(s, "^20")) #剧中

print(format(s, "20")) #左对齐

print(format(s, "20")) #右对齐

# hello world!

# hello world!

# hello world!

print(format(3, 'b' )) # 二进制:11

print(format(97, 'c' )) # 转换成unicode字符:a

print(format(11, 'd' )) # ⼗进制:11

print(format(11, 'o' )) # 八进制:13

print(format(11, 'x' )) # 十六进制(⼩写字母):b

print(format(11, 'X' )) # 十六进制(大写字母):B

print(format(11, 'n' )) # 和d⼀样:11

print(format(11)) # 和d⼀样:11

print(format(123456789, 'e' )) # 科学计数法. 默认保留6位小数:1.234568e+08

print(format(123456789, '0.2e' )) # 科学计数法. 保留2位小数(小写):1.23e+08

print(format(123456789, '0.2E' )) # 科学计数法. 保留2位小数(大写):1.23E+08

print(format(1.23456789, 'f' )) # 小数点计数法. 保留6位小数:1.234568

print(format(1.23456789, '0.2f' )) # 小数点计数法. 保留2位小数:1.23

print(format(1.23456789, '0.10f')) # 小数点计数法. 保留10位小数:1.2345678900

print(format(1.23456789e+3, 'F')) # 小数点计数法. 很大的时候输出INF:1234.567890

bytes() 把字符串转化成bytes类型

bs = bytes("今天吃饭了吗", encoding="utf-8")

print(bs) #b'\xe4\xbb\x8a\xe5\xa4\xa9\xe5\x90\x83\xe9\xa5\xad\xe4\xba\x86\xe5\x90\x97'

bytearray() 返回一个新字节数组. 这个数字的元素是可变的, 并且每个元素的值得范围是[0,256)

ret = bytearray("alex" ,encoding ='utf-8')

print(ret[0]) #97

print(ret) #bytearray(b'alex')

ret[0] = 65 #把65的位置A赋值给ret[0]

print(str(ret)) #bytearray(b'Alex')

ord() 输入字符找带字符编码的位置

chr() 输入位置数字找出对应的字符

ascii() 是ascii码中的返回该值 不是就返回u

print(ord('a')) # 字母a在编码表中的码位:97

print(ord('中')) # '中'字在编码表中的位置:20013

print(chr(65)) # 已知码位,求字符是什么:A

print(chr(19999)) #丢

for i in range(65536): #打印出0到65535的字符

print(chr(i), end=" ")

print(ascii("@")) #'@'

repr() 返回一个对象的string形式

s = "今天\n吃了%s顿\t饭" % 3

print(s)#今天# 吃了3顿 饭

print(repr(s)) # 原样输出,过滤掉转义字符 \n \t \r 不管百分号%

#'今天\n吃了3顿\t饭'

2. 数据集合

字典:dict 创建一个字典

集合:set 创建一个集合

frozenset() 创建一个冻结的集合,冻结的集合不能进行添加和删除操作。

3. 相关内置函数

len() 返回一个对象中的元素的个数

sorted() 对可迭代对象进行排序操作 (lamda)

语法:sorted(Iterable, key=函数(排序规则), reverse=False)

Iterable: 可迭代对象

key: 排序规则(排序函数), 在sorted内部会将可迭代对象中的每一个元素传递给这个函数的参数. 根据函数运算的结果进行排序

reverse: 是否是倒叙. True: 倒叙, False: 正序

lst = [5,7,6,12,1,13,9,18,5]

lst.sort() # sort是list里面的一个方法

print(lst) #[1, 5, 5, 6, 7, 9, 12, 13, 18]

ll = sorted(lst) # 内置函数. 返回给你一个新列表 新列表是被排序的

print(ll) #[1, 5, 5, 6, 7, 9, 12, 13, 18]

l2 = sorted(lst,reverse=True) #倒序

print(l2) #[18, 13, 12, 9, 7, 6, 5, 5, 1]

#根据字符串长度给列表排序

lst = ['one', 'two', 'three', 'four', 'five', 'six']

def f(s):

return len(s)

l1 = sorted(lst, key=f, )

print(l1) #['one', 'two', 'six', 'four', 'five', 'three']

enumerate() 获取集合的枚举对象

lst = ['one','two','three','four','five']

for index, el in enumerate(lst,1): # 把索引和元素一起获取,索引默认从0开始. 可以更改

print(index)

print(el)

# 1

# one

# 2

# two

# 3

# three

# 4

# four

# 5

# five

all() 可迭代对象中全部是True, 结果才是True

any() 可迭代对象中有一个是True, 结果就是True

print(all([1,'hello',True,9])) #True

print(any([0,0,0,False,1,'good'])) #True

zip() 函数用于将可迭代的对象作为参数, 将对象中对应的元素打包成一个元组, 然后返回由这些元组组成的列表. 如果各个迭代器的元素个数不一致, 则返回列表长度与最短的对象相同

lst1 = [1, 2, 3, 4, 5, 6]

lst2 = ['醉乡民谣', '驴得水', '放牛班的春天', '美丽人生', '辩护人', '被嫌弃的松子的一生']

lst3 = ['美国', '中国', '法国', '意大利', '韩国', '日本']

print(zip(lst1, lst1, lst3)) #

for el in zip(lst1, lst2, lst3):

print(el)

# (1, '醉乡民谣', '美国')

# (2, '驴得水', '中国')

# (3, '放牛班的春天', '法国')

# (4, '美丽人生', '意大利')

# (5, '辩护人', '韩国')

# (6, '被嫌弃的松子的一生', '日本')

fiter() 过滤 (lamda)

语法:fiter(function. Iterable)

function: 用来筛选的函数. 在filter中会自动的把iterable中的元素传递给function. 然后根据function返回的True或者False来判断是否保留留此项数据 , Iterable: 可迭代对象

搜索公众号顶级架构师后台回复“面试”,送你一份惊喜礼包。

def func(i): # 判断奇数

return i % 2 == 1

lst = [1,2,3,4,5,6,7,8,9]

l1 = filter(func, lst) #l1是迭代器

print(l1) #

print(list(l1)) #[1, 3, 5, 7, 9]

map() 会根据提供的函数对指定序列列做映射(lamda)

语法 : map(function, iterable)

可以对可迭代对象中的每一个元素进行映射. 分别去执行 function

def f(i): return i

lst = [1,2,3,4,5,6,7,]

it = map(f, lst) # 把可迭代对象中的每一个元素传递给前面的函数进行处理. 处理的结果会返回成迭代器print(list(it)) #[1, 2, 3, 4, 5, 6, 7]

和作用域相关

locals() 返回当前作用域中的名字

globals() 返回全局作用域中的名字

def func():

a = 10

print(locals()) # 当前作用域中的内容

print(globals()) # 全局作用域中的内容

print("今天内容很多")

func()

# {'a': 10}

# {'__name__': '__main__', '__doc__': None, '__package__': None, '__loader__':

# _frozen_importlib_external.SourceFileLoader object at 0x0000026F8D566080,

# '__spec__': None, '__annotations__': {}, '__builtins__':

# (built-in), '__file__': 'D:/pycharm/练习/week03/new14.py', '__cached__': None,

# 'func': }

# 今天内容很多

和迭代器生成器相关

range() 生成数据

next() 迭代器向下执行一次, 内部实际使⽤用了__ next__()⽅方法返回迭代器的下一个项目

iter() 获取迭代器, 内部实际使用的是__ iter__()⽅方法来获取迭代器

for i in range(15,-1,-5):

print(i)

# 15

# 10

# 5

# 0

lst = [1,2,3,4,5]

it = iter(lst) # __iter__()获得迭代器

print(it.__next__()) #1

print(next(it)) #2 __next__()

print(next(it)) #3

print(next(it)) #4

字符串类型代码的执行

eval() 执行字符串类型的代码. 并返回最终结果

exec() 执行字符串类型的代码

compile() 将字符串类型的代码编码. 代码对象能够通过exec语句来执行或者eval()进行求值

s1 = input("请输入a+b:") #输入:8+9

print(eval(s1)) # 17 可以动态的执行代码. 代码必须有返回值

s2 = "for i in range(5): print(i)"

a = exec(s2) # exec 执行代码不返回任何内容

# 0

# 1

# 2

# 3

# 4

print(a) #None

# 动态执行代码

exec("""

def func():

print(" 我是周杰伦")

""" )

func() #我是周杰伦

code1 = "for i in range(3): print(i)"

com = compile(code1, "", mode="exec") # compile并不会执行你的代码.只是编译

exec(com) # 执行编译的结果

# 0

# 1

# 2

code2 = "5+6+7"

com2 = compile(code2, "", mode="eval")

print(eval(com2)) # 18

code3 = "name = input('请输入你的名字:')" #输入:hello

com3 = compile(code3, "", mode="single")

exec(com3)

print(name) #hello

输入输出

print() : 打印输出

input() : 获取用户输出的内容

print("hello", "world", sep="*", end="@") # sep:打印出的内容用什么连接,end:以什么为结尾

#hello*world@

内存相关

hash() : 获取到对象的哈希值(int, str, bool, tuple). hash算法:(1) 目的是唯一性 (2) dict 查找效率非常高, hash表.用空间换的时间 比较耗费内存

s = 'alex'print(hash(s)) #-168324845050430382lst = [1, 2, 3, 4, 5]print(hash(lst)) #报错,列表是不可哈希的 id() : 获取到对象的内存地址s = 'alex'print(id(s)) #2278345368944

文件操作相关

open() : 用于打开一个文件, 创建一个文件句柄

f = open('file',mode='r',encoding='utf-8')

f.read()

f.close()

模块相关

__ import__() : 用于动态加载类和函数

# 让用户输入一个要导入的模块

import os

name = input("请输入你要导入的模块:")

__import__(name) # 可以动态导入模块

帮 助

help() : 函数用于查看函数或模块用途的详细说明

print(help(str)) #查看字符串的用途

调用相关

callable() : 用于检查一个对象是否是可调用的. 如果返回True, object有可能调用失败, 但如果返回False. 那调用绝对不会成功

a = 10

print(callable(a)) #False 变量a不能被调用

def f():

print("hello")

print(callable(f)) # True 函数是可以被调用的

查看内置属性

dir() : 查看对象的内置属性, 访问的是对象中的__dir__()方法

print(dir(tuple)) #查看元组的方法

你还有什么想要补充的吗?

免责声明:本文内容来源于网络,文章版权归原作者所有,意在传播相关技术知识行业趋势,供大家学习交流,若涉及作品版权问题,请联系删除或授权事宜。

技术君个人微信

添加技术君个人微信即送一份惊喜大礼包

→ 技术资料共享

→ 技术交流社群

--END--

往日热文:

Python程序员深度学习的“四大名著”:

这四本书着实很不错!我们都知道现在机器学习、深度学习的资料太多了,面对海量资源,往往陷入到“无从下手”的困惑出境。而且并非所有的书籍都是优质资源,浪费大量的时间是得不偿失的。给大家推荐这几本好书并做简单介绍。

获得方式:

2.后台回复关键词:名著

python爬虫 函数返回值如何调用?

在if 里只需要yield "" + item_url.attrs['href']

然后Lsit(最好改可名,在python规范里,函数命名是全小写,而list又是保留字,比如改为display_hrefs)只需要循环输出getUrl的结果就好:

def getUrl(url: str):

....html = urlopen(url)

....for item_url in BeautifulSoup((html.read()).find ('div' , class_='AAA').findAll ("a"):

........if 'href' in item_url.attrs:

............yield "" + item_url.attrs['href']

def display_hrefs(url: str):

....for href in getUrl(url):

........print(href)

if __name__ == '__main__':

....display_hrefs("")

python爬虫时,bs4无法读取网页标签中的文本

稍微说一下背景,当时我想研究蛋白质与小分子的复合物在空间三维结构上的一些规律,首先得有数据啊,数据从哪里来?就是从一个涵盖所有已经解析三维结构的蛋白质-小分子复合物的数据库里面下载。这时候,手动一个个去下显然是不可取的,我们需要写个脚本,能从特定的网站选择性得批量下载需要的信息。python是不错的选择。

import urllib #python中用于获取网站的模块

import urllib2, cookielib

有些网站访问时需要cookie的,python处理cookie代码如下:

cj = ***.cookiejar ( )

opener = ***.build_opener( ***.httpcookieprocessor(cj) )

***.install_opener (opener)

通常我们需要在网站中搜索得到我们需要的信息,这里分为二种情况:

1. 第一种,直接改变网址就可以得到你想要搜索的页面:

def GetWebPage( x ): #我们定义一个获取页面的函数,x 是用于呈递你在页面中搜索的内容的参数

url = '***.cgi?' + ‘你想要搜索的参数’ # 结合自己页面情况适当修改

page = ***.urlopen(url)

pageContent = ***.read( )

return pageContent #返回的是HTML格式的页面信息

2.第二种,你需要用到post方法,将你搜索的内容放在postdata里面,然后返回你需要的页面

def GetWebPage( x ): #我们定义一个获取页面的函数,x 是用于呈递你在页面中搜索的内容的参数

url = '' #这个网址是你进入搜索界面的网址

postData = ***.urlencode( { 各种‘post’参数输入 } ) #这里面的post参数输入需要自己去查

req= ***.request (url, postData)

pageContent = ***.urlopen (req). read( )

return pageContent #返回的是HTML格式的页面信息

在获取了我们需要的网页信息之后,我们需要从获得的网页中进一步获取我们需要的信息,这里我推荐使用 BeautifulSoup 这个模块, python自带的没有,可以自行百度谷歌下载安装。 BeautifulSoup 翻译就是‘美味的汤’,你需要做的是从一锅汤里面找到你喜欢吃的东西。

import re # 正则表达式,用于匹配字符

from bs4 import BeautifulSoup # 导入BeautifulSoup 模块

soup = BeautifulSoup(pageContent) #pageContent就是上面我们搜索得到的页面

soup就是 HTML 中所有的标签(tag)BeautifulSoup处理格式化后的字符串,一个标准的tag形式为:

hwkobe24

通过一些过滤方法,我们可以从soup中获取我们需要的信息:

(1) find_all ( name , attrs , recursive , text , **kwargs)

这里面,我们通过添加对标签的约束来获取需要的标签列表, 比如 ***.find_all ('p') 就是寻找名字为‘p’的 标签,而***.find_all (class = "tittle") 就是找到所有class属性为"tittle" 的标签,以及***.find_all ( class = ***.compile('lass')) 表示 class属性中包含‘lass’的所有标签,这里用到了正则表达式(可以自己学习一下,非常有用滴)

当我们获取了所有想要标签的列表之后,遍历这个列表,再获取标签中你需要的内容,通常我们需要标签中的文字部分,也就是网页中显示出来的文字,代码如下:

tagList = ***.find_all (class="tittle") #如果标签比较复杂,可以用多个过滤条件使过滤更加严格

for tag in tagList:

print ***.text

***.write ( str(***.text) ) #将这些信息写入本地文件中以后使用

(2)find( name , attrs , recursive , text , **kwargs )

它与 find_all( ) 方法唯一的区别是 find_all() 方法的返回结果是值包含一个元素的列表,而 find() 方法直接返回结果

(3)find_parents( ) find_parent( )

find_all() 和 find() 只搜索当前节点的所有子节点,孙子节点等. find_parents() 和 find_parent() 用来搜索当前节点的父辈节点,搜索方法与普通tag的搜索方法相同,搜索文档搜索文档包含的内容

(4)find_next_siblings() find_next_sibling()

这2个方法通过 .next_siblings 属性对当 tag 的所有后面解析的兄弟 tag 节点进代, find_next_siblings() 方法返回所有符合条件的后面的兄弟节点,find_next_sibling() 只返回符合条件的后面的第一个tag节点

(5)find_previous_siblings() find_previous_sibling()

这2个方法通过 .previous_siblings 属性对当前 tag 的前面解析的兄弟 tag 节点进行迭代, find_previous_siblings()方法返回所有符合条件的前面的兄弟节点, find_previous_sibling() 方法返回第一个符合条件的前面的兄弟节点

(6)find_all_next() find_next()

这2个方法通过 .next_elements 属性对当前 tag 的之后的 tag 和字符串进行迭代, find_all_next() 方法返回所有符合条件的节点, find_next() 方法返回第一个符合条件的节点

(7)find_all_previous() 和 find_previous()

这2个方法通过 .previous_elements 属性对当前节点前面的 tag 和字符串进行迭代, find_all_previous() 方法返回所有符合条件的节点, find_previous()方法返回第一个符合条件的节点

具体的使用方法还有很多,用到这里你应该可以解决大部分问题了,如果要更深入了解可以参考官方的使用说明哈!

python bs4 的使用

html_doc = """

html

head

titleThe Dormouse's story/title

/head

body

p class="title aq"

b

The Dormouse's story

/b

/p

p class="story"Once upon a time there were three little sisters; and their names were

a href="" class="sister" id="link1"Elsie/a,

a href="" class="sister" id="link2"Lacie/a

and

a href="" class="sister" id="link3"Tillie/a;

and they lived at the bottom of a well.

./p

p class="story".../p

"""

html字符串创建BeautifulSoup对象 :

soup = BeautifulSoup(html_doc, 'html.parser', from_encoding='utf-8')

输出第一个 title 标签 :

print soup.title

输出第一个 title 标签的标签名称 :

print soup.title.name

输出第一个 title 标签的包含内容 :

print soup.title.string

输出第一个 title 标签的父标签的标签名称 :

print soup.title.parent.name

输出第一个 p 标签

print soup.p

输出第一个 p 标签的 class 属性内容 :

print soup.p['class']

输出第一个 a 标签的 href 属性内容 :

print soup.a['href']

'''''

soup的属性可以被添加,删除或修改. 再说一次, soup的属性操作方法与字典一样

'''

修改第一个 a 标签的href属性为

soup.a['href'] = ' '

给第一个 a 标签添加 name 属性 :

soup.a['name'] = u'百度'

删除第一个 a 标签的 class 属性为 :

del soup.a['class']

输出第一个 p 标签的所有子节点 :

print soup.p.contents

输出第一个 a 标签 :

print soup.a

输出所有的 a 标签,以列表形式显示 :

print soup.find_all('a')

输出第一个 id 属性等于 link3 的 a 标签 :

print soup.find(id="link3")

获取所有文字内容 :

print(soup.get_text())

输出第一个 a 标签的所有属性信息 :

print soup.a.attrs

for link in soup.find_all('a'):

获取 link 的 href 属性内容

print(link.get('href'))

对soup.p的子节点进行循环输出 :

for child in soup.p.children:

print(child)

正则匹配,名字中带有b的标签 :

for tag in soup.find_all(re.compile("b")):

print(tag.name)

import bs4#导入BeautifulSoup库

Soup = BeautifulSoup(html)#其中html 可以是字符串,也可以是句柄

需要注意的是,BeautifulSoup会自动检测传入文件的编码格式,然后转化为Unicode格式

通过如上两句话,BS自动把文档生成为如上图中的解析树。


当前文章:bs函数python python abs函数
文章网址:http://bzwzjz.com/article/doioooc.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 重庆企业网站建设 教育网站设计方案 成都品牌网站建设 自适应网站设计 成都网站建设 自适应网站建设 四川成都网站制作 成都网站建设推广 成都网站建设 企业网站建设公司 成都网站建设公司 成都网站制作 响应式网站建设 企业网站设计 成都网站建设 移动网站建设 成都网站建设 成都网站建设 高端品牌网站建设 成都网站建设公司 企业网站制作 成都企业网站建设