##python基础知识学习总结(一) Python使用缩进来组织代码块,一般使用4个空格的缩进。使用 Python可以处理任意大小的整数,包括负整数,写法与数学上写法一致,例如:-100。如果用十六进制表示,则用前缀为 浮点数的表示方法:3.14,-9.01。若是科学技术法表示,则10用e代替,例如:1.23$\times10^9$表示为1.23e9。 整数和浮点数在计算机内存储的方式不同,整数运算永远是精确的(包括除法运算),浮点数运算可能会存在四舍五入的误差。 字符串是单引号或双引号括起来的文本。 如果字符串中包含单引号,则用双引号括起来; 如果包含双引号,则用单引号括起来; 如果既包含单引号又包含双引号,则使用转义字符 python中用 python中用 布尔值只有 布尔值运算规则如下: 空值是Python里一个特殊的值,用 Python中变量类型不固定,即动态语言,不需要提前声明。使用 变量 常量一般用全部大写的变量名表示,例如: Python的除法: Python支持多种数据类型,在计算机内部可以把任何数据看成一个”对象”,而变量赋值就是将变量和数据对象关联起来,即变量指向该数据对象。例如 Python的整数和浮点数没有大小的限制。若超出一定范围就用 在计算机内存中,统一使用Unicode编码。 当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。 例如: 用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件。 浏览网页的时候,服务器会把动态的生成的Unicode内容转换为UTF-8再传输到浏览器,所以很多网页的源码上会有类似 Python3的版本中,字符串是Unicode编码,即支持多语言。 对于单个字符的编码,Python提供 如果知道字符的整数编码,可以用十六进制写 Python的字符串类型是 Python对 以Unicode表示的 要把UTF-8编码或ASCII编码转换成Unicode编码,即bytes类型转换为str类型,可用decode()转换。例如: 如果 对于 1个中文字符经过UTF-8编码后通常会占用3个字节,而1个英文字符只占用1个字节。 为了避免中文乱码,一般使用UTF-8编码对 第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释; 第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可能会有乱码。 使用 例如: 可以使用字符串的 list表示列表,是可变的有序列表,即有序的集合,可以随时添加和删除元素。 用 用pop(i)的方法,i为索引值 即直接给对应索引的元素重新赋值。 list中元素的数据类型可以不同,如果要实现二维list,即将一维list中的元素定义为list即可,同理可以实现多维list。例如访问二维list可用 空list即一个元素也没有,长度为0。 tuple表示元组,即不可变的有序元素的集合。即没有修改元素的函数,例如append(),insert(),元素赋值等。 因为tuple元素不可变,所以代码更安全。当定义tuple时,元素就必须被确定下来。如果tuple中只含一个元素,则在该元素后加逗号。避免与小括号运算产生歧义。 tuple中的元素不可变表示元素的指向不可变,但该元素如果是list,则该list的内容可变。即list表示的是指向,该list的指向不可变,但是list中元素的指向可变,即list中的元素可变。例如: 示意图: list元素修改前: list元素修改后: dict即字典,相当于golang中的 由于dict中key的值是唯一的,因此如果多次赋值,最终结果为最后一次的赋值。 如果key不存在会报错,检测key是否存在可以通过 要删除dict中的元素,可以通过用 dict的特点: 对比list的特点: set表示无序和无重复元素的集合,与数学意义上的集合类似,也可以看成是只有key没有value的dict。 要创建一个set,需要提供一个list作为输入集合,如果list中有重复元素则自动过滤掉。 通过 通过 变量表示一个指向,而变量指向的内容表示一个对象。例如 Python中整数和字符串是不可变对象,而list是可变对象。 例如上例中, 对于不变对象来说,调用对象自身的任意方法,不会改变该对象自身的内容。而会创建新的对象并返回。 以上是if语句的完整格式,注意事项: 例如:以下例子打印的结果是teenager,即满足第一个if条件则后续判断不再执行。 只要 for…in循环,即把list或tuple中的每个元素迭代出来,执行后续操作。 Python提供一个 while循环,只要条件满足,就不断循环,条件不满足时退出循环。 在循环中, 在循环过程中,可以通过
1. 数据类型和变量
#
来注释一行,其他每一行都是一个语句,当语句以冒号:
结尾时,缩进的语句视为代码块。Python对大小写敏感。1.1 整数
0x
和0-9
,a-f
表示,例如:0xff00。1.2 浮点数
1.3 字符串
\
来标识,例如:'I\'m \"OK\"!'
表示的是I'm "OK"!
。r''
表示''
内部的字符串默认不转义,例如print(r'\\\t\\')
即打印\\\t\\
。'''...'''
三引号来输入多行内容,其中...
是提示符,表示接着上一行输入,例如:1
2
3
4
5
6'''line1 print(
line2
) line3'''
line1
line2
line31.4 布尔值
True
和Flase
两种(注意大小写,Python对大小写敏感),常用于if的条件判断。
and
运算是与运算,只有所有都为True
,and
运算结果才是True
。or
运算是或运算,只要其中有一个为True
,or
运算结果就是True
。not
运算是非运算,它是一个单目运算符,把True
变成False
,False
变成True
。1.5 空值
None
表示。1.6 变量
=
直接赋值,同一个变量可以反复赋值,且可以是不同类型的变量。例如:1
2
3
4
5a = 123 #a是整数,即a指向整数123
a = "ABC" #将a赋值成字符串,即a指向字符串"ABC"
b = a #将b指向a所指向的数据("ABC")
a = "XYZ" #将a指向字符串"XYZ"
print(b) #打印b将打印"ABC"而不是"XYZ"a="ABC"
赋值中,Python解释器处理了以下事项:
"ABC"
的字符串;a
的变量,并把它指向"ABC"
。a所指向的数据
。1.7 常量
PI=3.14
。实际上,Python没有机制保证PI的值不会被改变,所以本质仍然是个变量。
/
的除法计算结果是浮点数,即使是两个整数相除也是浮点数,例如9 / 3
结果为3.0
。//
除法只取结果的整数部分,例如10 // 3
结果是整数部分3。%
表示取余数,例如:10 % 3
结果是余数1。1.8 总结
x=y
,表示把变量x指向y所指向的数据对象,随后对y的赋值并不影响x的指向。inf
(无限大)表示。2. 字符串和编码
2.1 字符编码
ASCII
编码,早期的编码包含大小写英文字母、数字和一些符号,用一个字节(8位)表示。因编码量少可能会出现乱码问题。Unicode
编码,统一各国语言编码,用两个字节(16位)表示。如果文本全是英文,则会比ASCII编码需要多一倍的存储空间,在存储和传输上不划算。UTF-8
编码,即可变长的Unicode编码,UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符,用UTF-8编码能节省空间。2.2 字符编码使用场景
<meta charset="UTF-8" />
的信息,表示该网页正是用的UTF-8编码。2.3 Python的字符串
ord()
函数获取字符的整数表示,chr()
函数把编码转换为对应的字符。例如:1
2
3
4
5
6
7
8'A') ord(
65
'中') ord(
20013
66) chr(
'B'
25991) chr(
'文'str
:1
2'\u4e2d\u6587'
'中文'2.4 字符串(编码)转换
str
,在内存中以Unicode表示,一个字符对应若干个字节。如果要在网络上传输,或者保存到磁盘上,就需要把str
变为以字节为单位的bytes
(UTF-8/ASCII编码)。bytes
类型的数据用带b
前缀的单引号或双引号表示:1
x = b'ABC'
2.4.1 encode()[str→bytes]
str
通过encode()
方法可以编码为指定的bytes
,即Unicode编码转换成UTF-8编码或ASCII编码,例如:1
2
3
4
5
6
7
8
9'ABC'.encode('ascii')
b'ABC'
'中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
#错误例子
'中文'.encode('ascii')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)2.4.2 decode()[bytes→str]
1
2
3
4
5
6
7
8
9b'ABC'.decode('ascii')
'ABC'
b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
'中文'
#错误例子
b'\xe4\xb8\xad\xff'.decode('utf-8')
Traceback (most recent call last):
...
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 3: invalid start bytebytes
中只有一小部分无效的字节,可以传入errors='ignore'
忽略错误的字节:1
2b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')
'中'2.4.3 len()
str
类型len()计算的是字符数,对于bytes
类型len()计算的是字节数。1
2
3
4
5
6
7
8
9
10
11
12#对于str类型
'ABC') len(
3
'中文') len(
2
#对于bytes类型
b'ABC') len(
3
b'\xe4\xb8\xad\xe6\x96\x87') len(
6
'中文'.encode('utf-8')) len(
6str
和bytes
进行转换,即Unicode→UTF-8。所以一般在Python源文件开头写以下信息:1
2#!/usr/bin/env python3
# -*- coding: utf-8 -*-2.5 格式化
2.5.1 %的方式
%
来格式化字符串,其中%s
永远起作用,可以把任何数据类型转换成字符串,如果字符串中包含%
,则使用%%
转义表示字符串中的%
。常用占位符如下:
占位符
替换内容
%s
字符串
%d
整数
%f
浮点数
%x
十六进制整数
1
2
3
4
5
6
7
8
9
10
11
12
13'Hello, %s' % 'world'
'Hello, world'
'Hi, %s, you have $%d.' % ('Michael', 1000000)
'Hi, Michael, you have $1000000.'
#整数和浮点数
'%2d-%02d' % (3, 1)) print(
'%.2f' % 3.1415926) print(
# %s的通用性
'Age: %s. Gender: %s' % (25, True)
'Age: 25. Gender: True'
#转义字符串中的%
'growth rate: %d %%' % 7
'growth rate: 7 %'2.5.2 format()
format()
方法,它会用传入的参数依次替换字符串内的占位符{0}
、{1}
……。但建议直接使用%
的方式。1
2'Hello, {0}, 成绩提升了 {1:.1f}%'.format('小明', 17.125)
'Hello, 小明, 成绩提升了 17.1%'3. list和tuple类型
3.1 list
3.1.1 list的定义
1
2
3'Michael', 'Bob', 'Tracy'] classmates = [
classmates
['Michael', 'Bob', 'Tracy']3.1.2 len()
len()
函数可以获得list元素的个数1
2 len(classmates)
33.1.3 list的索引
-1
等价于len(classmates) - 1
IndexError
错误,倒序索引也会越界3.1.4 list元素增删
3.1.4.1 追加末尾元素
1
2
3'Adam') classmates.append(
classmates
['Michael', 'Bob', 'Tracy', 'Adam']3.1.4.2 指定位置插入元素
1
2
31, 'Jack') classmates.insert(
classmates
['Michael', 'Jack', 'Bob', 'Tracy', 'Adam']3.1.4.3 删除末尾元素
1
2
3
4 classmates.pop()
'Adam'
classmates
['Michael', 'Jack', 'Bob', 'Tracy']3.1.4.4 删除指定位置元素
1
2
3
41) classmates.pop(
'Jack'
classmates
['Michael', 'Bob', 'Tracy']3.1.4.5 替换元素
1
2
31] = 'Sarah' classmates[
classmates
['Michael', 'Sarah', 'Tracy']3.1.5多维list
s[2][1]
的方式,表示一维list中的第三个元素list中的第二个元素。1
2
3'python', 'java', ['asp', 'php'], 'scheme'] s = [
len(s)
43.1.6 空list
1
2
3 L = []
len(L)
03.2 tuple
3.2.1 tuple的定义
1
2
3
4
5
6
7
8#以下是单元素tuple的定义
1,) t = (
t
(1,)
#以下是小括号运算
1) t = (
t
13.2.2 特别说明
1
2
3
4
5'a', 'b', ['A', 'B']) t = (
2][0] = 'X' t[
2][1] = 'Y' t[
t
('a', 'b', ['X', 'Y'])t = ('a', 'b', ['A', 'B'])
t = ('a', 'b', ['X', 'Y'])
4. dict和set类型
4.1 dict
4.1.1 dict的定义
map
类型,key-value型。具有极快的查找速度。1
2
3
4
5
6//dict的赋值
'Michael': 95, 'Bob': 75, 'Tracy': 85} d = {
'Michael'] d[
95
//dict元素的赋值
'Adam'] = 67 d[4.1.2 dict的查找
in
或get()
方法。当key不存在时,in
的方式返回False
,get()
方法返回None
或指定值。1
2
3
4
5
6
7
8
9
10
11
12
13
14#key不存在的报错
'Thomas'] d[
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'Thomas'
#in方式检查key是否存在
'Thomas' in d
False
#get()方法检查key是否存在
'Thomas') d.get(
'Thomas', -1) d.get(
-14.1.3 dict的删除
pop(key)
方法,删除该key对应的键值对。1
2
3
4'Bob') d.pop(
75
d
{'Michael': 95, 'Tracy': 85}4.1.4 特别说明
4.2 set
4.2.1 set的定义
1
2
3
4
5
6
71, 2, 3]) s = set([
s
{1, 2, 3}
#如果有重复元素会自动过滤掉
1, 1, 2, 2, 3, 3]) s = set([
s
{1, 2, 3}4.2.2 set的添加和删除
add(key)
方法可以添加元素到set中,可以重复添加,但无效。1
2
3
4
5
64) s.add(
s
{1, 2, 3, 4}
4) s.add(
s
{1, 2, 3, 4}remove(key)
方法可以删除元素。1
2
34) s.remove(
s
{1, 2, 3}4.2.3 set的交集和并集
1
2
3
4
5
6
7
81, 2, 3]) s1 = set([
2, 3, 4]) s2 = set([
#交集
s1 & s2
{2, 3}
#并集
s1 | s2
{1, 2, 3, 4}4.3 不可变对象
a="abc"
中a
是变量即指向,而abc
是字符串对象。1
2
3
4
5
6'abc' a =
'a', 'A') b = a.replace(
b
'Abc'
a
'abc'a
是变量,abc
是字符串对象,当调用a的replace
的方法时,实际上是基于原字符串对象重新创建了一个新的字符串对象Abc
,而没有改变原字符串对象的内容。5. 条件语句
5.1 if格式
1
2
3
4
5
6
7
8if <条件判断1>:
<执行1>
elif <条件判断2>:
<执行2>
elif <条件判断3>:
<执行3>
else:
<执行4>
elif
和else
。1
2
3
4
5
6
7age = 20
if age >= 6:
print('teenager')
elif age >= 18:
print('adult')
else:
print('kid')5.2 条件简写
1
2if x:
print('True')x
是非零数值、非空字符串、非空list等,就判断为True
,否则为False
。5.3 input()使用
1
2
3
4
5
6s = input('birth: ')
birth = int(s)
if birth < 2000:
print('00前')
else:
print('00后')input()
返回的数据类型是str
,str
不能直接和整数比较,必须先把str
转换成整数。Python提供了int()
函数来转换成整数。6. 循环语句
6.1 for循环
1
2
3names = ['Michael', 'Bob', 'Tracy']
for name in names:
print(name)range(x)
函数,生成0-(x-1)
的整数序列。1
2
3
4
5
6
75)) list(range(
[0, 1, 2, 3, 4]
//求和运算
sum = 0
for x in range(101):
sum = sum + x
print(sum)6.2 while循环
1
2
3
4
5
6sum = 0
n = 99
while n > 0:
sum = sum + n
n = n - 2
print(sum)6.3 break
break
语句可以提前退出循环。1
2
3
4
5
6
7n = 1
while n <= 100:
if n > 10: # 当n = 11时,条件满足,执行break语句
break # break语句会结束当前循环
print(n)
n = n + 1
print('END')6.4 continue
continue
语句,跳过当前的这次循环,直接开始下一次循环。1
2
3
4
5
6n = 0
while n < 10:
n = n + 1
if n % 2 == 0: # 如果n是偶数,执行continue语句
continue # continue语句会直接继续下一轮循环,后续的print()语句不会执行
print(n)break
和continue
通常都必须配合if
语句使用。
python基础知识学习总结(一)
|
阅读次数