欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

机器学习中数据处理与可视化的python、numpy等常用函数

发布时间:2025/5/22 python 28 豆豆
生活随笔 收集整理的这篇文章主要介绍了 机器学习中数据处理与可视化的python、numpy等常用函数 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

写在前面:本文所针对的python版本为python3.0以上!


np.tile()

tile()相当于复制当前行元素或者列元素

import numpy as npm1 = np.array([1, 2, 3, 4]) # 行复制两次,列复制一次到一个新数组中 print(np.tile(m1, (2, 1))) print("===============") # 行复制一次,列复制两次到一个新数组中 print(np.tile(m1, (1, 2))) print("===============") # 行复制两次,列复制两次到一个新数组中 print(np.tile(m1, (2, 2)))

输出:

D:\Python\python.exe E:/ML_Code/test_code.py [[1 2 3 4][1 2 3 4]] =============== [[1 2 3 4 1 2 3 4]] =============== [[1 2 3 4 1 2 3 4][1 2 3 4 1 2 3 4]]

sum()

sum函数是对元素进行求和,对于二维数组以上则可以根据参数axis进行分别对行和列进行求和,axis=0代表按列求和,axis=1代表行求和。

import numpy as npm1 = np.array([1, 2, 3, 4]) # 元素逐个求和 print(sum(m1))m2 = np.array([[6, 2, 2, 4], [1, 2, 4, 7]]) # 按列相加 print(m2.sum(axis=0)) # 按行相加 print(m2.sum(axis=1))

输出:

D:\Python\python.exe E:/ML_Code/test_code.py 10 [ 7 4 6 11] [14 14]Process finished with exit code 0

shape和reshape

import numpy as npa = np.array([[1, 2, 3], [4, 5, 6]]) print(a.shape)b = np.reshape(a, 6) print(b)# -1是根据数组大小进行维度的自动推断 c = np.reshape(a, (3, -1)) # 为指定的值将被推断出为2 print(c)

输出:

D:\python-3.5.2\python.exe E:/ML_Code/test_code.py(2, 3)---[1 2 3 4 5 6]---[[1 2][3 4][5 6]]

numpy.random.rand

import numpy as np# 创建一个给定类型的数组,将其填充在一个均匀分布的随机样本[0, 1)中print(np.random.rand(3))print(np.random.rand(2, 2))

输出:

D:\python-3.5.2\python.exe E:/ML_Code/test_code.py[ 0.03568079 0.68235136 0.64664722]---[[ 0.43591417 0.66372315][ 0.86257381 0.63238434]]

zip()

zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。 如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。

import numpy as npa1 = np.array([1, 2, 3, 4]) a2 = np.array([11, 22, 33, 44])z = zip(a1, a2)print(list(z))

输出:

D:\Python\python.exe E:/ML_Code/test_code.py [(1, 11), (2, 22), (3, 33), (4, 44)]Process finished with exit code 0

注意点:在python 3以后的版本中zip()是可迭代对象,使用时必须将其包含在一个list中,方便一次性显示出所有结果。否则会报如下错误:

<zip object at 0x01FB2E90>

矩阵相关

import numpy as np# 生成随机矩阵 myRand = np.random.rand(3, 4) print(myRand)# 生成单位矩阵 myEye = np.eye(3) print(myEye)from numpy import *# 矩阵所有元素求和 myMatrix = mat([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) print(sum(myMatrix))# 计算矩阵的秩 print(linalg.det(myMatrix))# 计算矩阵的逆 print(linalg.inv(myMatrix))

注意:

from numpy import * import numpy as npvector1 = mat([[1, 2], [1, 1]]) vector2 = mat([[1, 2], [1, 1]]) vector3 = np.array([[1, 2], [1, 1]]) vector4 = np.array([[1, 2], [1, 1]])# Python自带的mat矩阵的运算规则是两者都按照矩阵乘法的规则来运算 print(vector1 * vector2)# Python自带的mat矩阵的运算规则是两者都按照矩阵乘法的规则来运算 print(dot(vector1, vector2))# numpy乘法运算中"*"是数组元素逐个计算 print(vector3 * vector4)# numpy乘法运算中dot是按照矩阵乘法的规则来运算 print(dot(vector3, vector4))

输出:

D:\python-3.5.2\python.exe D:/PyCharm/py_base/py_numpy.py [[3 4][2 3]]--- [[3 4][2 3]]--- [[1 4][1 1]]--- [[3 4][2 3]]

向量相关

两个n维向量A(X11,X12,X13,...X1n)A(X_{11},X_{12},X_{13},...X_{1n})与B(X21,X22,X23,...X2n)B(X_{21},X_{22},X_{23},...X_{2n})之间的欧式距离为:

d12=∑k=1n(x1k−x2k)2−−−−−−−−−−−−√

d_{12}=\sqrt{\sum_{k=1}^{n}(x_{1k}-x_{2k})^{2}}

表示成向量运算的形式:

d12=(A−B)(A−B)T−−−−−−−−−−−−−−√

d_{12}=\sqrt{(A-B)(A-B)^{T}}

from numpy import *# 计算两个向量的欧氏距离vector1 = mat([1, 2]) vector2 = mat([3, 4]) print(sqrt((vector1 - vector2) * ((vector1 - vector2).T)))

概率相关

from numpy import * import numpy as nparrayOne = np.array([[1, 2, 3, 4, 5], [7, 4, 3, 3, 3]])# 计算第一列的平均数 mv1 = mean(arrayOne[0])# 计算第二列的平均数 mv2 = mean(arrayOne[1])# 计算第一列的标准差 dv1 = std(arrayOne[0])# 计算第二列的标准差 dv2 = std(arrayOne[1])print(mv1) print(mv2) print(dv1) print(dv2)

总结

以上是生活随笔为你收集整理的机器学习中数据处理与可视化的python、numpy等常用函数的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。