TensorFlow 数学基础怎么学?线性代数矩阵微积分概率论入门?

文章导读
Previous Quiz Next 在 TensorFlow 中创建基本应用之前,理解 TensorFlow 所需的数学概念非常重要。数学被视为任何机器学习算法的核心。通过数学的核心概念,可以定义特定机器学习算法的解决方案。
📋 目录
  1. 向量
  2. 数学计算
A A

TensorFlow - 数学基础



Previous
Quiz
Next

在 TensorFlow 中创建基本应用之前,理解 TensorFlow 所需的数学概念非常重要。数学被视为任何机器学习算法的核心。通过数学的核心概念,可以定义特定机器学习算法的解决方案。

向量

向量定义为一个数字数组,可以是连续的或离散的。机器学习算法处理固定长度的向量以生成更好的输出。

机器学习算法处理多维数据,因此向量起着至关重要的作用。

Vector

向量模型的图形表示如下所示 −

Vector Model

标量

标量可以定义为一维向量。标量仅包含大小而无方向。我们只关心标量的大小。

标量的示例包括儿童的体重和身高参数。

矩阵

矩阵可以定义为多维数组,按照行和列的格式排列。矩阵的大小由行长和列长定义。下面的图示显示了任意指定矩阵的表示。

Multi Dimensional Arrays

考虑上述具有 m 行和 n 列的矩阵,其矩阵表示将指定为 m*n 矩阵,这也定义了矩阵的长度。

数学计算

在本节中,我们将学习 TensorFlow 中的不同数学计算。

矩阵加法

如果矩阵具有相同的维度,则可以对两个或多个矩阵进行加法。加法意味着按照给定位置对每个元素进行相加。

考虑以下示例来理解矩阵加法的工作原理 −

$$Example:A=\begin{bmatrix}1 & 2 \\3 & 4 \end{bmatrix}B=\begin{bmatrix}5 & 6 \\7 & 8 \end{bmatrix}\:then\:A+B=\begin{bmatrix}1+5 & 2+6 \\3+7 & 4+8 \end{bmatrix}=\begin{bmatrix}6 & 8 \\10 & 12 \end{bmatrix}$$

矩阵减法

矩阵减法的工作方式类似于两个矩阵的加法。用户可以减去两个维度相同的矩阵。

$$Example:A-\begin{bmatrix}1 & 2 \\3 & 4 \end{bmatrix}B-\begin{bmatrix}5 & 6 \\7 & 8 \end{bmatrix}\:then\:A-B-\begin{bmatrix}1-5 & 2-6 \\3-7 & 4-8 \end{bmatrix}-\begin{bmatrix}-4 & -4 \\-4 & -4 \end{bmatrix}$$

矩阵乘法

对于两个矩阵 A m*n 和 B p*q 要可相乘,n 应等于 p。结果矩阵为 −

C m*q

$$A=\begin{bmatrix}1 & 2 \\3 & 4 \end{bmatrix}B=\begin{bmatrix}5 & 6 \\7 & 8 \end{bmatrix}$$

$$c_{11}=\begin{bmatrix}1 & 2 \end{bmatrix}\begin{bmatrix}5 \\7 \end{bmatrix}=1\times5+2\times7=19\:c_{12}=\begin{bmatrix}1 & 2 \end{bmatrix}\begin{bmatrix}6 \\8 \end{bmatrix}=1\times6+2\times8=22$$

$$c_{21}=\begin{bmatrix}3 & 4 \end{bmatrix}\begin{bmatrix}5 \\7 \end{bmatrix}=3\times5+4\times7=43\:c_{22}=\begin{bmatrix}3 & 4 \end{bmatrix}\begin{bmatrix}6 \\8 \end{bmatrix}=3\times6+4\times8=50$$

$$C=\begin{bmatrix}c_{11} & c_{12} \\c_{21} & c_{22} \end{bmatrix}=\begin{bmatrix}19 & 22 \\43 & 50 \end{bmatrix}$$

矩阵转置

矩阵 A(m*n)的转置通常表示为 AT(转置)n*m,通过将列向量转置为行向量得到。

$$Example:A=\begin{bmatrix}1 & 2 \\3 & 4 \end{bmatrix}\:then\:A^{T}\begin{bmatrix}1 & 3 \\2 & 4 \end{bmatrix}$$

向量点积

任意维度为 n 的向量可以表示为矩阵 v = Rn*1

$$v_{1}=\begin{bmatrix}v_{11} \\v_{12} \\\cdot\\\cdot\\\cdot\\v_{1n}\end{bmatrix}v_{2}=\begin{bmatrix}v_{21} \\v_{22} \\\cdot\\\cdot\\\cdot\\v_{2n}\end{bmatrix}$$

两个向量的点积是对应分量的乘积之和 − 沿相同维度的分量,可以表示为

$$v_{1}\cdot v_{2}=v_1^Tv_{2}=v_2^Tv_{1}=v_{11}v_{21}+v_{12}v_{22}+\cdot\cdot+v_{1n}v_{2n}=\displaystyle\sum\limits_{k=1}^n v_{1k}v_{2k}$$

以下提到了向量点积的示例 −

$$Example:v_{1}=\begin{bmatrix}1 \\2 \\3\end{bmatrix}v_{2}=\begin{bmatrix}3 \\5 \\-1\end{bmatrix}v_{1}\cdot v_{2}=v_1^Tv_{2}=1\times3+2\times5-3\times1=10$$