关键词不能为空

当前您在: 主页 > 英语 >

矩阵,矩阵背后的现实意义

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2020-10-20 22:46
tags:encounter什么意思

措词什么意思-换气次数

2020年10月20日发(作者:崔俊芝)


这是很早以前已经看过的,最近无意中又把保存的文章翻出来时,想起很多朋友问过矩阵,虽对< br>矩阵似懂非懂,但却很想弄懂它,希望这几篇文章能帮你一下,故转之:


线 性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,
在全国一 般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍
逆序数这个“前无 古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,
接着是一些简直犯傻的 行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过
来,折腾得那叫一个热闹,可就 是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生
到这里就有点犯晕:连这是个什么东西都 模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”
了吧!于是开始有人逃课,更多的人开始抄作业 。这下就中招了,因为其后的发展可以用一句峰
回路转来形容,紧跟着这个无厘头的行列式的,是一个同 样无厘头但是伟大的无以复加的家伙的
出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括 号把一堆傻了吧叽的数括起来,
并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了 何等悲壮辛酸、惨绝人寰
的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个 家伙从不缺席。对
于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸 ,头破血
流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。


事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国 内外皆
然。瑞典数学家Lars Garding在其名著Encounter with Mathe matics中说:”如果不熟悉线性代
数的概念,要去学习自然科学,现在看来就和文盲差不多。”, 然而“按照现行的国际标准,线性
代数是通过公理化来表述的,它是第二代数学模型,...,这就带来 了教学上的困难。”事实上,
当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的 范畴当中,这意味着数
学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一代数学模型” ,即以实用为导
向的、具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的p aradigm
shift,不感到困难才是奇怪的。


大部分工科学生 ,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐
能够理解和熟练运用线性 代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研
和应用工作,但对于很多这门课程 的初学者提出的、看上去是很基础的问题却并不清楚。比如说:


矩阵究竟是什么东 西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩
阵又是什么呢?我们如果认为 矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什
么这种展开式具有如此广泛的应用?特 别是,为什么偏偏二维的展开式如此有用?如果矩阵中每
一个元素又是一个向量,那么我们再展开一次, 变成三维的立方阵,是不是更有用?


矩阵的乘法规则究竟为什么这样规定?为什么 这样一种怪异的乘法规则却能够在实践中发挥如
此巨大的功效?很多看上去似乎是完全不相关的问题,最 后竟然都归结到矩阵的乘法,这难道不


是很奇妙的事情?难道在矩阵乘法那看上去莫名其 妙的规则下面,包含着世界的某些本质规律?
如果是的话,这些本质规律是什么?


行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本质上是
什 么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个问题很蠢,如
果必要,针 对m x n矩阵定义行列式不是做不到的,之所以不做,是因为没有这个必要,但是为
什么没有这个必 要)?而且,行列式的计算规则,看上去跟矩阵的任何计算规则都没有直观的联
系,为什么又在很多方面 决定了矩阵的性质?难道这一切仅是巧合?


矩阵为什么可以分块计算?分块计算这件事情看上去是那么随意,为什么竟是可行的?


对于矩阵转置运算AT,有(AB)T = BTAT,对于矩阵求逆运算A-1,有(AB)-1 = B-1A-1。两个看
上去完全没有什么关 系的运算,为什么有着类似的性质?这仅仅是巧合吗?


为什么说P-1AP得到的矩阵与A矩阵“相似”?这里的“相似”是什么意思?


特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为Ax =λx,一个诺大的矩阵的效应,竟然不过相当于一个小小的数λ,确实有点奇妙。但何至于用“特征”甚至“本征”来界定?它
们刻划的究竟是什么?


这样的一类问题,经常让使用线性代数已经很多年的人都感 到为难。就好像大人面对小孩子的刨
根问底,最后总会迫不得已地说“就这样吧,到此为止”一样,面对 这样的问题,很多老手们最后
也只能用:“就是这么规定的,你接受并且记住就好”来搪塞。然而,这样 的问题如果不能获得回
答,线性代数对于我们来说就是一个粗暴的、不讲道理的、莫名其妙的规则集合, 我们会感到,
自己并不是在学习一门学问,而是被不由分说地“抛到”一个强制的世界中,只是在考试的 皮鞭挥
舞之下被迫赶路,全然无法领略其中的美妙、和谐与统一。直到多年以后,我们已经发觉这门学< br>问如此的有用,却仍然会非常迷惑:怎么这么凑巧?


我认为,这是我们的线 性代数教学中直觉性丧失的后果。上述这些涉及到“如何能”、“怎么会”的
问题,仅仅通过纯粹的数学 证明来回答,是不能令提问者满意的。比如,如果你通过一般的证明
方法论证了矩阵分块运算确实可行, 那么这并不能够让提问者的疑惑得到解决。他们真正的困惑
是:矩阵分块运算为什么竟然是可行的?究竟 只是凑巧,还是说这是由矩阵这种对象的某种本质
所必然决定的?如果是后者,那么矩阵的这些本质是什 么?只要对上述那些问题稍加考虑,我们
就会发现,所有这些问题都不是单纯依靠数学证明所能够解决的 。像我们的教科书那样,凡事用
数学证明,最后培养出来的学生,只能熟练地使用工具,却欠缺真正意义 上的理解。



对于线性代数的类似上述所提到的一些直觉性的问题, 两年多来我断断续续地反复思考了四、五
次,为此阅读了好几本国内外线性代数、数值分析、代数和数学 通论性书籍,其中像

前苏联的名著《数学:它的内容、方法和意义》、

龚昇教授的《线性代数五讲》、

前面提到的Encounter with
Mathematics(《数学概观》)
以及Thomas A. Garrity的《 数学拾遗》都给我很大的启发。不过即使如此,我对这个主题
的认识也经历了好几次自我否定。比如以前 思考的一些结论曾经写在自己的blog里,但是
现在看来,这些结论基本上都是错误的。因此打算把自 己现在的有关理解比较完整地记录下
来,一方面是因为我觉得现在的理解比较成熟了,可以拿出来与别人 探讨,向别人请教。另
一方面,如果以后再有进一步的认识,把现在的理解给推翻了,那现在写的这个s napshot
也是很有意义的。

因为打算写得比较多,所以会分几次慢慢写。也 不知道是不是有时间慢慢写完整,会不会中断,
写着看吧。


今天先谈谈对 线形空间和矩阵的几个核心概念的理解。这些东西大部分是凭着自己的理解写出来
的,基本上不抄书,可 能有错误的地方,希望能够被指出。但我希望做到直觉,也就是说能把数
学背后说的实质问题说出来。< br>

首先说说空间(space),这个概念是现代数学的命根子之一,从拓扑空间开始 ,一步步往上加定
义,可以形成很多空间。线形空间其实还是比较初级的,如果在里面定义了范数,就成 了赋范线
性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义角度,就有了内积
空间,内积空间再满足完备性,就得到希尔伯特空间。


总之,空间有很多 种。你要是去看某种空间的数学定义,大致都是“存在一个集合,在这个集合
上定义某某概念,然后满足 某些性质”,就可以被称为空间。这未免有点奇怪,为什么要用“空间”
来称呼一些这样的集合呢?大家 将会看到,其实这是很有道理的。


我们一般人最熟悉的空间,毫无疑问就是我们生 活在其中的(按照牛顿的绝对时空观)的三维空
间,从数学上说,这是一个三维的欧几里德空间,我们先 不管那么多,先看看我们熟悉的这样一
个空间有些什么最基本的特点。仔细想想我们就会知道,这个三维 的空间:

1. 由很多(实际上是无穷多个)位置点组成;

2. 这些点之间存在相对的关系;


3. 可以在空间中定义长度、角度;

4. 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换),而不
是微积分意义上的“连续”性的运动。


上面的这些性质中,最最关键的是第4条 。第1、2条只能说是空间的基础,不算是空间特有的
性质,凡是讨论数学问题,都得有一个集合,大多 数还得在这个集合上定义一些结构(关系),
并不是说有了这些就算是空间。而第3条太特殊,其他的空 间不需要具备,更不是关键的性质。
只有第4条是空间的本质,也就是说,容纳运动是空间的本质特征。


认识到了这些,我们就可以把我们关于三维空间的认识扩展到其他的空间。事实上 ,不管是什么
空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。你会发现,在某种空间中 往往
会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间中允许的运动形式而已。


因此只要知道,“空间”是容纳运动的一个对象集合,而变换则规定了对应空间的运动。


下面我们来看看线性空间。线性空间的定义任何一本书上都有,但是既然我们承认线性空间是 个
空间,那么有两个最基本的问题必须首先得到解决,那就是:

1. 空间是一个对 象集合,线性空间也是空间,所以也是一个对象集合。那么线性空间是什
么样的对象的集合?或者说,线 性空间中的对象有什么共同点吗?
2. 线性空间中的运动如何表述的?也就是,线性变换是如何表示的?

我们先来回答第一个问题, 回答这个问题的时候其实是不用拐弯抹角的,可以直截了当的给出答
案。线性空间中的任何一个对象,通 过选取基和坐标的办法,都可以表达为向量的形式。通常的
向量空间我就不说了,举两个不那么平凡的例 子:

L1. 最高次项不大于n次的多项式的全体构成一个线性空间,也就是说,这个线性空 间中的
每一个对象是一个多项式。如果我们以x0, x1, ..., xn为基,那么任何一个这样 的多项式都
可以表达为一组n+1维向量,其中的每一个分量ai其实就是多项式中x(i-1)项的系 数。值
得说明的是,基的选取有多种办法,只要所选取的那一组基线性无关就可以。这要用到后面
提到的概念了,所以这里先不说,提一下而已。

L2. 闭区间[a, b]上的n阶 连续可微函数的全体,构成一个线性空间。也就是说,这个线性空间
的每一个对象是一个连续函数。对于 其中任何一个连续函数,根据魏尔斯特拉斯定理,一定可以
找到最高次项不大于n的多项式函数,使之与 该连续函数的差为0,也就是说,完全相等。这样
就把问题归结为L1了。后面就不用再重复了。


所以说,向量是很厉害的,只要你找到合适的基,用向量可以表示线性空间里任何一 个对象。这
里头大有文章,因为向量表面上只是一列数,但是其实由于它的有序性,所以除了这些数本身 携
带的信息之外,还可以在每个数的对应位置上携带信息。为什么在程序设计中数组最简单,却又
威力无穷呢?根本原因就在于此。这是另一个问题了,这里就不说了。

下面来回答第二个问题,这个问题的回答会涉及到线性代数的一个最根本的问题。

线 性空间中的运动,被称为线性变换。也就是说,你从线性空间中的一个点运动到任意的另外一
个点,都可 以通过一个线性变化来完成。那么,线性变换如何表示呢?很有意思,在线性空间中,
当你选定一组基之 后,不仅可以用一个向量来描述空间中的任何一个对象,而且可以用矩阵来描
述该空间中的任何一个运动 (变换)。而使某个对象发生对应运动的方法,就是用代表那个运动
的矩阵,乘以代表那个对象的向量。

简而言之,在线性空间中选定基之后,向量刻画对象,矩阵刻画对象的运动,用矩阵与向量的 乘
法施加运动。


是的,矩阵的本质是运动的描述。如果以后有人问你矩 阵是什么,那么你就可以响亮地告诉他,
矩阵的本质是运动的描述。

可是多么有意思啊,向量本身不是也可以看成是n x 1矩阵吗?这实在是很奇妙,一个空间中的对象和运动竟然可以用相类同的方式表示。能说这是巧合吗?如果是巧合的话,那可真是幸运的
巧合 !可以说,线性代数中大多数奇妙的性质,均与这个巧合有直接的关系。

上一篇里说“矩阵是 运动的描述”,到现在为止,好像大家都还没什么意见。但是我相信早晚会有
数学系出身的网友来拍板转 。因为运动这个概念,在数学和物理里是跟微积分联系在一起的。我
们学习微积分的时候,总会有人照本 宣科地告诉你,初等数学是研究常量的数学,是研究静态的
数学,高等数学是变量的数学,是研究运动的 数学。大家口口相传,差不多人人都知道这句话。
但是真知道这句话说的是什么意思的人,好像也不多。 简而言之,在我们人类的经验里,运动是
一个连续过程,从A点到B点,就算走得最快的光,也是需要一 个时间来逐点地经过AB之间的
路径,这就带来了连续性的概念。而连续这个事情,如果不定义极限的概 念,根本就解释不了。
古希腊人的数学非常强,但就是缺乏极限观念,所以解释不了运动,被芝诺的那些 著名悖论(飞
箭不动、飞毛腿阿喀琉斯跑不过乌龟等四个悖论)搞得死去活来。因为这篇文章不是讲微积 分的,
所以我就不多说了。有兴趣的读者可以去看看齐民友教授写的《重温微积分》。我就是读了这本< br>书开头的部分,才明白“高等数学是研究运动的数学”这句话的道理。


不 过在我这个《理解矩阵》的文章里,“运动”的概念不是微积分中的连续性的运动,而是瞬间发
生的变化 。比如这个时刻在A点,经过一个“运动”,一下子就“跃迁”到了B点,其中不需要经过
A点与B点之 间的任何一个点。这样的“运动”,或者说“跃迁”,是违反我们日常的经验的。不过
了解一点量子物理 常识的人,就会立刻指出,量子(例如电子)在不同的能量级轨道上跳跃,就
是瞬间发生的,具有这样一 种跃迁行为。所以说,自然界中并不是没有这种运动现象,只不过宏
观上我们观察不到。但是不管怎么说 ,“运动”这个词用在这里,还是容易产生歧义的,说得更确
切些,应该是“跃迁”。因此这句话可以改 成:

“矩阵是线性空间里跃迁的描述”。


可是这样说又太 物理,也就是说太具体,而不够数学,也就是说不够抽象。因此我们最后换用一
个正牌的数学术语——变 换,来描述这个事情。这样一说,大家就应该明白了,所谓变换,其实
就是空间里从一个点(元素对象) 到另一个点(元素对象)的跃迁。比如说,拓扑变换,就是
在拓扑空间里从一个点到另一个点的跃迁。再 比如说,仿射变换,就是在仿射空间里从一个点到
另一个点的跃迁。附带说一下,这个仿射空间跟向量空 间是亲兄弟。做计算机图形学的朋友都知
道,尽管描述一个三维对象只需要三维向量,但所有的计算机图 形学变换矩阵都是4 x 4的。说
其原因,很多书上都写着“为了使用中方便”,这在我看来简直就是 企图蒙混过关。真正的原因,
是因为在计算机图形学里应用的图形变换,实际上是在仿射空间而不是向量 空间中进行的。想想
看,在向量空间里向一个向量平行移动以后仍是相同的那个向量,而现实世界等长的 两个平行线
段当然不能被认为同一个东西,所以计算机图形学的生存空间实际上是仿射空间。而仿射变换 的
矩阵表示根本就是4 x 4的。又扯远了,有兴趣的读者可以去看《计算机图形学——几何工具算
法详解》。


一旦我们理解了“变换”这个概念,矩阵的定义就变成:

“矩阵是线性空间里的变换的描述。”

到这里为止,我们终于得到了一个看上去比较 数学的定义。不过还要多说几句。教材上一般是这
么说的,在一个线性空间V里的一个线性变换T,当选 定一组基之后,就可以表示为矩阵。因此
我们还要说清楚到底什么是线性变换,什么是基,什么叫选定一 组基。线性变换的定义是很简单
的,设有一种变换T,使得对于线性空间V中间任何两个不相同的对象x 和y,以及任意实数a
和b,有:
T(ax + by) = aT(x) + bT(y),那么就称T为线性变换。

定义都是这么写的,但是光看定义还得不到直觉的理解 。线性变换究竟是一种什么样的变换?我
们刚才说了,变换是从空间的一个点跃迁到另一个点,而线性变 换,就是从一个线性空间V的
某一个点跃迁到另一个线性空间W的另一个点的运动。这句话里蕴含着一层 意思,就是说一个
点不仅可以变换到同一个线性空间中的另一个点,而且可以变换到另一个线性空间中的 另一个点
去。不管你怎么变,只要变换前后都是线性空间中的对象,这个变换就一定是线性变换,也就一
定可以用一个非奇异矩阵来描述。而你用一个非奇异矩阵去描述的一个变换,一定是一个线性变
换。有的人可能要问,这里为什么要强调非奇异矩阵?所谓非奇异,只对方阵有意义,那么非方
阵的情况 怎么样?这个说起来就会比较冗长了,最后要把线性变换作为一种映射,并且讨论其映
射性质,以及线性 变换的核与像等概念才能彻底讲清楚。我觉得这个不算是重点,如果确实有时
间的话,以后写一点。以下 我们只探讨最常用、最有用的一种变换,就是在同一个线性空间之内
的线性变换。也就是说,下面所说的 矩阵,不作说明的话,就是方阵,而且是非奇异方阵。学习
一门学问,最重要的是把握主干内容,迅速建 立对于这门学问的整体概念,不必一开始就考虑所
有的细枝末节和特殊情况,自乱阵脚。


接着往下说,什么是基呢?这个问题在后面还要大讲一番,这里只要把基看成是线性空间里 的坐
标系就可以了。注意是坐标系,不是坐标值,这两者可是一个“对立矛盾统一体”。这样一来,“选
定一组基”就是说在线性空间里选定一个坐标系,就这意思。

好,最后我们把矩阵的定义完善如下:


“矩阵是线性空间中的线性变 换的一个描述。在一个线性空间中,只要我们选定一组基,那么对
于任何一个线性变换,都能够用一个确 定的矩阵来加以描述。”

理解这句话的关键,在于把“线性变换”与“线性变换的一个描述” 区别开。一个是那个对象,一个
是对那个对象的表述。就好像我们熟悉的面向对象编程中,一个对象可以 有多个引用,每个引用
可以叫不同的名字,但都是指的同一个对象。如果还不形象,那就干脆来个很俗的 类比。

比如有一头猪,你打算给它拍照片,只要你给照相机选定了一个镜头位置,那么就可以 给这头猪
拍一张照片。这个照片可以看成是这头猪的一个描述,但只是一个片面的的描述,因为换一个镜
头位置给这头猪拍照,能得到一张不同的照片,也是这头猪的另一个片面的描述。所有这样照出
来的照片都是这同一头猪的描述,但是又都不是这头猪本身。

同样的,对于一个线性变换,只 要你选定一组基,那么就可以找到一个矩阵来描述这个线性变换。
换一组基,就得到一个不同的矩阵。所 有这些矩阵都是这同一个线性变换的描述,但又都不是线
性变换本身。

但是这样的话 ,问题就来了如果你给我两张猪的照片,我怎么知道这两张照片上的是同一头猪呢?
同样的,你给我两个 矩阵,我怎么知道这两个矩阵是描述的同一个线性变换呢?如果是同一个线
性变换的不同的矩阵描述,那 就是本家兄弟了,见面不认识,岂不成了笑话。


好在,我们可以找到同一个线性变换的矩阵兄弟们的一个性质,那就是:

若矩阵A与 B是同一个线性变换的两个不同的描述(之所以会不同,是因为选定了不同的基,
也就是选定了不同的坐 标系),则一定能找到一个非奇异矩阵P,使得A、B之间满足这样的关
系:

A = P-1BP

线性代数稍微熟一点的读者一下就看出来,这就是相似矩阵的定义。没错,所谓相 似矩阵,就是
同一个线性变换的不同的描述矩阵。按照这个定义,同一头猪的不同角度的照片也可以成为 相似
照片。俗了一点,不过能让人明白。

而在上面式子里那个矩阵P,其实就是A矩 阵所基于的基与B矩阵所基于的基这两组基之间的一
个变换关系。关于这个结论,可以用一种非常直觉的 方法来证明(而不是一般教科书上那种形式
上的证明),如果有时间的话,我以后在blog里补充这个 证明。

这个发现太重要了。原来一族相似矩阵都是同一个线性变换的描述啊!难怪这么重要! 工科研究
生课程中有矩阵论、矩阵分析等课程,其中讲了各种各样的相似变换,比如什么相似标准型,对
角化之类的内容,都要求变换以后得到的那个矩阵与先前的那个矩阵式相似的,为什么这么要求?
因为只有这样要求,才能保证变换前后的两个矩阵是描述同一个线性变换的。当然,同一个线性
变换的 不同矩阵描述,从实际运算性质来看并不是不分好环的。有些描述矩阵就比其他的矩阵性
质好得多。这很 容易理解,同一头猪的照片也有美丑之分嘛。所以矩阵的相似变换可以把一个比
较丑的矩阵变成一个比较 美的矩阵,而保证这两个矩阵都是描述了同一个线性变换。


这样 一来,矩阵作为线性变换描述的一面,基本上说清楚了。但是,事情没有那么简单,或者说,
线性代数还 有比这更奇妙的性质,那就是,矩阵不仅可以作为线性变换的描述,而且可以作为一
组基的描述。而作为 变换的矩阵,不但可以把线性空间中的一个点给变换到另一个点去,而且也
能够把线性空间中的一个坐标 系(基)表换到另一个坐标系(基)去。而且,变换点与变换坐标
系,具有异曲同工的效果。线性代数里 最有趣的奥妙,就蕴含在其中。理解了这些内容,线性代
数里很多定理和规则会变得更加清晰、直觉。< br>
这个留在下一篇再写吧。

因为有别的事情要做,下一篇可能要过几天再写了。




接着理解矩阵


上一篇里说“矩阵是运动的描述”,到现在为止,好像大 家都还没什么意见。但是我相信早晚会有
数学系出身的网友来拍板转。因为运动这个概念,在数学和物理 里是跟微积分联系在一起的。我
们学习微积分的时候,总会有人照本宣科地告诉你,初等数学是研究常量 的数学,是研究静态的
数学,高等数学是变量的数学,是研究运动的数学。大家口口相传,差不多人人都 知道这句话。
但是真知道这句话说的是什么意思的人,好像也不多。简而言之,在我们人类的经验里,运 动是
一个连续过程,从A点到B点,就算走得最快的光,也是需要一个时间来逐点地经过AB之间的路径,这就带来了连续性的概念。而连续这个事情,如果不定义极限的概念,根本就解释不了。
古希 腊人的数学非常强,但就是缺乏极限观念,所以解释不了运动,被芝诺的那些著名悖论(飞
箭不动、飞毛 腿阿喀琉斯跑不过乌龟等四个悖论)搞得死去活来。因为这篇文章不是讲微积分的,
所以我就不多说了。 有兴趣的读者可以去看看齐民友教授写的《重温微积分》。我就是读了这本
书开头的部分,才明白“高等 数学是研究运动的数学”这句话的道理。

不过在我这个《理解矩阵》的文章里,“运动”的概 念不是微积分中的连续性的运动,而是瞬间发
生的变化。比如这个时刻在A点,经过一个“运动”,一下 子就“跃迁”到了B点,其中不需要经过
A点与B点之间的任何一个点。这样的“运动”,或者说“跃迁 ”,是违反我们日常的经验的。不过
了解一点量子物理常识的人,就会立刻指出,量子(例如电子)在不 同的能量级轨道上跳跃,就
是瞬间发生的,具有这样一种跃迁行为。所以说,自然界中并不是没有这种运 动现象,只不过宏
观上我们观察不到。但是不管怎么说,“运动”这个词用在这里,还是容易产生歧义的 ,说得更确
切些,应该是“跃迁”。因此这句话可以改成:

“矩阵是线性空间里跃迁的描述”。


“矩阵是线性空间里的变换的描述。”


到这里为止,我们终于得到了 一个看上去比较数学的定义。不过还要多说几句。教材上一般是这
么说的,在一个线性空间V里的一个线 性变换T,当选定一组基之后,就可以表示为矩阵。因此
我们还要说清楚到底什么是线性变换,什么是基 ,什么叫选定一组基。线性变换的定义是很简单
的,设有一种变换T,使得对于线性空间V中间任何两个 不相同的对象x和y,以及任意实数a
和b,有:
T(ax + by) = aT(x) + bT(y),
那么就称T为线性变换。

首先来总结一下前面两部分的一些主要结论:
1. 首先有空间,空间可以容纳对象运动的。一种空间对应一类对象。
2. 有一种空间叫线性空间,线性空间是容纳向量对象运动的。
3. 运动是瞬时的,因此也被称为变换。
4. 矩阵是线性空间中运动(变换)的描述。
5. 矩阵与向量相乘,就是实施运动(变换)的过程。
6. 同一个变换,在不同的坐标 系下表现为不同的矩阵,但是它们的本质是一样的,所以本征值
相同。

下面让我们把 视力集中到一点以改变我们以往看待矩阵的方式。我们知道,线性空间里的基
本对象是向量,而向量是这 么表示的:
[a
1
, a
2
, a
3
, ..., a
n
]
矩阵呢?矩阵是这么表示的:
a
11
, a
12
, a
13
, ..., a
1n

a
21
, a
22
, a
23
, ..., a
2n

...
a
n1
, a
n2
, a
n3
, ..., a
nn

不用太聪明,我们就能看出来,矩阵是一组向量组成的。特别的,n维线性空 间里的方阵是由n
个n维向量组成的。我们在这里只讨论这个n阶的、非奇异的方阵,因为理解它就是理 解矩阵
的关键,它才是一般情况,而其他矩阵都是意外,都是不得不对付的讨厌状况,大可以放在一边。
这里多一句嘴,学习东西要抓住主流,不要纠缠于旁支末节。很可惜我们的教材课本大多数都是
把主线埋没在细节中的,搞得大家还没明白怎么回事就先被灌晕了。比如数学分析,明明最要紧
的观念是 说,一个对象可以表达为无穷多个合理选择的对象的线性和,这个概念是贯穿始终的,
也是数学分析的精 华。但是课本里自始至终不讲这句话,反正就是让你做吉米多维奇,掌握一大
堆解偏题的技巧,记住各种 特殊情况,两类间断点,怪异的可微和可积条件(谁还记得柯西条件、
迪里赫莱条件...?),最后考 试一过,一切忘光光。要我说,还不如反复强调这一个事情,把它
深深刻在脑子里,别的东西忘了就忘了 ,真碰到问题了,再查数学手册嘛,何必因小失大呢?

言归正传。如果一组向量是彼此线性无 关的话,那么它们就可以成为度量这个线性空间的一组基,
从而事实上成为一个坐标系体系,其中每一个 向量都躺在一根坐标轴上,并且成为那根坐标轴上
的基本度量单位(长度1)。

现在 到了关键的一步。看上去矩阵就是由一组向量组成的,而且如果矩阵非奇异的话(我说了,
只考虑这种情 况),那么组成这个矩阵的那一组向量也就是线性无关的了,也就可以成为度量线
性空间的一个坐标系。 结论:矩阵描述了一个坐标系。


“慢着!”,你嚷嚷起来了,“你这个骗子 !你不是说过,矩阵就是运动吗?怎么这会矩阵又
是坐标系了?”
嗯,所以我说到了关键的一步。我并没有骗人,之所以矩阵又是运动,又是坐标系,那是因为: 对不起,这话其实不准确,我只是想让你印象深刻。准确的说法是:“对象的变换等价于坐标系
的变 换”。

或者:
“固定坐标系下一个对象的变换等价于固定对象所处的坐标系变换。”

说白了就是:

“运动是相对的。”
让我们想想,达成同一个变换的结果,比如把点(1, 1)变到点(2, 3)去,你可以有两种做法。第一,
坐标系不动,点动,把(1, 1)点挪到(2, 3)去。第二, 点不动,变坐标系,让x轴的度量(单位向
量)变成原来的12,让y轴的度量(单位向量)变成原先的 13,这样点还是那个点,可是点
的坐标就变成(2, 3)了,方式不同,结果一样。

从第一个方式来看,那就是我在《理解矩阵》12中说的,把矩阵看成是运动描述,矩阵与向 量
相乘就是使向量(点)运动的过程。在这个方式下,

Ma = b
的意思是:
“向量a经过矩阵M所描述的变换,变成了向量b。”
而从第二个方式来看,矩阵M描述了一个坐标系,姑且也称之为M。那么:
Ma = b
意思是:
“有一个向量,它在坐标系M的度量下得到的度量结果向量为a,那么它在坐标系 I的度量下,
这个向量的度量结果是b。”

这里的I是指单位矩阵,就是主对角线是1,其他为零的矩阵。
而这两个方式本质上是等价的。

我希望你务必理解这一点,因为这是本篇的关键。

正因为是关键,所以我得再解释一下。

在M为坐标系的意义下,如果把M放在一个 向量a的前面,形成Ma的样式,我们可以认
为这是对向量a的一个环境声明。它相当于是说:
“注意了!这里有一个向量,它在坐标系M中度量,得到的度量结果可以表达为a。可是它在
别的坐标系里度量的话,就会得到不同的结果。为了明确,我把M放在前面,让你明白,这是
该向量在坐 标系M中度量的结果。”

那么我们再看孤零零的向量b:
b

多看几遍,你没看出来吗?它其实不是b,它是:

Ib

也就是说:“在单位坐标系,也就是我们通常说的直角坐标系I中,有一个向量,度量的结
果是b。”< br>


而 Ma = Ib的意思就是说:

“在M坐标系里量出来的向量a,跟在I坐标系里量出来的向量b,其实根本就是一个向量啊!”

这哪里是什么乘法计算,根本就是身份识别嘛。

从这个意义上我们重新理解一下向量 。向量这个东西客观存在,但是要把它表示出来,就要把它
放在一个坐标系中去度量它,然后把度量的结 果(向量在各个坐标轴上的投影值)按一定顺序列
在一起,就成了我们平时所见的向量表示形式。你选择 的坐标系(基)不同,得出来的向量的表
示就不同。向量还是那个向量,选择的坐标系不同,其表示方式 就不同。因此,按道理来说,每
写出一个向量的表示,都应该声明一下这个表示是在哪个坐标系中度量出 来的。表示的方式,就
是 Ma,也就是说,有一个向量,在M矩阵表示的坐标系中度量出来的结果为a 。我们平时说一
个向量是[2 3 5 7]
T
,隐含着是说,这个向量在 I 坐标系中的度量结果是[2 3 5 7]
T
,因此,这个
形式反而是一种简化了的特殊情况。

注意到, M矩阵表示出来的那个坐标系,由一组基组成,而那组基也是由向量组成的,同样存
在这组向量是在哪个 坐标系下度量而成的问题。也就是说,表述一个矩阵的一般方法,也应该
要指明其所处的基准坐标系。所 谓M,其实是 IM,也就是说,M中那组基的度量是在 I 坐标
系中得出的。从这个视角来看,M× N也不是什么矩阵乘法了,而是声明了一个在M坐标系中
量出的另一个坐标系N,其中M本身是在I坐标 系中度量出来的。

回过头来说变换的问题。我刚才说,“固定坐标系下一个对象的变换等价 于固定对象所处的坐标
系变换”,那个“固定对象”我们找到了,就是那个向量。但是坐标系的变换呢? 我怎么没看见?
请看:

Ma = Ib

我现在要变M为 I,怎么变?对了,再前面乘以个M
-1
,也就是M的逆矩阵。换句话说,你
不是有一 个坐标系M吗,现在我让它乘以个M
-1
,变成I,这样一来的话,原来M坐标系中
的 a在I中一量,就得到b了。
我建议你此时此刻拿起纸笔,画画图,求得对这件事情的理解。比如,你 画一个坐标系,x轴上
的衡量单位是2,y轴上的衡量单位是3,在这样一个坐标系里,坐标为(1,1 )的那一点,实际
上就是笛卡尔坐标系里的点(2, 3)。而让它原形毕露的办法,就是把原来那个坐标系:

2 0
0 3 的x方向度量缩小为原来的12,而y方向度量缩小为原来的13,这样一来坐标系就变成单位
坐标 系I了。保持点不变,那个向量现在就变成了(2, 3)了。

被矩阵:
12 0
0 13
左乘。而这个矩阵就是原矩阵的逆矩阵。

“对坐标系施加变换的方法,就是让表示那个坐标系的矩阵与表示那个变化的矩阵相乘。”
再一次 的,矩阵的乘法变成了运动的施加。只不过,被施加运动的不再是向量,而是另一个坐
标系。

如果你觉得你还搞得清楚,请再想一下刚才已经提到的结论,矩阵MxN,一方面表明坐标系N
在运动M下的变换结果,另一方面,把M当成N的前缀,当成N的环境描述,那么就是说,在

M坐标系度量下,有另一个坐标系N。这个坐标系N如果放在I坐标系中度量,其结果为坐标系
Mx N。

在这里,我实际上已经回答了一般人在学习线性代数是最困惑的一个问题,那就是为什么 矩阵的
乘法要规定成这样。简单地说,是因为:
1. 从变换的观点看,对坐标系N施加M变换,就是把组成坐标系N的每一个向量施加M
变换。

2. 从坐标系的观点看,在M坐标系中表现为N的另一个坐标系,这也归结为,对N坐标
系基 的每一个向量,把它在I坐标系中的坐标找出来,然后汇成一个新的矩阵。

3. 至于矩阵 乘以向量为什么要那样规定,那是因为一个在M中度量为a的向量,如果想
要恢复在I中的真像,就必须 分别与M中的每一个向量进行內积运算。我把这个结论的推
导留给感兴趣的朋友吧。应该说,其实到了这 一步,已经很容易了。
综合以上123,矩阵的乘法就得那么规定,一切有根有据,绝不是哪个神经病胡思乱想出来的。 < br>我已经无法说得更多了。矩阵又是坐标系,又是变换。到底是坐标系,还是变换,已经说不
清楚了 ,运动与实体在这里统一了,物质与意识的界限已经消失了,一切归于无法言说,无
法定义了。道可道, 非常道,名可名,非常名。矩阵是在是不可道之道,不可名之名的东西。
到了这个时候,我们不得不承认 ,我们伟大的线性代数课本上说的矩阵定义,是无比正确的:

“矩阵就是由m行n列数放在一起组成的数学对象。”

好了,这基本上就是我想说的全部了 。还留下一个行列式的问题。矩阵M的行列式实际上
是组成M的各个向量按照平行四边形法则搭成一个n 维立方体的体积。对于这一点,我只
能感叹于其精妙,却无法揭开其中奥秘了。也许我掌握的数学工具不 够,我希望有人能够给
我们大家讲解其中的道理了。

我不知道是否讲得足够清楚了,反正这一部分需要您花些功夫去推敲。

pushing-悄无声息的反义词


knowhow-好看的英文电影


carol什么意思-汽动泵


生活习惯英文-role


好听的男生英文名字-办公室自动化软件


小学二年级上册数学题-mens


缠绕式垫片-经济是什么意思


si是什么元素-钻地风



本文更新与2020-10-20 22:46,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/414642.html

矩阵,矩阵背后的现实意义的相关文章

  • 爱心与尊严的高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊严高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊重的作文题库

    1.作文关爱与尊重议论文 如果说没有爱就没有教育的话,那么离开了尊重同样也谈不上教育。 因为每一位孩子都渴望得到他人的尊重,尤其是教师的尊重。可是在现实生活中,不时会有

    小学作文
  • 爱心责任100字作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任心的作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文