20110724

对于教材写法的一点考虑 转载

请辩证阅读。

对于教材写法的一点考虑
via 宇宙的心弦 by Eagle Fantasy on 4/14/11

有感于Matrix67神牛的这篇文章(强烈建议大家去读一读),我也发表一下自己对于教材编写的一点看法。

1.对线性代数的吐槽

(没学过线性代数的同学请忽略下面3段往后接着看。)

我一直觉得线性代数用那种严格公理化的语言写成课本根本不适合初学者学习,一开始学习线性代数的时候,我本人对很多概念的直观意义根本就是完全不知道。我们的课本是丘维声的《简明线性代数》,我在此毫不掩饰的表示对这本教材的鄙视:这本教材居然是按照这样的顺序讲线性代数的:线性方程组->行列式->线性方程组的进一步讨论->矩阵的运算->一大堆东西->线性空间->线性映射->一大堆东西。这个狗屁顺序直接导致我前半个学期一直以为线性代数就是研究怎么解线性方程组的,我心想,这么简单的问题,具体问题谁都会解,值得这么大动干戈的定义出这么大堆东西么。。。一直到线性空间那一个章节以前,我完全就不知道线性代数整个是在干什么..后来学的多了我才知道,其实线性代数就是研究线性空间和线性映射的嘛,什么线性方程组,根本没那么重要。一个更加合理的顺序是:先讲线性空间、线性映射,其中明确说明矩阵就是线性映射,然后再讲行列式,然后线性方程组只作为一个例子出现就可以了。

然后在说说那个不靠谱的行列式。。我就不明白,国内的教材是基于怎样一种考虑,居然把行列式放在矩阵前面讲,放在线性映射前面讲。?于是就导致行列式的定义居然诡异的用到了逆序对,一上来就来这么个定义我们怎么可能明白行列式到底是个什么东西,它是干什么的?!还有矩阵的概念,我们的课本引入矩阵是从线性方程组引入的,于是让我在前半学期里面就仅仅以为矩阵就是一堆排成了方阵的数而已。。。于是我就死活不能理解,为什么矩阵之间还能引入乘法,乘法的定义还能那么诡异?!非要等到后面学到了线性映射,我们老师才终于跟我们讲清楚了:原来矩阵就是用来表示线性映射的嘛。。矩阵相乘就是表示先后做两个线性映射嘛,之所以那么定义矩阵乘法,就是因为这样定义了之后,乘得的新矩阵确实能够等价的表示先后做两次线性映射。。。但是行列式到底是什么,课本根本就到最后都没有说清楚。还是Matrix67文章里的一句话道清了本质:"其实,行列式的真正定义就一句话:每个单位正方形在线性变换之后的面积"。为什么所有的教材里就不能把这样一句话放在教材里呢?!

还有很多概念都没有讲清楚它们的直观意义到底是什么。有许许多多学经济或者学其他学科的同学,可能学完了整个线性代数也不明白,算特征值和特征向量到底是干什么的,为什么要研究这么诡异的问题。如果不是我们老师上课讲道它在量子力学里会体现出无穷重要的价值,我单看课本肯定不明白这是在干什么。特征值其实就是量子力学里的算符对应的可观测物理量(这点可能不学量子力学很难理解)。还有就是迹(trace)的概念,我至今没有搞清楚为什么要定义这么一个量,我根本就不知道它表示了什么。于是我就既记不住它的各种性质,也不知道我到底在何种物理问题里会用到迹这个诡异概念。你说我都完全不理解到这个地步了,学这个概念还有什么用?不光是我一个人的问题,我问了问身边的人,他们同样回答不出来迹是个什么。

国内好多同学应该都会对此有共鸣,因为我们国内的教材都是这样对概念只下严格数学定义,而基本上不作直观解释的,于是就导致很多很多人学完了线性代数都不知道自己学了些什么。理解数学概念的直观图像,其作用不仅仅是能够帮助记忆那些概念的性质,甚至可以帮助捋出证明思路,甚至都可以帮助数学家发明新的数学。可是现有的课本就是讲不清楚直观解释!

2.对理论力学的吐槽

但是,我忽然间想到,我其实也一直觉得理论力学课本只是拿牛顿力学作为例子去推导那些更加普遍的原理,让我觉得把握不住它的逻辑。而这样的课本的弊端,恰恰与线性代数相反。(没学过理论力学的同学可以跳过下4段直接往后看。)

至少我见过的所有理论力学课本(北大自己印的课本、Goldstein的《Classical
Mechanics》),全都是大致按照这样一个顺序讲的:用牛顿定律推导出拉格朗日方程,然后用拉格朗日方程推导出正则方程(即哈密顿方程),然后再从拉格朗日方程推导出最小作用量原理(或者叫哈密顿原理),然后是再推导一些其他的比如哈密顿雅克比方程和诺特尔定理之类的。/*补充说明一点
朗道的《力学》确实是从最小作用量原理出发的。我可能当初没太看懂。但是我仍觉得即使是朗道的力学也没有说清楚L的定义*/

如果说以上这些方程的地位是等价的,这么讲是没有问题的,可是最关键的问题是,正则方程和最小作用量原理的普遍性适用于任何物理系统的(有人甚至认为适用于任何系统,比如说金融之类的也有这些方程),但是众所周知牛顿力学是有很大局限性的。也就是说我们实际上是从一个特例推出了普遍成立的原理。于是我们其实只是拿牛顿力学作为了一个例子,稍微讲了一下在宏观低速的条件下这两个普适原理和牛顿力学是如何等价的。但是理论力学并没有指出正则方程和最小作用量原理在牛顿力学不适用的情况下是如何仍然成立的。尤其让我不能忍的是,拉格朗日量L和哈密顿量H在牛顿力学不成立之后如何定义,课本上都只字未提。于是我就搞不清楚整个理论力学的逻辑基础了。

记得几星期以前我们组的一个老师在黑板上在任意一个系统内(不限于物理系统),随手推出了正则方程,并且据此说正则方程是普遍适用于任何系统的!一开始我并没有太跟上他的思路,只是觉得这个结论实在是非常神奇,还因此而兴奋了许久。后来我仔细想想就觉得越想越不对劲,他的推导到底用到了什么前提条件?要写出正则方程首先得有哈密顿量H,那么任何一个系统的H是怎么给出的?如何定义任何一个系统里面的H?于是我找同学讨论,有找那个老师问,最后终于明白了整个理论力学的逻辑是怎样的了:

首先我们有一种信仰,那就是最小作用量原理总是成立的。即在任何一个系统(至少是物理系统)内,我们总能找到一个拉格朗日量L使得最小作用量原理得到满足。这就是L的定义式。有了L便可以很容易的定义出H。有了H的定义,就可以去推导正则方程了。于是那个老师的推导其实一点都不神奇,实际上就是从最小作用量原理推导正则方程而已,而这在理论力学课上肯定推得滚瓜烂熟了。但是把最小作用量原理做为最基本原理有一个问题,就是他并没有给出如何找到这样一个L的方法。于是在特定的物理体系中寻找合适的L便成了一个非常困难的核心难题。

总之,到底哪个原理是处于公理地位的,那些物理量是如何在普遍情况定义的,在现有理论力学课本里都只字未提。于是,理论力学课本里缺少的,正是线性代数课本中让我觉得不爽的:那就是严格的公理化系统和严格的逻辑。

3.结论

所以现在想想,真正好的教材其实应该把要讲的内容写两遍:第一遍怎么直观怎么讲,尽量用最少的数学让大家明白研究的对象到底是什么东西,要在头脑中有一个直观物理图像,然后讲的顺序可以按照历史上这些概念是怎么提出来的来讲;第二遍就上公理化系统
严格地列出这套理论的所有定义和公理,然后按照逻辑的先后顺序推演出所有需要掌握的定理。

于是我就有一个打算,等我也能教书育人了,我一定要自己写一本线性代数教材和一本理论力学教材,把我的这套理念发扬光大,让大家以后再学的时候少走些弯路。

嗯就是这样。

No comments: