工科学生如何学好数学
高考真题及答案-励志奖学金
工科学生如何学好数学
不少工科学生特别是工科
研究生对数学基础不足感到压力。确实,缺乏数学
的帮助会使得学生们的研究缺乏思路和工具,缺乏捕捉
问题的敏感性,缺乏抽取
问题本质的能力,缺乏处理问题的技巧和方法。我们许多硕士生、博士生的研究
论文缺乏创新性,数学基础差是一个重要原因。这个讲座谈谈工科学生如何学习
数学的问题,希
望对有愿望提高数学能力的同学有所帮助。我本人是电子信息领
域中的一个研究者,不是数学家,这里讲
的希望能贴近工科学生的需要。作数学
工作的同仁可以从这里了解到工科研究者对数学的一部分理解以及
对数学家们
的期望。
(一)让兴趣引导我们接近数学
有愿望学习数学,
而数学内容常常不那么有趣。确实没有多少人能坚持做那
些令人发困的劳作。然而,有人谈到过这样的经
验:对数学的兴趣需要发掘、引
导和培养。我对此很为认同。有多种方法可能增加你对数学的兴趣,当然
没有一
种办法可以减轻你需要付出的努力。
多做数学题是提高数学能力和兴趣的有效方法。不
少成功的研究者都介绍过
这个经验。如果你正在学习数学,如果你发现一道道看似困难的问题能逐渐被你
解答,就表明你已经进入了良好状态。这是一个好的开端,会有克服者的喜悦,
会不断发现你自
己的数学才能,有继续进展的兴趣和劲头。如果你已经进入了研
究工作,如果你不时抽出一点时间做一点
数学趣题,对保持和提高你的数学思维
活力一定有所帮助。
不少学生提出过这样的问题:是不
是必须先准备了深入宽广的数学基础才适
合于进入研究工作?确实,我不知道有哪个非数学专业的研究者
是那样做的。而
且认为那不是一个切合实际的方法。不过,准备在工科专业领域内做深入研究的
学生们应当花一点时间读一点最基础的数学。除了工科大学已经教过的高等数学
等课程外,可以读一点实
分析和近世代数的入门知识。了解一点关于集合、测度、
连续统、Lebesgue积分,以及初等数论
、群这些基本概念。学习这些基本知识不
需要太多的时间,而对进一步学习数学理论很有必要。对于更深
入广泛的数学知
识,不妨先采用“浏览学习法”:试着读一读,不太懂不要紧,但要求快
一些,
多一些。“浏览学习法”的目的是了解数学涉及的各个方面,为将来深入学习提
供线索。
不要小看那些似懂非懂的线索。如果你积累了较丰富的线索,它们会扩
展你的思路,在需要的时候引导你
较快地了解必须深入准备的基础。缺乏线索,
脑子里要么一片空白,要么产生一些不切实际的空想,自然
难以作研究工作。
结合专业研究的需要来学习深入的数学理论是一个许多研究者都很认可的
方
法。事实上,对专业研究题目深入思考可能激发起对数学的高度兴趣甚至产生
出创新性成果。爱因斯坦的
研究经历是人们知道的。在爱因斯坦研究广义相对论
的早期,并非数学基础十分丰厚。在他的同学格罗斯
曼的帮助下,了解了黎曼几
何和张量分析。爱因斯坦在深入研究中感觉到,这种数学工具简直是为他发展
广
义相对论而准备的。他的工作不仅使广义相对论发展到成熟,而且推动了黎曼几
何更加突飞猛
进地进步。
绝非只是在物理等基础研究领域能够提出挑战性问题和发现数学的应用。在
应用科
学包括工程学科领域内,处处都有挑战性问题。当你试图解决某个实际问
题的时候,你总会感到手头的数
学不够用。尽管现代数学已经取得了十分丰富的
成果,而物理世界太复杂太丰富了,当今数学能够描述和
处理的问题还仅仅是一
个很小的集合,而工科研究者手头的数学恐怕会更少。
从自己从事的工
程学科研究中抽取数学问题是我对工科学生的一个建议。不
必苦苦寻求那些被媒体追捧的“明珠”,除非
你确实有准备和兴趣。你在工程学
科中的已有基础是值得珍视的。这些基础有可能帮助你抽取出很有意义
的理论和
数学问题。而发现这些问题,除了灵感以外,最靠得住的恐怕是对专业工作的专
注、勤
奋而开放的思考和数学基础。
工科学生可以发挥自己在形象思维方面的长处去理解数学。如果这样,你
或
许会发现数学中的若干知识不仅有趣,而且有用。这里说一说几个常见的例子。
―― 正交
性。这是布满了数学和物理书籍的基本知识。为什么正交函数会
如此广泛地受到重视?从数学的角度看到
的是基,用它来描述函数空间中任何一
个元具有唯一性和可逆性;可以联系映射的定义域和值域,从而研
究解乃至求得
解。从应用的角度看到的是一种基本工具或方法,可以使得例如函数变换、函数
逼
近、数据压缩、数学物理问题的求解等问题变得容易处理和易于理解。与正交
性相联系的
自然是非正交性。非正交性也很有用。例如用非正交基(标架)表示
信号可以灵活地具有某些特别的性质
。这种表示带有一定冗余,但有一定抗损能
力。
描述空间正交性最基本的数学原理是什么?合
理的回答应该是Cauchy-
Riemann方程。由此才有保角变换、Laplace方程、调和函
数、Poisson方程等等。
空间正交性对数学物理问题的研究者太有用了。有了这个直观概念,就容
易理解
和猜测例如流体力学、引力场、电磁场等等领域中边值问题的解的形式。例如波
导中特别
是在不规则波导中电磁波存在的模式、模式变化这些问题可以根据正交
性来猜测和解释,因为电场分量必
定垂直于波导壁,而磁场分量必须平行于波导
壁。
―― 无源性。讨论无源性的数学家不多,
但对于物理和工程,无源性非常
重要。空间无源性隐含在解析函数的Cauchy积分定理中。事实上,
例如用有限
元方法处理大型力学计算问题时人们观察到,求解方程的矩阵一般是主对角优势
的,
这和求解一个无源电阻网络时观察到的现象相一致。其内因就是无源性,它
保证了解的数值稳定性和迭代
求解方法的快速收敛。在电路理论中证实,一类特
别的解析函数称为正实函数作为驱动阻抗,是无源网络
可综合的充分必要条件。
进而,无源而且无损的网络在电子工程设计上非常有用。因为例如无源无损滤波
器的特性随元件参数变化的敏感度底,适合于工业生产。现代数字滤波器包括通
信滤波器组的理
论和设计都要应用和发展这些概念。
―― 最大熵和最小熵。熵是热物理学中最先引入的概念,用它表
示能量在
系统中分布的均匀程度,同时也表示热和温度的关系。一个系统达到了热平衡,
或达到
了能量的均匀分布,则系统的熵达到最大。在通信领域中熵被用来作为信
息的度量,表示平均信息量。如
果熵最大,表明信源的不确定性最大,被传送的
信号寄载的信息自然就最多。在信息处理、信号估计,包
括图像处理应用中,熵
的概念被借用来表示对解的先验限制:最大熵限制表示解在数值分布上应该有一<
br>定的均匀性或平滑性;而最小熵限制表示解应该很不平滑,如同若干孤立点那样。
这两种情况在应
用中都可能出现。例如在若干反演问题中(如信号重建、复原、
去噪、估计等),为了抑制噪声,可以将
最大熵作为对解的附加限制。在另外的
情况下,例如希望的解是点状的星云,或者是如同若干孤立噪声那
样的岩层反射
序列,或者是只含一个非零元的理想信道,对这些情况就可以附加最小熵限
制。
注意我们这里使用的“概念被借用”说法。其实这是研究中的常用方法。如果你
的视野广些
,积累多些,就有可借用的机会。
―― 距离和相似性。距离这个概念在数学中太重要了,它
是定义度量空间
的第一要素。有了距离,才好讨论度量空间中元和元之间的相互关系,才好讨论
按距离的收敛性。有多种距离的具体形式适合于研究不同的数学问题。典型的例
子有用函数差值上界定义
的距离(一致收敛距离)和按函数差值平方积分定义的
距离(均方收敛距离)。典型地,许多问题需要通
过最优化一个泛函指标来表达,
这个指标就是距离。工科研究者十分关注距离的一个直观含义:函数的相
似性度
量。自然地,用距离描述的相似性是很窄的一类相似性。即使是这样, 它的应
用已经遍
及物理和工程的许多领域。与电子信息领域相关的应用例子有信号(图
像)重建、恢复、估计等等。两个
随机变量的在统计上是否相关或独立,或者它
们的统计特性是否相似,为检验这些问题在统计学中引入了
Kullback-Leibler型
距离和Bhattacharyya距离(或称为差离度,div
ergence)。这些距离不满足三角
不等式,称为广义距离。它们在统计模式分析、目标识别和分类
、图像分割和配
准等方面已经有重要应用。在工程研究中你可以利用手头掌握的数学不等式,定
义新的距离或广义距离,它或许有某种特别的性质。
人感知物理世界,哪些事和物按什么方
式和度量彼此相似,这可能是最富魅
力的科学问题之一。相似这个概念既直观又抽象甚至神秘。例如绘画
家可以将一
个人的形象用写实画、印象画、线描画、甚至各种形态的漫画表现出来,我们可
以认
识他,并认为和照片上的他是同一个人。问题是如何从数学上定义这些图画
中人的相似性?
如
果你细心思考,数学中处处都可以发现很有趣的问题,这些问题可以在物
理和工程中找到应用背景。 <
br>物理和工程学科中包含大量的数学。有的工科学习者对数学表达不经意,甚
至厌烦,这种心态会妨
碍知识的获得。如果你愿意花一点时间去读懂一些重要的
数学表达,你会发现不仅在认识的深度上会大大
不同,而且会引出乐趣甚至创新
性的认识。这里不妨举一个大家熟悉的例子。卷积的表达式为
b
我们的教科书中总是这样解说的:在每个时间点
t
,将
x(
)
y(t)
x(t
)h(
)d
。
a
翻转为
x(
)
,再平
移为
x(t
)
,与
h(
)
乘积的结
果,求面积,就得到卷积的结
果。这个解说是没错的,并且因为
x(
)要被翻转,成为“卷积”这个称呼的来源。
但问题是,这个解释符合物理事实吗?或者说在物理上的
一个卷积过程,要求一
个物理量在时间上(或空间上)必须被翻转吗?这显然不是事实!现在的问题出<
br>在哪里?问题出在刚才的解说仅仅是一个数学解说。另一种解说就没有这样的困
难:将
x
(t)
平移一个时间量
成为
x(t
)
,乘在
处的函数值
h(
)
,取遍定义
h(
)
的所有
,将乘积累积起来,就得到卷积的结果。后一种解释其实是最老的
解释:
叠加原理。正是按照这种解释,可以构造出用物理硬件实施卷积计算的卷积器。
“翻转”
这个概念应该说造成了某些负面后果。例如,考虑两个外形不同的多边
形(你不妨在纸上画一个任意的三
角形和一个任意的四边形,假定图形内数值是
1,图形外是0),这两个图形卷积后,结果是什么外形?
你可以试图通过上面的
两种解释从概念上得到结果。你会发现,从“翻转”解释出发会使你头痛,而从<
br>后一种解释得到结果就很直观和容易。不要小看了这里的问题,它联系着某些深
入的数学:代数几
何、多项式代数和分配函数理论。
另一个简单例子是矩阵的奇异值分解(SVD)。这种方法常常用于
图像的特
征描述、分类和识别。人们将图像离散化为数值数组,将数组作为矩阵,计算它
的若干
个显著的奇异值,作为描述图像特征的一组特征量。这样做合理吗?或者
说,若干个显著奇异值能描述图
像灰度分布特征吗?回答却是否定的。事实上,
你需要仔细解读一下SVD的数学表达式。注意每对奇异
向量的乘积
u
i
v
i
T
是一个
可分图像。SVD表
达式表明,用若干个可分图像按奇异值进行强度加权后叠加
在一起,可以逼近原图像。因此,除了几个显
著奇异值外,如何描述几个显著的
可分图像的特征是你可以发展的工作。
从物理和工程上解
释数学是工科研究者的优势,不要忘记了这一点。我们还
可以举一个抽象一点的例子。同伦是数学中的一
个概念。一个拓扑流形或函数如
果能够通过连续变形变成另一个拓扑流形或函数,我们就说这两个拓扑流
形或函
数彼此同伦。同伦论是数学中一个重要研究领域,并且与Riemann几何的研究
密切
关联。仅仅是同伦这个概念对工程就很有用。在大规模集成电路(VLSI)
设计中需要通过电路仿真,
检查设计出的电路是不是符合设计要求。一个基本的
检查是要计算各个晶体管在加电后的
工作点(电压和电流)。晶体管特性是非线
性的,数量多,相互直流互连。直接处理这样的非线性电路问
题很困难,并且可
能是多解的。电路仿真程序SPICE的研究者提出了一种“源步法”,就是利用了<
br>同伦的思想。让电源电压从0开始,连续小步地逐步升到额定值,计算随之逐步
迭代进行。这样在
每一步,都是解一个线性化的电路问题,并且计算过程符合加
电的实际物理过程。这种处理大型非线性计
算问题的方法应该不限于电路计算的
应用。
不同应用领域可以有关于数学概念和表达的不同解
读,其实这正是数学的奥
妙之处。解读数学需要耐性。如果你想把握它,就花一点时间去解读它。
(二)努力寻求数学概念的浅近解释
工科学生有形象思维的强势,但
在抽象思维方面常常处于弱势。实际上,学
生们进入学习多少都有这样的特点。好的教育工作者会注意这
个特点。例如前苏
联数学家柯尔莫哥罗夫建议讲解数学时要能用其他科学领域的例子来吸引学生,
增进理解,培养理论联系实际的能力。并且要求以清楚的解释和广博的知识来吸
引学生进行思维运动。
柯尔莫哥罗夫的学生、数学家Arnold更是强烈地呼吁数
学教育必须结合物理,充分利用几何直观,
反对数学教育的非几何化和脱离物理。
事实上,用物理和工程例子将数学概念形象化和具体化,达到浅近
易懂,是数学
家对学生(不只是工科学生)的最重要帮助。在50年代莫斯科大学组织了一批
顶
级的数学家写了数学普及名著“数学――它的内容、方法和意义”。直到现在,
世界范围内的科学工作者
中许多人都曾经或正在从该书获得入门知识。
许多学者都承认一个事实:高深理论的原始概念
其实是简单的。只是不少“专
著”直接从高深理论开始,忽略了对基础背景的介绍,学生接受起来就觉得
抽象
难懂。工科学生要想真正掌握数学理论,还不得不寻求一个具体化的或形象化理
解,最好有
一个物理的或工程的例子。如果得不到老师的指导,你就得准备多花
一点功夫。有一些方法可以供参考。
其一是尽量利用百科全书那样的工具,包括
Wikipedia的网络百科,它常常可以帮助你尽可能浅
近地理解基本知识。其二是
多参阅几本讲述同一个理论的书或涉及该理论的文章,从中发现你可以理解的
内
容。如果一时难以找到很切合的参考,可以暂时放一放,不必钻牛角尖。常常,
你在工程学科中的研究积累会帮助你开拓思路,甚至找到领悟的灵感。
工科学生有必要增强
自信。某些数学概念内涵的神秘性其实只是我们自己的
感觉而已。当然,抽象和严格是数学科学性的精髓
。但这并不妨碍可以将数学概
念和物理或几何直观联系起来。我们这里解说一两个例子,如有谬误请专家
不吝
赐教。
―― 紧集(Compact set),闭区间或有界闭集概念的拓
广。“有限维闭区间”
是一个易懂、易用的概念。它有一个很直观的性质,就是它在每个维上有下确界<
br>和上确界。此外,孤立点也很特别,不需要考虑它的任何“近邻”。引入“紧集”
的主要动因是为
了扩展有限维闭区间的概念,使得可以包含无穷维空间的点集,
或者是由一类函数组成的集合。紧集的机
巧定义就达到了这个目的。
紧集最有用的性质是它的有界性和可分性。这里,一个集合可分,
是指存在
着一个可数集合在该集中稠密。在有限维空间中,紧集的充分必要条件是有界和
闭性。
同时,在Hausdorff 空间中,紧集都是闭的。这含盖了分析中常用的空间,
如所有的距离空间
,拓扑群,和拓扑流形。在非Hausdorff空间可以构造出例子
表明紧集的闭性不一定成立。 <
br>紧集的例子如:有限维闭区间;R
n
中的有限个孤立点;含极限点在内的孤
立有
界点列集合;所有一致有界并等度连续的函数集合。在一维上的“紧支集”
可以是指一个闭区间,也可以
指实轴上一组有限个离散栅点。
Hausdorff空间是指符合分离公理的拓扑空间:如果集合中有
两个元不相等,
则它们必定有不同的邻域。细细思考一下你会发现,分离公理事实上是序列收敛
性论证的基本依据:按邻域收敛,并且收敛有唯一性。
――
拓扑(Topology),集合元素之间相互接触或连接的关系。
基本的拓扑学研究几何形体在连续
变形下保持不变的性质,例如连通性。典
型的问题有哥尼斯堡七桥问题,四色问题,布线平面化问题等等
。
既然拓扑是指集合元素的接触或连接关系,它显然是更一般的几何性质,而
不限于常规的E
uclid几何性质。例如,电路拓扑图上两个节点之间有支路相连,
这可以与物理连接关系一致,但与
物理元件的实际空间位置不必一致。
当集合元素在某个连续域中取值时,就需要将问题放到“拓扑空间
”中去研究。
在拓扑空间中,常规的距离定义不一定有意义,而点列的收敛可以通过“充分小
邻域”和“覆盖”这样的概念来定义和论证。一般拓扑学使用公理化方法研究连续
性问题, 概念变得更加抽象,并一直与微分几何、抽象代数等学科并行发展。
网络拓扑,是指网络的基本元素“ 顶点”和“边”的连接关系。例如用顶点
来表示一个国家,两个顶点之间有边相连,表示两个国家接壤。 关于网络拓扑的
学科分支通常称为图论。用图论方法研究的典型数学问题有一大类组合优化问
题 ,最优布线问题,流图分析,逻辑分析,交通流和数据流分析等等。
虽然拓扑是几何形体在连续变形下 不变的性质,但在应用中发现限制形体
(结构)的拓扑不变可能得不到最优解。于是希望,如果有必要, 能够通过连续
演化实现拓扑结构的改变。这一般地还是一个未解决问题,但也有解决得好的例
子 。例如希望将二维平面上的单连通区域连续地演化出多连通区域或多个单连通
区域,直接在二维平面上不 大好办。但如果扩充到三维,构造一个三维函数,并
使用水平截集获得二维区域,就能容易地解决。这个 方法已经成功地用于图像的
活动围道分割等处理算法。
―― 流形(Manifold),受 一定约束的某个(一维或多维)变量所有可能状
态的集合。在数学文献中,流形有一个抽象的定义:流形 是一类拓扑空间,其中
每个点都有邻域,而这种邻域与
R
n
中的单位开球在拓 扑上是同胚的。
流形的含义十分广泛,并且可以定义各种各样的流形。空间是流形。然而
流形 可以是某种“可弯曲”的空间(通常将Euclid空间视为“平直”的空间)。
3维空间中的球面是流 形的一个例子,而球面上任何一条经线或纬线是一个子流
形。基于球面建立的几何学与Euclid几何 学是不同的。
在物理上流形这个概念有一个重要应用,用它来表现某个受约束的物理量
的全局 行为。例如,机器臂可达的所有极限位置。在模式识别问题中(如人脸识
别),描述单个个体不同形态的 一系列N维特征量样本构成N维空间中的一个流
形上。不同个体有不同的流形。这些流形构成了进行模式 识别的基础。从这个例
子可以看出,即使你关注的流形不一定能够被解析地表达出来,它也为你提供了< br>一个处理问题的明晰概念。
微分流形或平滑流形是指可在其上实施微分运算的流形。
想象在曲面微分流形上有两个十分靠近的点,它们之间的坐标差为{
dx
i
}, p>
其Euclid距离就是
ds(
dx
i
2<
br>)
12
。然而,从一点只能沿流形的测地线到另一点,
i1
N
沿测地线的距离
ds
会大于Euclid距离。于是将
ds
定义为
ds(
g
ij
dx
i
dx
j
)
12
。
i,j1
N
其中
(g
ij
)
是
一个沿流形表面逐点定义的对称正定矩阵,称为Riemann度量,用
来描述对距离元的校正。定义了
Riemann度量的微分流形称为Riemann流形。
在信息处理技术中可以将概率分布
模型
p(y|x;
)
全体视为参数空间
中的
一
个Riemann流形。当参数
变成
时,
p(y|x;
)
和
p(y|x;
)
之间的
Kullback -Leibler距离正好等于
T
G
,这里
G
是Fisher信息矩阵。由此可见,
G
正好是这种Riemann流形的Riemann度量。发展这些概念可以建立起概率模
型参
数估计的新方法,用于例如盲源分离、盲辨识、神经网络学习算法等等。由
于流形有直观的几何解释,这
种数学概念和方法又称为信息几何。
以上所解说的几个数学概念仅仅希望起到抛砖引玉的作用。更多的
入门知
识显然不是这样的讲座适合介绍的,应该期望得到数学家门的帮助。我们希望工
科学生消
除数学的神秘感。柯尔莫哥罗夫说,应该把泛函分析方法当作日常工具
来应用。虽然我们一下子作不到,
只要不忘记有机会就用它,你会发现,你论文
的学术水准会有所提高,得到的评价会有所不同。另一方面
,数学研究者了解物
理和工程需求是有益的。事实上,把数学概念讲得浅显易懂,这需要对物理和工程的了解,一定能够扩展数学研究者的思路。
(三)应用需求是数学产生的源泉和发展的源动力
我们需要更多地帮助工科学生增强学习数
学的兴趣和进行深入研究的信心。
在我国的媒体上对“数学明珠”有过度的宣传,对学生们的影响是复杂
的,对工
科学生造成的负面影响多于正面影响。许多工科学生和工科研究者觉得自己的工
作和数
学的距离愈来愈远,甚至认为自己的工作只是一些工程性的工作,难于和
理论研究结合起来。一些研究生
痛苦于定不下一个适当的研究题目,这种情况在
我国的科研单位和大学不算少见。出现这种情况的原因是
多方面的。从文化方面
来看,重理轻工的观念和习俗,影响一部分工科学生,放松了对应用科学前景的<
/p>
追求。这种情况在我国相当严重,值得引起关注。
工程学科中是不是难于提出有
创新性的研究题目呢?近代科技发展的历史
已经明确回答了这个问题。虽然计算机断层成像技术有早先的
理论铺垫,被承认
和授予诺贝尔奖的还是它的实现技术。晶体管的发明更是物理和工艺实现技术结
合的产物。当今的科技创新,其主要支撑点是技术创新――方法、工艺、条件和
工具的创新。工科研究
者不必自惭形秽。你所处的应用需求环境和工作条件是值
得珍视的。只要注意了积累功底(理论的和实践
的),你一定会不断提高捕捉问
题的敏感性,增强抽取问题本质的能力,就很有可能发现值得探索的问题
。
数学是从应用需求产生的。这句话讲的不只是历史,还是现实。
一个例子是泛函分析,它
的出现得益于运动变分问题(J.阿达马)和力学积
分方程(阿贝尔、Fredholm)的研究。推动
这门数学全面进步的有J. von Neumann
的工作,是他首先将Hilbert谱理论和量
子力学完美结合起来。Sobolev将泛函分
析方法用于数学物理方程的研究和求解。在Sobole
v空间中引入弱导数和广义解
这些概念,为大型求解计算问题的分段近似处理提供了理论基础。与此密切
关联
的有限元方法可以说是数学和工程结合的典范。其应用领域包括结构力学、流体
力学、空气
动力学、计算电磁学、气象科学等各个学科。多领域的应用需求又反
过来推动了计算数学理论和方法的完
善和发展,这不仅仅限于有限元方法。
近20~30年间在信息技术领域中出现了几次重要的研究热潮
。这些热潮活
跃于信息技术领域,但吸引了大量的数学研究者共同参与。典型的有:关于人工
神
经网络的研究;关于小波理论的研究;关于高阶统计的研究;关于Markov随
机场的研究;关于偏微
分方程法用于图像处理的研究等等。当这些热潮出现的时
候,不仅仅是信息技术类刊物,还包括数学刊物
都大量报道研究进展。人们可以
从美国应用数学协会(Society for Industrial
and Applied Mathematics,SIAM)出
版的十几种刊物了解到相关的动态。
数学家们需要应用背景的支持,需要从应用
需求中寻找灵感。而大量研究结果表明,他们这样作是成功的
。从事应用包括工
程的研究者应该意识到自己所处的有利环境,问题是你需要提高对科学问题的敏
感度。
为了让工科学生了解如何提出和处理问题,这里不妨介绍几个例子。这虽然
算不上重
大成果,但或许有用,学生们或许可以从中找到某些可借鉴的思路。
例子1。 两个或多个多项式的最大公因子(GCD)问题。
这是一个很经典
的问题,但一直解决得不好。数学家们建议了Euclid辗转
除法、结式法等多种方法,似都不好用。
例如MATLAB中有计算GCD的程序
(m-文件),但一般不可用。严重的问题是,数学家提供的方
法中,多项式的
系数不容许有一点点误差。而在工程中我们需要这样的方法:如果两个多项式有
数值上准确的GCD,方法应该给出准确的GCD;如果两个多项式的系数在数值
上有误差,方法应该给
出GCD的一个合理估计。由于一维信号反卷积问题的需
要,迫使我们考虑这个经典问题。
因
为多项式乘积等价于系数数组的卷积,而离散卷积可以表达为矩阵向量
积。利用这些工程上熟悉的工具,
将多项式代数转换为矩阵代数来处理,立即可
以得到GCD阶次和矩阵秩的关系,从而估计GCD的阶。
最后GCD的决定可以
通过解一个确定性代数方程获得,也可以用最小二乘方法获得。这样的方法可以<
br>处理的多项式阶次相当高(例如达到500阶以上),并且结果不敏感于多项式系
数的变化,因此
新方法可以用于工程。
例子2。 二变量多项式的可分解性。
这是代数几何中关心的基本问题之一。德国数学家F.G.M. Eisenstein的一个
重要成果是提出了关于多项式不可分解(或称不可约)的判别方法。其实质是指
出了一种特别的二维支持
域,称为Eisenstein支持域,定义其上的二变量多项式,
无论系数取何值,都是不可约的。这
是一个十九世纪的工作。直到上世纪80年
代,由于反卷积和相位恢复问题的研究和应用需求,才重新唤
起了人们的注意。
我们注意到,Eisenstein支持域只是一种很特别的支持域,在实际物理问题
中缺
乏可用性。于是提出了判别一个任意的二维支持域是不是强制其上定义的二变量
多项式不可
约的问题。这个问题要求将Eisenstein的特例推广到一般。
我们不是沿数学家过去的思路。
重新审视一下分配函数论中关于两个(非负)
分配函数卷积造成的支持域关系。这个关系表达为C=A+
B,其中A和B是两
个卷积因子的支持域,C是结果的支持域,符号“+”表示集合加。这个看似简单的表达式解释起来并不简单,问题来源于关于卷积运算需要“翻转”一个因子
的思维定式。我们抛
弃了这个思维定式,按叠加原理解释卷积,得出了支持域可
嵌入性的认识:A和B是C的
两个互补可嵌入因子。这样,A和B外形的每个
线元都完全并正好地保留在C的外形上。这样,C如果可
分解为C=A+B,它的
外形线元集合就必能够划分成两个集合,每个分别能构成一个封闭图形。否则,
C就是不可分解的。演绎这个结果可以进一步得出若干判据,从几何直观上就能
够判断一个支持
域是不是强制不可约的,包括判断Eisenstein支持域。这样就大
大扩充了关于多项式不可约判
别的理论和方法,并且能够用于工程实践。
例子3。 多变量非线性函数全局最优化。 <
br>这是一个多学科关注的问题。简单表述如下:设
f(x)
是一个非负函数,找
一
个最小化子
x
0
,使得
f(x)
在
x
0
处
达到全局最小值。关于这类全局优化问题典
型地有以下几种方法。(1)基于梯度下降的方法。该类方法
容易找到局部极小值,
缺乏有效的机制逃出局部极值区。(2)采用模拟退火、演化规划一类随机搜索的
方法。该类方法缺乏收敛机制,即使搜索到全局最小值附近,新的搜索可以跳开
很远。(3)区
间代数搜索方法。在搜索策略上有规律性,但仍然缺乏收敛机制。
如果搜索正确,结果误差由最终的区间
长度决定。
我们希望寻找一种方法,能将随机或规则搜索与梯度下降结合起来,达到这
样的效
果:从任何一个点出发,只用很少的搜索步就能够判断,往下的搜索是否
值得继续,也就是判断当前的搜
索是不是处在一个局部极小值的盆中。由此决定
是不是要选择新的起始点。如果能够找到有效地提供这种
判断的机制,函数全局
优化的算法应该非常有效。这可能吗?
假定
f(x)
是优化目标函数,构造一个“辅助价格函数”
g(x)f(x)(f
T
fc)
,其中
c
> 0, 是一个可调整的常数。能证明函数
g(x)
具<
br>有以下性质:它与
f(x)
具有相同的全局极小值;对于给定的
c
,<
br>f(x)
在
c
决定
的一个电平以上的全部极小值点都变成
g(
x)
的极大值点,而
f(x)
在该电平下的
极小值处
g(x)
也是极小值。因此算法可以这样来构造:使用随机搜索法,从任
何一点出发用梯度法往下搜索
f(x)
的极小值。在搜索中同时观察
g(x)
的变化。
如果发现
g
(x)
不减,立即改用新的搜索起始点。当重新起始搜索的次数达到一
i
个指定次数N以后,根据迄今已搜索到的
f(x)
最小的极小值
f
min<
br>(x)
,对
c
进行
i
修正。当上述过程重新进行时,
f(x)
的电平高于
f
min
(x)
的全部极小值点都映射
成
g(x)
的极大值点。在将来的联合搜索中,就大大减轻了计算工作量。计算表
明,
如果搜索落到了
f(x)
的局部极小值附近的区域内,利用
g(x)
,通常只
要2
到3步迭代就会跳出到新的起始。这样,新方法具有梯度方法快速、准确的优点,
同时避免
了停在局部极值点的困难。用这种方法试验了我们收集到的若干典型困
难例子,认为是目前最有效的方法
。
方法有潜在的应用前景。在许多情况下,我们不清楚
f(x)
的具体表达式。例如用几种材料组分合成新材料,使新材料达到某种品质。只要这种希望的品质
能够定量地被测量,
以上方法就可能应用。事实上,只要
f(x)
能够被测量获得,
f
就能够在
数值上获得,于是方法就可以实施。
以上是我们在处理工程技术研究中获得的部分结果。我
们体会到,物理和工
程学科中的研究能够帮助我们从不同的角度和思路去思考问题,能够扩展数学问题的解决和应用。
(四)几句忠告
现代科技发展已经将科技、经济、国力联
系在一起。任何一个专业门类都有
成千上万的人参与。重大科技创新的背后都有许多前人的基础性工作。
有志的青
年科技工作者和研究生需要不断积累知识,拓宽知识领域,树立团队工作观念和
合作精
神,同时勤于独立思考。在科学研究中特别忌讳盲从,包括盲从“权威”、
盲从大流。积累知识和勤于思
考应该说是科技工作者的基本功,这需要坚持。特
别是刚毕业的硕士生、博士生,能够在2、3年后成为
世界知名科学家当然再好
不过,只是这样的成功者太少。对每个研究者,只要坚持了积累知识和勤于思考
的基本功,总会有回报的。
如何选择科研方向和研究题目是青年科技工作者常常感到困惑的问
题。从手
头的项目作深作精开始,或许你会发现,你现在正处于手头项目的优势环境中,
而你获得的任何实际进步可能都包含着很有意义的创新。当然另一方面,聪明的
研究者决不会在
小问题上钻牛角尖,而会时时关注科技发展的全景,时时发现自
己能够开拓的新路子。同时需注意,基础
理论研究是重要的,而基础方法、条件
和工具的研究同样重要。
如果你刚刚进入研究,不妨拟
定一个自己的五年计划和目标,包括数学、理
论的扩充和实际技能的学习两个方面。这个讲座只讲了如何
学习数学的问题,希
望不会造成误导。利用一切联系实际的机会学习和积累实际技能,是一个必须补充的建议。