1、附录 3 49 Java 的思考 抽象过程 所有编程语言都提供抽象 (abstraction)机制。可以认为,你所能够解决的问题的复杂性直接取决于抽象的类型和质量。我所谓的“类型”是指“你所抽象的是什么?”汇编语言是对底层机器的小型抽象。接着出现的许多所谓“命令式 (Imperative)”语言 (诸如 FORTRAN、 BASIC、 C 等 )都是对汇编语言的抽象。这些语言在汇编语言之上有了大幅的改进,但是它们所作的主要抽象仍要求你在解决问题时要基于计算机的结构,而不是基于你试图要解决的问题的结构来考量。程序员必须建立在机器模型 (Machine Model)(位于你对问题建模所作的解空间
2、(Solution)内,例如计算机 )和实际待解决问题模型(Problem Model)(位于问题所在的问题空间 (Problem Space)内 )之间的关联。建立这种映射 (Mapping)是费力的,而且它不属于编程语言的内在性质,这使得程序难以编写,并且维护代价高昂 。由此,产生了完整的“编程方法(Programming Method)”产业。 另一种对机器建模的方式就是对待解决问题建模。早期的编程语言,诸如 LISP 和 APL 都选择世界的某种特定视图 (分别对应于“所有问题最终都是列表 (List)”或者“所有问题都是算法形式的 (algorithmic)” )。 PROLOG 则
3、将所有文图转换成为决策链 (Chain of decisions)。此外还产生了基于约束条件 (constraint-based)编程的语言 (后者被证明限制性过强 )。这些方式对于它们被设计时所瞄准要解决的特定类 型的问题都是不错的解决方案,但是一旦超出其特定领域,它们就力不从心了。 面向对象方式 (Object-oriented approach)通过向程序员提供用来表示在问题空间中的元素的工具而更进一步。这种表示方式具有足够的概括性,使得程序员不会受限于任何特定类型的问题。我们将问题空间中的元素及其在解空间中的表示成为“对象 (Object)”。 (你还需要一些无法类比为问题空间元素的对
4、象 )。这是一种更灵活和更强有力的语言抽象。所以, OOP 允许以问题的形式来描述问题,而不是以执行解决方案的计算机的形式来描述问题。附录 3 50 但是它 仍然与计算机有联系:每个对象看起来都有点像一台微型计算机 它具有状态,并且能够执行你赋予它的各种操作。如果要在现实世界中对对象作类比,那么说它们都具有特性 (Characteristic)和行为 (Behavior)似乎不错。 Alan Kay 曾经总结了第一个成功的面向对象语言,同时也是 Java 赖为根基的语言之一的。 Smalltalk 的五个基本特性,这些特性表现了一种纯粹的面相对象程序设计方式: 1. 万物皆为对象。将对象视为奇
5、特的变量,它可以存储数据,除此之 外,你还可以要求它在自身上执行操作。理论上讲,你可以 抽取待解决问题的任何概念化构建 (狗、建筑物、服务等 ),将其表示为程序中的对象。 2. 程序是对象的集合,它们彼此通过发送消息来调用对方。要想产生 一个对象的请求,就必须对该对象发送一条消息。更具体地说,你可以把消息想象为对某个特定对象的方法的调用请求。 3. 每个对象都拥有由其它对象所构成的存储。你可以通过创建包含现 有对象集合的包的方式来创建新类型的对象。因此,你可以在程序中构建复杂的体系,同时将其复杂性通过对象的质朴性得以屏蔽。 4. 每个对象都拥有其类型 (Type)。按照通用的说法,“每个对象都
6、是某 个类 (Class)的一个实例 (Instance)”,其中“类”就是“类型”的同义词。每个类中最重要的区别于其它类的特性就是“你可以发生什么消息给他?” 5. 某一特定类型的所有对象都可以接收 (Receive)同样的消息。这是一 句意味深长的表述,你在稍后便会看到。因为“圆形 (circle)”类型的对象同时也是“几何形 (shape)”类型的对象,所以一个“圆形”对象必定能够接受(accept)发送给“几何形”对象的消息。这意味着你可以编写与“几何形”交互并自动处理所有与几何形性质相关的事务的代码。这种“可替代性(substitutability)”是 OOP 中最强有力的概念之一
7、。 Booch 提出了一个对对象的更加简洁的描述:对象拥有状态 (State)、行为 (Behabviour)和标识 (Identity).这意味着每一个对象都可以拥有内部数据(它们给出了该对象的状态 )和方法 (它们产生行为 ),并且每一个对象都可以唯一地与其他对象区分开,具体说来,就是每一个对象在内存中都有一个唯附录 3 51 一的地址。 每个对象都有一个接口 亚里士多德大概是第一个深入研究类型 (Type)的哲学家,他曾提出过鱼类和鸟类这样的概念。所有的对象都是唯一的,但同时也是具有相同的 特性和行为的对象所归属的类的一部分,这种思想被直接应用于第一个面向对象语言 Simula-67,他
8、在程序中使用基本关键词 class 来引入新的类型。 Simula 就像其名字一样,是为了开发诸如经典的“银行出纳员问题 (Bank teller problem)”这样的仿真程序而创建的。在银行出纳员问题中,有出纳员、客户、账户、交易和货币单位等许多“对象”。在程序执行期间具有不同的状态而其他方面都相似的对象会被分组到对象的类中,这就是关键词 class的由来。创建抽象数据类型 (类 )是面向对象程序设计的基本概念之一。抽象数据类型的运行方式与内置 (built-in)类型几乎完全一致;你可以创建某一类型的变量 (按照面向对象的说法,称其为对象或实例 ),然后操作这些变量 (称其为发送消息或
9、请求:你发送消息,对象就能够知道需要做什么 )。每个类的成员 (member)或元素 (element)都共享相同的性质:每个账户都有结余金额,每个出纳都可以处理存款请求等。同时每个成员都有其自身状态:每个账户都有不同的结余金额,每个出纳都有自己的名称。因此,出纳、客户、账户、交易等都可以在计算机程序中被表示成为唯一的实体 (entity)。这些实体就是对 象,每一个对象都属于定义了特性和行为的某个特定的类。 所以,尽管我们在面向对象程序设计中实际所作的是创建新的数据类型,但事实上所有的面向对象程序设计语言都使用 Class 关键词来表示数据类型。当你看到类型 (Type)一词时,请将其作为类 (Class)来考虑,反之亦然。 既然类被描述成了具有相同特性 (数据元素 )和行为 (功能 )的对象集合,那么一个类就确实是一个数据类型,就像所有浮点型数字具有相同的特性和行为集合一样。二者的差异在于,程序员通过定义类来适应问题,而不再被强制只能使用现有的被设计用来表示在机器中的存储 单元的数据类型。你可以根据需求,通过添加新的数据类型来扩展编程语言。编程系统欣然接受新的类,并且给予它们与内置类型相同的管护和类型检查 (Type-checking)。