块 (编程)

(重定向自代码块

计算机编程中,(block)或代码块是将源代码组织在一起的词法结构。块构成自一个或多个声明英语Declaration (computer programming)语句。编程语言允许创建块,包括嵌入其他块之内的块,就叫做块结构编程语言。块和子程序结构化编程的基础,结构化所强调的控制结构可以用块来形成的。

在编程中块的功能,是确使成组的语句被当作如同就是一个语句,限定在一个块中声明的对象如变量、过程和函数的词法作用域,使得它们不冲突于在其他地方用到的同名者。在块结构编程语言中,在块外部的对象名字在块内部是可见的,除非它们被声明了相同名字的对象所遮掩

历史

块结构的想法是在1950年代开发最初的Autocode英语Autocode期间发展出来的,并形式化于ALGOL 60报告中。ALGOL 58介入了“复合”(compound)语句的概念,它只与控制流程有关[1]。在“ALGOL 60报告”中,介入了块和作用域的概念[2]。最终在“修订报告”中,复合语句被定义为:包围在语句括号beginend之间的成序列的语句,形成一个复合语句。块被定义为:成序列的声明,跟随着成序列的语句,并被包围在beginend之间,形成一个块;所有声明以这种方式出现在一个块中,并只在这个块中有效[3]。块与复合语句的主要差异是不能从块外跳转到块内的标签[4]

语法

块在不同语言家族中使用不同的语法:

此外,复合语句界定还可以采用:

建立控制结构,除了将所控制的语句序列,包围入复合语句或匿名块之外,还可以采用其他语法机制:

限制

受ALGOL影响的一些语言支持块,但有着各自的限制:

  • C家族语言,在块和复合语句之中不仅支持嵌套入复合语句,还支持嵌入带有声明的匿名块,但不允许声明嵌套函数英语nested function[8]
  • Pascal家族语言,在语句部份的复合语句之中,不允许存在带有声明的匿名块[6],只支持复合语句,用来在ifwhilerepeat等控制语句内组合语句序列。

基本语义

块的语义是双重的。首先,它向编程者提供了建立任意大和复杂的结构,并把它当作一个单元的一种途径。其次,它确使编程者能限制变量的作用域,有时可以限制已经被声明了的其他对象的作用域。

在早期语言比如FORTRANBASIC中,没有语句块或控制结构。直到1978年标准化FORTRAN 77之前,都没有“块状IF”语句,要实现按条件选择,必须诉诸GOTO语句。例如下述FORTRAN代码片段,从雇员工资中分别扣除超出正税阈值部分的税款,和超出附加税阈值部分的附加税款:

C     语言:ANSI标准FORTRAN 66C     初始化要计算的值      PAYSTX = .FALSE.      PAYSST = .FALSE.      TAX = 0.0      SUPTAX = 0.0C     如果雇员挣钱小于等于正税阈值则跃过税款扣除      IF (WAGES .LE. TAXTHR) GOTO 100      PAYSTX = .TRUE.      TAX = (WAGES - TAXTHR) * BASCRTC     如果雇员挣钱小于等于附加税阈值则跃过附加税扣除      IF (WAGES .LE. SUPTHR) GOTO 100      PAYSST = .TRUE.      SUPTAX = (WAGES - SUPTHR) * SUPRAT  100 TAXED = WAGES - TAX - SUPTAX

由于程序的逻辑结构不反映在语言中,分析出给定语句在何时执行可能会有困难。

块允许编程者把一组语句当作一个单元。例如,在与上述FORTRAN代码相对应的Pascal代码片段:

{ 语言:Jensen与Wirth版标准Pascal }if wages > tax_threshold thenbegin    paystax := true;    tax := (wages - tax_threshold) * tax_rate    { 附加税处理代码不再嵌套在这里 }endelse begin    paystax := false;    tax := 0end;if wages > supertax_threshold thenbegin    pays_supertax := true;    supertax := (wages - supertax_threshold) * supertax_rateendelse begin    pays_supertax := false;    supertax := 0end;taxed := wages - tax - supertax;

与上述FORTRAN代码相比,上例中出现在初始化中的那些缺省值,通过复合语句即不带声明的块结构,被分别放置作出有关判断的地方。此外,处理附加税代码不再嵌入到处理正税代码之中,去除了附加税阈值要大于正税阈值,才能处理附加税的隐含条件。使用块结构,能明晰编程者的意图,使代码的结构更加密切反映出编程者的思考;再凭借某种风格的缩进增进可读性,可使代码更加容易理解和修改。

在早期语言中,在子例程中变量的作用域遍及整个子例程。假想在一个Fortran子例程中,完成了与管理者有关的任务,这里可能用到叫做IEMPNO的一个整数变量,指示作为管理者的雇员的社会安全号码(SSN);后来在这个子例程的维护工作中,又增加与下属们有关的任务,此时编程者可能不经意间使用同名变量IEMPNO,指示了作为这个管理者的下属的雇员的SSN,这就会导致一个难于跟踪的缺陷。

块结构使得编程者能够容易地将作用域控制到细微级别。例如完成有关雇员任务的Scheme代码片段:

;; 语言:R5RS标准Scheme(let ((empno (ssn-of employee-name)))  (when (is-manager? empno) ;; when已列入R7RS-small标准    (let ((employee-list (underlings-of empno)))      (display        ;; format是SRFI-28和SRFI-48规定的字符串格式化过程        (format "~a has ~a employees working under him:~%"          employee-name (length employee-list)))      (for-each        (lambda (empno)          (display            (format "Name: ~a, role: ~a~%"              (name-of empno) (role-of empno))))        employee-list))))

这里在外层通过绑定let将管理者的SSN绑定到了局部变量empno,在其形成的块的作用域中列出管理者的雇员名字和他的下属数目;随后通过for-each高阶函数,将他所有下属的SSN逐个绑定到匿名函数lambda的形式参数empno上,执行此匿名函数列出这个下属的名字和角色;这个形式参数的作用域是此匿名函数的主体,它与其外层的局部变量,标识符重名但不相互影响。在实践中,出于清晰性的考虑,编程者更可能选取明显不同的变量名字,但是即使名字选取存在重复,也难以在不经意间介入一个缺陷。在基于S-表达式的语言中,经常见到大量的嵌套圆括号,故而其代码必须采用良好的缩进

提升

在一些语言中,变量可以声明为有函数作用域即使它位于函数的内嵌块之中。例如在JavaScript中,变量应当总是在使用之前被声明,它曾经允许赋值到未声明变量,会为此建立为未声明的全局变量,这在strict模态下是个错误。以var声明的变量有函数作用域,而非以letconst声明的变量可从属的块作用域。以var声明的变量会被提升(hoist),这意味着可以在这个函数的作用域内任何地方提及这个变量,即使还未触及到它的声明,从而可以将var声明视为被提举(lift)到它所在函数的顶部或全局作用域。但是如果在其声明之前访问了一个变量,这个变量的值总是未指定的。

参见

引用