当前位置：首页 > news >正文

《编译原理》课程作业

news 2025/6/14 7:21:34

文章目录

- - 1. 说明文法G(S):S->aSb S->ab能够产生怎样的语言？
  - 2. 写出能够产生语言 {ambn|1<=n<=m<=2n}的文法。
  - 3. 写出文法G(E):E->i|E+E|E*E|(E)的最左推导和最右推导，画出对应的语法树并说明该文法是否具有二义性。
  - 4. 对于DFA M = ({0, 1, 2, 3}, {a, b}, f, 0, {3}), 其中，f定义为：f(0, a)=1; f(0, b)=2; f(1, a)=3; f(1, b)=2; f(2, a)=1; f(2, b)=3; f(3, a)=3; f(3, b)=3. 请画出其状态转换矩阵和状态转换图。
  - 5. 请指出下列的错误可在编译的那个阶段发现（18分）。
  - 6. 请阐述编译原理在工业界或学术界的一项应用并给出代码（30分）。

1. 说明文法G(S):S->aSb S->ab能够产生怎样的语言？

起始符号是 SS。
产生规则：
第一条规则：S→aSbS→aSb，在字符串中添加一个aa，然后是任意数量的SS，最后是一个bb。这可以生成形式为anSbnanSbn的字符串，其中n≥1n≥1。
第二条规则：S→abS→ab允许直接生成字符串abab。使用第二条规则，生成字符串abab。使用第一条规则，生成更长的字符串。例如：
应用S→aSbS→aSb一次，得到aSbaSb。然后，将SS替换为abab（使用第二条规则），得到aabaab。再次应用S→aSbS→aSb，得到aaSbbaaSbb。将SS替换为abab，得到aabbaabb。可以生成形式为anbnanbn的字符串，其中n≥1n≥1。
文法 G(S)G(S) 可以生成所有形式为 anbnanbn 的字符串，其中n≥1n≥1。这意味着字符串必须有相同数量的 aa 和 bb，并且它们必须成对出现。

最终答案为：

在这里插入图片描述

2. 写出能够产生语言 {ambn|1<=n<=m<=2n}的文法。

定义一个文法，其中起始符号SS可以生成一个aa，然后是一个bb，并且可以递归地生成更多的aa和bb，同时确保aa的数量至少与 bb 一样多，最多是 bb 的两倍。
文法如下： S→aSbS→aSb S→aSBS→aSB S→abS→ab B→bBB→bB B→ϵB→ϵ
规则S→aSbS→aSb：这条规则生成一个aa，然后是更多的aa和bb，确保 aa 和 bb 的数量保持平衡。
规则S→aSBS→aSB：这条规则生成一个aa，然后是更多的aa，最后是bb的序列，确保aa的数量可以是bb的两倍。
规则S→abS→ab：这条规则生成基本情况，即aa和bb的数量相等。
规则B→bBB→bB：这条规则生成更多的bb，直到aa的数量是bb的两倍。
规则B→ϵB→ϵ：这条规则停止生成bb，确保aa的数量不会超过bb的两倍。
最终答案：
S→aSb∣aSB∣ab∣B→bB∣B→ϵS→aSb∣aSB∣ab∣B→bB∣B→ϵ

3. 写出文法G(E):E->i|E+E|E*E|(E)的最左推导和最右推导，画出对应的语法树并说明该文法是否具有二义性。

最左推导：E→E+E→i+E→i+iE→E+E→i+E→i+i
E
E+E
i+E
i+i
最左推导语法树：
在这里插入图片描述

最右推导：E→E+E→E+i→i+iE→E+E→E+i→i+i
E
E+E
E+i
i+i
最右推导语法树：
在这里插入图片描述

4. 对于DFA M = ({0, 1, 2, 3}, {a, b}, f, 0, {3}), 其中，f定义为：f(0, a)=1; f(0, b)=2; f(1, a)=3; f(1, b)=2; f(2, a)=1; f(2, b)=3; f(3, a)=3; f(3, b)=3. 请画出其状态转换矩阵和状态转换图。

状态转换矩阵：

在这里插入图片描述

状态转换图：
在这里插入图片描述

5. 请指出下列的错误可在编译的那个阶段发现（18分）。

 关键字拼写错误:词法分析阶段
 缺少运算对象：语法分析阶段
 实参与形参的类型不一致：语义分析阶段
 引用的变量没有定义：语义分析阶段
 数组下标越界：语义分析阶段
 常数中出现了非数字字符：词法分析阶段

6. 请阐述编译原理在工业界或学术界的一项应用并给出代码（30分）。

编译原理在学术界的一个重要应用是代码优化，特别是在高性能计算和并行计算领域。一个具体的例子是循环优化，它涉及到循环展开、循环融合、循环分布等技术，以减少循环迭代之间的依赖，提高数据局部性和并行度。
下面是使用Python编写的简单循环展开的示例代码。循环展开是一种减少循环迭代次数，每次迭代执行多个操作的技术，这有助于减少循环开销和提高指令流水线的效率。
循环展开示例
假设有一个简单的循环，用于计算数组中所有元素的和。通过循环展开来优化这个循环。
代码如下：

def simple_sum(arr):total = 0for i in range(len(arr)):total += arr[i]return total
def loop_unrolling(arr):n = len(arr)total = 0# 循环展开因子为4unroll_factor = 4for i in range(0, n, unroll_factor):total += arr[i] + arr[i+1] + arr[i+2] + arr[i+3] if i+3 < n else (arr[i] + arr[i+1] + arr[i+2] + arr[i+3] - 3*(n-i))return total
import random
arr = [random.randint(1, 100) for _ in range(100)]
simple_result = simple_sum(arr)
print("Simple loop sum:", simple_result)
unrolled_result = loop_unrolling(arr)
print("Loop unrolling sum:", unrolled_result)

或者：

以下是C++代码，它使用DFA来识别一个简单的语言，该语言包含关键字if和else，以及标识符和数字。

#include <bits/stdc++.h>
using namespace std;enum State {START,IF,ELSE,IDENT,NUM,ERROR
};// DFA转换函数
State transition(State current, char input) {switch (current) {case START:if (input == 'i') return IF;if (input == 'e') return ELSE;if (isalpha(input)) return IDENT;if (isdigit(input)) return NUM;return ERROR;case IF:if (input == 'f') return IF + 1;return ERROR;case ELSE:if (input == 'l') return ELSE + 1;return ERROR;case IDENT:if (isalpha(input) || isdigit(input) || input == '_') return IDENT;return ERROR;case NUM:if (isdigit(input)) return NUM;return ERROR;default:return ERROR;}
}// 识别标记
string recognizeToken(string input) {State state = START;for (char c : input) {state = transition(state, c);if (state == ERROR) {return "Error";}}switch (state) {case IF + 1:return "if";case ELSE + 1:return "else";case IDENT:return "Identifier";case NUM:return "Number";default:return "Unknown";}
}int main() {string input;cout << "Enter a keyword or identifier: ";cin >> input;cout << "Token: " << recognizeToken(input) << endl;return 0;
}