遗传算法
遗传算法($Genetic\ Algorithm, GA$)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。
其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,不需要确定的规则就能自动获取和指导优化的搜索空间,自适应地调整搜索方向。
遗传算法以一种群体中的所有个体为对象,并利用随机化技术指导对一个被编码的参数空间进行高效搜索。其中,选择、交叉和变异构成了遗传算法的遗传操作;参数编码、初始群体的设定、适应度函数的设计、遗传操作设计、控制参数设定五个要素组成了遗传算法的核心内容。
遗传算法流程
遗传算法是从代表问题可能潜在的解集的一个种群($population$)开始的,而一个种群则由经过基因($gene$)编码的一定数目的个体($individual$)组成。每个个体实际上是染色体($chromosome$)带有特征的实体。
染色体作为遗传物质的主要载体,即多个基因的集合,其内部表现(即基因型)是某种基因组合,它决定了个体的形状的外部表现,如黑头发的特征是由染色体中控制这一特征的某种基因组合决定的。因此,在一开始需要实现从表现型到基因型的映射即编码工作。由于仿照基因编码的工作很复杂,我们往往进行简化,如二进制编码。
初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代($generation$)演化产生出越来越好的近似解,在每一代,根据问题域中个体的适应度($fitness$)大小选择($selection$)个体,并借助于自然遗传学的遗传算子($genetic\ operators$)进行组合交叉($crossover$)和变异($mutation$),产生出代表新的解集的种群。
这个过程将导致种群像自然进化一样的后生代种群比前代更加适应于环境,末代种群中的最优个体经过解码($decoding$),可以作为问题近似最优解。
遗传算法流程图
相关术语
基因型($genotype$):性状染色体的内部表现;
表现型($phenotype$):染色体决定的性状的外部表现,或者说,根据基因型形成的个体的外部表现;
进化($evolution$):种群逐渐适应生存环境,品质不断得到改良。生物的进化是以种群的形式进行的。
适应度($fitness$):度量某个物种对于生存环境的适应程度。
选择($selection$):以一定的概率从种群中选择若干个个体。一般,选择过程是一种基于适应度的优胜劣汰的过程。
复制($reproduction$):细胞分裂时,遗传物质DNA通过复制而转移到新产生的细胞中,新细胞就继承了旧细胞的基因。
交叉($crossover$):两个染色体的某一相同位置处DNA被切断,前后两串分别交叉组合形成两个新的染色体。也称基因重组或杂交;
变异($mutation$):复制时可能(很小的概率)产生某些复制差错,变异产生新的染色体,表现出新的性状。
编码($coding$):DNA中遗传信息在一个长链上按一定的模式排列。遗传编码可看作从表现型到基因型的映射。
解码($decoding$):基因型到表现型的映射。
个体($individual$):指染色体带有特征的实体;
种群($population$):个体的集合,该集合内个体数称为种群
数值优化
一般的,最优化问题($optimization\ problem$)由目标函数($object\ function$)和约束条件($constraints$)两部分构成:
将满足所有约束条件的解空间$S$称为可行域($feasible\ region$),可行域中的解称为可行解($feasible\ solution$);将可行域中使目标函数最小的解称为最优解($optimal\ solution$),对于最大化问题,可以乘以$\ -1\ $,转化为最小化问题。
这次解决的是只含上、下限约束的最优化问题:
编码
采用二进制编码:
1 | # 依据解的精度求得每个二进制码位数(基因型长度), 再将各基因型组合在一起成为单条染色体长度 |
初始化种群
随机初始化种群:1
2
3
4
5
6for i in range(self.populationSize):
# 随机生成单条染色体
chromosome = []
for j in range(self.chromosomeLength):
chromosome.append(random.randint(0, 1))
population.append(chromosome)
计算适应度
最大化问题可以直接将函数值作为个体适应度,最小化问题可将函数值乘以 -1 变成最大化问题。为了后面选择操作的方便统一将个体适应度归一化为正值。
1 | avgV = fitnessValueTemp.mean() |
选择
采用轮盘赌方式挑选个体,计算选择概率、累积概率,构建轮盘1
2
3
4
5
6
7
8fitnessValueSum = sum(fitnessValue)
selectionProbability = (np.array(fitnessValue)/fitnessValueSum).tolist() # 选择概率
accumulationProbability = [] # 累积概率
probabilityTemp = 0 # 构建轮盘(斐波契数列)
for i in selectionProbability:
probabilityTemp += i
accumulationProbability.append(probabilityTemp)
accumulationProbability.append(1)
交叉
采用单点交叉方式产生子个体
1 | crossoverPos = random.randint(1, self.chromosomeLength-2) # 第一个位置和最后一个位置不交叉 |
变异
直接将需要变异的位置取反
1 | mutationPos = random.randint(0, self.chromosomeLength-1) |
总结
遗传算法的一般步骤就如上述给出的例子一样,但众多变化都是在遗传操作上,编码方式,选择算子,交叉算子,变异算子都是需要去探究的。下面是这段时间通过学习,解决了书上部分问题。
- 遗传算法
- 数值优化 :二进制编码、轮盘赌选择、单点交叉、单点变异
- TSP:路径编码、轮盘赌选择、锦标赛选择、部分匹配交叉、顺序交叉、位置交换变异
- JSP:实数矩阵编码、排序选择、精英保留策略、单点交叉、单点变异
- 0-1背包:二进制编码、二重结构编码、轮盘赌选择、多点交叉,部分匹配交叉,逆序变异