决策树简介
前面我们列举了很多决策方法,这些方法看似简单,但效果却非常的好。除此以外它们还有一个共同特征,所有这些方法都没有考虑一个重要因素:事情发生的可能性。可能性是什么呢?例如今天天气晴朗,那明天下雨的可能性就很小;相反今天阴云密布,明天下雨的可能性就很大。数学上用百分数的大小来表示可能性高低,可能性很大可以表示成80%,可能性很小可以表示为10%,绝对会发生的事情直接写成100%。
考虑到可能性的决策工具通常称为风险决策,因为你的任何决策都不能保证一定会发生,只能说明选择这种方案是最有可能够达到目标。风险性决策是和我们生活中大大小小的决策更加贴近,更能真实地反映实际情况。决策树分析方法是风险决策的一种,它是一种用树形图来描述各方案在不同可能性下会得到的结果。通过计算和比较,我们可以从树中选出最有可能性最大,效果最好的方案。
一、绘制决策树
为了便于理解,我们从一个军训的例子入手,在军训的时候有一个项目叫行军测试。假设我们的起始地是甲目的地是乙,从甲地到乙地有两条路可以走,因此出发之前我们不得不做出选择。一号路中间没有桥,可以直接到达乙地;二号路中间有一座桥,如果桥坏了的话,你要么返回走一号路,要么坐船到达目的地。走一号路,你需要4个小时;走二号路,如果桥没有坏,你仅仅要2个小时。据交通管理部门的报道桥坏了的可能性比较小,用个数字表示一下,大概只有30%的可能。如果你好想要坐船,对不起,你还需要考虑明天是否刮大风;天气预报说风小风大的可能差不多,略偏向于风小,而船家的估计风大用的时间会长,其中的数值列在下面的表中。
状态 | 风小 |
风大 |
可能性 |
0.6 |
0.4 |
时间(小时) |
4.5 |
7 |
该选那条路呢?我想我们应该经过一个通盘考虑才能做出决定。为此首先将所有可能的选择画在一张图上,因为我们讨论的是决策树,所以我们将图画成树形结构。
在这个图中,五个小的三角形代表你全部的可以选择的五个方案,从上向下分别是:
编号 |
方案 |
时间 |
1 |
走一号路,直接到达目的地 |
4 |
2 |
走二号路,并且好运的是桥也没有问题 |
2 |
3 |
走二号路,倒霉的是桥坏了,重新回去走一号路 |
6 |
4 |
走二号路,倒霉的是桥坏了,改乘船,好在风不大 |
4.5 |
5 |
走二号路,倒霉的是桥坏了,改乘船,悲催的是风还不小 |
7 |
那上面的方格和圆圈又是什么呢?方格、圆圈和三角分别决策树的三个组成部分,方格代表到达时这一点你必须做出决定,挑选出其中一个分支;圆圈表示这一点会有两种或多种状态,例如风大风小,不是人能够控制的;三角形代表最终的结果。下面的图是一个标准的决策树的各种节点的概念。
根据上面的图形,我们可以看到第一个图中图形元素1~4分别代表了不同的信息。
编号 |
意义 |
1 |
本次决策的终点:我们该选哪条路 |
2 |
桥的两种状态决定我们应该怎么走,无法认为控制桥是否会坏 |
3 |
必须由人来决定是回头还是坐船 |
4 |
风的不同状态 |
注意,在你的图画完后,你最好回头看看你是否已经考虑了所有的选项,列举了所有可能的状态;遗漏其中的一个或两个将导致决策不完全,你可能根本得不到良好的结果。
二、评估决策树
评估决策树的过程是将你目前所有的信息加入到树上并计算各条分支分值的过程。下表列出所有的分支可能性。
编号 |
描述 |
可能性 |
1 |
一号路直达,选这条路的话100%能到目的地 |
100% |
2 |
二号路且桥不断,只有70%的可能性,那桥坏的可能性就是30% |
70% |
3 |
二号路且桥断了,回头走一号路 |
100% |
4 |
大风的可能是40% |
100% |
有了可能性列表后我们就可以容易的计算出所有不同分支的分值,选择分值最小的一支,分值越小说明这一分支的综合起来时间用的越少。
节点 |
选择 |
选择时间 |
4 |
4.5x60%+7x40%=5.5 |
5.5 |
3 |
节点3是一个决策节点,你必须从两个分之中选出一个分支。 |
5.5 |
2 |
5.5x30%+2x70%=3.05 |
3.05 |
1 |
节点1又是一个决策节点。 |
3.05 |
三、做出决策
通过上面的一棵树,我们其实已经得到决策所需要的答案,我们总是选择期望值最高的决策分支。在上面的例子中选择二号路的综合时间最短,并且碰到桥断的时候应该果断选择渡船。在大多数情况下,这种选择会保证快速到达目的地,但这不是绝对的。如果你的人品不好,步步维艰,你可能会碰上狂风,一天也无法到达目的地。
总的来说决策树分析法作为一种决策技术,是随机决策模型中最常见、最普及的一种规策模式和选择方法,并有效地控制了决策带来的风险。通过计算你最终优选出效益最大成本最小的决策方法。应用决策树决策方法必须具备以下条件
1、具有决策者期望达到的明确目标;
2、存在决策者可以选择的两个以上的可行备选方案;
3、存在着决策者无法控制的两种以上的自然状态(如气候变化、市场行情、经济发展动向等);
4、不同行动方案在不同自然状态下的收益值或损失值(简称损益值)可以计算出来;
5、决策者能估计出不同的自然状态发生概率。