BFS/DFS
最后更新于
DFS算法就是回溯算法的思想,迭代的实现中往往需要「栈」这种数据结构用来回退,递归的实现中往往是在递归出口的位置得到全局的解。
BFS 的核心思想就是把一些问题解空间抽象在一个图中,从一个点开始,向四周开始扩散。一般来说,我们用迭代写 BFS 算法都是用「队列」这种数据结构,每次将一个节点周围的所有节点加入队列。如果是递归实现,则递归返回的是子问题的解。
BFS 相对 DFS 的最主要的区别是:BFS 找到的路径一定是最短的,但代价就是空间复杂度比 DFS 大很多。
问题的本质就是让你在一幅「图」中找到从起点 start
到终点 target
的最近距离,这个例子听起来很枯燥,但是 BFS 算法问题其实都是在干这个事。
队列
q
就不说了,BFS 的核心数据结构;cur.adj()
泛指cur
相邻的节点,比如说二维数组中,cur
上下左右四面的位置就是相邻节点;visited
的主要作用是防止走回头路,大部分时候都是必须的,但是像一般的二叉树结构,没有子节点到父节点的指针,不会走回头路就不需要visited
。
1、为什么 BFS 可以找到最短距离,DFS 不行吗?
首先, BFS 的逻辑是,
depth
每增加一次,队列中的所有节点都向前迈一步,这保证了第一次到达终点的时候,走的步数是最少的。DFS 不能找最短路径吗?其实也是可以的,但是时间复杂度相对高很多。因为 DFS 实际上是靠递归的堆栈记录走过的路径,你要找到最短路径,肯定得把二叉树中所有树杈都探索完才能对比出最短的路径有多长对不对?而 BFS 借助队列做到一次一步「齐头并进」,是可以在不遍历完整棵树的条件下找到最短距离的。
形象点说,DFS 是线,BFS 是面;DFS 是单打独斗,BFS 是集体行动。
2、既然 BFS 那么好,为啥 DFS 还要存在?
BFS 可以找到最短距离,但是空间复杂度高,而 DFS 的空间复杂度较低。
拿二叉树的最小高度问题的例子,假设给你的这个二叉树是满二叉树,节点数为
N
,对于 DFS 算法来说,空间复杂度无非就是递归堆栈,最坏情况下顶多就是树的高度,也就是O(logN)
。但是 BFS 算法,队列中每次都会储存着二叉树一层的节点,这样的话最坏情况下空间复杂度应该是树的最底层节点的数量,也就是
N/2
,用 Big O 表示的话也就是O(N)
。由此观之,BFS 还是有代价的,一般来说在找最短路径的时候使用 BFS,其他时候还是 DFS 使用得多一些(主要是递归代码好写)。