程序设计有一个二维数组，请求出每一行的最大值，并求出这些最大值的和

点击联系发帖人 时间：2022-05-08 13:15

java二维数组求最大值

没什么可说的, 改进方法就是加一个标志位防止有序后重复遍历. 由于需要遍历两次, 所以时间复杂度O(N^2)

外层从0开始默认outer是最小数的下标, 内存从outer+1位置开始遍历, 不稳定, 如{ 3, 3, 3, 2 }, 当比较最后一个4时, 是第一个3和2交换, 从而不稳定. 内外层遍历两次, 时间复杂度O(N^2)

插入排序选择排序冒泡排序有浪费许多比较的次数
归并排序快的是因为小范围合并为大范围时, 有序可以同过外排方式
小组和为大组时, 组内有序没有浪费, 永远是组与组之间的比较

迄今为止, 除了在一些特殊的情况下, 还没人能够从理论上分析希尔排序的效率, 有各种各样基于实验的评估, 估计它的时间级从O(N^(3/2))到O(N^(7/6))

递归公式同归并排序, 由于需要记录分隔点, 所以额外空间复杂度O(logN), 快排做不到稳定性, 因为partition过程做不到稳定

经典快排与数据状况有关, 这是因为分隔点选取的问题, 如{1, 2, 3, 4, 5, 6}分隔点选取最右边时每次只排序一个数字, 此时时间复杂度为O(N^2)
如果分隔点选取中位数, 则每次恰好可把数组划分为两部分, 时间复杂度为O(N*logN)
随机快排的分隔点随机选取, 把复杂度转化为与概率有关, 复杂度长期期望为O(N*logN)

算法: 插入时, 上浮, 直至没有父节点比当前节点大; 排序交换堆顶与堆未元素, 这时堆顶元素下沉, 直至当前节点比子节点都大

归并排序可以做到额外空间复杂度O(1), 有难度, 相关搜索"归并排序内部缓存法"
有一道题目, 奇数放在数组的左边边, 偶数放在数组右边, 要求原始的相对次数不变, 牛客练习 -->

基础类型很长时, 使用快排, 因为基础数据类型不要求稳定
复合数据类型长度很长时, 使用归并排序, 复合数据类型要求稳定
任何数据类型的数组长度很短(<60)时, 使用插入排序

非基于比较的排序, 与被排序的样本的实际数据状况有很大关系, 所以实际中并不经常使用

简单桶排序: 一个桶统计一个数, 大体思路同计数排序, 如果数据是期望平均分布的，则每个桶中的元素平均个数为N/M, 最后一个for循环时间复杂度M*N/M, 所以总的时间复杂度O(N), 空间复杂度O(M+N). 头结点处理的挺漂亮, 其实就是计数排序.

桶排序的时间复杂度就可以近似认为是O(N)的, 就是桶越多, 时间效率就越高, 而桶越多, 空间却就越大, 由此可见时间和空间是一个矛盾的两个方面

时间复杂度先遍历数组求最大值最小值O(N), 然后加入桶O(N), 再累加桶O(M), 最后遍历原始数组O(N), 所以总的时间复杂度O(M+N), 当M=N时时间复杂度O(N), 空间复杂度O(N+K), M为数字的范围, 稳定

其实利用计数排序的稳定性原理

出现频率最高的前k个元素

给定一个非空的整数数组，返回其中出现频率前 k 高的元素。

一个有序数组A, 另一个无序数组B, 打印B中所有不在A中的数组, A数组长度为N, B数组长度为M

算法2: 遍历B数组, 使用二分法在A中查找相同元素, 时间复杂度O(M * logN)

假设按照升序排序的数组在预先未知的某个点上进行了旋转

算法: 二分法. 循环内首先要先判断两个端点是否为target. arr[L]<arr[mid]: 说明左端有序右端无序, 进而判断target在不在左端范围内, 同理arr[L]>arr[mid]: 说明右端有序而左端无序, 进而判断在不在右端范围内

算法: 还是二分法, 折半法

使用递归查找数组中的最大值

在一个数组中, 每一个数左边比当前数小的数累加起来, 叫做这个数组的小和. 求一个数字的小和. 如[1, 3, 4, 2, 5]小和为16

在一个数组中, 左边的数如果比右边的数大, 则这两个数构成一个逆序对, 请打印所有逆序对

给定一个数组arr, 和一个数num, 请把小于num的数放在数组的左边, 等于num的数放在数组的中间, 大于num的数放在数组的右边, 要求额外空间复杂度O(1), 时间复杂度O(N)

算法: 准备三个游标leftPtr初始指向数组边界起始位置前一个元素即left-1, rightPtr初始指向末尾后一个元素right+1, index从头到尾遍历数组比较

给定一个数组 nums，编写一个函数将所有 0 移动到数组的末尾，同时保持非零元素的相对顺序。

算法1: 与荷兰国旗类似, 这里准备两个指针, L指向左边边界数字与0交界数, 游标cur遍历数组
算法2: 使用algorithm中的remove方法, 然后遍历至从remove返回迭代的位置开始至数组尾部置0

求无序数组排序后相邻俩数最大差值

给定一个数组, 求排序之后相邻两数的最大差值, 要求时间复杂度O(N), 且要求使用非基于比较的排序

算法: 运用桶的概念. N个数, 准备N+1个桶, 最小值放0号桶, 最大桶放N号桶放N号桶;
三个数组, 分别记录桶是否有值, 桶内最大值, 桶内最小值; 相邻两个数最大差值可能存在于两个非空桶之间, 也可能存在于空桶之间

如何可以得到数据流中排序后的中位数

算法: 两个堆, 最大堆与最小堆结合使用, 使最大堆的size始终大于最小堆的size

用数组结构实现大小固定栈

用数组结构实现大小固定队列

算法: 使用两个红黑树htMap和pmMap, htMap键为高度, 值高度出现的次数, pmMap记录当前位置最大轮廓, 键为位置, 值为高度. 利用红黑树自动排序功能, count只返回0或1, 不是返回出现次数!!!

买卖股票的最佳时机含手续费

算法: 对于第i天的最大受益分成两种情况:

(1) 当天结束后手里有 stock. 可能保持前一天的状态, 也可能是今天卖出的. cash

(2) 当天结束后手里没有 stock. 可能保持前一天的状态, 也可能是买入了. hold

未排序正数数组中累加和为给定值的最长子数组

给定一个数组arr, 该数组无序, 但每个值均为正数, 再给定一个正数k. 求arr的所有子数组中元素累加和为k的最长子数组

算法: 两个点, 利用都是正数的特点. 时间复杂度O(N), 空间复杂度O(1)

未排序数组中累加和为给定值的最长子数组

给定一个数组arr, 数组有正有负, 和一个整数aim, 求在arr中, 累加和等于aim的最长子数组的长度

算法: 若数组累加和为sum, 找到子数组中第一次出现sum-aim值的位置, 则从此位置之后到数组结尾就为所求最长子数组. 时间复杂度O(N), 空间复杂度O(N)
map中记录累加和第一次出现的位置, 累加和0为-1位置(一个数都没有的情况下也能累加出0), 查出位置是从累加和的下一位置到当前位置, 若不记录会错过从0开始的位置

数组中都是整数, 有奇数有偶数, 求奇数与偶数个数相等的最长子数组

算法: 奇数记为1, 偶数记为-1, 求累加和为0的最长子数组

数组中含有0, 1, 2, 求子数组中含有1的数量和含有2的数量相等的最长子数组是多少

算法: 0还是0, 1还是1, 2变为-1, 求累加和为0的最长子数组

给定一个数组arr, 可以任意把arr分成很多不相容的子数组. 求: 分出来的子数组中, 异或和为0的子数组最多是多少

算法: 与数组累加和等于aim最长子数组类似, 都是用一个map记录数值出现位置, 前者记录最早出现的位置, 后者记录最近一次出现的位置
数据dp记录异或和的位置, 假设数组最后一个数的下标是i, 并且数组存在一个最优划分, 使得划分的子数组个数最多, 那么i有两种情况

有一个整型数组arr和一个大小为w的窗口从数组的最左边滑到最右边, 窗口每次向右滑一个位置. 如果数组长度为n, 窗口大小为w, 则一共产生n-w+1个窗口的最大值. 实现一个函数. 输入: 整型数组arr, 窗口大小为w. 输出: 一个长度为n-w+1的数组res, res[i]表示每一种窗口状态下的数组

算法2: 使用list(本算法中不需要随机访问, 所以不使用deque)qmax, 队列中保存数组的下标, 遍历数组, 时间复杂度O(N), 遍历数组, 每个数只会进队列一次, 出队列一次
(1)游标i大于等于数组qmax, 弹出尾部所有小于等于i的值, 这里之所以使用等于, 是为了更新值相等情况下的qmax中数组下标

最大值减去最小值小于或等于num的子数组数量

算法1: 暴力解O(N^3), 生成的子数组共O(N^2), 每个子数组求最大最小值O(N), 所以总时间复杂度共O(N^3)
算法2: 利用两个思路可以加速: (1) 一个子数组达标, 数组内任何子数组都达标; (2) 一个子数字不达标, 数组外任何子数组都不达标. 相当于使用两个滑动窗口, 一个窗口保存最大值, 一个窗口保存最小值

解决数组中所有数, 左边距离它最近比它小/大的数, 右边距离它最近比它小/大的数. 要求O(N)

算法1: 暴力解, 依次遍历每个元素, 再遍历这个元素的两边时间复杂度O(N^2)
算法2: 使用栈使用单调栈结构(栈中保存数组的下标), 遍历每个元素, 压栈过程中从小到大(从大到小)压栈. 若有重复元素, 栈中元素使用链表. 每个数进入/弹出一次, 时间复杂度O(N)
(1)使栈中元素弹出的元素即为最右边最小(大)值, 栈中剩余元素为最左边最小(大)值
(2)依次弹出栈, 栈的左边元素为下以元素, 右边元素为-1

算法: 运用值方图的概念, 分别以每一行为底做值方图数组, 求值方图的最大值. 时间复杂度O(M*N)

算法: 运用抽象的方法, 把问题抽象化. 把打印矩阵抽象为打印一个边框, 整体转化为局部

给定一个整型正方形矩阵matrix, 把该矩阵调整成顺时针转换90度的样子. 额外空间复杂度O(1)

算法: 同顺时针打印矩阵一样, 抽象一个顺时针打印边框的函数, 从外到内依次调用这个函数.

给定一个矩阵matrix, 按照"之"字形方式打印这个矩阵

算法: 抽象一个打印斜行的矩阵, 通过一个布尔变量来判断从上到下还是从下到上, 调用函数多了些边界判断. x_1和y_1, x_2和y_2先后移动次序有很大关系, 先比较x_1再判断y_1, 先比较y_2再判断x_2,

给定一个由N*M的整数型矩阵matrix和一个整数K, matrix的每一行和每一列都是排好序的. 实现一个函数, 判断K是否在matrix中. 要求时间复杂度O(N+M), 额外空间复杂度O(1)

算法: 从矩阵的特性出发, 确定查找方法. 设置查找起始点设置为右上角
(1)若K小于右上角的数, 则不可能在当前列的下面, 左移起始点
(2)若K大于右上角的数, 则不可能在当前行的左边, 下移起始点

给定一个包含非负整数的 m x n 网格，请找出一条从左上角到右下角的路径，使得路径上的数字总和为最小。

算法2: 根据递归暴力递归改动态规划

一个矩阵中只有0和1两种值, 每个位置都可以和自己的上行左右四个位置相连, 如果有一片1连在一起, 这个部分叫做一个岛, 求一个矩阵中有多少个岛

算法: 按顺序遍历矩阵, 每遍历一个点都判断这个节点是否被遍历过

判断在一个矩阵中是否存在一条包含某字符串所有字符的路径

算法: 路径可以向上、向下、向左、向右走, 利用递归做好边界条件的判断

仅用队列结构实现栈结构

仅用栈结构实现队列结构

实现一个特殊的栈, 在实现栈的基本功能的基础上, 再实现返回栈中的最小元素的操作. 要求: 1. pop, push, getMin操作的时间复杂度都是O(1); 2. 设计的栈类型可以使用现成的栈结构

逆序栈, 不能申请额外的数据结构, 只能使用递归函数

算法: 利用两个递归函数, 一个用来逆序栈, 一个用来获得栈底元素.

输入一个链表, 输出该链表中倒数第k个结点

算法: 两个节点一个节点先走, 另一个节点等k个循环之后再走. 边界扣定问题

分别实现反转单向链表和反转双向链表函数

判断一个链表是否是回文结构

算法1: 使用栈把元素逆序, 遍历两次列表, 第一次压栈, 第二次和栈中元素对比是否相同, 时间复杂度O(N), 额外空间复杂度O(N)
算法2: 使用快慢指针. 时间复杂度O(N), 需要N/2个额外空间
算法3: 快慢指针+反转链表. 时间复杂的O(N), 额外空间复杂度O(1). 翻转链表时假定头部节点为要翻转节点的下一节点, 相当于prePtr的位置指定为要翻转的节点, 处理ptrPtr的next域指向空(因为翻转后是尾节点要指向nullptr)

将单向链表按某值划分成左边小, 中间相等, 右边大的形式

算法1: (1)准备一个数组存放node节点, 然后遍历链表把结点都放入数组中;(2)根据数组中的元素对数组进行划分;(3)之后从头到尾恢复链表, 时间复杂度O(N), 额外空间复杂度O(N), 不稳定
算法2: 准备6个指针, 分别存放小于, 等于, 大于pivot的节点, 关键在于最后这6个指针的连接, 扣边界

复制含有随机指针节点的链表

输入一个复杂链表(每个节点中有节点值, 以及两个指针, 一个指向下一个节点, 另一个特殊指针指向任意一个节点), 返回结果为复制后复杂链表的head. (注意, 输出结果中请不要返回参数中的节点引用, 否则判题程序会直接返回空)

算法1: 使用哈希表, 表的key为要复制的节点, value为复制后的节点. 遍历两次, 第一次建立节点, 第二次连接next指针和rand指针
算法2: (1)克隆每个节点, 并在被克隆的节点之口插入该克隆结点, 被克隆节点与克隆节点相邻; (2)并且克隆节点的random指针位置正好在被克隆节点random指针的下一位置, 这样刚好可以通过被克隆节点的random指针指向克隆节点random指针的位置. 拆开链表时扣边界挺有意思curCopy->next = (next != nullptr

算法1: 哈希表, 边遍历变查找, 使用set容器和find函数
算法2: 使用快慢指针, 快慢指针相遇后, 快指针从head从重新开始遍历, 一次走一个节点

x为环前面的路程(黑色部分), a为环入口到相遇点的路程(蓝色部分, 假设顺时针走), c为环的长度()(蓝色+红色部分). 
即环前面的路程 = 数个环的长度 (为可能为0) + c - a
c-a是相遇点后, 环后面部分的路程(红色部分)
所以, 可以让一个指针从起点A开始走, 让一个指针从相遇点B开始继续往后走
2个指针速度一样, 那么, 当从原点的指针走到环入口点的时候(此时刚好走了x)
从相遇点开始走的那个指针也一定刚好到达环入口点, 所以2者会相遇, 且恰好相遇在环的入口点

算法1: 使用哈希表, 先遍历一个链表插入哈希表中, 使用unordered_set容器和find函数; 遍历第二个链表并比较哈希表中的节点, 若遍历到尾则无相交节点

实现一个函数, 如果两个链表相交, 返回相交的第一个结点, 如果不相交返回nullptr. 如果链表1长度N, 链表2长度M, 要求时间复杂度O(M+N), 额外空间复杂度O(1)

算法: 步骤: (1)判断单链表有环无换; (2)判断无环单链表第一个相交的节点; (3)判断有环链表第一相交的节点
有环链表相交共三种情况: (1)各自有环不相交; (2)相交后共享一个环; (3)有环, 两个链表入口节点不同

(1) loop1=loop2时, 第二中情况. 转化到两个无环链表, 找第一相交节点

算法: 时间复杂度O(1)自然使用哈希表保存记录, 可更新链表与双向链表类似, 哈希表与双向链表组合. 使用keyNodeMap用于从key到value映射对应get方法, nodeKeyMap保存从value到key的映射, 用于更新链表时查找node对应的key

递归版: 每个节点都会走过三次, 只是走过节点时的打印时机不同. (1) 先序, 在第一次经过节点时就会打印其值; (2) 中序, 在第二次经过该节点打印其值; (3) 后序, 在最后一次经过该节点时会打印其值

算法: 利用二叉树的递归遍历来实现

二叉树的前驱与后继节点

后继: 该节点中序遍历的下一个节点
前驱: 该结点中序遍历的前一个节点

前驱算法: (1)有左子树, 返回左子树的最右边节点; (2)无左子树, 非右孩子: 查找该节点是以哪个节点为子树的最左边节点; 右孩子: 返回父节点
后继算法: (1)有右子树, 返回右子树的最左边节点; (2)无右子树, 非左孩子: 查找该结点是以哪个节点为子树的最右边节点; 左孩子: 返回父节点

算法: 利用二叉树的递归遍历. 不能使用中序遍历后的数组两端是否相等来进行判断, 例如节点数相同1的任意树结构. 不能使用一个节点的递归, 下层非对称上层可以是对称的, 不能利用下层返回信息来判断上层结构

算法: 利用二叉树的递归遍历, 设计递归返回结构

判断一课二叉树是否是搜索二叉树

一个二叉搜索树具有如下特征

节点的左子树只包含小于当前节点的数.
节点的右子树只包含大于当前节点的数.
所有左子树和右子树自身必须也是二叉搜索树.

算法1: 二叉树中序遍历非递归版打印部分加些代码
算法3: 只判断当前节点的左孩子与右孩子了, 并没有判断整颗左子树与右子树中的最大值与最小值和当前节点是否满足二叉搜索树的条件, 待完善

判断一颗二叉树是否是完全二叉树

算法: 二叉树的按层遍历, 增加一个标志位标识是否是叶子节点. 可分为两种情况进行处理:
(1)左孩子为空并且右孩子为空, 返回false
(2)左孩子不为空右孩子为空, 或者左右孩子都为空, 下次迭代开启叶子节点检查状态

算法: 使用队列, 先压左孩子后压右孩子

算法: 使用两个栈数组, 使用变量来代替数组下标的变化. 不能使用一个队列如把二叉树打印成多行那样, 因为本层多个节点时, 队列后面存储当前左右孩子相反时, 下层节点的先后顺序发生改变

二叉树的序列化与反序列化

目前版本只有先序方式的序列化与反列化

算法: 使用string字符串没有结束字符, 分隔后找不到结尾, 故统一每个节点后的分隔符为叹号. 反序列化的关键在于string的分隔, string的find使用方法是关键, 使用了string::npos

要求: 时间复杂度低于O(N), N为这颗树的节点个数

算法: 利用二叉树的概念. 满二叉树高度L, 节点2^L-1个; mostLeftLevel找当前节点可到达的最大深度时, 节点下移, 层数同时+1. 每一层只会选择一个节点进行递归, 所以调用递归函数的次数为O(h). 每次调用递归函数都会查看node的最左节点, 所以会遍历O(h)个节点, 整个过程的时间复杂度O(h^2)
(1)由于是完全二叉树, 先遍历整颗树的左边界获取树高L
(2)遍历右子树的做边界是否到达最后一层:
　　(1)是, 当前节点的左子树是满的, 左子树的加当前节点的个数为2^L-1+1=2^L, 递归求右子树
　　(2)否, 当前节点的右子树是满的, 右子树加当前节点的个数为2^(L-1)+1-1=2^(L-1), 递归求左子树

二叉树中和为某一值的路径

输入一颗二叉树的根节点和一个整数, 打印出二叉树中结点值的和为输入整数的所有路径. 路径定义为从树的根结点开始往下一直到叶结点所经过的结点形成一条路径.

算法: 宽度优先, vector弹出与压出

输入二叉树先序遍历和中序遍历结果, 重建二叉树

判断t1树中是否有与t2树拓扑结构完全相同的子树

给定彼此独立的两颗树头结点分别为t1和t2, 判断t1中是否有与t2树拓扑结构完全相同的子树

算法: 把树序列化, 使用KMP字符串匹配算法, 查看T2的序列化结果是否是T1的子串

判断t1树是否包含t2树的全部的拓扑结构

给定彼此独立的两颗树头结点分别为t1和t2, 判断t1树是否包含t2树全部的拓扑结构

算法: 使用两个递归函数, 一个判断是否结构相同, 一个判断当结构不同时, 移动t1的指针进行, 判断t1的子树是否包含t2的结构. 二叉树递归返回与或非的示例

在二叉树中找到两个节点的最近公共祖先

给定一课二叉树的头结点head, 以及这颗树中的两个节点o1和o2, 返回o1和o2的最近公共祖先节点

算法1: 利用二叉树的后续遍历, 后续遍历结束相当于处理完两颗子树会返回所需信息, 实际就是利用后续遍历分别查找两个节点. 假设处理cur时左子树返回节点L, 右子树返回节点R
算法2: 构建一个表. 遍历树, 使用map记录每个节点的父节点, 然后通过这个map把从根节点至p1所有的节点插入set中, 同理, p2利用这个map中祖先节点到set中查找, 找到就挺

给定一个非空二叉树，返回其最大路径和。

算法: 利用递归, 先处理左子树, 再处理右子树, 其中利用一个全局变量记录返回值. 这里基本递归返回0做基值

判断一颗二叉树是否是平衡树

以每个节点作为头结点的树都是平衡树则整颗树平衡.

算法1: 设计递归返回结构, 返回两个信息: (1) 是否平衡; (2) 返回高度. 整个递归过程按照同样的函数得到子树的信息, 整合子树的信息, 加工出我的信息向上返回, 要求返回结构一样. 使用了智能指针
算法2: 使用递归计算树高. 平衡信息作为返回值, 树高作为传出参数. 太神奇了
算法3: 树高做传入参数来进行处理, 多看几遍

给定一棵二叉树的头节点head, 请返回最大搜索二叉子树的大小

算法: 求每一个节点为头的整颗树的最大搜索二叉树. 情况分析
1.左树最大搜索二叉树
2.右树最大搜索二叉树
3.左树最大搜索二叉树头部, 是当前节点左孩子
4.右树最大搜索二叉树头部, 是当前节点右孩子
满足3, 4情况下, 求左树最大值与右树最小值, 并与当前节点比较

二叉树中, 一个节点可以往上走和往下走, 那么从节点A总能走到节点B. 节点A走到节点B的距离为: A走到B最短路径上的节点个数. 求一棵二叉树上的最远距离

算法: 求每一个节点为头的整颗树的最大距离. 情况分析:
1.以当前节点为头的整颗树最大距离来自左子树最大距离, 不经过当前节点
2.以当前节点为头的整颗树最大距离来自右子树最大距离, 不经过当前节点
3.经过当前节点, 当前节点到两个节点深度和
设计递归返回结构: (1)左子树最大距离; (2)右子树最大距离; (3)左子树深度+右子树深度
精炼递归返回结构: (1)最大距离; (2)深度

一个公司的上下节关系是一棵多叉树, 这个公司要举办晚会, 作为组织者已经摸清了大家的心理: 一个员工的直接上级如果到场, 这个员工肯定不会来. 每个员工都有一个活跃度的值, 决定谁来你会给这个员工发邀请函, 怎么让舞会的气氛最活跃? 返回最大的活跃值
matrix[1] = {1 , 5}, 表示1这个员工的直接上级为1(他自己是这个公司的最大boss), 1这个员工自己的活跃度为5
为了让晚会活跃度最大, 应该让1不来, 0和2来. 最后返回活跃度为10

设计返回结构: (1)来时的活跃度; (2)不来时活跃度

经典哈希函数输入域无穷大
哈希函数的输出域有穷尽
输入一样, 输出肯定一样
输入不一样, 输出可能一样, 即哈希碰撞
输出域均匀分布. 输出结果模m, 结果0~m-1均匀分布

哈希函数可以打乱输入规律

特征: (1)与输入规律无关; (2)输出结果模m, 结果0~m-1均匀分布

急需1000个哈希函数(相对独立), 可以通过1个哈希函数来获得
比如哈希函数h, 会得到2^64范围, 16字节字符串, 得到结果分为高8位h1与低8位h2

哈希表: 利用哈希函数做一N桶, 在桶中挂一些链. 哈希表的增删改查可以理解成时间复杂度O(1), 但实际不是, 有扩容代价, 哈希表扩容, 离线扩容

100T大文件, 每行是一个字符串, 打印所有重复的字符串. 思路: 通过哈希分流
问: 处理大文件按行读是否有很快的读取工具
把每一行作为文本读出来, 利用哈希函数计算一个哈希code, 然后模1000, 模的结果是多少就存放在多少号的机器上. 相同的文本一定会分配到一台机器上, 如果有重复的文本一定会来到一台机器上, 出现的不同字符串(相同字符串算一种)

不安全网页的黑名单包含100亿个黑名单网页, 每个网页的URL最多占用64B. 现在想要实现一个网页过滤系统, 利用该系统可以根据URL判断该网页是否在黑名单上, 设计该系统
要求: 该系统允许有万分之一以下的判断失误率; 使用的额外空间不超过30GB
思路1: 先前如大文件, 有些浪费空间, 还可以继续优化吗
思路2: 如果把黑名单中的所有URL通过数据库或哈希表保存下来, 就可以对每条URL进行查询, 但是每个URL有64B, 数量100亿个, 所以至少需要640GB空间, 不满足要求
准备一个长度为m的bit类型数组bitMap, 准备k个彼此独立的哈希函数(计算结果独立), 这些函数输出值域大于或等于m, 使用这k个哈希函数对一个url进行计算. 对每一结果都对m取余, 然后再bitMap中想应位置1. 按照同样方法处理所有黑名单中的对象, 遇到已经为1的位置保持不变
黑名单中样本的个数为100亿个, 记为n; 失误率不能超过0.001%, 记为p; 每个样本的大小为64B, 这个信息不会影响布隆过滤器的大小, 只和选择哈希函数有关, 一本的哈希函数都可以接受64B的输入对象, 所以使用布隆过滤器还有一个好处是不用顾忌单个样本的大小, 它丝毫不能影响布隆过滤器的大小

数据迁移代价很低, 同时可以完成负载均衡
通过虚拟节点, 路由表映射虚拟节点

设计一种结果, 在该结构中有如下三个功能: insert(key)将某个key加入到该结构, 做到不重复加入. delete(key): 将原本在结构中的某个key移除. getRandom(): 等概率随机返回结构中的任何一个key

给定一个没有重复的整型数组arr, 初始认为arr中每一个数都各自是一个单独的集合. 设计一种结构, 提供isSameSet查询是否处于一个集合与unionSet合并集合. 要求: 如果调用isSameSet与unionSet的总次数逼近或者超过O(N), 做到单次调用isSameSet或unionSet方法的平均时间复杂度为O(1)

算法: 结构上如何避免重复, 以及合并完的部分不重复 --> 并查集. 并查集初始化时, 必须已知所有数据样本, 不能对于流样本处理

假设矩阵很大, 并有多个cpu, 怎么把这道题目分解. 设计一个分治的思路, 多任务并行的算法. 一个矩阵切四块, 各自块信息算好之后, 能不能合并正确的岛数; 或者设计一种思路, 可切任意块, 各自块算好之后合并正确的岛数, 关键在于岛的边界信息如何合并

如何避免重复, 以及合并完的部分不重复 --> 并查集

如图, 把矩阵按中间红色部分分为两块, 左边有岛A, B, 右边有岛C, D共4个岛, 合并
最终一共4-1-1=2个岛, 查找是否在一个集合可使用并查集

每组数据一行, 为待编码的字符串. 保证字符串长度小于等于1000. 求这个字符串最短编码的长度

算法: 哈夫曼编码, 使用最小堆实现

给定的字符串里面, 找出最长的对称字符串(可以跳过部分字符)

算法: 两个游标分别指向头部和尾部, 思想就是要当前位置不要当前位置

打印一个字符串的全部子序列, 包括空字符串

算法: 与背包问题相似, 要当前的字符, 不要当前字符两种情况递归

输入一个字符串(输入一个字符串,长度不超过9, 可能有字符重复, 字符只包括大小写字母), 按字典序打印出该字符串中字符的所有排列.

算法1: for循环中去重复字符
算法2: 使用set去重复字符, 自定义比较器

给定字符串构成最长回文字符串

给定一个包含大写字母和小写字母的字符串, 找到通过这些字母构造成的最长的回文串. 在构造过程中, 请注意区分大小写. 比如"Aa"不能当做一个回文字符串

算法: 回文字符串中出现奇数的字符一定在中间, 两边的字符必须都出现过偶数次. 使用哈希表把字符串都存储起来, 然后通过(cnt/2)*2来取每个字符的个数(除法取整出现奇数次与偶数次的区别了), 每个字符都会取偶数个, 不论字符出现多少次. 由于前面都是取偶数个字符, 最后当res<str.size()表示可以再在中间添加一个出现过奇数次的字符

实现字典树, 包含以下四个主要功能

算法: 与样本量无关, 与样本的长度有关系. 不能把字母放在边上, 应该把字符转换为索引放到边上, 通过增加数据项来添加功能:
(1)每个节点加一个数据项, 有多少个字符串是以当前节点为结尾的, 可以统计字符串的个数
(2)每个节点加一个数据项, 有个字符串, 统计有多少个字符串以其作为前缀, 每个节点被划过多少次

一个字符串类型的数组arr1, 另一个字符串类型的数组arr2,
(2)arr2中有哪些字符串, 是作为arr1中某个字符串前缀出现的, 打印出来
(3)arr2中有哪些字符, 是作为arr1中某个字符串前缀出现的. 请打印arr2中出现次数最大的前缀

给定一个数组, 求子数组的最大异或和

算法1: 三个for循环, 依次定义子数组的start与end位置, 最后一个for求子数组的异或和, 时间复杂度O(N^3)
算法2: 与算法1相比用了两个for循环, 区别是求最大值的位置
算法4: 利用字典树的加速, 遍历数组同时遍历字典树, 由于字典树的深度为固定位数(int为32位), 所以事件复杂度O(N)

给定两个字符串str和match, 长度分别为N和M. 实现一个算法, 如果字符串str中含有子串match, 则返回match在str中的开始位置, 不含有则返回-1

算法1: 笨方法, 依次遍历str1字符然后与str2比较, 时间复杂的O(N*M), 从任何位置开题配str2都是独立的
算法2: KMP解决包含问题, 让前面匹配的信息指导后面. 滑动匹配

把一个字符串调整为大字符串, 在这个大字符串中要求包含两个原始串
要求: 大字符串生成时只能在原始串后面添加字符串, 添加长度最短, 包含两个原始串, 开头位置不能相同, 并且大串最短

算法: 与KMP求next数组类似, 求整体串最长前缀与最长后缀, 即最后一个位置的下一个位置的next值, 例如: abcdeabc, 最后一个位置的下一个位置的next值为3, 添加后abcdeabcdeabc

确定一个字符串不是某一字符串重复得到的

确定一个字符串不是某一字符串重复得到的. 如字符串由字符串123得到

给定一个字符串str, 返回str中最长回文子串的长度

算法: 任意字符间及两边插入一个任意字符(可以是出现过的), 三个概念, 回文半径数组, 回文中心, 回文右边界
回文半径数组pArr: 以每个字符串为中心, 向两边扩, 最多能扩多少个字符
回文中心(index): 对应回文半径时的中心字符
回文右边界(pR): 下一个即将扩到的位置
遍历字符串, 遍历位置i

(1) i不在回文在回文右边界, 暴力扩

(4) i在回文半径内, i的对称点i'的回文半径当前回文左边界重合, 两边不确定, 暴力扩

末尾添加字符串构成回文串

只能够向字符串最后添加字符, 怎么能够让字符串整体都变成回文串. 要求添加字符最少

给定一个字符串str, 找到str中最长的回文子串

算法: 使用Manache, , 与最长回文字符串长度有区别, 首位置需添加一个未出现过的字符

一块金条切成两半, 需要花费和长度数值一样的铜板. 如长度为20的金条, 不管切成长度多大的两半, 都需要花费20个铜板. 一群人想分整块金条, 怎么分最省铜板?
如果先把金条分成10和50, 花费60, 在把长度50的金条分成20和30, 花费50, 一共花费110
如果先把金条分成30和30, 花费60, 在把长度30的金条分成10和20, 花费30, 一共花费90

算法: 贪心问题, 把这个数组加入到小根堆中, 每次从小根堆中拿出两个数相加后放入小根堆, 直至堆中元素只剩下一个时停止. 从底往上算, 从上向下切. 哈夫曼编码问题, 子节点合并在一起的代价是加起来的和, 代价是所有非叶子节点的和

给定两个整数w和k, w代表拥有的初始资金, k代表最多可做k个项目. 再给定两个长度为N的正数数字cost[]和profits[], 代表一共有N个项目, cost[i]和profits[i]分别表示第i号项目的启动资金与做完后的利润(注意是利润, 如果一个项目启动资金为10, 利润为4, 代表该项目的最终收入为14). 一次只能做一个项目, 并且手里拥有自己大于或等于某个项目的启动资金时, 才能做这个项目. 该如何选择做项目, 可以使最终的受益最大
说明: 每做完一个项目, 马上获得的收益, 可以支持你去做下

一些项目要占用一个会议室宣讲, 会议室不能同时容纳两个项目的宣讲. 给你每一个项目开始的时间和结束的时间(给你一个数组, 里面是一个个具体的项目), 安排宣讲的日程.
要求会议室进行的宣讲的场次最多. 返回这个最多的宣讲场次.

依赖顺序逆着回去就是计算顺序

算法2: 定义出6个过程, 彼此间嵌套

母牛每年生一只母牛, 新出生的母牛成长三年后也能每年生一只母牛, 假设不会死.
求N年后, 母牛的数量
如果每只母牛只能活10年, 求N年后母牛的数量

所有动态规划都是从暴力版本优化而来, 空间换时间傻白甜问题
有些方法改不出动态规划, 如汉诺塔, 因为没有重复计算
暴力递归改动态规划, 哪些问题可以改, 哪些问题不可以改
面试过程中没见过的动态规划都是从暴力递归修改而来

汉诺塔, 要求打印所有步骤, 有后效性问题, 所以改不出动态规划

用一种机制, 把递归过程中的用到的数据做一个缓存记录下来, 再用到数据时, 不递归而是直接从缓存中拿取数据, 记忆化搜索放法

递归展开过程中有重复状态, 而且重复状态与到达它的路径无关, 无后效性问题

写出尝试版本, 即暴力方法
分析可变参数, 哪几个可变参数可以代表返回值的状态
可变参数几维, 动态规划表就是几维
普遍位置需要哪些位置, 逆着回去就是填表的顺序

一个二维数组, 二维数组中的每个数都是正数, 要求从左上角走到右下角, 每一步只能向右或者向下. 沿途经过的数字要累加起来. 要求返回最小的路径和

算法1: 暴力递归, 依次递归当前节点与有边节点和, 当前节点与下边节点的和, 递归结束条件为到达右下角
算法2: 动态规划, 右下角到当前位置的路径和与之前走过的路径无关, 状态参数确定返回值确定, 即当row和col确定返回值确定, 无后效性问题, 可以改动态规划
可变参数为row和col, row和col的变化范围就是返回值的变化范围, 以row和col为行和列建立一张二维表, 查看哪些位置的值不依赖其他位置, base case(一个为题划分到什么程度就不用向下划分了)最右下角位置

一个数组arr, 和一个整数aim. 如果可以任意选择arr中的数字, 能不能累加得到aim, 返回true或者false

算法1: 暴力递归, 要当前数字和不要当前数字, 同前面字符串子序列一样

给定两个数组w和v, 两个数组长度相等, w[i]表示第i件商品的重量, v[i]表示第i件商品的价值. 再给定一个整数bag, 要求你挑选商品的重量加起来一定不能超过bag, 返回满足这个条件下, 你能获得的最大价值

算法1: 暴力递归, 要当前的w[i]和v[i]和不要当前w[i]和v[i]两种情况讨论, 返回条件超重和到达数组末端. 模式同前面字符串子序列一样
算法2: 动态规划, 以bag建立二维表, 同数组累加以aim为列建立二维表类似, 偏移量变为weights数组, 有些疑问

如何判断一个数是否在40亿个整数中

如何只用2GB内存从20/40/80亿个整数中找到出现次数最多的数

面试官: 如果我给你 2GB 的内存, 并且给你 20 亿个 int 型整数, 让你来找出次数出现最多的数, 你会怎么做？
小秋: (嗯？怎么感觉和之前的那道判断一个数是否出现在这 40 亿个整数中有点一样？可是, 如果还是采用 bitmap 算法的话, 好像无法统计一个数出现的次数, 只能判断一个数是否存在) , 我可以采用哈希表来统计, 把这个数作为 key, 把这个数出现的次数作为 value, 之后我再遍历哈希表哪个数出现最多的次数最多就可以了.

面试官: 你可以算下你这个方法需要花费多少内存吗？
小秋: key 和 value 都是 int 型整数, 一个 int 型占用 4B 的内存, 所以哈希表的一条记录需要占用 8B, 最坏的情况下, 这 20 亿个数都是不同的数, 大概会占用 16GB 的内存.

面试官:你的分析是对的, 然而我给你的只有 2GB 内存.
小秋: (感觉这道题有点相似, 不过不知为啥, 没啥思路, 这下凉凉) , 目前没有更好的方法.
面试官: 按照你那个方法的话, 最多只能记录大概 2 亿多条不同的记录, 2 亿多条不同的记录, 大概是 1.6GB 的内存.

小秋： (嗯？面试官说这话是在提示我？) 我有点思路了, 我可以把这 20 亿个数存放在不同的文件, 然后再来筛选.
面试题：可以具体说说吗？
小秋：刚才你说, 我的那个方法, 最多只能记录大概 2 亿多条的不同记录, 那么我可以把这 20 亿个数映射到不同的文件中去, 例如, 数值在 0 至 2亿之间的存放在文件1中, 数值在2亿至4亿之间的存放在文件2中…., 由于 int 型整数大概有 42 亿个不同的数, 所以我可以把他们映射到 21 个文件中去. 显然, 相同的数一定会在同一个文件中, 我们这个时候就可以用我的那个方法, 统计每个文件中出现次数最多的数, 然后再从这些数中再次选出最多的数, 就可以了.

面试官：嗯, 这个方法确实不错, 不过, 如果我给的这 20 亿个数数值比较集中的话, 例如都处于 1~ 之间, 那么你都会把他们全部映射到同一个文件中, 你有优化思路吗？
小秋：那我可以先把每个数先做哈希函数映射, 根据哈希函数得到的哈希值, 再把他们存放到对应的文件中, 如果哈希函数设计到好的话, 那么这些数就会分布的比较平均. 数字过于集中可以直接在内存中统计

面试官：那如果我把 20 亿个数加到 40 亿个数呢？
小秋：最开始用21个文件是因为整型范围是42以内, 给40个整数还是再42亿以内, 还是可以用21个文件解决

面试官：那如果我给的这 40 亿个数中数值都是一样的, 那么你的哈希表中, 某个 key 的 value 存放的数值就会是 40 亿, 然而 int 的最大数值是 21 亿左右, 那么就会出现溢出, 你该怎么办？
小秋： (那我把 int 改为 long 不就得了, 虽然会占用更多的内存, 那我可以把文件分多几份呗, 不过, 这应该不是面试官想要的答案) , 我可以把 value 初始值赋值为负21亿, 这样, 如果 value 的数值是 21 亿的话, 就代表某个 key 出现了 42 亿次了。

面试官：如果把 40 亿增加到 80 亿呢？
小秋： (我靠, 这变本加厉啊) ………我知道了, 我可以一边遍历一遍判断啊, 如果我在统计的过程中, 发现某个 key 出现的次数超过了 40 亿次, 那么, 就不可能再有另外一个 key 出现的次数比它多了, 那我直接把这个 key 返回就搞定了。

算法: 最小公约数就是交叉相模. 最小公倍数=两数成绩/最大公约数

统计二进制中1的个数与判断是否是2的倍数

}

1.按下述格式，从键盘输入一个整数加法表达式：操作数1+操作数2，

然后计算并输出表达式的计算结果，形式如下：操作数1+操作数2=计算结果。（课本62）

2.输入两个整形数并打印，如果用户不慎输入了非法字符，那么程序

提示“输入数据类型错误”。（课本68页）

3.已知三角形的三边长a，b，c，要求编写程序，从键盘输入a，b，

c的值，计算并输出三角形的面积（注意不存在的情况）。（第三章习题）

4.编程从键盘输入圆的半径r，计算并输出圆的周长和面积。（第三章

5.任意从键盘输入一个三位整数，要求正确分离它的个位，十位和百

位数，并分别在屏幕上输出。（课本82）

6.写一个函数实现统计一个输入的整形数的位数。

7.编程计算方程ax*x+bx+c=0的根，a，b，c由键盘输入,只是用主函

数来实现。（课本83页，但需综合考虑）

8.编写三个函数，分别在b*b-4*a*c大于0、小于0、等于0时进行

调用，并输出结果，在主函数中读入a、b、c的值。

9.从键盘输入你和你朋友的年龄，编程判断谁的年龄大，并打印最大

者的年龄。（课本86页）

10.从键盘输入一个年份，判断该年是否是闰年，并输出结果。

11.判断某人是否属于肥胖体型。根据身高与体重因素，医务工作者经

广泛的调查分析给出了以下按“体指数”对肥胖程度的划分：体指

}

我就爱股票网