- 正确答案：该题目属于字符串处理类手撕题，常见变体为“按指定长度切割字符串，但不能在单词中间断开”，即要求切分点必须落在空格或标点边界上；若某段内无空格（如超长单词或URL），则强制截断。典型输出是List，每段长度不超过limit且尽可能接近limit。 - 解答思路：采用贪心+双指针扫描。从起始位置start开始，向后找第limit个字符位置end；然后从end向前回溯，寻找最近的空格或行尾；若找到空格，则切分到该空格前；若未找到（即整段无空格），则直接在limit处硬切。更新start为切分点后一位置，循环直至处理完全部字符串。需特别处理首尾空格、连续空格、limit≤0、空字符串等边界情况。 - 深度知识讲解：本题表面是字符串切分，实则综合考察四大底层能力：（1）字符串不可变性与内存视图——Java中String底层是final char[]，substring()在JDK 7u6以后不再共享底层数组，避免内存泄漏；（2）边界安全遍历——回溯查找时需防止索引越界（i >= start而非i > 0）；（3）空白语义理解——ASCII空格(0x20)、制表符\t(0x09)、换行\n(0x0A)、回车\r(0x0D)均属whitespace，可用Character.isWhitespace()统一判断，其内部基于Unicode属性表实现，时间复杂度O(1)；（4）算法稳定性与分词一致性——若要求“不拆单词”，本质是构建以空格为分隔符的token流，可类比Lexer阶段的词法分析，此时正则split("\\s+")会丢失原始分隔符位置，故不可直接使用，必须手动扫描。进一步延伸：若需求升级为“支持中英文混合、全角空格（\u3000）、零宽空格（\u200B）”，则需扩展whitespace判定逻辑；若要求“每行末尾补足空格至limit长度（左对齐）”，则涉及String.format("%-Ns", s)或Arrays.fill()填充；若用于日志系统或终端渲染，还需考虑ANSI转义序列（如颜色码）是否计入显示长度——此时需用Pattern.compile("\u001B\\[[;\\d]*m").matcher(s).replaceAll("")预清洗，因ESC序列不占显示列但占字符串长度。 - 伪代码： ``` function splitText(text, limit) if text == null or limit <= 0 return empty list result = new ArrayList() start = 0 n = text.length() while start < n end = min(start + limit, n) // 向前找第一个whitespace位置（含start本身） splitPos = -1 for i = end down to start if i == start or Character.isWhitespace(text.charAt(i-1)) splitPos = i break // 若没找到空格，则强制在end处切 if splitPos == -1 splitPos = end // 提取子串（注意：substring(start, splitPos) 左闭右开） segment = text.substring(start, splitPos).trim() // 可选：是否trim首尾空格？ if !segment.isEmpty() // 过滤纯空白段 result.add(segment) start = splitPos return result ``` - Java完整实现（带健壮性处理）： ``` import java.util.*; public static List splitByLimit(String text, int limit) { if (text == null || limit <= 0) return Collections.emptyList(); List res = new ArrayList<>(); int n = text.length(), start = 0; while (start < n) { int end = Math.min(start + limit, n); int splitPos = end; // 优先尝试在end之前找空白符作为切分点（从end-1往start方向找） for (int i = end - 1; i >= start; i--) { if (Character.isWhitespace(text.charAt(i))) { splitPos = i; break; } } // 若整个[start, end)区间无空白符，则splitPos保持为end（硬切） String seg = text.substring(start, splitPos).strip(); // strip()移除首尾空白 if (!seg.isEmpty()) { res.add(seg); } start = splitPos; // 跳过切分点后的连续空白（避免重复切出空段） while (start < n && Character.isWhitespace(text.charAt(start))) { start++; } } return res; } ``` 补充考点提示：面试官可能追问——“如果文本含大量重复空格，如何优化回溯查找？” 答：可预处理生成“下一个空白符位置”数组nextWhitespace[i]，用单调栈O(n)预计算，使每次查找降为O(1)；或改用正则Matcher.find()配合Pattern.compile("(?<=^|\\s)(\\S{1,"+limit+"})(?=\\s|$)")，但正则回溯可能导致最坏O(n²)，不推荐超长文本。

百度大模型算法实习二面 50min

全站热榜

创作者周榜