1. 先做一下自我介绍2. 讲讲你做的这个项目这个项目可以设计成面向投研分析师的问答和报告辅助系统,支持财报解析、公告问答、指标对比和结论摘要。整体链路一般包括文档接入、结构化解析、分块索引、检索增强、模型生成和结果回溯。我主要负责的是文档清洗、分块策略、Embedding 入库、重排、长上下文裁剪和推理链路监控。项目里比较难的点在于文档质量参差不齐,表格、脚注和跨页内容很多,直接切分会严重影响召回效果,所以后面会专门做表格提取和层级切片。3. 怎么解决大事务问题,为什么会导致这些风险大事务的风险主要在于占锁时间长、回滚成本高、undo log 膨胀、主从延迟和数据库连接占用时间过久。尤其是在...