首页 > 试题广场 >

在RAG中处理表格(Table)数据时,以下哪种方法效果最好

[单选题]
在RAG中处理表格(Table)数据时,以下哪种方法效果最好?
  • 将表格直接转换为字符串(CSV格式)进行embedding
  • 为每行/每列生成自然语言描述,结合表格结构信息分别索引
  • 只对表格标题进行索引,忽略表格内容
  • 将整个表格作为一个chunk存储
举例:整张员工薪资表太大、结构太乱,不适合直接存,所以人工 / 程序把它拆成 3 个独立 Chunk
  • Chunk1:本表是员工薪资表,张三就职于研发部,月薪 18000 元
  • Chunk2:李四就职于市场部,月薪 15000 元
  • Chunk3:表格包含姓名、部门、月薪三个字段
后处理这三个chunk:每个 Chunk 单独转成 Embedding 向量,给这批 Embedding 向量的每一个向量单独在向量数据库里建索引、入索引库,用 HNSW 之类算法建好的检索目录,方便以后秒搜相似内容
发表于 2026-05-01 15:47:11 回复(0)