第 3 课
引号、逗号与换行
处理真实 CSV 字段中的逗号、引号和换行。
真实 CSV 字段中可以包含逗号:
id,note
1,"hello, world"
引号里的逗号是数据,不是分隔符。字段内换行也是同理:
id,note
1,"first line
second line"
正确解析器会把它视为一行中的多行字段。
字段中的引号
CSV 通常用两个引号表示字段内的一个引号:
id,note
1,"She said ""ship it"""
它表示文本:
She said "ship it"
为什么简单 split 会失败
line.split(",") 遇到引号内逗号或换行就会失败。它适合玩具示例,但不适合真实表格导出。
关键结论
处理 CSV 应使用理解引号规则的解析器。转换出错时,先检查包含逗号、引号或换行的字段是否正确包在引号中。
可以把复杂行粘贴到 CSV 转 JSON / JSON 转 CSV 工具 中,先看表格预览,再信任输出。