Lição 7
Escape de strings e Unicode
Sequências de escape, pontos de código Unicode e caracteres especiais em strings JSON.
Strings JSON são sempre delimitadas por aspas duplas. Qualquer caractere que quebraria a string — ou seria ambíguo — deve ser escapado com barra invertida.
Sequências de escape comuns
| Sequência | Significado |
|---|---|
\" | Aspas duplas dentro de uma string |
\\ | Barra invertida literal |
\n | Nova linha |
\t | Tab |
\r | Retorno de carro |
\b | Backspace |
\f | Form feed |
Exemplo:
{
"message": "Line one\nLine two",
"path": "C:\\Users\\dev\\config.json"
}
Escapes Unicode
Use \uXXXX para um ponto de código Unicode com exatamente quatro dígitos hex:
{
"greeting": "Hello, \u4e16\u754c"
}
Para caracteres fora do Plano Multilíngue Básico, pares substitutos UTF-16 aparecem como dois escapes \u no JSON — a maioria dos editores e parsers lida com isso ao ler/escrever arquivos UTF-8.
Caracteres que não podem ir crus em strings
Caracteres de controle (U+0000 até U+001F) devem ser escapados. Quebras de linha sem escape dentro de strings são JSON inválido — use \n em vez disso.
Arquivos UTF-8 vs Unicode escapado
Um arquivo .json salvo como UTF-8 pode conter caracteres chineses ou emoji literais:
{ "label": "世界" }
Isso é JSON válido. Formas \u escapadas são equivalentes quando normalizadas — escolha o que deixar seu pipeline e ferramentas de diff mais felizes.
Dicas práticas
- Ao copiar strings de logs, cuidado com aspas tipográficas
""— não são delimitadores JSON válidos. - Docs de API costumam mostrar
\nem exemplos; seu parser converte para novas linhas reais em memória. - Se a validação falhar dentro de uma string longa, busque barras invertidas sem escape ou sequências
\uquebradas.