Lição 7

Escape de strings e Unicode

Sequências de escape, pontos de código Unicode e caracteres especiais em strings JSON.

Strings JSON são sempre delimitadas por aspas duplas. Qualquer caractere que quebraria a string — ou seria ambíguo — deve ser escapado com barra invertida.

Sequências de escape comuns

SequênciaSignificado
\"Aspas duplas dentro de uma string
\\Barra invertida literal
\nNova linha
\tTab
\rRetorno de carro
\bBackspace
\fForm feed

Exemplo:

{
  "message": "Line one\nLine two",
  "path": "C:\\Users\\dev\\config.json"
}

Escapes Unicode

Use \uXXXX para um ponto de código Unicode com exatamente quatro dígitos hex:

{
  "greeting": "Hello, \u4e16\u754c"
}

Para caracteres fora do Plano Multilíngue Básico, pares substitutos UTF-16 aparecem como dois escapes \u no JSON — a maioria dos editores e parsers lida com isso ao ler/escrever arquivos UTF-8.

Caracteres que não podem ir crus em strings

Caracteres de controle (U+0000 até U+001F) devem ser escapados. Quebras de linha sem escape dentro de strings são JSON inválido — use \n em vez disso.

Arquivos UTF-8 vs Unicode escapado

Um arquivo .json salvo como UTF-8 pode conter caracteres chineses ou emoji literais:

{ "label": "世界" }

Isso é JSON válido. Formas \u escapadas são equivalentes quando normalizadas — escolha o que deixar seu pipeline e ferramentas de diff mais felizes.

Dicas práticas

  • Ao copiar strings de logs, cuidado com aspas tipográficas " " — não são delimitadores JSON válidos.
  • Docs de API costumam mostrar \n em exemplos; seu parser converte para novas linhas reais em memória.
  • Se a validação falhar dentro de uma string longa, busque barras invertidas sem escape ou sequências \u quebradas.

Voltar à visão geral do curso