Cuidados Gerais com seus Dados

Tirar todo o valor de seus dados inclui quase sempre cuidados como validação, aperfeiçoamento, normalização, padronização e um embelezamento de forma geral.

Trate os meus Dados!

Validação de Dados

Extração de Domínios Válidos

Use qualquer tipo de texto bruto de entrada que inclua URLs e/ou e-mails e obtenha domínios únicos com consultas de DNS válidas.

Valide códigos NCM

Insira qualquer número com 8 dígtos e valide o código junto à um banco de dados atualizado do sistema da Nomenclatura Comum do Mercosul para verificar se o código é válido ou não.

Aperfeiçoamento de Dados

Detecção de Números de Telefone Internacionais

Utiliza dígitos de entrada, formatação, e combinação de informações adicionais sobre o país de origem como o endereço de IP e fuso horário, para retornar um número formatado no padrão internacional ITU-T E.123.

Reconstrução de Dados Faltantes

Adiciona dados faltantes baseados em informações obtidas de outros dados. Estado e cidade podem ser obtidos com base no CEP, sites podem ser extraídos de e-mails, e DDDs podem ser obtidos baseados no nome da cidade.

Normalização e Padronização de Dados

Identificação Canônica de URL

Este serviço voltado à identificação de uma URL canônica a partir de uma dada URL. Isto pode ser realizado através da extração de parâmetros de rastreio, informações da sessão ou rastreio de dominios de qualquer URL na web.

Classificador de Nome do Host

Toma qualquer nome do host e identifica o trajeto do usuário registrável baseado em lógicas de negócios. A meta é entender qual o conteúdo pertence de fato ao domínio. Um exemplo é support.squarespace.com e www.squarespace.com são controlados pelo mesmo propritário, enquanto matthew-painter.squarespace.com não tem qualquer relação com os domínios anteriores.

Identificação de datas

Toma qualquer data e hora e retorna no formato compatível com o padrão ISO 8601. No momento oferecemos suportes em inglês, português e norueguês.

***

Você está buscando por dados pré-tratados?
Veja nossos Conjuntos de Dados.