Community database | Spécifications | Typosquatting Data Feed | WhoisXML API

Base de données communautaire

Le fil d'actualité de la communauté Typosquatting contient des fichiers d'essai limités quotidiens qui sont des versions filtrées des fichiers complets qui comprennent un sous-ensemble de groupes et, pour les fichiers enrichis, un sous-ensemble de colonnes.

Pour en savoir plus sur le téléchargement de cette base de données localement ou sur Snowflake , cliquez ici.

Échantillons

Disponibilité des données

Type d'abonnement Description
Mises à jour quotidiennes Sont disponibles à 18 heures UTC la plupart des jours. Certains jours, étant donné que la génération de données provenant d'autresflux quotidiens peut prendre plus de temps, les données sont générées 8 heures plus tard. 

Convention d'appellation

Type d'abonnement Description
Mises à jour quotidiennes typosquatting.YYYY-MM-DD.daily.trial.[basic|enriched].csv

Structure CSV

Les fichiers de données sont des fichiers de valeurs séparées par des virgules, sans délimiteurs de texte. Les fichiers utilisent des terminateurs de ligne (CR+LF) de style DOS/Windows (CR+LF). La première ligne est une ligne d'en-tête avec les noms des champs.

Fichiers d'essai de base

Champ d'application Description
group_number Numéro ordinal du groupe dans le jour donné (dans le cas d'un abonnement quotidien, dans le fichier).
group_member_number Numéro ordinal du domaine au sein du groupe.
total_no_of_grp_members Nombre de membres du groupe au sein du groupe.
domain Nom de domaine
domain_utf Nom de domaine transcrit en Unicode ; uniquement pour les domaines comportant des caractères nationaux (non anglais).

Fichiers d'essai enrichis

Champ d'application Description
group_number Numéro ordinal du groupe dans le jour donné (dans le cas d'un abonnement quotidien, dans le fichier).
group_member_number Numéro ordinal du domaine au sein du groupe.
total_no_of_grp_members Nombre de membres du groupe au sein du groupe.
domain Nom de domaine
domain_utf Nom de domaine transcrit en Unicode ; uniquement pour les domaines comportant des caractères nationaux (non anglais).
registrant_country Extrait de l'enregistrement WHOIS.
registrarName Extrait de l'enregistrement WHOIS.
status A partir de l'enregistrement WHOIS ; codes d'état EPP du domaine.
standardRegCreatedDate Date d'enregistrement au format standard (voir le commentaire sur "createdDate").
standardRegExpiresDate Date d'expiration au format standard.
IPs Une liste d'adresses IPv4 séparées par des espaces, attribuées au domaine selon une recherche DNS le jour ou le lendemain de la date du fichier.


Les groupes susmentionnés sont sélectionnés à l'aide de " buzzwords " et comprennent le premier groupe, qui a le buzzword comme sous-chaîne dans au moins un nom de domaine et qui n'a pas été inclus avec un buzzword précédent, s'il existe. Les buzzwords sont généralement des noms de marque et des mots populaires dans le typosquatting comme, par exemple, settlement, bank ou support.

Téléchargement via Snowflake

Les utilisateurs de Snowflake peuvent télécharger le flux ici.