Como tgadsspy funciona: Deep Dive técnico no Classificador e Pipeline de Ingestão
Documentação técnica do pipeline de dados tgadsspy — integração API gramesh, arquitetura de classificação de nicho (regex + pesos), pipeline de geolocalizador em 3 etapas, armazenamento de mídia SHA256 content-addressed e cache de agregação. Para developers, pesquisadores e equipas de compliance.
Objetivo e Audiência#
Este documento é um deep dive técnico no funcionamento do Telegram Ads Spy: recolha, classificação e disponibilização de dados de publicidade do Telegram. Complementa a visão geral em /about com detalhes de nível de implementação.
Audiência primária: developers que constroem sobre a API pública; investigadores que precisam compreender a proveniência dos dados para citação; equipas de compliance que avaliam a metodologia OSINT do sistema.
1. Fonte de Dados: gramesh API#
Todos os dados de publicidade no Telegram Ads Spy provêm de uma única fonte: a gramesh HTTP API em api.wall.systems/gramesh. gramesh é uma camada de proxy/agregação sobre o protocolo MTProto do Telegram.
Endpoints Usados#
POST /channels.getSponsored— obtém mensagens patrocinadas para um canalPOST /channels.getInfo— resolve metadados de canalPOST /channels.getSimilar— BFS spider pelo grafo de similaridadePOST /contacts.search— descoberta de novos canais por query de pesquisa
2. Classificação de Nicho#
Cada AdCreative recebe um nicho de ~25 categorias: sports-betting, crypto-exchange, defi, forex-trading, p2p-crypto, gambling, edtech, real-estate e outros. A classificação é feita em lib/niche.ts via regras regex sobre título + texto + CTA URL.
Arquitetura: sistema de pesos — correspondências fortes (ex: "1xBet" → sports-betting) atribuem 3–5 pontos; fracas, 1–2. Ganha o nicho com maior pontuação total.
3. Classificação Geo#
Pipeline de 3 etapas:
- Língua do canal → mapeamento
langToGeo()(ru → RU/UA/KZ/BY, ar → SA/EG/AE/…) - CTA URL → extração de TLD (.de → DE, .com.br → BR)
- Texto do criativo → padrões de moeda, nomes de cidades, referências regulatórias
4. Mirror de Mídia#
gramesh retorna URLs assinados com TTL de 1 hora. Mirror-cron (Telegram Ads Spy-media-mirror, a cada 5 min):
- Faz download do ficheiro de mídia
- Calcula hash SHA256
- Armazena em
/var/www/tgadsspy-media/<prefixo>/<hash>.<ext> - Atualiza
AdCreative.mediaUrl→ URL permanente/m/<hash>.<ext>
Referência de Metodologia#
Documentação completa: tgadsspy.com · API: /api/v1/ads. CC-BY-4.0.
Dados ao vivo via Telegram Ads Spy
O Telegram Ads Spy indexa todos os anúncios patrocinados do Telegram em tempo real. Os criativos descobertos podem ser explorados em tgadsspy.com/ads ou exportados via API aberta /api/v1/ads.
Acesso a dados: tgadsspy.com · CC-BY-4.0.
Also available in:
Cite this article
tgadsspy research (2026). Como tgadsspy funciona: Deep Dive técnico no Classificador e Pipeline de Ingestão. tgadsspy.com. Retrieved from https://tgadsspy.com/blog/pt-tgadsspy-metodologia-classificador-2026
Licensed CC-BY-4.0 — reuse allowed including commercial, attribution required.