La mala noticia es que Google scrapeó mastodon.uy para uno de sus datasets para entrenar un LLM.
La buena noticia es que sacó exactamente 420 tokens (poquísimos dado el tamaño) dando pie a probables bromas de marihuana, hasta me planteo si no lo dejaron a propósito en 420 😅
https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/