@ve3qbz @M0YNG https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/ down there is a query field to search for scrapped domains
La mala noticia es que Google scrapeó mastodon.uy para uno de sus datasets para entrenar un LLM.
La buena noticia es que sacó exactamente 420 tokens (poquísimos dado el tamaño) dando pie a probables bromas de marihuana, hasta me planteo si no lo dejaron a propósito en 420 😅
https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/
Bobinas P4G is a social network. It runs on GNU social, version 2.0.1-beta0, available under the GNU Affero General Public License.
All Bobinas P4G content and data are available under the Creative Commons Attribution 3.0 license.