Conversation
Notices
-
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 20:42:58 UTC fanta La eficiencia en la búsqueda en buscadores rollo google, duckduckgo, bing, Peekier, yandex, ... creo que es un tema importante.
No a nivel de que sean capaces de encontrar resultados más o menos relevantes. Si a nivel del "coste de la búsqueda en si".
Al final todos los buscadores hacen una algoritmia similar. "Pre-indexan" y "rankinean". Les dan pesos a las cosas, omiten monosílabos, son capaces de pasar a singular el plural, etc...
Son capaces de trabajar con mayor o menor margen de error. Por ejemplo ser capaces de separar palabras aunque se escriban juntas.
La importancia en la eficiencia creo que está al día de hoy en lo que ocurre en el "backstage". Allí es donde se analizan los datos de esos "inputs".
Google en apariencia ofrece resultados más acordes a lo que se busca porque cruza muchos datos para ello. El tema es que el coste energético de eso es increíble.
Hablamos de que cada búsqueda en google supone un montón de dinero ya que supone un montón de gasto energético.
Y al final de cuentas ese gasto cada vez que realizas una búsqueda se gasta en procesar tu identidad. Tu perfil fantasma, tu historial de anteriores búsquedas, etc...
Por eso creo que es importante usar navegadores que sepan menos de nosotros y más del dato.
Enriquecer el dato está bien. Pero el gasto energético de cada búsqueda en sitios como google.com está cargandose el planeta.
Es mejor estar menos enburbujado y obtener resultados menos precisos que todo lo que lleva detrás una búsqueda en google.
Y es que buscar algo la peña cree que es gratis. No es gratis, tiene un coste y en el caso de google muy grande para el planeta.
Eso creo.- Moribundo Insurgente repeated this.
-
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 20:45:13 UTC fanta y he dicho "navegadores que sepan menos de nosotros" y no "buscadores que sepan más de nosotros" porque al día de hoy navegador y buscador están a nivel general fusionados con la misma finalidad. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 20:52:17 UTC fanta @marcelcosta el coste energetico no viene de que seas más o menos preciso en la busqueda. Eso está solucionado y lo hacen todos los buscadores incluido duckduckgo.
El tema son los metadatos de las busquedas y todo lo que en el back sucede para que obtengas un dato más preciso.
Y eso es lo preocupante. Que para ser más precisos se ha de analizar a quien busca. Y los perfiles fantasma son perfiles que identifican a personas aunque no tengan cuenta en google. Vamos que muchos datos se cruzan por cada busqueda.
No es atacar a una base de datos como hace decadas. Es muchooo mucho más esfuerzo energetico de procesamiento.
Todo al final para crear burbujas.
Google es una empresa de publicidad. Su buscador y demás servicios son inputs para perfilarte.
Eso creo. No estoy tan loco para afirmarlo. Es así leñes. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:01:56 UTC fanta @marcelcosta si estos días el sever minetest.mastodon.madrid va un poco más lento es por culpa de la caja negra que ha metido @ekaitz_zarraga en ese server dedicado (en otra máquina) y que supongo nos explicará pronto cuando tenga más datos.
O cuando quiera contarnos en lo que anda investigando. Un pepinazo muy chulo. -
Moribundo Insurgente (demoakracia@gnusocial.cc)'s status on Thursday, 30-Jan-2020 21:04:21 UTC Moribundo Insurgente @fanta ¿Y que ocurre con los metabuscadores? Yo uso starpage, que busca en google pero eliminando el rastreo. fanta likes this.fanta repeated this. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:04:56 UTC fanta @marcelcosta así es marcelcosta :). El dato que das en el input de busqueda es por ejemplo "comida para perro".
Unos buscadores trabajarán con su algoritmia en código y su infraestructura para darte unos resultados más relevantes.
Otros realizarán eso multiplicado por 1000 ya que no darán el mismo resultado si lo buscas tú o lo buscas en el ordenador de tu compañero de piso . -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:08:01 UTC fanta @demoakracia pues que de algún modo estas instancias re-buscan lo que dices por ti.
Para google son un solo usuario y consumirán recursos pensando en que es el mismo usuario buscando de nuevo. O bloquearan como hacen normalmente cuando se dan cuenta que se concentran las búsquedas.
Pero esos buscadores en teoría funcionan para unificar. para que te escondas entre la multitud.
Luego solo son al final de cuentas un server que terminará por buscar lo que le ofrecen por ti. Y luego te lo dará.
Eso en la teoría. -
Ekaitz Zárraga 👹 (ekaitz_zarraga@mastodon.social)'s status on Thursday, 30-Jan-2020 21:12:19 UTC Ekaitz Zárraga 👹 @fanta @marcelcosta Qué fácil es culpar a la peña... qué fácil.
😘Pronto os contaré. Vamos a dejarlo unos días a ver qué pasa.
fanta repeated this. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:14:58 UTC fanta @ekaitz_zarraga @marcelcosta estoy deseando ver datos del análisis que está haciendo @ekaitz_zarraga
Yo le veo al resultado posibles muy chulos :).
El evidente es bloquear toda la publi en internete (o la gran mayoría).
Ya nos contarás -
Ekaitz Zárraga 👹 (ekaitz_zarraga@mastodon.social)'s status on Thursday, 30-Jan-2020 21:16:51 UTC Ekaitz Zárraga 👹 @fanta @marcelcosta llevamos unos 90k records revisados ya. Estoy contento.
Tardará una semanita más o así.
Cuando esté listo iré haciendo el código para el análisis.
fanta repeated this. -
Moribundo Insurgente (demoakracia@gnusocial.cc)'s status on Thursday, 30-Jan-2020 21:17:00 UTC Moribundo Insurgente @fanta Cual recomiendas usar? Searx, duckduckgo... fanta likes this.fanta repeated this. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:21:59 UTC fanta @ekaitz_zarraga @marcelcosta hoy he ido a mirar el tema y he visto que sigue creciendo. No es problema ninguno que crezca pero he topado con las limitaciones del kernel linux si buscas tratar tanto fichero.
Y me está saliendo un articulo de lujo para formaciones futuras.
Y he encontrado un par de formas de copiar tanto fichero sin problema y sin recurrir a for o find. Mucho mucho más eficaces :).
time tar cf - out/ | (cd out2; tar xvf -)
vs
time cp -pR out/* out2/
Las cintas de backup siguen de moda. Usar tar bien usado permite saltarse las limitaciones del kernel ( getconf ARG_MAX).
Crema siempre trabajar con muchos datos.
largos.png -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:26:25 UTC fanta @ekaitz_zarraga @marcelcosta
searx es una trampa.
"searx no comparte las direcciones IP de los usuarios o el historial de búsqueda con los motores de búsqueda de los que obtiene resultados"
Obtiene los resultados de otros buscadores. Les pone a currar.
En teoría duckduckgo es en si mismo un buscador real.
El gasto por búsqueda es menor si lo que nos importa es el gasto en si energético.
Y digo que es una trampa ya que nos permite anonimizar pero no palía el trabajo que se precisa para que nos lleguen los resultados cuando buscamos. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:27:35 UTC fanta @titi @ekaitz_zarraga @marcelcosta aprender BSD le cambiará la vida. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:30:10 UTC fanta @marcelcosta @ekaitz_zarraga se supone duckduckgo no perfila. Se supone.
Para lo demás wget y curl. La mastercard no sirve en esto para mucho. -
Echedenyan (elr@fedi.absturztau.be@fedi.absturztau.be)'s status on Thursday, 30-Jan-2020 21:30:41 UTC Echedenyan @fanta
Simplemente hace la petición por si. Si te preocupa que haga a muchos buscadores simplemente desactiva el resto de los que no te importen las búsquedas y promueve dicha configuración
DDG no es totalmente libre, para tomar en cuenta.
Sí que estaría guay que Searx tuviese quizás un método de hacer cache de webs y así se evita hacer peticiones de nuevo con el gasto que supone al estilo que hace DDG.
@ekaitz_zarraga @marcelcostafanta repeated this. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:32:50 UTC fanta @marcelcosta @ekaitz_zarraga y en realidad un wget o curl tampoco. Tienes que torificar esos comandos.
# apt install tor torify
torify wget "https://blablalba.com"
y si es posiblme meter useragent aleatorio a wget y ... cambiar de nodo tor de salida y ... mil mierdas.
Pero eso da menos info sinceramente. Algo menos que un firefox o un google shit browser. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:36:12 UTC fanta Me he cuidado de nombrar a duckduckgo siempre por eso que comentas. Y siempre digo y repito "dicen que". -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:37:55 UTC fanta @marcelcosta @ekaitz_zarraga da info sobre eso please. Lo desconozco y no se para que lo usan. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:41:06 UTC fanta @marcelcosta @ekaitz_zarraga de todos modos también está en juego siempre donde se almacenan las cosas. Pero no por usar amazon son el mal. Depende de como lo usen y que almacenen allí y como lo almacenene.
Yo no optaría jamás por nada en AWS para algo serio. Pero he visto cosas subidas a amazon/azure/google/... que me han echo ir al baño a cagar.
Y luego he visto empresas que utilizan aws para procesamientos sin datos personales. Y nada que objetar. -
Ekaitz Zárraga 👹 (ekaitz_zarraga@mastodon.social)'s status on Thursday, 30-Jan-2020 21:41:49 UTC Ekaitz Zárraga 👹 @fanta @marcelcosta Y también está dónde se almacenan las cosas. Si las peticiones viajan por todo el mundo gastan más energía.
fanta repeated this. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:42:57 UTC fanta @ekaitz_zarraga @marcelcosta en un año y algo amazon tendrá cpds en zaragoza. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:48:50 UTC fanta @ekaitz_zarraga @marcelcosta de todos modos si usas algo en un smartphone con android por ejemplo estás identificado por el serial number + otras variables.
Si la app que usas precisa de id tirará de eso y otras variables. Y da igual lo que hagas. Da igual que pongas un navegador u otro, da igual que pongas un plugin, .. no vas a ser anónimo con un smartphone nunca. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:50:50 UTC fanta @ekaitz_zarraga @marcelcosta incluso si le pones tor a tu android :).
No eres anónimo, eres gilipollas.Panko likes this. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:56:18 UTC fanta @marcelcosta @ekaitz_zarraga
si, te lo preguntaba a ti marcelcosta.
"Cloud computing" is an umbrella term for scalable third party data and software services. We use Amazon S3. As such we rely on Amazon's infrastructure for security and performance. In the future we may let you host your own DuckDuckGo data."
Usamos Amazon S3. Como tal, confiamos en la infraestructura de Amazon para la seguridad y el rendimiento.
Fin de duckduckgo para mi. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 21:58:35 UTC fanta @marcelcosta @ekaitz_zarraga yo pensaba que no pasarían por eso sinceramente. Pero veo que les importa poco 8 que 80 también.
Seguramente tengan de amazon una oferta que no han podido rechazar.
Una pena. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 22:08:32 UTC fanta @ekaitz_zarraga @marcelcosta yo hace tiempo llegue a poner publicidad de productos amazon en alguna web.
Me ofrecía eso poca ganancia pero algo. Sigo vivo y hablando y no durmiendo en la calle.
No es que defienda a amazon y mucho menos a AWS pero ... algunas veces la gente hace cosas para sobrevivir que si no necesitase hacer no realizaría.
Al día de hoy no metería algo así. Pero en el pasado he experimentado con amazon y lo digo sin remordimiento alguno (ofrecía enlaces directos y no javascripts ni mierdas, solo si se pinchaba realmente). Y no me daba para vivir ni de coña pero algo para sostener servicios que no podía pagar si.
Y una cosa es como hablo al día de hoy sin problemas económicos y otra es mi yo en el futuro o en el pasado buscándose la vida.
De modo que no entraré a juzgar a la gente por eso. Si por el tema técnico evidentemente.
Y la diferencia entre ganar unos euros con amazon o pagarle a amazon unos euros es grande. Eso creo.
Y creo que sale a la larga más barato hostear algo que irse a esas nubes. Eso creo.
Pero por favor no mezclemos cosas. AWS es una cosa y promocionar en un lateral de una web algo sin dar info de la peña otra. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 22:42:31 UTC fanta @jartigag @marcelcosta @ekaitz_zarraga no aún creo -
fanta (fanta@asocial.56k.es)'s status on Thursday, 30-Jan-2020 22:43:39 UTC fanta @jartigag @marcelcosta @ekaitz_zarraga son las limitaciones del kernel. Y existen truquillos más rápidos que otros para trabajar grandes ingestas de data -
fanta (fanta@asocial.56k.es)'s status on Friday, 31-Jan-2020 07:10:55 UTC fanta @makhiscal me perdí hace tiempo en lo que intentas transmitir. -
Siroco (siroco@social.piperrak.cc)'s status on Saturday, 01-Feb-2020 16:40:35 UTC Siroco @fanta
Bueno.... anónimo para el site de destino no, pero por lo menos tu ISP no se entera de lo que estas mirando y si te apetece participar en un referendum no te bloquea el acceso, no?
@ekaitz_zarraga @marcelcosta
Siento si me he perdido algun trozo de conversación y esto ya estaba cuestionado.fanta repeated this. -
fanta (fanta@asocial.56k.es)'s status on Thursday, 06-Feb-2020 06:36:10 UTC fanta @ikssawall @marcelcosta @ekaitz_zarraga creo que BQ tenía los #cervantes también a la venta.