Agenda completa de actividades presenciales y online de Emilio Carrillo para el Curso 2024-2025

Agenda completa de actividades presenciales y online de Emilio Carrillo para el Curso 2024-2025

20/4/17

Sobre la Big Data y sus implicaciones inmediatas (De la Entrevista a Martin Hilbert, experto en redes digitales, sobre las nuevas tecnologías y el Big Data)


¿Cuánta información hay en el mundo?

–La última vez que actualicé este estudio, hace dos años, había 5 zetabytes. Un ZB es un 1 con 21 ceros, lo cual no te dirá mucho. Pero si tú pones esta información en libros, convirtiendo las imágenes y todo eso a su equivalente en letras, podrías hacer 4500 pilas de libros que lleguen hasta el sol. O sea, hay mucha información.

¿Y a qué ritmo está creciendo?

–A un ritmo exponencial. Se duplica cada dos años y medio. Entonces, ahora probablemente son 10 ZB.

O sea, ocho mil pilas de libros que llegan al sol.

–Ocho o nueve mil pilas, sí. Piensa en esto: desde el 2014 hasta hoy, creamos tanta información como desde la prehistoria hasta el 2014. Y lo más impresionante, para mí, es que la información digital va a superar en cantidad a toda la información biológica que existe en el planeta. La vida es procesamiento de información, ¿no? Toma del ambiente moléculas normalmente muertas, toma fotones del sol, y los convierte en estructuras complejas de información con un código base que es el ADN. Y ya existe más información digital que código genético humano. Aun contando cada copia de ADN en las trillones de células de cada persona en el mundo, en la humanidad hay como 1 ZB de información. Y durante este siglo, la información digital va a superar a toda la información genética que existe en la biósfera. Todo lo cual lleva a muchas preguntas sobre el futuro de la humanidad, ¿no?

Parece que la pregunta existencial más importante va a ser cómo interpretamos tantos datos.

–Y la respuesta es que la única manera de interpretarlos es con máquinas también. Este procesador [apunta a su cerebro] no aguanta eso, sabe hacer otras cosas. Ahora, lo bueno es que la información crece muy rápido, pero nuestro poder de computación crece tres veces más rápido. Se duplica en menos de un año. Porque la tecnología siempre es mejor pero también porque tenemos muchas más máquinas, ¿no? Tú mismo tienes ahora un celular, un computador, etc., que interpretan muchos datos por ti. Y ahí viene toda la cuestión de la inteligencia artificial [en adelante, IA] y el Deep Learning, que ahora es lo más importante.

¿Qué es el Deep Learning?

–Es la manera como se hace la IA hoy en día. Son redes neuronales que funcionan de manera muy similar al cerebro, con muchas jerarquías. Todo esto que hacen Apple y Google y todas las Siri en el teléfono, todo usa Deep Learning. Es una IA súper poderosa que descubrimos hace cinco años y ya todo el mundo la usa, porque es muy superior a todo lo que habíamos encontrado.

Y la otra pregunta existencial, ¿qué tan espiados estamos?

–Nooo, ¡súper espiados! Todo está espiado. Y es muy interesante, porque después de Edward Snowden la gente dijo: “¡Qué es esto, pueden ver mis fotos desnudo! Ya, bueno, qué tanto”. Nadie se fue a protestar a la calle, la cosa siguió tal cual. La NSA confesó que hizo un par de cosas demasiado ilegales y bueno, esas cosas se arreglaron. Pero las otras no, y cada vez te van a espiar más. Yo no digo que esto sea bueno o malo, pero la gente tiene que saber. Y si la gente sabe que está espiada y no le importa, está perfecto. Ahora, la pregunta delicada es qué pasa si esos datos llegan a las manos de alguien que pueda abusar de ellos. En Silicon Valley no están muy contentos con que sus herramientas ahora las pueda usar Donald Trump. Están muy decepcionados, la verdad.

¿Qué cosas de nosotros se pueden saber de un momento a otro?

–De partida, dónde estás y dónde has estado. Si tienes Gmail en tu celular con wifi, puedes ver en Google Maps un mapa mundial que muestra dónde estuviste cada día, a cada hora, durante los últimos dos o tres años (ver www.google.com/maps/timeline). Es una información que tú les permites coleccionar al aceptar los términos de licencia cuando instalas la aplicación.

Lo que uno nunca lee.

–Exactamente. Y en muchos casos tú puedes optar que no lo hagan, pero nadie se fija. Ahora, lo interesante es que con estos datos de movilidad se pueden hacer estudios. Y ya sabemos, por ejemplo, que se puede predecir con casi un 90% de probabilidad dónde vas a estar tú en cada momento de cada día del año que viene. Imagínate lo que vale esa información para una empresa que hace marketing, por ejemplo.

Cuentas que en África el celular hizo lo que nunca pudo hacer el certificado de nacimiento. La huella de que una persona existe es su teléfono.

–Claro, es súper poderoso. Es tu verdadera huella digital. Y África es el caso extremo, pero piensa en América Latina, donde hay tanto orgullo por los censos. El censo de Chile ahora fue un desastre y era una tragedia, ¿no? Pero con los datos de tu celular, si uso solamente lo que se llama metadata, o sea sin escuchar tus conversaciones ni saber con quién hablas, sino sólo con qué frecuencia y con qué duración usas tu celular, con eso yo puedo hacer ingeniería reversa y reproducir el 85% de tus resultados de un censo: si eres hombre o mujer, cuál es tu rango de ingresos, si tienes niños, si estás casado, tu origen étnico…

¿Sólo conociendo la frecuencia y duración con que uso mi celular?

–Sí. El censo que hacen cada 10 años, que es tan costoso y tan importante, lo puedo reconstruir en un 85% con esos dos datos. De eso se trata el Big Data: tenemos tantos datos y tanta capacidad de procesarlos, de identificar correlaciones, que podemos hacer a la sociedad muy predecible. Y cuando puedes predecir, puedes programar.

Y en el caso de las empresas de Internet que nos prestan servicios gratuitos, ¿qué tan importante es para su negocio la información que tienen de nosotros?

–Todo, eso es todo lo que tienen. Facebook vale billones de dólares por la información, no por otra cosa. De las diez empresas del mundo tasadas a un precio más alto, yo creo que cinco son proveedoras de información. Y la gente siempre dice “no, hay que regular todo eso, proteger a los usuarios”. Pero la demanda más extrema que he escuchado en todas esas conferencias donde voy, es que necesitamos derechos de propiedad de datos, como los de propiedad intelectual, para que tú puedas vender tus datos y no regalarlos. Y yo voy con este reclamo donde mis amigos en Silicon Valley y me dicen “pero hueón, ¡si ya lo estamos haciendo! Tú sigues siendo dueño de tus datos, pero aceptas que yo también lo sea al aprobar los términos de licencia. Y a cambio puedes usar Google Maps gratis y te ahorras una hora de taco al día, ¿no es fantástico?”. Ahí llegamos al fin de la discusión, no hay nada más que hacer. Incluso ante las propuestas más progresistas, Silicon Valley ya tiene respuesta. Y la verdad es que la gente se beneficia tanto de eso que no le molesta.

También las empresas telefónicas, que uno supone que sólo nos cobran el plan, hacen buena plata con nuestros datos, ¿no?

–Claro. Por ejemplo, Smart Steps es la empresa de Telefónica que vende los datos de la compañía. Si tú tienes Movistar, tus datos están ahí vendidos.

¿A quién le sirven?

–¡A mucha gente! Si tú quieres abrir una tienda de corbatas en una estación de metro, te vale mucho saber cuántos hombres caminan en cada salida del metro, entonces compras estos datos de Telefónica. Y también los puedes usar en tiempo real: saber a qué hora pasa la gente, e incluso si se detiene o no a ver el anuncio de oferta que pusiste afuera. Y lo más impresionante es que esto convirtió a las ciencias sociales, de las que siempre se burlaron, en la ciencia más rica en datos. Antes tenías que hasta negociar con diplomáticos para que te prestaran una base de datos de cien filas por cien columnas. Y en las universidades hacían experimentos con 15 alumnos de pregrado, que necesitaban créditos extra para pasar el ramo, todos blancos, todos de 18 años, y decían “miren, así funciona la psicología humana”. ¡De adónde! Nosotros nunca tuvimos datos, y por eso nunca funcionaban las políticas públicas. Y de la noche a la mañana, el 95% de los sujetos que estudiamos pasó a tener un sensor de sí mismo 24 horas al día. Los biólogos siempre dijeron “eso no es ciencia, no tienen datos”. Pero ellos no saben dónde están las ballenas en el mar. Hoy nosotros sí sabemos dónde están las personas, pero también sabemos qué compran, qué comen, cuándo duermen, cuáles son sus amigos, sus ideas políticas, su vida social. Se puede abusar también, como Obama y Trump lo hicieron en sus campañas, como Hillary no lo hizo y por eso perdió. Pero el gran cambio es que estamos conociendo a la sociedad como nunca antes y podemos hacer predicciones con un nivel científico. ¡Lo de antes era arte, no era ciencia!

Entiendo que algunos estudios ya han logrado predecir un montón de cosas a partir de nuestra conducta en Facebook.

–Claro, esos son los datos que Trump usó. Teniendo entre 100 y 250 likes tuyos en Facebook, se puede predecir tu orientación sexual, tu origen étnico, tus opiniones religiosas y políticas, tu nivel de inteligencia y de felicidad, si usas drogas, si tus papás son separados o no. Con 150 likes, los algoritmos pueden predecir el resultado de tu test de personalidad mejor que tu pareja. Y con 250 likes, mejor que tú mismo. Este estudio lo hizo Kosinski en Cambridge, luego un empresario que tomó esto creó Cambridge Analytica y Trump contrató a Cambridge Analytica para la elección.

¿Qué hizo con eso?

–Usaron esa base de datos y esa metodología para crear los perfiles de cada ciudadano que puede votar. Casi 250 millones de perfiles. Obama, que también manipuló mucho a la ciudadanía, en 2012 tenía 16 millones de perfiles, pero acá estaban todos. En promedio, tú tienes unos 5000 puntos de datos de cada estadounidense. Y una vez que clasificaron a cada individuo según esos datos, lo empezaron a atacar. Por ejemplo, en el tercer debate con Clinton, Trump planteó un argumento, ya no recuerdo sobre qué asunto. La cosa es que los algoritmos crearon 175 mil versiones de este mensaje –con variaciones en el color, en la imagen, en el subtítulo, en la explicación, etc.– y lo mandaron de manera personalizada. Por ejemplo, si Trump dice “estoy por el derecho a tener armas”, algunos reciben esa frase con la imagen de un criminal que entra a una casa, porque es gente más miedosa, y otros que son más patriotas la reciben con la imagen de un tipo que va a cazar con su hijo. Es la misma frase de Trump y ahí tienes dos versiones, pero aquí crearon 175 mil. Claro, te lavan el cerebro. No tiene nada que ver con democracia. Es populismo puro, te dicen exactamente lo que quieres escuchar.

¿Y qué hizo Obama?

–Obama fue como el pionero en esto. En la campaña de 2012, para su reelección, invirtió en esto mil millones de dólares, mucho más que en comerciales de TV. Y con eso contrató a un grupo de cuarenta nerds, de Twitter, de Google, de Facebook, de Craigslist, tres profesionales de póker, otro que trabaja con células madres, en fin. A esos cuarenta nerds los puso en un subterráneo, les dio mil millones de dólares y un número para el servicio de pizza, ¿no? Y ahí en el subterráneo crearon los 16 millones de perfiles que les interesaban, los votantes indecisos. Sacaron datos de todos lados. Incluso tuvieron acceso a las Setup-Boxes, lo que sería el DirectTV en Chile, que registra cómo tú ves televisión. Si tienen acceso a eso, ya saben lo que te interesa, y empezaron a llevar comerciales individualizados. Lo más delicado es que no sólo pueden mandarte el mensaje como más te va a gustar, también pueden mostrarte sólo aquello con lo que vas a estar de acuerdo. Si Obama tiene sesenta compromisos de campaña, puede que 58 te parezcan mal, pero al menos con dos vas estar de acuerdo. Digamos que estás a favor del desarrollo verde y a favor del aborto. Bueno, empezaron a mostrarte en Facebook sólo estos dos mensajes.

¿Con avisos publicitarios?

–No, lo hicieron más sofisticado. Como algún amigo vas a tener que hizo un like a la campaña de Obama, ese like les dio acceso a los perfiles de todos sus amigos –esto también va en la licencia que nunca leemos–, entonces podían ver tu historial y clasificarte. Y además tenían acceso a postear desde el timeline de tu amigo, porque esto también está permitido. Él no lo ve, Facebook no se lo muestra, pero tú sí vas a ver muchos artículos así como “Obama el héroe de la energía alternativa”, “Obama el héroe del aborto legal”. No son propagandas de la campaña, son artículos de prensa bien elegidos. Y si tú por medio año ves “Obama héroe” de estas dos cosas que te gustan, al final vas a decir “oye, tan mal no está este Obama”. Bueno, en 2012 le cambiaron la opinión al 78% de la gente que atacaron así. Y Trump lo hizo con 250 millones. Creo que George Orwell se metería un tiro, porque ni él se imaginó algo así. La democracia es completamente inútil con algo así.

En un artículo explicabas que también los call center de Estados Unidos te clasifican mientras hablas, y cuando vuelves a llamar te derivan a un empleado con una personalidad afín a la tuya.

–Así es. El que habla contigo no lo sabe, ¿no? Una vez conté esto en una conferencia y uno de mis estudiantes, la próxima vez que llamó a un call center, le dijo “¡oye huevón, deja de clasificarme la personalidad!”. El otro no entendía nada, ¡ja, ja, ja! El trabajo lo hacen alrededor de diez mil algoritmos que te escuchan hablar y clasifican tu personalidad en seis diferentes cajas. La última vez que hablé con esta compañía, me dijeron que ya el 30% de las llamadas a los call center de Estados Unidos están intermediadas así. Y ya hay sistemas que les dan inteligencia en tiempo real: el tipo está ahí con un monitor que le dice “ahora es el momento de ofrecerle tal cosa”, “ahora ya no”. Pero eso es reciente, por ahora lo más común es que te dejan clasificado. Y todo esto, al final, ¿a qué nos lleva? A crear burbujas, en todos los niveles.

¿Cómo así?

–Que la gente emocional sólo hable con gente emocional, la gente de acción con la gente de acción, los reactivos con los reactivos. Hablamos mucho de que ahora los demócratas no hablan con republicanos, pero esta fragmentación de la sociedad en subgrupos va mucho más allá de la política. La verdad, es una cosa triste. Pero no es culpa de la tecnología, es la manera en que la usamos hoy día. Toda tecnología es normativamente neutral, tú puedes usar un martillo para colgar un cuadro o para matar a tu vecino. Lo mismo con la tecnología digital: podríamos usarla para unir gente, para mezclar gente de opiniones opuestas, pero no lo estamos haciendo.

Y más rezagada aún queda la democracia, incapaz de mediar entre tanta información fragmentada. No hay denominador común.

–Claro, el Big Data permite poner a la gente en muchas más cajas que antes no veías, es un arma de fragmentación muy poderosa. Sí, esa es una amenaza. Esto de la privacidad y el comercio no es el gran problema, la gente tiene razón en no preocuparse tanto. Es útil que las chicas reciban comerciales sobre la píldora y los chicos sobre condones, ¿no? Ahora, Big Data para la democracia representativa… ahí termina. Tú sabes que la democracia siempre estuvo muy ligada a las posibilidades informacionales que tenía cada sociedad. Aristóteles fue muy claro en decir que la democracia no podía ir más allá de un radio de 70 km, porque la información no podía viajar más que eso en un día. Por eso la democracia griega fue para una ciudad. Y en Estados Unidos, ¿por qué crearon las primarias, los colegios electorales por cada Estado y todo eso que conocemos? Porque el viaje en caballo de costa a costa tomaba una semana. Como no había acceso a la gente y la gente tampoco estaba informada, se necesitó todo este constructo representativo. Pero con la tecnología actual, este constructo está completamente abusado y tiene potencial para constituirse en una dictadura informacional, esto hay que decirlo abiertamente. Esto es lo que más me preocupa. La democracia representativa de esta manera no funciona.

Obligados a pensarla de nuevo…

–La verdad es que tenemos que repensarla completamente. Y ya tampoco podemos ignorar que las redes digitales son globales. O sea, personas que están a miles de millas se pueden ofender con una información que les llega y presentarse en la redacción de una revista para matar a los dibujantes. Es que todo esto pasó muy rápido. Llevábamos miles de años separados en diferentes culturas y nos tuvimos que conocer en un par de décadas. En el Islam dijeron que no quieren ver mujeres desnudas, y un día llegamos nosotros con el TV cable y les forzamos a mirar las tetas de Pamela Anderson. Y nosotros no entendemos por qué ellos pueden tener dos esposas. Entonces, si la información fluye globalmente, ¿hasta dónde podremos prescindir de una gobernanza global? No lo sé. Pero esto va a ser un camino de ensayo y error, como siempre ocurrió con la tecnología. Ahora vimos que Facebook, después de la elección de Trump, empezó a limpiar sus fake news, estas noticias mentirosas. Hace tres meses decían “no, nosotros no somos editorial”, y ahora están sacando cosas. Ya es un comienzo.

Y los Estados, ¿están sabiendo aprovechar el Big Data para las políticas públicas?

–No, están muy atrás todavía. Pero tienen una oportunidad muy grande. Se estima que el Estado posee alrededor de un tercio de los datos de un país, lo que es mucho. ¿Acaso tiene un tercio del poder productivo? Ni loco. El gobierno sabe todo lo que pasa en los colegios, en los hospitales, en los servicios de impuestos, ¡cuánta información hay ahí! Se puede aprovechar mucho más para políticas sociales y económicas, sobre todo en América Latina. Y lo segundo es poner la información que es pública a disposición de la sociedad, lo que se llama el Open Data. Pero ahí estamos aún más atrasados, incluso acá. Por ejemplo, a mí me nombraron Chair of Technology de la Biblioteca del Congreso, que en EE.UU. siempre fue LA institución de la información. Ellos mismos me invitaron porque se dan cuenta de que perdieron el tren y Google les robó el show en diez años. Y cuando voy allá, veo que todavía podrían recolectar mucha más información, y hacerla pública. Los mapas… ¡el gobierno tiene un montón de mapas! No necesitamos Google Maps, los militares tienen todos los mapas que necesitas. ¿Por qué no los hacen disponibles? Los precios de terrenos, qué tipo de terrenos hay para qué tipo de agricultura, quién es el dueño del terreno, todo esto el gobierno lo tiene y socializarlo podría ser muy productivo. Pero es una buena noticia: si el insumo de esta nueva economía son los datos y el Estado tiene un tercio de ellos, los puede usar para democratizar la economía.

Si es que también se democratiza la capacidad de usarlos.
–Sí, esa será la clave, y todavía no está claro si la disponibilidad de información crea más o menos desigualdad. Pero si en otra época el Estado destinó recursos para llevar la telefonía a las áreas rurales, ahora tendrá que hacerlo para igualar el acceso a Big Data. Son cosas que estamos aprendiendo, aunque los gobiernos ya podrían estar haciendo mucho más.

===============================================
Fuente:
===============================================

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.