Video: Лучшие в своём деле: Артур Хачуян | Большие данные — Big Data | ЛСД #7 (Noviembre 2024)
Se suponía que 2013 sería el año de Big Data, y hay pocas dudas de que el impulso de nuevas formas de almacenarlo, nuevos esquemas para administrarlo y nuevas herramientas para analizarlo siguen siendo un foco central para muchas, si no para la mayoría de las empresas. Pero lo que me sorprendió este año fue la cantidad de atención que ahora se dedica a proteger los datos y las implicaciones de privacidad de recopilar toda esa información en primer lugar.
No es ningún secreto que gran parte de la tecnología detrás de los llamados proyectos de "big data" provino originalmente de las compañías web más grandes como Google, Yahoo, Amazon y Facebook. Creen, y tienen una buena cantidad de evidencia para respaldar esto, que al conocer más acerca de usted, pueden hacer mejores recomendaciones de productos y así lograr que les compre más cosas. Después de todo, el trato implícito en la Web, casi por la apariencia del navegador moderno, es que obtienes información gratis a cambio de publicidad dirigida. De hecho, hasta el día de hoy, algunos de los mayores avances en tecnología de datos provienen de estos grandes sitios web y de las empresas de publicidad y marketing que los respaldan.
En el último año, hemos escuchado mucho más sobre cómo los grandes datos están influyendo en más industrias. Algunas compañías, como GE, han expresado su opinión sobre la implementación de sensores en dispositivos que recopilan datos para hacer cosas como predecir las tasas de falla. Otras compañías como IBM están hablando sobre el uso de datos para ayudar a las personas a hacer predicciones, como el diagnóstico de posibles enfermedades. Sigo siendo muy optimista sobre el potencial de tales tecnologías, aunque creo que muchos, si no la mayoría, los proyectos de Big Data no producirán el retorno de la inversión que esperan sus creadores.
Pero ese no fue el enfoque de Big Data este año. Más bien, fueron las revelaciones sobre el alcance de la recopilación de datos por parte de las agencias gubernamentales, especialmente la NSA, lo que generó los titulares más importantes, incluidas las inserciones de malware y otros ataques a fuentes críticas de datos, desde historias sobre piratería china hasta el reciente pirateo de tarjetas de crédito en Target. Las historias de malware han llevado a un mayor uso de sistemas de prevención de intrusos y firewalls de próxima generación, aunque todos sabemos que ningún sistema es infalible. Las filtraciones de la NSA han hecho que las personas en otros países sean mucho más escépticas de almacenar datos con empresas estadounidenses, y la presión ahora está llevando a los grandes proveedores de la nube a agregar más cifrado, incluso entre sus servidores internos. Todos están instalando más sistemas de seguridad, aunque todos sabemos que ningún sistema es perfecto y que la "ingeniería social" es casi imposible de prevenir.
Ahora estamos viendo un mayor enfoque en la privacidad, ya sea de espías del gobierno o de compañías que recopilan datos. Hasta ahora eso no se ha convertido en una mayor regulación, pero las nuevas reglas y políticas seguramente serán un foco en 2014. Una preocupación para las grandes empresas estadounidenses es que esto puede llevar a leyes que obliguen a los proveedores de Internet a mantener los datos de los usuarios dentro del país. del usuario, o al menos el interés político, como mantener todos los datos brasileños en Brasil, o todos los datos alemanes dentro de Europa. Esto podría resultar en más servicios nacionales (como los muchos servicios chinos que han prosperado, en parte porque las compañías estadounidenses no operan allí) o al menos un requisito para más centros de datos locales. El temor es que esto podría resultar en una creciente balcanización de Internet.
Mientras tanto, sin embargo, hemos visto un aumento en las aplicaciones diseñadas para que los usuarios almacenen y conserven menos datos, no más, como Snapchat, por ejemplo. Por primera vez, parece que los usuarios típicos están pensando qué datos se capturan, dónde y durante cuánto tiempo se almacenan. Lo que puede tener un impacto aún mayor en los datos.