Microsoft ha respondido a la polémica generada hace unas semanas sobre el supuesto uso de los documentos de Microsoft 365 (tales como Word y Excel) de los usuarios para entrenar modelos de IA, como Copilot. La compañía afirma que no está haciendo uso de los datos de ningún cliente de su servicio de ofimática, y que se trata de una confusión a causa de una función de seguridad.
En concreto, los usuarios llevan semanas quejándose de que la compañía mostraba en Microsoft 365 una opción que requería no entrenar a modelos de IA, sugiriendo, por tanto, que la recopilación de datos para el posterior desarrollo de modelos de lenguaje, estaba activado por defecto.
Microsoft ha llegado a afirmar que la opción a la que hacen referencia los usuarios es, en realidad, una que permite “buscar imágenes en línea” o “encontrar información disponible en línea”, a través de una serie de características llamadas “experiencias conectadas opcionales”. Esta viene activada por defecto, y se puede desactivar. Además, no se menciona en ningún apartado el uso de datos para el entrenamiento de la IA.
Muchas personas, sin embargo, aseguran que en las condiciones de la mencionada opción se puede leer que el conjunto de características “analizan su contenido”, y no excluyen explícitamente el uso de datos para entrenar a la IA.
No, Microsoft no usa tus datos de Word para entrenar a su IA
Tras las quejas, la compañía ha reiterado a través de una publicación en X (Twitter) que en las apps de Microsoft 365 no se recopilan datos para entrenar a modelos de inteligencia artificial. “Esta configuración solo habilita funciones que requieren acceso a Internet, como la coautoría de un documento”, detallan. Frank Shaw, máximo responsable de comunicaciones de Microsoft, también afirmó a través de Bluesky que las acusaciones sobre el uso de los datos de plataformas como Word o Excel no son ciertas.
El caso de Microsoft recuerda mucho al de Adobe, donde las condiciones de las plataformas de la compañía sugerían que utilizaban los datos de los usuarios para entrenar modelos de inteligencia artificial. Adobe respondió a la polémica modificando las condiciones con un lenguaje que dejara claro que no se utilizaban imágenes o cualquier otro tipo de información de otros usuarios para este fin.
En cualquier caso, y debido al auge de la IA, muchas plataformas sí recopilan datos con el objetivo de entrenar a modelos de lenguaje. Todas ellas, sin embargo, —y al menos dentro de la Unión Europea— deben mostrar una opción al usuario para que sea este quien escoja si quiere que sus datos se recopilen o no.