Bluesky trabaja en una opción para configurar el consentimiento del uso de datos de los usuarios para entrenar IA

MADRID, 27 Nov. (Portaltic/EP) -

Bluesky ha señalado que está trabajando en una opción de configuración con la que permitir a los usuarios especificar si desean dar su consentimiento para que desarrolladores externos utilicen sus publicaciones e información para entrenar Inteligencia Artificial (IA).

La red social de 'microblogging' explicó recientemente cuál es su postura sobre la IA generativa, asegurando que no entrena sus modelos con los datos de los usuarios, ni tiene "intención de hacerlo" de cara al futuro.

Concretamente detalló que, de cara a sacar de dudas a los usuarios que tengan "inquietudes sobre el entrenamiento de otras plataformas" con su información, la plataforma no utiliza "ninguno" de los contenidos de sus suscriptores para entrenar la IA generativa. Sin embargo, utiliza esta tecnología para "ayudar en la moderación de contenido" y para las publicaciones del 'feed' algorítmico de 'Descubrir'.

Ahora, Bluesky ha compartido una actualización sobre el uso de la IA generativa en la plataforma, donde ha señalado que está investigando una opción de configuración con la que permitir a los usuarios especificar si dan su consentimiento para que desarrolladores externos puedan utilizar su contenido en conjuntos de datos de entrenamiento de IA.

Tal y como ha explicado en un hilo de publicaciones en la plataforma, al tratarse de una red social publica y abierta, funciona de forma "muy similar a los sitios web de Internet". Así, ha señalado que estos sitios web pueden especificar si aceptan que las empresas externas rastreen sus datos con, por ejemplo, un robot.txt, de cara a poder utilizarlos posteriormente para otros fines, como el entrenamiento de IA.

En este sentido, Bluesky está investigando "una práctica similar" a la de los sitios web, relacionada con permitir que empresas externas rastreen los datos y contenidos publicados por los usuarios en la plataforma.

Según ha especificado, con esta opción de configuración los usuarios podrán matizar si dan permiso o no para que los desarrolladores externos utilicen su contenido. Sin embargo, Bluesky también ha subrayado que "no podrá hacer cumplir este consentimiento fuera de sus sistemas".

Es decir, aunque el usuario señale que no permite el uso de su contenido para entrenar IA, la compañía ha aclarado que finalmente dependerá de los desarrolladores externos "respetar estas configuraciones".

Por el momento, Bluesky está "manteniendo conversaciones continuas con ingenieros y abogados" para terminar de desarrollar esta opción de configuración del uso de la información. Por lo que compartirá más información relacionada próximamente.

Esta novedad en el uso de datos para el entrenamiento de IA coincide con la publicación de un empleado de Hugging Face, en la que comparte información de un millón de publicaciones de Bluesky, extraídas de su API en el repositorio de IA.

Tal y como ha explicado Hugging Face, esta publicación provocó "muchas críticas de la comunidad" sobre su creación y carga, así como sobre el uso de los datos de los usuarios. Por tanto, la compañía terminó eliminando los datos de Bluesky del repositorio y explicando que, si bien su intención era "apoyar el desarrollo de herramientas para la plataforma", se trata de un enfoque que "viola los principios de transparencia y consentimiento en la recopilación de datos".

Bluesky trabaja en una opción para configurar el consentimiento del uso de datos de los usuarios para entrenar IA

Leer más acerca de: