" />
ZOOM
GALERÍA
0 COMENTARIOS

Ha sido desarrollado por la UOC y la URV

Un sistema oculta automáticamente la información confidencial en los documentos de texto

Privacidad y seguridad siguen siendo dos de los puntos más preocupantes dentro de las TICs. Para las grandes corporaciones y los sectores que trabajan con datos sensibles, el manejo de la información confidencial es especialmente delicado. Los datos personales se han convertido en un objeto de comercio muy atractivo para los cibercriminales. Datos médicos, datos bancarios, datos comerciales… todo un universo de información confidencial que son objeto de ataques para usos fraudulentos o delictivos, y que cuesta mucho mantener en el anonimato.

Un nuevo desarrollo, diseñado por investigadores de la Universitat Oberta de Catalunya (UOC) y la Universitat Rovira i Virgili (URV) es capaz de detectar y ocultar automáticamente la información confidencial de documentos de texto. El sistema permite enviar documentos a terceros manteniendo el anonimato de las personas u organizaciones a los que se refieran los documentos.

Hasta el momento, proteger la información confidencial de los documentos era algo que había que hacer casi a mano, identificando las palabras o frases reveladoras y eliminándolas. Un ejemplo sería un informe médico en el que se identifique el nombre de una enfermedad contagiosa o frases que hagan alusión al contagio de forma indirecta, como el tipo de medicación prescrita.

Según los investigadores que lo han desarrollado, el sistema automatiza todo el proceso, de manera que se facilita la labor de manejar y proteger mejor grandes volúmenes de datos, como los que se emplean en investigación médica, por ejemplo. El sistema analiza la información disponible en Internet, que es precisamente la que podría usar un tercero como base de conocimiento para deducir información confidencial de un documento protegido. A partir de ahí protege todos los términos susceptibles de hacer deducciones.

En las pruebas realizadas los investigadores señalan que se trata de el más exhaustivo de los métodos que se usan hasta ahora, con “una precisión equiparable a la de un experto humano”. A diferencia de los expertos, el sistema no sólo elimina los términos delicados, sino que también intenta, en la medida de lo posible, reemplazarlos por conceptos más generales y ambiguos, de manera que no se desvirtúe el sentido de cara a trabajos de investigación, pero no revele datos personales.

Por el momento el sistema prototipo está implementado en un software que trabaja sobre documentos clínicos en inglés, pero a futuro puede aplicarse a otros ámbitos y a otros idiomas. La legislación europea es de las más restrictivas respecto a la cesión de datos personales sin consentimiento, pero en países como EE.UU. es bastante habitual que se pidan o envíen documentos privados para diversos trámites administrativos. Sea cual sea el marco jurídico de cada país sigue siendo igual de importante garantizar que los documentos que se envían no revelan información confidencial que pueda usarse, por ejemplo, con el objeto de discriminar a las personas.

El trabajo ha sido desarrollado por Montserrat Batet, del grupo de investigación KISON de la UOC, y el investigador David Sánchez, del grupo de investigación CRISES-Cátedra UNESCO de Privacidad de Datos, del Departamento de Ingeniería Informática y Matemáticas de la URV. La investigación se enmarca en el proyecto europeo CLARUS, sobre privacidad de datos en la nube, que coordina la URV y que cuenta con financiación del programa Horizonte 2020 de la Unión Europea para el periodo 2015-2017. Y también forma parte del proyecto «SmartGlacis: Tecnologías de seguridad y privacidad para ciudades inteligentes» de la UOC, financiado por el Ministerio de Economía y Competitividad.

No comments yet.

Deja un comentario