Servicio de Atención al Cliente: 902 170 000 comercial@extrasoft.es

Desde que comenzaron a aparecer las imágenes y audios simulados con técnicas digitales hasta llegar a los deepfakes (vídeos o audios falsos que simulan ser reales) hemos recorrido un camino de casi veinte años. Actualmente, las fotos, audios y vídeos generados digitalmente, son casi indistinguibles de las que tienen un referente real. Nos paramos a analizar cómo han surgido los deepfakes, para qué se están usando y cuáles son las maneras de detectarlos y, sobre todo, si son los deepfakes indistinguibles de la imágenes reales.

CONTENIDOS

Origen de los deepfakes

¿Para qué se están usando?

¿Cuál es el peligro de los deepfakes?

¿Como detectar los deepfakes?

Origen de los deepfakes

Aunque hay quien sitúa su origen en las manipulaciones fotográficas o algunos programas de radio del siglo pasado, lo cierto es que hasta 1997 con el programa Video Rewrite no podemos hablar de deepfakes como tal. Este programa informático permitía generar la imagen en movimiento de una persona al audio generado en una pista diferente. En definitiva, se trataba de una manipulación de la imagen de vídeo de una persona para hacerle decir unos contenidos de audio que no fueran emitidos por ella, es decir, falsos (fake).

Sin embargo, no fue hasta 2013 con el desarrollo de la tecnología GAN  (Red Generativa Antagónica), que utiliza machine learning para generar un contenido sintético que imita a uno real. Esto se hace mediante dos redes neuronales antagónicas. La red generadora se utiliza para proponer el contenidos sintético y la red discriminadora para determinar si es real.   Mediante este proceso de ida y vuelta la imagen sintética se vuelve más indistinguible de una real.

explicacion deepfakes

Fuente: https://www.ibm.com/es-es

Desde entonces, la tecnología ha permitido llegar a un 86,6% de seguridad y consistencia, es decir, de lo que hace a un deepfake indistinguible de la realidad, y se calcula que pronto alcanzará el 99%.

¿Para qué se están usando?

En 2017, un usuario malintencionado de Reddit utilizó el nombre “Deepfakes” como identificación (origen por cierto de este término, fusión de Deep learning  y Fake). Este usuario utilizó  la tecnología GAN para combinar la imagen de mujeres famosas con vídeos pornográficos, simulando  que eran ellas las que los protagonizaban, produciendo vídeos deepfake. Desde entonces, el uso de la tecnología para realizar deepfakes explícitos ha sido  por desgracia predominante. Según estudios de Security hero en 2023 los vídeos deepfake pornográficos eran el 98% de todos los vídeos deepfake online, siendo además las mujeres objeto de ellos en un 99%. Por último, el 94% de las personas que figuran en estos vídeos falsos eran personas del mundo del entretenimiento (cantantes, actrices…). El estudio también indicaba que una de cada tres herramientas que permitía hacer deepfake, permitía ese uso para pornografía, llevando de media 25 minutos hacer un vídeo de estas características con simplemente una imagen clara del rostro de la persona.

deepfake video online

Fuente: https://www.securityhero.io

Aunque esto es lo que dicen los datos, también se han dado otros usos no maliciosos de esta tecnología. En 2019 se creó  Dalí Lives, una exposición de arte permanente en el Dalí Museum en San Petersburgo (Florida). En ella, un avatar tridimensional que emula la imagen y la voz de Dalí interactúa con los visitantes. Para que Dalí Lives simulara ser el Dalí original, es decir, para que pudiera interactuar con los visitantes independientemente del contexto de la conversación, hicieron falta 6.000 fotogramas de entrevistas suyas y 1.000 horas de aprendizaje automático.  Es un ejemplo de que la tecnología que permite hacer deepfakes no está destinada intrínsecamente a un uso malicioso, aunque haya sido el más habitual hasta nuestros días.

Deepfake indistinguible de la imagen real

¿Cuál es el peligro de los deepfakes?

Hemos visto que proliferan los vídeos falsos con usos maliciosos, siendo en su mayoría las víctimas las mujeres de la industria del entretenimiento, cuya imagen se usa ilegítimamente para generar vídeos explícitos. Por supuesto nadie está a salvo de este uso malicioso, si bien quienes realizan estas prácticas se fijan  sobre todo como objetivos mujeres con cierto grado de exposición pública.

Pero también está el uso de la tecnología de los deepfake por los ciberdelincuentes que buscan obtener ganancias ilegítimamente, o manipular la política o la actualidad.

Hasta la fecha se han detectado diversos usos maliciosos:

  • Los audios deepfake se han utilizado para suplantar la identidad de las personas y realizar vishing (una modalidad del phishing, técnica maliciosa para suplantar la identidad de una persona o entidad con el objetivo de obtener datos, dinero o una conducta determinada). Se ha suplantado la identidad de políticos con objetivos de voto, de CEOs de importantes compañías para simular la autorización para una operación fraudulenta (en 2019 una empresa británica de energía perdió así 243.000 dólares),  o de personas que son autoridades en su campo para estimular la compra de un determinado producto (desde criptomonedas a complementos alimenticios).
  • Los vídeos deepfake se han utilizado para reforzar con vídeos falsos de cargos de las empresas para autorizar operaciones millonarias fraudulentas (en 2024 una empresa de Hong Kong perdió 25 millones de dólares de este modo).
  • Vídeos o audios deepfake se han utilizado para atacar la reputación y el honor de las personas manipulando su imagen para que simular que hicieron declaraciones racistas o extremistas que nunca habían hecho.O bien para hacerles protagonizar escenas explícitas, lo que en el caso de los menores es doblemente grave.
  • La propagación de noticias falsas recibe un gran impulso si aparece un audio o vídeo deepfake que las avalan. Un vídeo deepfake de Barack Obama fue viralizado por el director Jordan Peele para alertar del peligro de esta tecnología.

 

Deepfake_peligro

¿Como detectar los deepfakes?

Si bien, como hemos dicho, la tecnología actual logra un 86,6% de consistencia y seguridad de la imagen, todavía hay algunos detalles que nos permiten identificar un deepfake:

  • Dado que un vídeo falso está construido por diversas imágenes, a veces puede fallar en la consistencia global, y aparecer elementos irreales. esto es especialmente notorio en la coherencia lumínica, a veces hay sombras que no deberían aparecer.
como detectar deepfakes 1

Fuente: https://www.dw.com/es/c%C3%B3mo-reconocer-un-deepfake/g-60268891

  • Hay detalles reveladores como el conjunto de la boca de la persona cuando habla, dado que la tecnología a veces no reproduce fielmente lengua, dientes o cavidad bucal.
  • Hay otros detalles en el rostro como los reflejos oculares, vello facial poco realista, piel demasiado lisa o arrugada, lunares ficticios o los pendientes pueden delatar un deepfake.
como detectar deepfakes 2

Los reflejos oculares son especialmente difíciles de simular para la IA

  • La frecuencia del parpadeo: normalmente en los deepfake el parpadeo se produce con mucha menos frecuencia que en un vídeo real.
  • Muchos vídeos deepfake están hechos simplemente encajando el rostro de una persona sobre un cuerpo que no es el suyo. Se puede ver la incongruencia entre la proporción del rostro y del cuerpo. Otras veces fallan al realizar los ajustes morfológicos entre rostro y figura (por ejemplo, bordes fuertes, incoherencias o zonas difuminadas en los límites de la “máscara”).

 

como detectar deepfakes 3

Fuente: https://www.vicomtech.org/es/

  • En cuanto a los audio, el tono monótono o carente de emoción con que se pronuncian las palabras pueden delatar un audio falso. También puede haber entonación o pausas inusuales.
  • Un audio auténtico suele tener ruido ambiental. Si el audio no ha sido grabado en estudio, pero suena perfectamente “limpio” o se corta de forma antinatural, puede ser indicativo de fake audio.
  • Las IA fallan a veces también en reproducir determinados sonidos. Por ejemplo, La combinación de consonantes fricativas con ruido de fondo puede ser difícil de reproducir, así que hay que prestar especial atención a ellas (en español serían la “f”, la “z”, la “y” no utilizada aisladamente, la “s” y la “j”). También puede haber siseos o brillos en las terminaciones de palabras.

Con esto, esperamos haberte dado algunas herramientas para hacer falso el enunciado de que los deepfakes generan imágenes indistinguibles de la realidad, si bien a medida que avance el tiempo tendremos que recurrir a herramientas tecnológicas, con la IA a la cabeza, para desmontar la falsedad de este tipo de imágenes.  Esperemos que, para entonces, usuarios e instituciones estén suficientemente concienciados.

¡SI TE GUSTÓ, COMPÁRTELO!
gextor-horizontal-rgb
Política de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible.

La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles...

Tienes toda la información sobre privacidad, derechos legales y cookies en nuestra pagina de privacidad y cookies