La inteligencia artificial generativa o IA generativa es un tipo de sistema de inteligencia artificial (IA) capaz de generar texto, imágenes u otros medios en respuesta a comandos.[1][2] Los modelos de IA generativa aprenden los patrones y la estructura de sus datos de entrenamiento de entrada y luego generan nuevos datos que tienen características similares.[3][4]
En su origen, la IA generativa surgió con el propósito de simular los procesos de pensamiento humano. Hoy en día, IA generativa tiene aplicaciones potenciales en una amplia gama de industrias, que incluyen el arte, la escritura, el desarrollo de software, el diseño de productos, la atención médica, las finanzas, los juegos, el marketing y la moda.[7][8][9] La inversión en IA generativa aumentó a principios de la década de 2020, con grandes empresas como Microsoft, Google y Baidu, así como numerosas empresas más pequeñas que desarrollan modelos de IA generativa.[1][10][11]
La IA generativa persigue el desarrollo de la alfabetización y las competencias en IA por parte de la ciudadanía[12]. La UNESCO pretende alcanzar un enfoque centrado en el ser humano, basado en principios de inclusión y equidad, garantizando un «AI for all» en términos de innovación y conocimiento[13][14]. En este sentido, uno de los desafíos más importantes es garantizar que la IA sea diseñada y utilizada de manera ética y responsable
Sin embargo, también existen preocupaciones sobre el posible uso indebido de la IA generativa, como la creación de noticias falsas o deepfakes, que pueden usarse para engañar o manipular a las personas.[15][16]La IA toma información de diferentes fuentes y las une, no se valida la cientificidad de la información tomada. Permite interactuar de forma diferente con un buscador web o con un manual escolar, hay que tener en cuenta que la IA es una fuente más de información generada en un ecosistema virtual.[17]En este mismo sentido, en septiembre de 2023, la UNESCO ha emitido una llamada urgente a los gobiernos de todo el mundo para que regulen de manera eficaz la IA generativa en el ámbito educativo.[18]
En 2014, avances como el autocodificador variacional y la red generativa adversativa produjeron las primeras redes neuronales profundas prácticas capaces de aprender modelos generativos, en lugar de discriminativos, de datos complejos como imágenes. Estos modelos generativos profundos fueron los primeros capaces de generar no solo etiquetas de clase para imágenes, sino también imágenes completas.[20]
En enero de 2023, Futurism.com publicó la historia de que CNET había estado usando una herramienta de IA interna no revelada para escribir al menos 77 de sus historias; después de que se conoció la noticia, CNET publicó correcciones a 41 de las historias.[23]
En marzo de 2023, se lanzó GPT-4. Un equipo de Microsoft Research argumentó que «podría verse razonablemente como una versión temprana (pero aún incompleta) de un sistema de inteligencia artificial fuerte (IAF)».[24]
En abril de 2023, el tabloide alemán Die Aktuelle publicó una entrevista falsa generada por IA con el solitario expiloto de carreras Michael Schumacher. La historia incluía dos posibles revelaciones: la portada incluía la línea «engañosamente real», y dentro de la revista reconocía al final de la entrevista que la entrevista fue generada por IA. El editor en jefe fue despedido poco después en medio de la controversia.[25]
Modalidades
Un sistema generativo de IA se construye aplicando aprendizaje automáticono supervisado o autosupervisado a un conjunto de datos. Las capacidades de un sistema de IA generativa dependen de la modalidad o el tipo de conjunto de datos utilizado.
La IA generativa puede ser unimodal o multimodal; los sistemas unimodales toman solo un tipo de entrada, mientras que los sistemas multimodales pueden tomar más de un tipo de entrada.[26] Por ejemplo, una versión de GPT-4 de OpenAI acepta entradas de texto e imágenes.[27]
Música: los sistemas de IA generativa como MusicLM se pueden entrenar en las formas de onda de audio de la música grabada junto con anotaciones de texto, para generar nuevas muestras musicales basadas en descripciones de texto como "una melodía de violín relajante respaldada por un riff de guitarra distorsionado".
Video: la IA generativa entrenada en video anotado puede generar videoclips coherentes temporalmente. Los ejemplos incluyen Gen1 de RunwayML y Make-A-Video de Meta Platforms .
Multimodal: se puede construir un sistema de IA generativa a partir de múltiples modelos generativos, o un modelo entrenado en múltiples tipos de datos. Por ejemplo, una versión de GPT-4 de OpenAI acepta entradas de texto e imágenes.[29]
Elaboración de órdenes para la IA generativa.
En el contexto de la IA un Prompts son instrucciones elaboradas por los usuarios que le brindamos a un sistema para que este genere una respuesta. Estos prompts son una forma de guiar el comportamiento del modelo de la IA para obtener el resultado deseado.[30] Estas órdenes están destinadas para máquinas, y ellas responden automáticamente a pedidos simples y complejos. Pueden ser elaborados tanto como textos o como audios.[31]
Uso de los verbos para la creación de Prompts
Al momento de redactar consignas es muy importante que le prestemos atención a los verbos, ya que si queremos que la IA nos devuelva una respuesta útil debemos tener en cuenta la utilización de dichos verbos. Puede pasar estar usando un verbo cuando en realidad debería ir otro, por ello debemos tener en cuenta cuáles están dentro de un mismo conjunto.[30] A continuación algunos ejemplos.[32]
Categorías y
Procesos Cognitivos
Nombres Alternativos
Definiciones
Reconocer
Identificar
Confirmar que la información que se presenta explícitamente ya se encuentra en la memoria a largo plazo.
Rememorar
Reproducir
Extraer información de la memoria a largo plazo a partir de algún estímulo.
Interpretar
Aclarar, parafrasear,
representar, traducir
Cambiar de una forma de representación a otra.
Ejemplificar
Ilustrar
Proponer ejemplos que ilustren y muestren una idea o principio.
Clasificar
Categorizar, agrupar
Determinar que algo pertenece a una categoría.
Resumir
Abstraer, generalizar
Extraer las ideas o los datos principales de una información.
Inferirir
Concluir, extrapolar,
predecir
Sacar conclusiones a partir de la información presentada.
Comparar
Contrastar, mapear, relacionar
Detectar correspondencias entre dos ideas, objetos o acontecimientos
El desarrollo de la IA generativa ha generado preocupación por parte de gobiernos, empresas e individuos, lo que ha dado lugar a protestas, acciones legales, llamados a suspender los experimentos de IA y acciones por parte de múltiples gobiernos. En una sesión informativa del Consejo de Seguridad de las Naciones Unidas en julio de 2023, el Secretario GeneralAntónio Guterres afirmó que "la IA generativa tiene un enorme potencial para el bien y el mal a escala", que la IA puede "impulsar el desarrollo global" y contribuir entre 10 y 15 billones de dólares al crecimiento global para 2030, pero que su uso malicioso "podría causar niveles horribles de muerte y destrucción, traumas generalizados y daños psicológicos a una escala inimaginable".[33]
Desde los primeros días del desarrollo de la IA, ha habido argumentos planteados por Joseph Weizenbaum, creador de ELIZA, y otros, sobre si las tareas que pueden realizar las computadoras en realidad deberían ser realizadas por ellas, dada la diferencia entre computadoras y humanos, así como entre los cálculos cuantitativos y los juicios cualitativos basados en valores.[34] En abril de 2023, se informó que la IA de generación de imágenes había provocado la pérdida del 70% de los puestos de trabajo de ilustradores de videojuegos en China.[35][36] En julio de 2023, los avances en la IA generativa contribuyeron a los 2023 conflictos laborales de Hollywood. Fran Drescher, presidenta del Sindicato de Actores de Cine, declaró que "la inteligencia artificial representa una amenaza existencial para las profesiones creativas" durante la huelga SAG-AFTRA de 2023.[37]
La capacidad de la IA generativa para crear contenido falso realista se ha explotado en numerosos tipos de delitos cibernéticos, incluidas las estafas de phishing.[46] Se han utilizado vídeos y audio deepfake para crear desinformación y fraude. Shuman Ghosemajumder, exjefe de fraude de Google, predijo que aunque los vídeos deepfake causaron revuelo en los medios de comunicación, pronto se volverán comunes y, como resultado, más peligrosos.[47] Los ciberdelincuentes han creado grandes modelos de lenguaje centrados en el fraude, incluidos WormGPT y FraudGPT.[48]
Investigaciones recientes realizadas en 2023 han revelado que la IA generativa tiene debilidades que pueden ser manipuladas por delincuentes para extraer información dañina sin pasar por salvaguardas éticas. El estudio presenta ejemplos de ataques realizados en ChatGPT, incluidos Jailbreaks y psicología inversa. Además, personas malintencionadas pueden utilizar ChatGPT para ataques de ingeniería social y ataques de phishing, lo que revela la naturaleza dañina de estas tecnologías.[49]
En la Unión Europea, la propuesta de Ley de Inteligencia Artificial incluye requisitos para divulgar material protegido por derechos de autor utilizado para entrenar sistemas generativos de IA y etiquetar cualquier resultado generado por IA como tal.[50]
En Estados Unidos, un grupo de empresas, incluidas OpenAI, Alphabet y Meta, firmaron un acuerdo voluntario con la Casa Blanca en julio de 2023 para usar marcas de agua en el contenido generado por IA.[51]
En China, las Medidas Provisionales para la Gestión de Servicios de IA Generativa introducidas por la Administración del Ciberespacio de China regulan cualquier IA generativa de cara al público. Incluye requisitos para usar marcas de agua en las imágenes o videos generados, regulaciones sobre datos de entrenamiento y calidad de etiquetas, restricciones a la recopilación de datos personales y una directriz de que la IA generativa debe "adherirse a los valores fundamentales socialistas". [52][53]
↑Andrej Karpathy; Pieter Abbeel; Greg Brockman; Peter Chen; Vicki Cheung; Yan Duan; Ian Goodfellow; Durk Kingma; Jonathan Ho; Rein Houthooft; Tim Salimans; John Schulman; Ilya Sutskever; Wojciech Zaremba (16 de junio de 2016). «Generative models». OpenAI.
↑Bommasani, R; Hudson, DA; Adeli, E; Altman, R; Arora, S; von Arx, S; Bernstein, MS; Bohg, J et ál. (2021-08-16). «On the opportunities and risks of foundation models». arXiv:2108.07258 [cs.LG].
↑Collier, Kevin (14 de julio de 2023). «Actors vs. AI: Strike brings focus to emerging use of advanced tech». NBC News. «SAG-AFTRA has joined the Writer's [sic] Guild of America in demanding a contract that explicitly demands AI regulations to protect writers and the works they create. ... The future of generative artificial intelligence in Hollywood — and how it can be used to replace labor — has become a crucial sticking point for actors going on strike. In a news conference Thursday, Fran Drescher, president of the Screen Actors Guild-American Federation of Television and Radio Artists (more commonly known as SAG-AFTRA), declared that 'artificial intelligence poses an existential threat to creative professions, and all actors and performers deserve contract language that protects them from having their identity and talent exploited without consent and pay.'».