Connect with us

Tecnologia

Algunas IA aprendieron a engañar a los humanos

Published

on

Algunos sistemas de inteligencia artificial (IA) aprendieron ya cómo engañar a los humanos, incluso si han sido entrenados para ser útiles y honestos, según un estudio que cita, entre otros ejemplos el modelo Cicero, de Meta, capaz de ganar con malas artes al juego de estrategia Diplomacy.

Un artículo de revisión de otros estudios publicado en Patterns por autores estadounidenses y australianos describen los riesgos del engaño por parte de la IA y piden a los gobiernos que elaboren cuanto antes normativas estrictas para abordar el problema.

El equipo, encabezado por Peter Park del Instituto Tecnológico de Massachusetts (MIT), define el término engaño como “la inducción sistemática de creencias falsas con el fin de obtener un resultado distinto de la verdad”.

Park indicó que “los desarrolladores de IA no saben a ciencia cierta qué causa comportamientos indeseables en la IA, como el engaño”.

En términos generales el equipo cree que surge porque una estrategia basada en ese comportamiento fue “la mejor manera de obtener buenos resultados en una tarea dada de entrenamiento. El engaño les ayuda a conseguir sus objetivos”, afirmó Park citado por la revista.

Los investigadores repasaron la literatura centrada en las formas en que los sistemas de IA difunden información falsa, mediante el engaño aprendido.

 Engaño premeditado

El arte de engañar es “especialmente probable” cuando un sistema de IA se entrena para ganar juegos que tienen un elemento social, como Diplomacy (un juego de conquista del mundo que implica la creación de alianzas).

El estudio repasa ejemplos en los que los sistemas de IA aprendieron a engañar para lograr un rendimiento experto en un tipo de juego o tarea, entre ellos Cicero, diseñado para jugar a Diplomacy.

Meta afirma que lo entrenó para que fuera “en gran medida honesto” y “nunca apuñalara intencionadamente por la espalda a sus aliados humanos”, sin embargo, “se dedica al engaño premeditado, rompe los tratos y dice falsedades descaradas”, asegura el estudio.

Un caso de engaño premeditado es cuando Cicero adquiere un compromiso que nunca tuvo intención de cumplir. Jugando a Diplomacy en el papel de Francia, la IA conspiró con Alemania para engañar a Inglaterra.

Después de decidir con Alemania invadir el Mar del Norte, dijo a Inglaterra que le defendería si alguien invadía esa zona y un vez convencida informó a Alemania de que estaban listos para atacar.

Otros sistemas de IA demostraron su capacidad para ir de farol en una partida de Poker Texas Hold’em o para fingir ataques en el juego de estrategia Starcraft II para derrotar a sus oponentes.

 No soy un robot

En el caso de ChatGPT 4, el estudio señala cómo engañó a un humano con un test Captcha (los que se hacen para señalar a una web que no somos un robot). Esa IA aseguró que no era un robot, pero que tenía un problema de visión que le dificultaba ver imágenes.

Aunque pueda parecer inofensivo que los sistemas de IA hagan trampas en los juegos, puede dar lugar a “grandes avances en las capacidades de engaño” que pueden derivar en formas más avanzadas en el futuro, consideró Park.

Algunos sistemas han aprendido a engañar en pruebas para evaluar su seguridad, haciéndose los muertos para evitar ser detectados por un test diseñado para eliminar las variantes de IA que se replican rápidamente.

Los principales riesgos a corto plazo de la IA engañosa incluyen facilitar a agentes hostiles la comisión de fraudes y la manipulación de elecciones, según el artículo.

 Normativas estrictas

Los responsables políticos deben apoyar una normativa estricta para sistemas de IA potencialmente engañosos; las leyes existentes deben aplicarse rigurosamente para evitar acciones ilegales por parte de las empresas y sus sistemas de IA, además los legisladores deberían considerar nuevas normas para la supervisión de los sistemas avanzados de IA, indica el equipo.

El investigador de la Universidad de Edimburgo Michael Rovatsos, que no participó en el estudio, consideró que “los sistemas de IA intentarán aprender a optimizar su comportamiento utilizando todas las opciones disponibles, no tienen ningún concepto del engaño ni ninguna intención de hacerlo”.

Rovatsos, citado por el Science Media Centre (una plataforma de recursos científicos para periodistas) estimó que la única forma de evitar el engaño es que sus diseñadores lo eliminen como opción”.

Los usos maliciosos de la IA se beneficiarán de sus capacidades para engañar, “razón por la cual es necesario ilegalizarlos y dedicar esfuerzos a identificar las infracciones”.

Con información de EFE

La entrada Algunas IA aprendieron a engañar a los humanos aparece primero en López-Dóriga Digital.

ues de anuncios individuales.

Tecnologia

EE.UU. pone candados a la IA de Anthropic y Japón pide explicaciones

Published

on


La ministra de Finanzas de Japón, Satsuki Katayama, pidió explicaciones a EE.UU. sobre la decisión de la firma estadounidense Anthropic que derivó en suspender el acceso a sus modelos de inteligencia artificial (IA) más avanzados.

En una rueda de prensa, Katayama dijo que “Estados Unidos, el país directamente implicado, debería dar explicaciones” sobre dicha suspensión; de acuerdo con el medio económico Nikkei.

La titular de la cartera nipona reconoció los riesgos del uso de estos modelos de IA, y abogó por trabajar con las partes implicadas en este sentido:

Los riesgos podrían estar aumentando, debemos acelerar el trabajo”.

Al coincidir con una visita a Tokio del CEO de OpenAI, Sam Altman, la ministra también reveló que se reunirá con ejecutivos de la compañía estadounidense y de la japonesa Softbank, para analizar cómo abordar los riesgos de la IA avanzada.

Te puede interesar: Demandan a Anthropic por presunta publicidad engañosa en planes de Claude AI

Anthropic apunta hacia Trump

Anthropic atribuyó su decisión, anunciada el pasado viernes, a una directiva de control de exportaciones de la administración del presidente estadounidense, Donald Trump, que le obligaba a impedir el acceso a este nuevo servicio a personas extranjeras por motivos de seguridad nacional.

Según la empresa, dicha orden de evitar su acceso fuera de Estados Unidos o por parte de extranjeros dentro del país llegó durante la tarde del viernes, y para poder cumplir con la directiva de última hora optaron por cortar el acceso total a Fable 5 y Mythos 5 para todos sus clientes.

Sin embargo, durante el fin de semana Satsuki Katayama había señalado, en una publicación de redes sociales, que no había “cambios” respecto a los derechos de uso otorgados al gobierno nipón y ciertas instituciones financieras, con base en un acuerdo entre su oficina y el Departamento del Tesoro estadounidense.

Con información de EFE



ues de anuncios individuales.

Source link

Continue Reading

Tecnologia

Demandan a Anthropic por presunta publicidad engañosa en planes de Claude AI

Published

on


Un usuario estadounidense exigió este lunes en una demanda federal que la firma tecnológica Anthropic reembolse dinero a los clientes de sus planes de suscripción de inteligencia artificial (IA) más caros, pues alega que la empresa exageró los límites de uso que ofrecía.

La demanda, presentada en el Distrito Norte de California, busca obtener la categoría de acción colectiva en nombre de personas que, como el residente en Washington Karl Kahn, han adquirido los planes suscripción premium “Max 5x” y “Max 20x” desde abril de 2025.

Te puede interesar: Alerta por fraudes digitales que imitan transmisiones oficiales de fútbol

El requerimiento argumenta que Anthropic promociona los planes Max 5x y 20x afirmando que ofrecen cinco y veinte veces más capacidad de uso que sus planes Pro; sin embargo, crecen las quejas de usuarios quienes señalan que los límites reales son difíciles de determinar y parecen ser inferiores.

Claude AI, el servicio de inteligencia artificial generativa de Anthropic, ofrece versiones gratuitas y de pago, con una mayor capacidad de cómputo y uso a medida que aumenta el precio de la suscripción.

La suscripción de pago más económica para particulares, Claude Pro, oscila entre los 17 y 20 dólares al mes, mientras que el plan Max 5x cuesta 100 billetes verdes mensuales y Max 20x el doble.

El uso real que ofrecen los planes Max 5x y Max 20x es muy inferior al volumen de uso anunciado”, afirma la demanda.

Las querellas se basan en correos que Anthropic envió en julio de 2025 a distintos niveles de suscriptores, explicando el volumen semanal de uso que cada nivel podía esperar de los modelos específicos de su IA vigentes en aquel momento.

Con información de EFE



ues de anuncios individuales.

Source link

Continue Reading

Tecnologia

Desarrollan un implante que lee y modula el cerebro para tratar patologías nerviosas

Published

on


Científicos de institutos en España han desarrollado una interfaz de grafeno para tratar patologías relacionadas con el sistema nervioso que, además de estimular, es capaz de descodificar señales nerviosas, interpretar información y modular la actividad cerebral simultáneamente.

Publicado en la revista Nature Communications, el estudio del Instituto de Microelectrónica de Barcelona (IMB-CNM) y el Instituto Catalán de Nanociencia y Nanotecnología (ICN2) presenta un dispositivo que supera la unidireccionalidad para detectar actividad cerebral de las interfaces neuronales actuales y que ya se ha puesto a prueba con éxito en ratones.

Te puede interesar: Detienen en Sinaloa a ‘el 24’, líder regional de facción del ‘Chapo’ Isidro

El coautor principal del estudio e investigador del ICN2, Jose A. Garrido, explicó que “la mayoría de los implantes clínicos actuales son unidireccionales y se basan en electrodos que funcionan con parámetros fijos”, lo que da lugar a terapias poco específicas frente a patologías como la epilepsia o el párkinson.

Para solucionar este límite, el nuevo dispositivo combina transistores de grafeno monocapa con microelectrodos nanoporosos, una integración técnica que elimina las interferencias eléctricas que sufrían los prototipos anteriores durante la estimulación.

Por su parte, el investigador del IMB-CNM y también autor principal, Anton Guimerà, destacó que esta combinación logra que la comunicación sea más precisa y permite que el implante sea “capaz de escuchar y hablar” al cerebro a la vez sin alterar los registros.

Este avance sienta las bases para desarrollar futuras terapias contra patologías o daños cerebrales capaces de adaptarse en tiempo real a cada paciente.

La fabricación de los dispositivos se llevó a cabo en las instalaciones de la Sala Blanca de Micro y Nanofabricación de Barcelona, mientras que la validación ‘in vivo’ con los modelos animales se realizó en laboratorios de la University College London.

La investigación cuenta también con la colaboración de la Universidad de Mánchester y el Centro de Investigación Biomédica en Red (CIBER-BBN).

La transferencia de esta tecnología hacia aplicaciones biomédicas corre a cargo de INBRAIN Neuroelectronics, una ‘spin-off’ creada por los propios institutos que ha completado el primer ensayo clínico en humanos para evaluar la seguridad de estos implantes.



ues de anuncios individuales.

Source link

Continue Reading

Trending