Connect with us

Actualidad

Las IA se están volviendo muy listas. Y crear pruebas para ponerlas en aprietos está siendo cada vez más difícil

Published

on


El modelo o3 de OpenAI es demasiado listo. Al menos, para las pruebas y los benchmarks diseñados hasta ahora. En programación, matemáticas y razonamiento llega hasta donde ningún otro modelo de IA había llegado, y eso ha demostrado que necesitamos nuevas formas de poner a prueba la IA. Y en eso están los expertos.

Los exámenes normales se han quedado cortos. A principios de 2023 ChatGPT ya era capaz de superar los exámenes de derecho y los de un MBA, aunque con un aprobado raspado. Como señalan en Time, casi dos años después el avance de los modelos es tan enorme que esas pruebas diseñadas para humanos se han quedado cortas, pero también lo han hecho los benchmarks que hasta ahora servían para evaluar sus prestaciones. Era algo que ya se veía venir.

Una evolución vertiginosa. En 2010 la profesora de Stanford Fei-Fei Li desarrolló un benchmark para clasificar imágenes llamado ImageNet Large Scale Visual Recognition Challenge. Cinco años después un sistema de visión artificial logró superar el reto. En 2017 DeepMind logró con AlphaGo aplastar al mejor jugador del mundo de Go y nos recordó el hito de DeepBlue. Parecía que retos como esos iban a tardar más en ser superados por las máquinas, pero la evolución de los sistemas de IA ha sido frenética, y ahora los modernos modelos de IA están mejorando de forma aún más vertiginosa.

FrontierMath. Epoch AI, una ONG de investigación, ha acabado desarrollando por ejemplo un nuevo conjunto de pruebas matemáticas llamado FrontierMath. Hasta hace muy poco, los modelos de IA como GPT-4 o Claude no pasaban del 2% en este test, un comportamiento que demostraba que aún había muchísimo margen de mejora. El lanzamiento de o3 ha cambiado las cosas: de repente ha logrado un rendimiento del 25,2%, algo que el director de Epoch AI, Jaime Sevilla, describía como “mucho mejor de lo que nuestro equipo esperaba tan poco después de lanzarlo”.

Frontiermath Vs Other Benchmarks
Frontiermath Vs Other Benchmarks

Los modelos de IA superaban con bastante solvencia los benchmarks matemáticos anteriores. Con FrontierMath la cosa cambia. Al menos, de momento, porque o3 ya logra una puntuación del 25,2% (no mostrado este diagrama, donde los modelos solo lograban llegar al 2%). Fuente: Epoch AI.

Pruebas más exigentes. Este benchmark consiste en unos 300 problemas matemáticos de distinto nivel. Han sido diseñados por un equipo de más de 60 matemáticos entre los cuales está Terence Tao, ganador de la medalla Fields. Aunque hay algunos problemas más asequibles, el 25% de ellos están calificados como especialmente complejos. De hecho, solo los mejores expertos podrían resolverlos, y tardarían incluso días en hacerlo.

Humanity’s Last Exam. Otra de las pruebas recientes es Humanity’s Last Exam, un examen con entre 20 y 50 veces más preguntas que FrontierMath, pero que cubren muchas más disciplinas. Los problemas a resolver han sido recolectados de la comunidad académica, y para ser incluida, una pregunta debe haber sido no respondida correctamente por los modelos actuales. Se espera que dicha prueba se lance a principios de 2025.

La paradoja de Moravec. Pero tan interesante o más que esas pruebas avanzadas son las que juegan con el concepto que maneja la paradoja de Moravec. Cosas que son triviales para los seres humanos pero que las máquinas no logran resolver.

ARC-AGI. Es justo lo que hace el benchmark ARC-AGI, creada por el investigador François Chollet en 2019 y que en su última evolución plantea pruebas con las que la mayoría de modelos lo pasan realmente mal. O1 mini solo lograba un 7,8% de puntuación, pero de nuevo o3 ha sorprendido a todos y alcanza un 87,5% en su modo más avanzado (muy caro) y un 75,7% en el modo de bajo consumo, un hito realmente excepcional. Por supuesto, los creadores de ARC-AGI ya trabajan en una nueva versión mucho más exigente que creen que los modelos de IA tardarán mucho en superar.

Imagen | Crymedy7 con Midjourney

En Xataka | OpenAI está quemando el dinero como si no hubiera mañana. La pregunta es cuánto podrá aguantar así

ues de anuncios individuales.

Source link

Continue Reading
Advertisement

Actualidad

por primera vez en muchos años, La 1 sube de puesto en el ranking de audiencias

Published

on


Como cada año, la consultora Barlovento Comunicación elabora un informe de las audiencias del año, con las subidas y bajadas, las sorpresas y los triunfadores (y perdedores) de los últimos doce meses. Y el interés sabemos donde se concentra: en los últimos tres meses, donde el choque entre ‘La revuelta’ y ‘El hormiguero’ se ha convertido en clave para un giro, quizás permanente, en el ranking de cadenas más vistas.

Antena 3 gana. Un año más Antena 3 es la cadena más vista por tercer año consecutivo, con un 12,6% de share, cifra que la coloca por delante de La 1 (10,5) y Telecinco (9,9). 10 de los 12 meses ha sido la más vista, y programas como ‘Cocina abierta de Karlos Arguiñano’, ‘La ruleta de la suerte’, ‘Pasapalabra’, ‘El Hormiguero‘ o las noticias han sido líderes. También lo hace por franjas, quedando fuera de su dominio solo el late night y la madrugada. Con todo, es la cadena que más audiencia ha perdido, un 0,7% menos de share con respecto a 2023, pero eso no le impide liderar igualmente.

La 1 toma la delantera. Mucho más agresivo es el cambio de tornas con La 1, que es la que más sube en el ranking, pasando de ser la tercera cadena más vista a ser la segunda. Ocho décimas ha crecido gracias a la Eurocopa y los Juegos Olímpicos en junio y julio: fue en esos meses la cadena más vista, después de nada menos que 12 años sin liderar un mes. Y a esto se suma, por supuesto, ‘La Revuelta‘, que sin apenas rascar audiencia de ‘El Hormiguero’ (lo que explica, también, que Antena 3 siga liderando: Motos no ha perdido audiencia por mucho que haya un nuevo actor en la parrilla), sí que suma espectadores de forma consistente para la pública.

Gana ‘La revuelta’. En el choque entre ambos programas, siempre según las cuentas de Barlovento a partir de los datos de Kantar Media, la distancia entre el programa de Motos y el de Broncano es absolutamente mínima, pero suficiente para declarar vencedor, entre ellos dos, al de La 1. En el siguiente cuadro se pueden ver las diferencias de cifras entre ambos programas:

El hormiguero

la revuelta

Espectadores únicos diarios

4,8 millones

4,9 millones

cuota

15,6%

15,7%

audiencia media

2.036.000 espectadores

2.054.000 espectadores

espectadores únicos totales

26,7 millones

28,9 millones

Como se puede ver, las diferencias son escasísimas, pero no debemos olvidar el dato que da el triunfo a Antena 3 sobre La 1: ‘La Revuelta’ solo existe desde septiembre. Los ocho primeros meses del año Motos reinó a gran distancia de sus rivales, acumulando cifras que la suben al trono de la cadena más vista del año.

Telecinco, en caída libre. Mientras tanto, la cadena de Mediaset frena su caída del año pasado, cuando perdió 1,9 puntos de share, pero sigue descendiendo, con medio punto menos. Sus únicos formatos de éxito son los realities ‘Gran Hermano’ y ‘Supervivientes’. Y poco más: ‘TardeAR’ y ‘El diario de Jorge’ no terminan de consolidarse, y la cadena cuenta además con un par de sonados fracasos este año, ‘Factor X’ y ‘Babylon Show‘.

Cada vez menos televisión tradicional. Este ha sido el año de menor consumo televisivo tradicional desde que se tienen registros (1992), con unos diez minutos menos por persona y día que en 2023. Sin duda, el dato más relevante es que la edad promedio de los espectadores es de 58 años, la más alta desde que se calcula este dato (1996). Es decir, podemos hablar de audiencias de la tele tradicional sin parar, pero cada vez está más claro que estamos ante un consumo residual frente a otras formas de entretenimiento. Y cada vez más y con menos relevo generacional.

Cabecera | RTVE

En Xataka | El choque de Motos y Broncano hace honor a una larga costumbre televisiva: la de las guerras de presentadores

ues de anuncios individuales.

Source link

Continue Reading

Actualidad

Dan de alta a Raphael tras estar 10 días internado en un hospital en Madrid por un linfoma cerebral

Published

on


Escrito en ENTRETENIMIENTO el

EFE.- El cantante español Raphael recibió este viernes el alta hospitalaria tras 10 días ingresado por un linfoma cerebral primario, del que ya está siendo tratado, según el parte médico del Hospital 12 de Octubre de Madrid.

El cantante de 81 años abandonó el centro hospitalario en el asiento del copiloto de un vehículo, sonriendo a la prensa que le esperaba a las puertas y sin detenerse ni bajar la ventanilla para evitar la fuerte presencia de medios de comunicación.

“Se encuentra muy bien”, indicó su hijo Jacobo, que fue quien explicó que el artista no se detendría ante la prensa.

Su ingreso se produjo el pasado 18 de diciembre, después de que se sintiera indispuesto —presentaba dificultades en el habla— en la grabación del programa “La Revuelta” de Televisión Española.

Descartado el ictus tras los primeros análisis, el artista estuvo ingresado hasta hoy en el Hospital Universitario 12 de Octubre, el mismo en el que en 2003 se le practicó con éxito un trasplante de hígado y donde permaneció ingresado hasta este viernes.

Según el parte médico trasladado este jueves a la prensa, los análisis y pruebas que se le realizaron en este tiempo detectaron que Raphael sufre un linfoma cerebral primario con dos nódulos cerebrales en el hemisferio izquierdo que “justifican los síntomas neurológicos que presentó hace unos días”.

En el parte médico se informaba además que el intérprete “Mi gran noche” ya ha comenzado tratamiento específico para esta patología, que continuará a partir de ahora de forma ambulatoria.

Por esta causa, se notificó la cancelación de los conciertos que tenía programados para los primeros meses de 2025 en Estados Unidos, República Dominicana, Costa Rica, Puerto Rico y México, como sucedió con los dos conciertos especiales que debería haber celebrado en Madrid los pasados 20 y 21 de diciembre.

ues de anuncios individuales.

Source link

Continue Reading

Actualidad

destruir las fábricas de TSMC en Taiwán si China invade la isla

Published

on


Elbridge Colby es una de las personas de confianza de Donald Trump. De hecho, lo ha elegido para ejercer como Subsecretario de Defensa para Políticas cuando este empresario y político regrese a la Casa Blanca el próximo 20 de enero. Colby fue el Subsecretario Adjunto de Defensa de 2017 a 2018, durante el primer mandato de Trump, y en junio de 2018 fue nombrado director del Programa de Defensa del CNAS (Centro para una Nueva Seguridad Americana).

La trayectoria profesional de Elbridge Colby durante los últimos años ha estado estrechamente vinculada a la defensa de EEUU, por lo que resulta previsible que Donald Trump haya pensado en él para ejercer como Subsecretario de Defensa. Y con toda probabilidad en esta elección ha influido, quizá decisivamente, la estrategia que defiende Colby desde hace ya varios años para lidiar con la posibilidad de que el Gobierno chino decida invadir Taiwán.

Colby lidera la línea dura con China

Este tuit publicado por Elbridge Colby en mayo de 2023 refleja con claridad cuál es la estrategia que defiende con el propósito de disuadir al Gobierno de Xi Jinping: “Seríamos unos locos si permitimos que TSMC caiga intacta en manos de China”. A priori podríamos aceptar que está exagerando. Al fin y al cabo esta compañía es taiwanesa, no estadounidense. Sin embargo, la realidad es inapelable. Según Gina Raimondo, la Secretaria de Comercio, “EEUU compra el 92% de sus chips de vanguardia a TSMC en Taiwán”.

“Deshabilitar o destruir TSMC es lo mínimo que debemos hacer si China toma Taiwán”

El tuit de Colby que he mencionado en el párrafo anterior insinúa que EEUU debería hacer todo lo que esté en su mano para evitar que China se apropie de las plantas que tiene TSMC en Taiwán. No obstante, durante los últimos dos años Colby no se ha conformado con insinuar esta idea; ha declarado públicamente que si China invade Taiwán lo que debería hacer EEUU es destruir las fábricas de TSMC y no permitir que esta iniciativa recaiga en el Gobierno taiwanés.

“Deshabilitar o destruir TSMC es lo mínimo que debemos hacer si China toma Taiwán. ¿Seríamos tan insensatos como para permitir que la principal empresa de semiconductores del mundo caiga intacta en las manos de una República Popular China agresiva”, declaró Colby a principios de 2024. Este es el meollo del asunto. La dependencia de EEUU de los circuitos integrados que produce TSMC en Taiwán es evidente si nos ceñimos a la cifra que maneja Raimondo, pero hay algo más que no debemos pasar por alto.

Actualmente TSMC tiene las tecnologías de integración utilizadas para fabricar semiconductores de vanguardia más avanzadas del planeta. Este es el motivo por el que en su cartera de clientes se codean NVIDIA, AMD, Apple, Qualcomm, e, incluso, Intel, entre muchas otras empresas estadounidenses.

Además, sus plantas más avanzadas ahora mismo son las que tiene en Taiwán (presumiblemente las próximas de EEUU y Japón también estarán equipadas a la última). En ellas abundan los equipos de litografía fabricados por la compañía neerlandesa ASML y la japonesa Tokyo Electron, entre otras máquinas. Esta es, en definitiva, la tecnología de vanguardia que EEUU quiere colocar fuera del alcance de China a cualquier precio.

Imagen | TSMC

Más información | DCD

En Xataka | Joe Biden golpeará a China otra vez antes de irse. Su objetivo son los chips de los coches y los electrodomésticos

ues de anuncios individuales.

Source link

Continue Reading

Trending