Actualidad
Qwen3-Max-Thinking rivaliza más que nunca con Gemini 3 Pro de Google. La clave está en lo que no se está contando
Hay días en los que da la sensación de que abrimos el móvil y el tablero vuelve a cambiar. Desde que ChatGPT irrumpió en noviembre de 2022, la carrera de la inteligencia artificial no ha dejado de acelerarse, y cada pocas semanas aparece un nuevo modelo que promete empujar un poco más el listón. A veces es una actualización, otras es un “flagship” con un apellido distinto, pero el patrón se repite: más potencia, más ambición y un relato cada vez más global. En ese contexto, China está ganando visibilidad de forma cada vez más evidente, y el nombre que ahora se cuela en la conversación es Qwen3-Max-Thinking, la propuesta de Alibaba con la que quiere jugar en la misma liga que las grandes referencias del momento.
A primera vista, Qwen3-Max-Thinking podría parecer otro nombre más en la lista interminable de modelos. Pero aquí hay un matiz relevante: lo presenta como su modelo estrella para tareas de razonamiento, y lo coloca explícitamente en la misma conversación que Gemini 3 Pro. La compañía asegura que ha escalado parámetros y ha invertido recursos de computación en refuerzo para mejorar varias dimensiones a la vez, desde conocimiento factual y razonamiento complejo hasta seguimiento de instrucciones, alineamiento con preferencias humanas y capacidades de agente. Dicho de otro modo: no está vendiendo solo potencia bruta, sino una forma de “pensar” mejor.
Lo que los benchmarks enseñan
Para aterrizar esa promesa, lo más útil es mirar la tabla comparativa que tenemos entre manos, con 19 benchmarks y un recuento directo: Gemini 3 Pro lidera en 11, Qwen3-Max-Thinking lo hace en 8. Este dato, por sí solo, no decide “quién es mejor”, pero sí ayuda a entender el tipo de pulso que plantea Alibaba cuando lo enfrenta a Google. Aquí merece la pena ser muy literal con lo que estamos midiendo: cada benchmark se centra en una habilidad concreta, desde conocimiento general hasta programación, uso de herramientas, seguimiento de instrucciones o análisis de contexto largo.


Si buscamos el punto donde Qwen3-Max-Thinking aprieta de verdad, hay uno que destaca por encima del resto: el seguimiento de instrucciones y la alineación con lo que los humanos prefieren en una conversación. En Arena-Hard v2, Qwen se impone con 90,2 frente a 81,7 de Gemini, que es la mayor diferencia a su favor en toda la tabla (8,5 puntos arriba). No es un matiz menor, porque este tipo de benchmark no premia solo el “acierto” técnico, sino el resultado final que una persona considera más útil al comparar respuestas a ciegas. A eso se suma IFBench, donde Qwen gana por la mínima (70,9 frente a 70,4). Traducido a la vida real: cuando el usuario no formula una instrucción perfecta, cuando el encargo tiene ambigüedad o exige interpretar intención, Qwen parece más orientado a clavar lo que se le pide y a hacerlo de una forma que se siente natural.


El otro terreno donde Qwen sostiene su narrativa de “modelo pensante” es el razonamiento matemático y la resolución lógica de problemas. En HMMT, tanto en la edición de noviembre de 2025 como en la de febrero de 2025, Qwen queda por delante (94,7 frente a 93,3 y 98,0 frente a 97,5, respectivamente). Y en IMOAnswerBench también gana, aunque por un margen mínimo: 83,9 frente a 83,3. Estos números no sugieren una paliza, pero sí un patrón consistente: cuando el problema exige varios pasos de lógica y no se resuelve solo con memoria o con una respuesta bonita, Qwen tiende a sacar ventaja.
A estas mejoras Alibaba les añade un componente que ya se está convirtiendo en el nuevo estándar: que el modelo no se quede en el texto, sino que pueda actuar. En su presentación, la compañía habla de un uso adaptativo de herramientas que permite recuperar información bajo demanda e invocar un intérprete de código. Y en los benchmarks también aparece esa orientación: en HLE (w/ tools), Qwen se impone con 49,8 frente a 45,8 de Gemini, lo que sugiere una mejor capacidad para desenvolverse cuando el modelo puede apoyarse en herramientas externas. Aquí el cambio de fondo es importante: ya no es solo “qué responde”, sino cómo investiga, cómo decide qué herramienta utilizar y cómo sintetiza lo que encuentra.
Hay una parte de esta comparación donde Gemini 3 Pro se siente más “ingeniero” que “conversador”, y es precisamente donde muchos usuarios profesionales ponen el foco. El modelo de Google gana en MMLU-Pro y MMLU-Redux, dos pruebas muy asociadas a conocimiento general, y también en GPQA y HLE, que en esta tabla aparecen como benchmarks exigentes de evaluación y preguntas complejas. En código, Gemini se impone en LiveCodeBench v6 y también en SWE Verified, lo que refuerza la idea de que, para tareas de programación, sigue siendo una apuesta muy sólida. A eso se suma AA-LCR, donde lidera en análisis de documentos largos.
La letra pequeña se esconde más allá del precio
Llegados a este punto, hay una pregunta que pesa tanto como cualquier benchmark: cuánto cuesta usar estos modelos en serio. En precios estándar por 1M de tokens, el contraste es claro. En Gemini 3 Pro, la entrada se mueve entre 2 y 4 dólares según el tramo de tokens de entrada, mientras que en Qwen3-Max el input figura en 1,2 dólares. Pero la diferencia más importante aparece en la salida, que es donde se paga el “pensamiento” del modelo: Gemini marca 12 a 18 dólares frente a los 6 dólares de Qwen. Traducido en proporciones, en uso estándar Gemini es aproximadamente 1,67 veces más caro en entrada y 2 veces en salida en el tramo habitual. Si el tramo supera los 200.000 tokens de entrada, la distancia sube a 3,33 veces en entrada y 3 veces en salida.
Gemini es aproximadamente 1,67 veces más caro en entrada y 2 veces en salida en el tramo habitual.
Y aquí llegamos a la parte que suele quedar fuera de la conversación cuando todo se centra en potencia y precio: qué pasa con tus datos cuando usas el modelo, y bajo qué reglas. En el caso de Qwen, hay que separar claramente dos mundos. Por un lado está el chat web de consumo, cuyos términos contemplan el uso y almacenamiento del “contenido de Usuario” para desarrollar y mejorar tecnologías de IA, incluyendo contenido desidentificado, y la posibilidad de procesarlo para nuevos productos y servicios. Además, al menos en nuestra revisión, no hemos encontrado un control claro o una opción visible que permita desactivar ese uso. Por otra parte, en el material revisado no aparece una referencia explícita a la UE ni al RGPD. En su política de privacidad, Alibaba advierte de transferencias internacionales de datos y señala que el servicio se presta generalmente desde Singapur y que los datos suelen procesarse en Singapur, Indonesia y o China.
Alibaba, eso sí, introduce matices importantes. El entorno profesional Alibaba Cloud asegura que no usa los datos para entrenamiento y que cifra la información con AES-256. También explica que el tratamiento de las conversaciones cambia según el tipo de uso: en llamadas directas por API no se guardan, mientras que en otros modos sí puede conservarse historial para mejorar la experiencia. Google introduce un matiz comparable: con Gemini API de pago, los prompts y respuestas no se usan para entrenar modelos y se tratan como confidenciales. A ese marco debemos señalar otro elemento de contexto: la Ley de Inteligencia Nacional china, en su artículo 7, establece que organizaciones y ciudadanos deben, conforme a la ley, “apoyar, asistir y cooperar” con el trabajo de inteligencia nacional, manteniendo además el secreto sobre lo conocido, una obligación legal que ha generado preocupaciones en la Unión Europea y en otras partes del mundo.
Imágenes | Xataka con Gemini 3 Pro | Captura de pantalla
ues de anuncios individuales.
Source link
Actualidad
Mañana regresa a Prime Video uno de los principales héroes de acción de la plataforma, aunque lo hace en un formato inesperado
Cuando Amazon cerró ‘Jack Ryan de Tom Clancy’ en julio de 2023, la cuarta y última temporada dejó un personaje con las cuentas saldadas. John Krasinski había pasado cinco años encarnando a un analista de la CIA perpetuamente desubicado en un mundo que le sobrepasaba. Pocos esperaban que volviera tan pronto al personaje y, sobre todo, que lo hiciera de esta forma: ‘Jack Ryan: Guerra encubierta’, la primera película derivada de la serie, llega este miércoles 20 de mayo a Prime Video.
Cuando Amazon estrenó la serie en 2018, el streaming aún era un fenómeno incipiente. Amazon necesitaba un producto de acción de alto presupuesto, y optó por este conocido analista de la CIA que ya había tenido cuatro intérpretes previos: Alec Baldwin, Harrison Ford, Ben Affleck y Chris Pine. Krasinski se quedó con el personaje durante toda la singladura televisiva, lo que permitió desarrollar al personaje con mayor detalle que sus anteriores encarnaciones. La serie fue un éxito: el 37% de los usuarios de Prime Video visionaron la serie durante el primer mes.
En 2024, Amazon MGM Studios anunció la producción de una película que continuaría la serie. La última vez que vimos a Ryan protagonizar un largometraje fue en ‘Jack Ryan: Operación Sombra’ en 2014, con Chris Pine. Aquí, a Krasinski le acompaña Sienna Miller como agente del MI6. La trama sigue a Ryan, retirado de la acción pero arrastrado de vuelta cuando descubre una unidad de operaciones clandestinas corrupta conocida como Proyecto Starling.
La película llega en un momento peculiar para Prime Video. La plataforma ha construido en los últimos años un ecosistema de acción muy sólido, con series como ‘Fallout’, ‘The Boys’ y, sobre todo, ‘Reacher’, epítome de ese subgénero de thrillers y acción “para padres” al que también pertenece Jack Ryan. La tercera temporada de ‘Reacher’ acumuló 54,6 millones de espectadores globales en sus primeras dos semanas. No es de extrañar que Amazon ya haya sugerido que ‘Guerra encubierta’ no es un final, sino un nuevo capítulo.
ues de anuncios individuales.
Source link
Actualidad
La misión conjunta entre Europa y China ya está en el espacio. Lo verdaderamente importante llega ahora
Por fin, a pesar del aplazamiento del pasado mes de abril, SMILE se ha lanzado con éxito. La misión que une a China y Europa para estudiar cómo interaccionan los vientos solares con la magnetosfera terrestre partió del Puerto Espacial de Kurú, en la Guayana Francesa, a las 03:52 GMT (05:52, hora peninsular española). Por delante le quedan al menos 3 años de trabajo, pero antes de empezar con su labor deberá dar algunos pasos previos.
Viaje a la órbita final. Durante los primeros 25 días de la misión, SMILE deberá encender sus motores 11 veces. Esto le va a permitir alargar gradualmente su órbita alrededor de los polos terrestres, hasta alcanzar los 121.000 km sobre el Polo Norte y los 5.000 km sobre el Polo Sur. Una vez en su órbita final, alrededor del 13 de junio, llegará el momento de poner a punto todos sus instrumentos.
El despliegue final. Remotamente, desde Tierra, los ingenieros de la misión comprobarán que todos los instrumentos de SMILE funcionan adecuadamente. Para eso, algunos deben cambiar su conformación. Concretamente, será necesario desplegar el brazo del magnetómetro y abrir el obturador de la cámara de rayos X y la tapa de la cámara ultravioleta. Cada uno de estos puntos es esencial para el buen desarrollo de la misión.
Las primeras imágenes. Una vez comprobados los experimentos, SMILE comenzará con su trabajo. Las primeras imágenes se enviarán a la Tierra para su análisis tres meses después.
La misión. SMILE estudiará la interacción de la actividad solar con el escudo que utiliza la Tierra para protegerse de ella. Aunque otras misiones han realizado tareas similares, será la primera vez que se tomen imágenes globales de dicha interacción, tanto en rayos X como en ultravioleta.
Esto nos aportará un conocimiento mejor que el actual sobre las tormentas solares y cómo afectan a nuestro planeta. Y es que no solo nos dibujan auroras preciosas en el cielo. También pueden afectar a las telecomunicaciones, a veces de forma preocupante. Es importante entenderlas y saber predecir en la medida de lo posible los efectos perjudiciales que podrían provocar.
Al menos tres años. La duración nominal de la misión será de 3 años. Esto significa que está diseñada para alcanzar sus objetivos principales en este tiempo. La inversión económica de las agencias espaciales europea y china se ha centrado en garantizar esta duración. Sin embargo, eso no quiere decir que dentro de tres años se vaya a desorbitar la nave o que se vayan a apagar todos sus instrumentos. Si sigue funcionando adecuadamente, se podría alargar mucho su vida útil.
El caso de Cluster. Cluster fue una misión de la ESA cuyo objetivo era también medir el entorno magnético de la Tierra. En cierto modo, se podría considerar una predecesora de SMILE. Su lanzamiento se produjo en el año 2000 y permaneció activa hasta 2024. Sin embargo, su duración nominal inicialmente era de 2 años. Una vez llegada la fecha de jubilación, se comprobó que Cluster estaba totalmente en forma, por lo que se decidió invertir en ella durante mucho más tiempo.
Quizás pase algo parecido con SMILE. De momento, habrá que ir paso a paso. Para empezar, debe llegar a su órbita operativa. Una vez allí, empieza la magia. O mejor dicho: la ciencia.
Imagen | ESA
ues de anuncios individuales.
Source link
Actualidad
China acaba de darles una misión mucho más ambiciosa
Cada vez que le pedimos algo a una IA, la escena parece casi invisible: escribimos una frase, recibimos una respuesta y seguimos adelante. Pero detrás de esa aparente ligereza hay edificios llenos de servidores, sistemas de refrigeración funcionando sin descanso y una demanda eléctrica que no deja de crecer. La nube, por mucho que la llamemos nube, tiene suelo, cables, calor y consumo. Y precisamente por eso empieza a cobrar sentido una idea que hace no tanto sonaba a experimento extraño: sacar parte de esa infraestructura de tierra firme y llevarla al mar.
China ya lo está llevando al terreno comercial. MERICS señala que el país ha presentado el primer centro de datos submarino comercial en Hainan y un módulo alimentado por energía eólica marina en Shanghái, dos movimientos que apuntan en una misma dirección: comprobar si esta arquitectura puede dejar de ser una rareza técnica y convertirse en una pieza aprovechable dentro de su despliegue digital. La novedad no está solo en sumergir servidores, sino en plantearlos como una posible respuesta a tres tensiones que ya pesan sobre la infraestructura de la IA: energía, refrigeración y suelo.
Hainan es la primera pieza de ese salto. Las pruebas piloto del centro de datos submarino de Hainan empezaron en 2023, primero con servicios de almacenamiento para el puerto de libre comercio de la isla y operadores de telecomunicaciones, antes de extenderse a empresas cloud y de IA. El proyecto no juega en la liga de los grandes centros de datos terrestres, pero sí tiene una escala suficiente para dejar de ser una simple maqueta: cada cabina está situada a 35 metros bajo el agua, cuenta con 24 racks y puede albergar hasta 500 servidores. Su valor está precisamente ahí: demostrar que China está intentando convertir una idea experimental en una infraestructura comercial real.
Shanghái como escaparate energético. Si Hainan representa el salto comercial, Shanghái añade la pieza que hace que la historia sea más ambiciosa: la integración directa con energía eólica marina. Este proyecto está frente a Lingang, donde CGTN sitúa una plataforma submarina ya operativa y conectada directamente a un parque eólico marino cercano. La inversión total prevista es de 1.600 millones de yuanes, unos 235 millones de dólares según esa fuente, y la instalación parte de una fase piloto de 2,3 MW, mientras que el proyecto completo está previsto que alcance los 24 MW.
Refrigerar sin pelear contra el entorno. Esa es la promesa técnica que explica buena parte del interés por estos centros de datos submarinos. El medio estatal chino recuerda que las instalaciones terrestres pueden dedicar hasta el 40% de su electricidad a refrigeración, un problema especialmente visible cuando hablamos de racks cada vez más densos. Bajo el mar, la idea cambia: aprovechar el agua como disipador natural de calor. En Shanghái, por ejemplo, la temperatura media del mar ronda los 15 grados Celsius.
La otra mitad de la ecuación está en la energía. El centro de Shanghái está conectado mediante un cable compuesto fotoeléctrico a un parque eólico marino de 200 MW, con más de 50 turbinas, y más del 95% de su electricidad procede de energía renovable. Si el proyecto alcanza su escala completa, se calcula que podría ahorrar 61 millones de kWh al año y reducir de forma notable sus emisiones de carbono.
También hay desafíos. MERICS advierte de que estos centros de datos plantean retos importantes: sellar los módulos, lidiar con la corrosión del agua marina, operar en un entorno de alta presión y asumir que el mantenimiento puede exigir sacar módulos enteros a la superficie. Esto no es ningún secreto. Acceder al hardware sumergido en caso de un fallo es uno de los puntos más sensibles.
Microsoft ya había probado el camino. El antecedente más conocido es Project Natick, una iniciativa con la que Microsoft sumergió un centro de datos frente a las islas Orcadas, en Escocia, y lo recuperó en 2020 tras dos años de funcionamiento bajo el agua. La prueba sirvió para demostrar que la idea podía funcionar técnicamente, pero no terminó convirtiéndose en una línea comercial.
La lectura no es una solución mágica. Como podemos ver, China está probando otra forma de repartir las piezas del problema. Hainan muestra el intento de llevar los centros de datos submarinos al terreno comercial; Shanghái añade una ambición más amplia, conectarlos con energía eólica marina y orientarlos hacia cargas cada vez más exigentes. Los centros de datos bajo el mar parecían una rareza tecnológica. Ahora, al menos en China, empiezan a parecer una apuesta industrial con una misión mucho más ambiciosa.
Imágenes | Shanghai Hailanyun Technology
ues de anuncios individuales.
Source link
-
Deportes2 días agoMundial 2026: Excluye FIFA a árbitro neerlandés investigado por presunto acoso sexual
-
Actualidad2 días ago“Su energía no es normal”: BTS “regaña” a las Army por la falta de entusiasmo en el primer concierto de su gira en EU
-
Deportes2 días agoMundial 2026: Critica Julian Nagelsmann el alto costo de los boletos
-
Musica2 días agoMúsica: J Balvin desata la fiesta en la Arena VFG
-
Musica2 días ago
Conciertos: Reik celebra dos décadas de éxitos con show en la Arena Guadalajara
-
Actualidad2 días agoBarbara Streisand confirma que no asistirá a Cannes por un problema de salud
-
Musica1 día agoCorona Capital 2026 confirma a Gorillaz, The Strokes y Twenty One Pilots: Cartel completo y fechas
-
Actualidad2 días agohemos convertido el océano en un infierno acústico




