Escrito en ENTRETENIMIENTO el
Actualidad
qué es, cómo funciona y qué opciones tiene esta inteligencia artificial
Vamos a explicarte qué es DeepSeek, el chat de inteligencia artificial creado por la empresa del mismo nombre. Se trata de una IA que a principios del 2025 está llamando mucho la atención, y que incluso en las tiendas móviles de aplicaciones ya conseguido superar a ChatGPT. Y no solo eso, sino también en pruebas de rendimiento y razonamiento con su modelo R1.
En los últimos meses hemos hablado bastante sobre esta empresa y sus modelos, sobre todo porque son de código abierto, lo que permite que sea más accesible para todos, y porque muestra lo mucho que está avanzando China en las tecnologías de inteligencia artificial.
Qué es DeepSeek
DeepSeek es el nombre de una empresa china especializada en inteligencia artificial. También es el nombre de su chat de IA, una alternativa propia a ChatGPT, Gemini, Copilot y compañía. Por lo tanto, puedes escuchar y leer menciones a DeepSeek refiriéndote a ambas cosas.
En este artículo nos vamos a centrar en el chatbot de inteligencia artificial, que es un Gran Modelo Lingüístico o Large Language Model (LLM), creado para ayudar con el desarrollo de software, el procesamiento del lenguaje natural y la automatización empresarial.
DeepSeek destaca por ser de código abierto. Esto quiere decir que cualquier persona puede ver cómo funciona internamente, es totalmente transparente, y cualquiera puede instalarse esta IA de forma local o usarla con total libertad. Un desarrollador o investigador puede descargarlo de GitHub y modificarlo para diversos escenarios, incluyendo algunos comerciales.. Esto contrasta totalmente con el secretismo de unos modelos privados.
Se suele tener la falsa percepción de que una de las cosas a favor del código privado y opaco de la mayoría de desarrolladoras es que la calidad de sus productos es superior. Sin embargo, DeepSeek es una prueba de que el código abierto puede igualar e incluso superar en unos aspectos a estas empresas.
Otra de las principales características de DeepSeek es que su chatbot nativo, el de su web oficial, es totalmente gratuito y no requiere de ninguna suscripción para utilizar su modelo más avanzado.
Si lo comparamos con ChatGPT haciendo las mismas preguntas, DeepSeek puede ser un poco más escueto a la hora de responder, va más al grano. Sin embargo, tiene la misma flexibilidad que otros modelos, y puedes pedirle que explique las cosas más ampliamente o que las adapte a ti.
Dos modelos de IA como punta de lanza
DeepSeek ha dado mucho que hablar a finales del 2024 y principios del 2025 por dos modelos de IA concretos. Primero está DeepSeek V3, un modelo de larga escala LLM que supera a la mayoría de IA, y también supera a algunos propietarios. En pruebas como la de programación, este modelo logró superar a Llama 3.1 405B, a GPT-4o y a Qwen 2.5 72B, aunque todos ellos tienen muchos menos parámetros y eso puede influir en el rendimiento y las comparaciones.
Pero lo que realmente ha sorprendido de este modelo es que “solo” necesitó 2,788 millones de horas de entrenamiento, y este proceso costó tan solo 5,5 millones de dólares. Por poner un ejemplo, con el GPT-4 de OpenAI se inviertieron cerca de 80 millones de dólares. Vamos, que costó muchísimo menos de entrenar, lo que le convierte en un modelo muy eficiente, y un 60% más grande que Llama 3.1 405B, de Meta.
El otro gran modelo ha sido DeepSeek R1, que está especializado en razonamiento, y ha sido capaz de alcanza o superar el rendimiento de los modelos más avanzados de OpenAI en pruebas clave de matemáticas y programación. Con él, es la primera vez que un modelo chino de código abierto y gratuito iguala a los líderes occidentales, rompiendo el monopolio de Silicon Valley.
Por poner algunas cifras, este modelo R1 ha costado de desarrollar entre un 90% y 95% menos que sus competidores, y tiene 671.000 millones de parámetros. Además, en pruebas matemáticas MATH-500 ha conseguido un 97,3% de aciertos, frente al 96,4% de OpenAI.
Sin embargo, no todo es bueno. Igual que pasa con Gemini o ChatGPT, DeepSeek también está sujeto a los valores del país donde ha sido desarrollado. En este caso ha sido desarrollado en china, y se adapta a su regulación, debiendo “encarnar valores socialistas fundamentales”. Por poner un ejemplo, esto hace que no responda a preguntas sensibles sobre política y geopolítica, como esas sobre Tiananmen o la autonomía de Taiwán.
En este aspecto, en China son más férreos a la hora de controlar las respuestas, hay un mayor control estatal. Por lo tanto, mientras que los modelos occidentales pueden tener más liebrtad para discutir temas polémicos para los valores con los que ha sido entrenado, en los modelos chinos deben alinearse siempre con la ideología y la narrativa del Partido que gobierna el país.
Cómo funciona DeepSeek
DeepSeek ha sido desarrollado usando aprendizaje por refuerzo puro, sin datos etiquetados previamente. Esta es una hazaña técnica que hasta ahora se consideraba imposible, y que abre nuevas puertas al entrenamiento de este tipo de sistemas.
Este aprendizaje por refierzo permite que el modelo sea capaz de aprender por si mismo mediante prueba y error, igual que tú puedes aprender a montar en bici o a realizar algunas tareas. Esto hace que el resultado inicial sea más errático e impreciso, pero el propio modelo va descubriendo y desarrollando estrategias de razonamiento únicas para seguir mejorando.
Una vez realizado este entrenamiento, DeepSeek refinó el modelo combinándolo con otros entrenamientos supervisados para pulirlo y crear la versión final de R1, que mantiene este componente pero añadiendo consistencia y pulido.
De cara al usuario su funcionamiento es igual que el de otros modelos. Tienes una pantalla de inicio con una campo de escritura y varias opciones de funcionamiento, y luego a la hora de ver los resultados tienes una columna izquierda con un historial de todos tus chats.
Para usarlo tienes que escribir una pregunta en lenguaje natural, igual que lo harías con una pregunta. Entonces, DeepSeek analizará las palabras de tu pregunta para encontrar el resultado, y luego buscará en la base de datos con la que fue entrenado o en Internet para obtener datos con los que componer una respuesta también en lenguaje natural.
Gracias a la manera en la que ha sido creado, este modelo puede entender contextos complejos de preguntas muy largas y elaboradas. Además, también puede ir aprendiendo y mejorando. Su aplicación puede usarse gratis online o bajándose su app móvil, y no tiene ninguna cuota.
Qué puedes hacer con DeepSeek
Con este modelo de IA puedes hacer prácticamente lo mismo que con otros modelos. Puedes hacerle todo tipo de preguntas, y re responderá en tiempo real. Puedes preguntarle por personajes famosos, por lugares, puedes preguntarle el significado de cosas, y todo lo que se te ocurra.
También sirve para explicarte temas complejos de manera sencilla, siempre y cuando le pidas que lo haga así. También puedes enviarle documentos para que extraiga información clave sobre ellos, y hacerle preguntas relacionadas cobre su contenido.
Sirve para la programación, permitiéndote escribir o depurar código, así como para resolver problemas matemáticos. Además, si eres un creador de contenido puedes pedirle que te genere ideas, textos, que componga poesía, o que te cree plantillas o estructuras para artículos. También puede revisar y corregir textos.
En el cuadro donde escribes tu prompt o pregunta, tienes tres botones. El del clip es para adjuntar archivos. Pero además tienes el botón de DeepThink R1 para hacer que la IA “piense” en lo que te ha respondido antes o en tu contexto, y te de una respuesta razonada. Y luego, el botón Search sirve para obtener la información de Internet, aunque de momento no te va a indicar las fuentes de donde la ha sacado.
Luego, con cada respuesta que te da tienes botones para copiar el texto, dos botones para calificarlo positiva o negativamente dependiendo de la calidad de la respuesta, y otro para recargar la respuesta y que te la vuelva a generar desde cero basándose en tu mismo prompt.
En Xataka Basics | Páginas de prompts: 16 webs y comunidades gratis para encontrar ideas para tus prompts y buscar consejo para mejorarlos
ues de anuncios individuales.
Source link
Actualidad
la NASA ha encontrado moléculas vinculadas a la vida en las muestras de Bennu
Atrás quedó el famoso tornillo atascado en el contenedor de muestras del asteroide Bennu. Los científicos de la NASA acaban de publicar los resultados de su análisis y son tan ilusionantes como prometía el asteroide de 4.500 millones de años.
OSIRIS-REx y el asteroide Bennu. Lanzada en 2016, OSIRIS-REx completó una de las misiones más ambiciosas de la NASA en los últimos años. La sonda alcanzó un asteroide cercano a la Tierra llamado Bennu en 2018. Pasó varios meses cartografiándolo y analizándolo de cerca y, finalmente, descendió para tocar su superficie.
OSIRIS-REx recolectó 121,6 gramos de muestras de Bennu en 2020. Luego emprendió su viaje de vuelta y, en septiembre de 2023, logró soltarlas con éxito en la Tierra. Es menos de lo esperado y, aun así, la mayor cantidad de muestras traídas de otro cuerpo celeste que no sea la Luna. Además de una verdadera cápsula del tiempo por la edad del asteroide: 4.500 millones de años, casi tantos como los que tiene el sistema solar.
Qué hay en las muestras de Bennu. Dos estudios publicados este martes en Nature y Nature Astronomy detallan los resultados de los análisis. Podemos decir que la espera ha valido la pena porque esos 121,6 gramos que OSIRIS-REx trajo del asteroide Bennu contienen moléculas esenciales para la vida, así como el rastro de un ambiente salado que pudo propiciar su formación:
- Aminoácidos y nucleobases. 14 de los 20 aminoácidos que usan los seres vivos para fabricar proteínas, y las cinco nucleobases que conforman el ADN y el ARN, la codificación genética de la vida en la Tierra
- Amoniaco y formaldehído. El amoniaco es esencial en reacciones químicas que generan moléculas compleja, y el formaldehído puede dar lugar a aminoácidos al combinarse con el amoniaco
- Sales y agua salada. Vestigios de minerales formados por la evaporación de agua con salmuera, un entorno que pudo ser el caldo idóneo para la química prebiótica en el cuerpo del que proviene Bennu
Lo que este hallazgo significa. El descubrimiento de todas esas moléculas refuerza la hipótesis de que los ingredientes básicos para la vida podrían haberse esparcido por todo el sistema solar a una edad temprana. Se sabe que los asteroides trajeron agua a la Tierra, y nada impide que entregaran también otros bloques esenciales para la vida o la vida microbiana en sí misma. Tal vez se dieran las condiciones propicias para la vida en muchas otras partes del sistema solar.
El material proveniente de Bennu contiene una combinación de sales (calcita, halita, trona y silvita) que solo se había visto de manera incompleta en algunos meteoritos. Es una pista de que el cuerpo del que proviene originalmente Bennu pudo contener agua con las condiciones necesarias para el desarrollo de compuestos orgánicos.
Lo que este hallazgo no significa. Que el “padre” del asteroide Bennu pudiera tener las condiciones necesarias para que surgieran formas de vida no significa que los científicos hayan descubierto vida en un cuerpo ajeno a la Tierra. Las muestras no contienen evidencias de organismos vivos, ni confirman de ninguna manera la existencia de vida extraterrestre.
El material, que se formó en una región fría del sistema solar más allá de la órbita de Júpiter, no termina de resolver, pero arroja algo de luz sobre la gran pregunta: si hay escenarios propicios para la vida más allá de la Tierra. Y no, las muestras no tienen contaminación terrestre, como ocurrió con las del asteroide Ryugu que trajeron los japoneses en la misión Hayabusa 2.
A por otros asteroides. Los laboratorios de la Tierra son por ahora los mejores que tenemos, así que nada de esto habría sido posible sin una compleja misión de recuperación de muestras. OSIRIS-REx es la tercera, tras las misiones japonesas Hayabusa. Pronto veremos despegar también Tianwen-2, la misión china que viajará al asteroide 2016 HO3 Kamoʻoalewa.
Imágenes | NASA
ues de anuncios individuales.
Source link
Actualidad
Qué es High-Flyer, el fondo chino que impulsa DeepSeek y lleva años utilizando la IA para tomar decisiones de inversión
DeepSeek es la compañía de inteligencia artificial (IA) de moda. Sus modelos de lenguaje más recientes han desafiado el liderazgo de OpenAI y han provocado un auténtico terremoto en la industria tecnológica. Estos días hemos sabido que se fundó en mayo de 2023 y que ha desarrollado sus productos con una fracción de la capacidad de cómputo de algunos de sus principales rivales occidentales. Pero ¿qué más se sabe? Vamos a verlo.
El prometedor presente de DeepSeek es el resultado de años de investigación que comenzaron mucho antes de su constitución oficial. Su origen se encuentra en High-Flyer, un fondo cuantitativo de inversión creado en 2015 por el estudiante de ingeniería electrónica Liang Wenfeng junto a dos compañeros de clase. Según cuentan en su página web, la idea era que los algoritmos se convirtieran en el corazón de su negocio al permitir operaciones en tiempo real.
Una compañía enfocada en el mercado bursátil chino
High-Flyer concretó su primera posición bursátil asistida por IA en octubre de 2016, movimiento que desencadenó un imparable esfuerzo para seguir trabajando en ese sentido. La compañía conformó equipos de investigación y desarrollo de software y hardware. Y aparentemente fue la decisión adecuada. En 2017 ya aplicaba IA en casi todas sus estrategias de inversión cuantitativas, pero para seguir avanzando necesitaba romper algunas barreras.
Descubrieron que las tareas de entrenamiento de modelos complejos requerían de una potencia de cálculo descomunal. Esto no les desanimó y en 2019 pusieron en marcha una división dedicada llamada High-Flyer AI para abordar el desafío. El grupo construyó empezó a trabajar con 500 GPU, después construyó un supercomputador de 1.100 GPU A100 de NVIDIA y en 2022 gastó 140 millones de dólares para elevar el número hasta 10.000 GPU, antes de la entrada en vigor de los controles de exportación de Estados Unidos.
High-Flyer estaba completamente enfocada en desarrollar su negocio de trading algorítmico. Tenía su propia plataforma de entrenamiento de aprendizaje profundo y una destacada infraestructura de cómputo. Mientras tanto, en Estados Unidos había una empresa llamada OpenAI que apostaba por la IA generativa y que había sorprendido a muchos con las bondades de su modelo de lenguaje GPT-3.
Como recoge China Talk, Liang quería ir más allá de las finanzas. Durante mucho tiempo había estado convencido de que la IA cambiaría el mundo, y había encontrado la oportunidad de llevar su esfuerzo al siguiente nivel. En 2023, High-Flyer anunció que sentaría las bases de una nueva organización para avanzar en el desarrollo de la inteligencia artificial general (AGI). Así nació DeepSeek, con una inyección de capital de High-Flyer.
DeepSeek es producto de años de trabajo de High-Flyer y evidentemente ha bebido mucho de esta compañía. Ambas firmas comparten oficinas en el mismo edificio, aunque parece que utilizan recursos de cómputo diferente. La startup de IA dice que cuenta con chips H20, que se venden como rosquillas en China, y H800 de NVIDIA, y que ha utilizado solo 2.048 GPU de este último modelo para entrenar sus modelos más recientes, una afirmación que algunos han cuestionado.
Imágenes | High-Flyer | DeepSeek
ues de anuncios individuales.
Source link
Actualidad
Nueva controversia de “Emilia Pérez”: Jacques Audiard, su director, llama al español “idioma de países pobres y migrantes”
Una nueva controversia rodea la película “Emilia Pérez”, luego de que su director, el francés Jacques Audiard, criticara el idioma español —la lengua en la que se desarrolla la cinta— al calificarlo como un idioma de “países pobres y de migrantes”.
“El español es un idioma de países emergentes, de países modestos, de pobres y de migrantes”, comentó Audiard en una entrevista para el medio Konbini hace unos meses.
El cineasta explicó que no quería que su película fuera en inglés o francés, y que al optar por el español en las canciones, el proyecto adquirió una dimensión internacional.
Sin embargo, esta decisión ha generado controversia, sumándose a las críticas que ha recibido “Emilia Pérez” desde su estreno en el Festival de Cannes. Entre las objeciones se encuentran el acento en español de la actriz y cantante Selena Gómez, así como la forma en que la película aborda temas sensibles de México, como la desaparición de personas y los cárteles de la droga.
A pesar de sus 13 nominaciones al Óscar, incluida Mejor Película, el largometraje no ha logrado captar la atención del público mexicano. En su primer fin de semana de estreno, ocupó el octavo lugar en la taquilla, según la Cámara Nacional de la Industria Cinematográfica (Canacine).
Además, la película ha desatado una ola de quejas en redes sociales, donde cientos de espectadores exigen el reembolso de sus boletos.
La controversia creció cuando la cadena de salas Cinépolis, que ofrece una “garantía” por el filme, fue cuestionada por la Procuraduría Federal del Consumidor (Profeco). A pesar de las demandas, la empresa aclaró que la “Garantía Cinépolis” es sólo un sello de recomendación y no una política de devolución de dinero.
Con información de EFE.
ues de anuncios individuales.
Source link
-
Musica1 día ago
Spotify pagó una cifra récord para la industria musical en 2024
-
Musica1 día ago
Los detalles del homenaje a Pau Donés de Jarabe de Palo en el Vive Latino 2025
-
Actualidad20 horas ago
Alemania fue la gran potencia europea del automóvil. Ahora, cada vez más fabricantes tienen claro que es el lugar a evitar
-
Deportes1 día ago
“A mí estos insultos (negro de mier….) no me afectan”: Alejandro Balde | Video
-
Musica17 horas ago
The Killers, Scorpions, Ángeles Azules, Los Acosta y más en la Feria de San Marcos…
-
Curiosidades20 horas ago
Quentin Tarantino confirma que su próximo proyecto será una obra de teatro
-
Tecnologia1 día ago
Trump dice que Microsoft está interesado en adquirir TikTok
-
Deportes1 día ago
Decomisan droga, armas, dinero y joyas en la operación que involucra a Nainggolan