Inteligencia Artificial

Zyphra rompe el monopolio de NVIDIA: el modelo ZAYA1-8B que desafía a los gigantes con menos de 1B de parámetros activos

Un nuevo modelo de IA, ZAYA1-8B, desarrollado por Zyphra, ha sorprendido al sector por igualar a modelos de vanguardia como DeepSeek-R1 y acercarse a Claude Sonnet 4.5, pero con una característica revolucionaria: opera con menos de 1.000 millones de parámetros activos (760M) en tiempo de inferencia, a pesar de tener 8.400 millones en total.

¿Por qué es un hito?

🟢

Hardware alternativo: A diferencia de casi toda la industria que depende de NVIDIA, ZAYA1-8B fue entrenado 100% en clústeres de AMD Instinct MI300X junto con IBM. Esto demuestra que el ecosistema AMD puede producir resultados de nivel "frontier".

🟢

Arquitectura eficiente: Utiliza una mezcla de expertos (MoE) y un mecanismo de atención personalizado que permite mantener una alta calidad de razonamiento matemático y de codificación con un presupuesto de parámetros activos mínimo.

🟢

Rendimiento:
* Matemáticas (AIME 2026): 89.1% (superando a modelos con 10 veces más parámetros activos).
* Codificación (LiveCodeBench): 65.8%, competitivo con modelos mucho más grandes.
* Innovación: Emplea "Markovian RSA", un método de inferencia que permite al modelo mejorar su respuesta al aumentar el tiempo de "pensamiento" sin saturar la ventana de contexto.

Limitaciones a considerar:
No es un modelo generalista. Su fuerte es la ciencia, matemáticas y código complejo. Su rendimiento en tareas de "agente" (llamadas a funciones fiables) y seguimiento de instrucciones complejas es inferior al de competidores como Qwen3-4B.

Disponibilidad:
Las weights están disponibles en Hugging Face bajo licencia Apache 2.0, aunque requieren una versión modificada de vLLM de Zyphra para su ejecución local.

ZAYA1-8B no es solo un modelo más; es una prueba de concepto viable para una infraestructura de IA más diversa y eficiente.

Fuente: Firethering

💙

Zaya1-8B

@todoIA

Please open Telegram to view this post

VIEW IN TELEGRAM

Firethering

ZAYA1-8B Matches DeepSeek-R1 on Math with Less Than 1B Active Parameters. - Firethering

Who should care If you work with math, science problems, or complex coding tasks and you're looking for something small enough to run locally or cheaply via API, this is worth serious evaluation. The benchmark numbers at 760M active parameters are not normal…

352 views11:00

Inteligencia Artificial

💸

El Pentágono promete constantemente cumplir la ley al utilizar la IA, pero ¿cuáles son los límites?

https://cnnespanol.cnn.com/2026/05/07/eeuu/pentagono-cumplir-ley-utilizar-ia-limites-trax

@todoIA

Please open Telegram to view this post

VIEW IN TELEGRAM

CNN

El Pentágono promete constantemente cumplir la ley al utilizar la IA, pero ¿cuáles son los límites? | CNN

La guerra con Irán ha llevado a las fuerzas estadounidenses a utilizar la IA más que en cualquier otro conflicto anterior, recurriendo a enormes cantidades de datos —procedentes de satélites, inteligencia de señales y otras fuentes— que se introducen en programas…

352 views11:00

Inteligencia Artificial

🔥

Utiliza estas instrucciones de ChatGPT para ahorrar horas:

1. Resume documentos largos:
Perfecto para resumir informes largos o presentaciones de clientes.

Resume este documento en un informe ejecutivo de una página que destaque los puntos clave, las implicaciones estratégicas y los próximos pasos recomendados. Mantenga una estructura clara adecuada para presentar en una reunión de equipo.

2. Transforma notas en presentaciones:
Transforma información en bruto en contenido listo para presentaciones.

Convierte estas notas de investigación desorganizadas en una presentación clara y bien estructurada de 10 diapositivas, con un flujo lógico, títulos breves y conclusiones orientadas a la acción.

3. Simplifica textos técnicos:
Simplifica la información técnica para una comprensión rápida.

Reescribe esta explicación técnica extensa en un memorando interno simple que cualquier ejecutivo no técnico pueda entender en menos de 2 minutos. Incluye una analogía para una mayor claridad.

4. Organiza tareas complejas:
Ayuda a lidiar con la sobrecarga de trabajo y priorizar lo esencial.

Organiza esta abrumadora lista de 40 tareas utilizando bloques de tiempo, clasificación de urgencia y dependencias para crear un plan de acción práctico de un día.

5. Identifica cuellos de botella en el soporte:
Ideal para equipos de operaciones o atención al cliente.

Revisa estas transcripciones de soporte al cliente, identifica los 3 problemas más recurrentes y escribe un breve párrafo que resuma las principales causas y las mejoras sugeridas.

6. Resume las comunicaciones semanales:
Facilita la creación de informes semanales automáticos.

Convierte las notas de llamadas, correos electrónicos y mensajes de Slack de esta semana en un resumen de progreso del viernes que destaque los resultados, los bloqueos y los próximos pasos.

7. Analiza las métricas de rendimiento:
Haz que el análisis de datos sea sencillo y comprensible.

Analiza este conjunto de métricas de rendimiento y explica, en un lenguaje claro, qué funciona mejor, qué no funciona y por qué, en menos de 300 palabras.

🙌

@aipost

#promptologia@todoIA

Please open Telegram to view this post

VIEW IN TELEGRAM

430 viewsedited 14:01

Inteligencia Artificial

ChatGPT Phone: ¿cómo será el teléfono que prepara OpenAI?

https://tn.com.ar/tecno/novedades/2026/05/07/chatgpt-phone-como-sera-el-telefono-que-prepara-openai/?outputType=amp

@todoIA

ChatGPT Phone: ¿cómo será el teléfono que prepara OpenAI?

Nuevos informes revelan que el dispositivo entrará en etapa de producción en masa durante la primera mitad de 2027. ¿Con qué características nos sorprenderá?

381 views14:01

Inteligencia Artificial

El peligro de la amistad de una inteligencia artificial y la búsqueda de civilizaciones SETI

https://www.elconfidencial.com/tecnologia/novaceno/2026-05-07/peligro-amistad-ia-busqueda-seti_4350928/

@todoIA