Inteligencia Artificial
9.11K subscribers
569 photos
327 videos
13 files
32.6K links
Actualidad en Inteligencia Artificial. Las noticias diarias más relevantes sobre IA, LLMs, agentes, robótica, novedades, opiniones de referencia y una pizca de humor. Para no perderte nada del futuro que ya está aquí.
Download Telegram
Please open Telegram to view this post
VIEW IN TELEGRAM
Zyphra rompe el monopolio de NVIDIA: el modelo ZAYA1-8B que desafía a los gigantes con menos de 1B de parámetros activos

Un nuevo modelo de IA, ZAYA1-8B, desarrollado por Zyphra, ha sorprendido al sector por igualar a modelos de vanguardia como DeepSeek-R1 y acercarse a Claude Sonnet 4.5, pero con una característica revolucionaria: opera con menos de 1.000 millones de parámetros activos (760M) en tiempo de inferencia, a pesar de tener 8.400 millones en total.

¿Por qué es un hito?
🟢Hardware alternativo: A diferencia de casi toda la industria que depende de NVIDIA, ZAYA1-8B fue entrenado 100% en clústeres de AMD Instinct MI300X junto con IBM. Esto demuestra que el ecosistema AMD puede producir resultados de nivel "frontier".

🟢Arquitectura eficiente: Utiliza una mezcla de expertos (MoE) y un mecanismo de atención personalizado que permite mantener una alta calidad de razonamiento matemático y de codificación con un presupuesto de parámetros activos mínimo.

🟢Rendimiento:
* Matemáticas (AIME 2026): 89.1% (superando a modelos con 10 veces más parámetros activos).
* Codificación (LiveCodeBench): 65.8%, competitivo con modelos mucho más grandes.
* Innovación: Emplea "Markovian RSA", un método de inferencia que permite al modelo mejorar su respuesta al aumentar el tiempo de "pensamiento" sin saturar la ventana de contexto.

Limitaciones a considerar:
No es un modelo generalista. Su fuerte es la ciencia, matemáticas y código complejo. Su rendimiento en tareas de "agente" (llamadas a funciones fiables) y seguimiento de instrucciones complejas es inferior al de competidores como Qwen3-4B.

Disponibilidad:
Las weights están disponibles en Hugging Face bajo licencia Apache 2.0, aunque requieren una versión modificada de vLLM de Zyphra para su ejecución local.

ZAYA1-8B no es solo un modelo más; es una prueba de concepto viable para una infraestructura de IA más diversa y eficiente.

Fuente: Firethering

💙 Zaya1-8B

@todoIA
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Utiliza estas instrucciones de ChatGPT para ahorrar horas:

1. Resume documentos largos:

Perfecto para resumir informes largos o presentaciones de clientes.

Resume este documento en un informe ejecutivo de una página que destaque los puntos clave, las implicaciones estratégicas y los próximos pasos recomendados. Mantenga una estructura clara adecuada para presentar en una reunión de equipo.


2. Transforma notas en presentaciones:

Transforma información en bruto en contenido listo para presentaciones.

Convierte estas notas de investigación desorganizadas en una presentación clara y bien estructurada de 10 diapositivas, con un flujo lógico, títulos breves y conclusiones orientadas a la acción.


3. Simplifica textos técnicos:
Simplifica la información técnica para una comprensión rápida.

Reescribe esta explicación técnica extensa en un memorando interno simple que cualquier ejecutivo no técnico pueda entender en menos de 2 minutos. Incluye una analogía para una mayor claridad.


4. Organiza tareas complejas:
Ayuda a lidiar con la sobrecarga de trabajo y priorizar lo esencial.

Organiza esta abrumadora lista de 40 tareas utilizando bloques de tiempo, clasificación de urgencia y dependencias para crear un plan de acción práctico de un día.

5. Identifica cuellos de botella en el soporte:
Ideal para equipos de operaciones o atención al cliente.

Revisa estas transcripciones de soporte al cliente, identifica los 3 problemas más recurrentes y escribe un breve párrafo que resuma las principales causas y las mejoras sugeridas.


6. Resume las comunicaciones semanales:
Facilita la creación de informes semanales automáticos.

Convierte las notas de llamadas, correos electrónicos y mensajes de Slack de esta semana en un resumen de progreso del viernes que destaque los resultados, los bloqueos y los próximos pasos.

7. Analiza las métricas de rendimiento:
Haz que el análisis de datos sea sencillo y comprensible.

Analiza este conjunto de métricas de rendimiento y explica, en un lenguaje claro, qué funciona mejor, qué no funciona y por qué, en menos de 300 palabras.


🙌 @aipost

#promptologia@todoIA
Please open Telegram to view this post
VIEW IN TELEGRAM