🤖Aprende IA con Ligdi González
164 subscribers
1 photo
18 links
Aprende todo sobre Inteligencia Artificial
Download Telegram
to view and join the conversation
¡Hola! Espero que te encuentres muy bien.

Hoy te voy a hablar sobre enseñar a las máquinas a dibujar.

David Ha de Google Brain usó una red neuronal recurrente generativa (RNN) para hacer dibujos que son gráficos basados en vectores. Con un dibujo daba por un humano, la máquina podía reconstruirlos a la perfección y en ocasiones hasta interpolarlos.

En el enlace podrás ver mejor el proceso de esto, de igual forma, las imágenes que fueron creadas.

https://ai.googleblog.com/2017/04/teaching-machines-to-draw.html
¡Hola! Espero que te encuentres muy bien.

Hoy te voy a hablar sobre transferir movimientos de bailes.

Utilizando la estimación de la pose y el entrenamiento de adversarios generativos (GAN), los investigadores pudieron recrear un video de cualquier persona real, la persona es el objetivo, bailando con grandes habilidades.

En el video puedes ver los resultados.

https://www.youtube.com/watch?v=PCBTZh41Ris&ab_channel=CarolineChan
¡Hola! Espero que te encuentres muy bien.

La semana pasada no tuvimos publicación por este medio, por esa razón hoy vengo con uno un poco largo, relacionado a los modelos del mundo.
Los humanos no conocemos ni pensamos en todos los detalles del mundo en el que vivimos. Nos comportamos basados en la abstracción del mundo que está en nuestras cabezas.

Por ejemplo, si vamos en una bicicleta, no pensamos en los engranajes, tuercas, pernos de la misma, solo tenemos una idea aproximada de donde están las ruedas, el asiento y el manubrio y cómo interactuar con ellos.

¿Por qué no usar un enfoque similar para la Inteligencia Artificial?

Este enfoque de “modelos del mundo” permite al “agente” crear un modelo generativo del mundo a su alrededor que es una simplificación o abstracción del entorno real.

Así que puedes pensar en el modelo del mundo como un sueño que vive en la cabeza de la Inteligencia Artificial.

Entonces la IA puede entrenar a través de un Aprendizaje de Refuerzo en este “sueño” para lograr un mejor rendimiento. Al hacer esto, los investigadores fueron capaces de lograr un rendimiento de última generación ciertas tareas de videojuegos.

Puedes conocer más sobre este tema, ingresando en la página web.

https://worldmodels.github.io/
¡Hola! Espero que te encuentres muy bien.

En la publicación de hoy te hablaré sobre AlphaStar, la Inteligencia Artificial de Starcraft II que supera a los mejores jugadores profesionales

Hemos recorrido un largo camino desde los históricos combates de Go con AlphaGo de DeepMind, puedes ver el documental en Netflix.

Entonces, fue aún más sorprendente que AlphaZero en 2017 se convirtiera en mejor que AlphaGo en el Go, a pesar de no utilizar ningún dato de entrenamiento de los partidos humanos.

Pero AlphaStar en 2019 es aún más asombroso.

AlphaStar esencialmente usó una combinación de Machine Learning, de partidos humanos, y Aprendizaje de Refuerzo, jugando contra sí mismo, para lograr sus resultados.

Puedes obtener más información en el link:

https://deepmind.com/blog/article/alphastar-mastering-real-time-strategy-game-starcraft-ii
¡Hola! Espero que te encuentres muy bien.

En la publicación de hoy te hablaré de las tareas de enseñanza a las máquinas con una sola demostración humana.

Los investigadores descubrieron una manera de que un brazo robótico realice con éxito una tarea, como recoger los bloques y apilarlos para que estén en el orden, basándose en un solo video de una sola demostración humana, una mano humana real física moviendo los bloques.

El algoritmo genera una descripción legible por el hombre de la tarea que planea hacer, lo que es genial para la resolución de problemas.

El algoritmo se basa en la detección de objetos con estimación de la pose, generación de datos sintéticos de entrenamiento y transferencia de la simulación a la realidad.

Puedes ver más en el video:

https://www.youtube.com/watch?time_continue=1&v=B7ZT5oSnRys&ab_channel=NVIDIA
¡Hola! Espero que te encuentres muy bien.

En la publicación de hoy te hablaré sobre la traducción automática no supervisada

Normalmente, se necesitaría un enorme conjunto de datos de capacitación de documentos traducidos para hacer bien la traducción automática.

En este proyecto, los investigadores demostraron que es posible utilizar el Aprendizaje no Supervisado, es decir, sin datos de traducción y utilizando únicamente el cuerpo del texto no relacionados en cada idioma, es posible alcanzar la calidad de traducción de los enfoques de Aprendizaje Supervisado más avanzados.

La idea básica es que, en cualquier idioma, ciertas palabras o conceptos tenderán a aparecer muy cerca, por ejemplo, peludo y gato. Describen esto como las incrustaciones de palabras en diferentes idiomas comparten una estructura de vecindad similar.

Puedes conocer más sobre este proyecto en el enlace.

https://engineering.fb.com/ai-research/unsupervised-machine-translation-a-novel-approach-to-provide-fast-accurate-translations-for-more-languages/
¡Hola! Espero que te encuentres muy bien.

Sabias que la Inteligencia Artificial y la Ciencia de los Datos se están apoderando de la era moderna y la están convirtiendo en un paso revolucionario.

Estamos rodeados de dispositivos de computación de ritmo rápido y una variedad de ideas evolutivas que están cambiando el juego y que están haciendo del mundo una burbuja mucho mejor para vivir y ser testigos de las numerosas exploraciones que se harán en el futuro.

No hay escasez de uso e implementación de la Inteligencia Artificial y la Ciencia de los Datos en el mundo práctico. Son campos fabulosos que están cubriendo una amplia gama de espectros y múltiples aplicaciones en la vida real.

De hecho, la Inteligencia Artificial es el campo de mayor crecimiento en la actualidad.

La próxima semana te estaré publicando más sobre esto, por esa razón está atento.
¡Hola! Espero que te encuentres muy bien.

La semana pasada te indique que la Inteligencia Artificial es el campo de mayor crecimiento en la actualidad. Pero, ¿por qué se dice esto?

Según la revista Fortune, las estadísticas dicen que las contrataciones de especialistas en Inteligencia Artificial han crecido un 74% en los últimos cuatro años.

La Inteligencia Artificial se considera a menudo como el mejor trabajo de la generación actual.

La demanda de especialistas cualificados en IA está creciendo más rápido, como nunca antes.

Los requisitos y puestos vacantes para expertos en los subcampos de la IA, como Machine Learning, Deep Learning, Visión Computacional y Procesamiento de Lenguaje Natural, están aumentando cada día.

Las próximas semanas te estaré publicando algunas de las aplicaciones de la vida real que tiene la Inteligencia Artificial.
¡Hola! Espero que te encuentres muy bien.

Sabías que los métodos de Machine Learning de los últimos tiempos se están utilizando para detectar y filtrar con éxito los correos electrónicos de spam.

La principal metodología para detectar si el correo electrónico suministrado es spam o no, es la detección de patrones de correos electrónicos falsos y palabras que se utilizan habitualmente al promocionar o anunciar productos para clientes con descuentos excesivos u otras formas similares.

Los diversos algoritmos de aprendizaje de máquina como Naive Bayes, máquinas de vector de apoyo, k vecinos más cercanos y bosques aleatorios, entre muchos otros algoritmos, pueden utilizarse para filtrar los mensajes de spam y clasificar si el correo electrónico recibido es un "mensaje de spam" o no.

La detección avanzada de spam puede realizarse mediante técnicas como las redes neuronales o el reconocimiento óptico de caracteres (OCR), que también es utilizado por empresas como Gmail para el filtrado de spam.
¡Hola, volvimos!

Hoy te voy hablar sobre autocompletar.

Autocompletar, o terminación de palabras, es una característica en la que una aplicación predice el resto de una palabra que un usuario está escribiendo.

A medida que tecleamos "cuál es la debilidad..." ya recibimos algunas predicciones.

Estas búsquedas predictivas también funcionan con Inteligencia Artificial.

Normalmente trabajan en conceptos como el Procesamiento del Lenguaje Natural, Machine Learning y Deep Learning.

Se puede utilizar un mecanismo de secuencia a secuencia con atención para lograr una mayor precisión y menores pérdidas para estas predicciones.

Existen incluso métodos de aprendizaje de tiro cero y tiro único para el procesamiento del lenguaje natural.

Los mismos métodos pueden utilizarse para mejorar la capacitación del modelo a fin de mejorar el rendimiento general y evitar procedimientos de capacitación repetidos que pueden ser un obstáculo realmente grande en algunas aplicaciones y escenarios de la vida real.

Por lo tanto, el aprendizaje de una sola vez es una gran alternativa para el despliegue y el trabajo en otros sistemas incorporados con menor capacidad de capacitación
¡Hola! Espero que te encuentres muy bien.

Como ya debes saber, la autocorrección es una función de validación automática de datos que se encuentra comúnmente en los procesadores de texto.

La autocorrección basada en las metodologías de la Inteligencia Artificial es muy beneficiosa para lograr los mejores resultados al escribir un texto o al teclear para evitar declaraciones o palabras incorrectas.

La ortografía se comprueba automáticamente y se corrige inmediatamente a los valores correctos más cercanos.

El proceso de autocorrección implica cuatro pasos principales, a saber, identificar una palabra mal escrita, y luego encontrar las cadenas mientras se calcula la distancia mínima de edición de cada una de ellas, filtrando los posibles candidatos para la selección de la palabra correcta.

Y finalmente, calcular las probabilidades de la palabra para pronosticar la mejor predicción posible para la palabra en particular.

El método mencionado anteriormente es una de las formas de calcular el problema de autocorrección con la ayuda de algoritmos de aprendizaje de máquinas como la Regresión Logística o Naive Bayes.

Sin embargo, incluso los métodos de Deep Learning también pueden utilizarse para resolver problemas similares.
¡Hola! Espero que te encuentres muy bien.

El Reconocimiento Facial es el reconocimiento procesal de un rostro humano junto con el nombre autorizado del usuario.

La detección de rostros es una tarea más sencilla y puede considerarse como un proyecto de nivel de principiante.

El clasificador de cascada Haar puede utilizarse para el propósito de detección de rostros y detectar con precisión múltiples rostros en el marco.

El clasificador en cascada Haar para la cara frontal suele ser un archivo XML que puede utilizarse con el módulo OpenCV para leer las caras y luego detectarlas.

Después de la detección de rostros, podemos utilizar el enfoque de Deep Learning para resolver las tareas de reconocimiento facial.

También puede construir un modelo de Deep Learning personalizado para resolver la tarea de reconocimiento facial.

Los modelos modernos construidos para el reconocimiento facial son muy precisos y proporcionan una exactitud de casi más del 99% para los conjuntos de datos etiquetados.

Las aplicaciones de los modelos de reconocimiento facial pueden utilizarse en sistemas de seguridad, vigilancia, sistemas de asistencia y mucho más.
¡Hola! Espero que te encuentres muy bien.

Un asistente virtual, también llamado asistente de Inteligencia Artificial, es un programa de aplicación que entiende los comandos de voz en lenguaje natural y completa las tareas del usuario.

Tenemos asistentes virtuales como Google AI, Siri, Alexa, Cortana, y muchos otros asistentes virtuales similares.

Con la ayuda de estos asistentes, podemos pasar comandos, y usando el reconocimiento de voz, intenta interpretar lo que decimos y automatiza/realiza una tarea realista.

Usando estos asistentes virtuales, podemos hacer llamadas, enviar mensajes o correos electrónicos, o navegar por la web con un simple comando de voz.

El poder de los Asistentes Virtuales impulsados por la Inteligencia Artificial no se limita a los teléfonos inteligentes o a los dispositivos informáticos.

También pueden ser usados en dispositivos de entrada y salida, sistemas integrados para realizar tareas de forma efectiva y controlar todo lo que te rodea.

Un ejemplo de esto puede ser la automatización del hogar utilizando un Raspberry Pi, donde eres capaz de controlar toda tu casa con un simple comando de voz.

Con la integración de la Inteligencia Artificial en dispositivos como el Raspberry Pi y Nvidia Jetson Nano (entre muchos otros) son capaces de desarrollar algunas obras maestras, que serán altamente rentables y beneficiosas para la sociedad en su conjunto.

Algunos ejemplos populares de asistentes virtuales como Alexa, Siri o la IA de Google muestran el alto nivel de inteligencia y las posibilidades futuras.
¡Hola! Espero que te encuentres muy bien.
Los chatbots se utilizan hoy en día de manera universal en muchos sitios web para interactuar con los usuarios humanos que llegan a los sitios específicos.

Los "chatbots" suelen utilizarse para obtener respuestas rápidas a las preguntas más frecuentes de un sitio web determinado.

Los chatbots ahorran tiempo y reducen el trabajo y los gastos humanos.

Hay muchos tipos de chatbots, y cada uno de ellos se especializa, en particular, en uno o unos pocos campos.

La creación de chatbots específicos es ideal ya que puede mejorar enormemente el rendimiento de la tarea distinta.

Se pueden utilizar más métodos de preprocesamiento y de Procesamiento del Lenguaje Natural para lograr una mayor precisión y reducir las pérdidas en el entrenamiento del modelo.

Esto también puede mejorar las predicciones generales del modelo.

Algoritmos avanzados de entrenamiento como el modelo GPT-3 entrenado en casi 175 mil millones de parámetros funciona de manera fantástica incluso para los chatbots de conversación y es un gran método alternativo para entrenar chatbots de alta calidad.

Se pueden utilizar otros métodos como la clasificación basada en el aprendizaje por transferencia, los modelos de secuencia a secuencia con atención, o incluso ciertos métodos de aprendizaje de un solo tiro para el entrenamiento.
¡Hola! Espero que te encuentres muy bien.

El reconocimiento óptico de caracteres (OCR) es la conversión de datos de texto bidimensional en una forma de texto codificado por máquina mediante el uso de un dispositivo electrónico o mecánico.

Se utiliza la visión por ordenador para leer los archivos de imagen o de texto.

Después de leer las imágenes, utiliza el módulo pytesseract de Python para leer los datos de texto en la imagen o el PDF y luego convertirlos en una cadena de datos que pueden ser mostrados en Python.

Los motores de OCR se han desarrollado en muchos tipos de aplicaciones

Las diversas aplicaciones y usos de la tecnología OCR en escenarios de la vida real son entrada de datos para documentos de negocios, por ejemplo, cheque, pasaporte, factura, extracto bancario y recibo, y mucho más.

Una vez que tenga un conocimiento profundo de cómo funciona el OCR y las herramientas necesarias, puede proceder a computar problemas más complejos.

Esto puede ser usando modelos de atención de secuencia a secuencia para convertir los datos leídos por el OCR de un idioma a otro.
¡Hola! Espero que te encuentres muy bien.

Sabías que estas dos redes neuronales, OpenIA, quiere avanzar hacia la construcción de redes neuronales multimodales.

La primera red neuronal es DALL·E, cuyo nombre procede del artista Salvador Dalí y del robot Wall-E, y puede convertir con éxito un texto en una imagen adecuada para una amplia gama de conceptos expresables en lenguaje natural.

La segunda red es CLIP, y tiene la capacidad de realizar con fiabilidad un conjunto de asombrosas tareas de reconocimiento visual. Dado un conjunto de categorías expresadas en lenguaje, CLIP puede clasificar instantáneamente una imagen como perteneciente a una categoría, sin necesidad de hacer un “fine-tune”, como se requiere con las redes neuronales estándar.

Puedes conocer más al respecto en el enlace que te dejo.
https://openai.com/blog/tags/multimodal/?utm_campaign=Dynamically%20Typed&utm_medium=email&utm_source=Revue%20newsletter
¡Hola! Espero que te encuentres muy bien.

Hoy te voy hablar sobre Background Matting v2, este se inspira en el popular proyecto de código abierto “The world is your green screen” (el mundo es tu pantalla verde) y muestra cómo eliminar o cambiar el fondo en tiempo real.

Ofrece un mejor rendimiento (30 fps en 4K y 60 fps en FHD) y puede utilizarse con Zoom, la popular aplicación de videoconferencia.

La técnica utiliza un fotograma adicional capturado del fondo y lo utiliza en la recuperación del mate alfa y la capa de primer plano.

Para procesar las imágenes de alta resolución en tiempo real, se utilizan dos redes neuronales.

Este proyecto es sin duda útil si se quiere eliminar una persona de un video conservando el fondo.

https://github.com/PeterL1n/BackgroundMattingV2
¡Hola! Espero que te encuentres muy bien.

Otro proyecto increíble que hace un reemplazo y armonización del cielo en video, que puede generar automáticamente fondos de cielo realistas y dramáticos en videos con estilos controlables, es el siguiente.

Basado en Pytorch, el proyecto adapta parcialmente el código del pryecto CycleGAN y pix2pix, y aprovecha la armonización del cielo, la estimación del movimiento a través del flujo óptico y la mezcla de imágenes para proporcionar fondos artísticos en los videos en tiempo real.

Este código abierto tiene un potencial increíble para las películas y los videojuegos, por ejemplo, para añadir lluvia, tiempo soleado, entre muchas otras cosas.

https://github.com/jiupinjia/SkyAR
¡Hola! Espero que te encuentres muy bien.

Colocar tu fotos como caricatura es siempre un proyecto de Machine Learning divertido.

Este proyecto, AnimeGAN v2, es la versión mejorada de AnimeGAN.

En concreto, combina la transferencia de estilo natural y red generativa adversaria (GAN) para llevar a cabo la tarea, al tiempo que se asegura de evitar la generación de artefactos de alta frecuencia.

https://github.com/TachibanaYoshino/AnimeGANv2
¡Hola! Espero que te encuentres muy bien.

Sabía que los motores de búsqueda que utilizan Inteligencia Artificial y los Chatbots de control de calidad son siempre la necesidad del momento. Y eso es exactamente lo que hace este proyecto.

Mediante el uso de transformadores, transformadores de frases y FAISS (búsqueda de similitudes en la IA de Facebook) txtai construye un motor potenciado por la Inteligencia Artificial para búsqueda contextual y la extracción de preguntas-respuestas

Básicamente, txtai permite construir índices de texto para realizar búsquedas por similitud y crear sistemas basados en la extracción de preguntas y respuestas.

https://github.com/neuml/txtai