Tras revisar los principales hechos clave en el camino a la Inteligencia Artificial (IA) y la terminología básica, cabe enumerar las principales herramientas que nos proporciona. Y como antesala a este complejo mundo, ¿qué es lo que el usuario de a pie debe conocer para comenzar el camino? Y comencemos con, quizás, lo más popular: los chatbots.
a) Chatbots: son aplicaciones que mantienen conversaciones fluidas, son capaces de responder preguntas y generar contenido. Son asistentes a lo que se les puede pedir que expliquen temas difíciles, generen resúmenes, cuestionarios para para practicar, ayudan a ordenar nuestras ideas y generan borradores de contenidos.
- ChatGPT: lanzado al público en noviembre de 2022, marcó el inicio del boom de la IA. Es el chatbot más completo hasta hoy. Y por varias características: tiene memoria (guarda información entre chats, a diferencia de otros) y puede crear asistentes especializados (en la versión de pago).
- Claude: desarrollado por Antrhopic, es el chatbot más avanzado después de ChatGPT. Es muy seguro, pues previene de respuestas dañinas y procesa más información que ChatGPT (es decir, tiene mayor ventana de contexto).
- Gemini: desarrollado por Google Deepming, no es tan potente como los otros dos, pero tiene una capa gratuita muy amplia y se conecta con los servicios de Google.
- Llama: es un modelo Open Source desarrolado por Meta (Facebook) que es muy adaptable tanto a entornos empresariales como locales. Meta AI es la implementación de Llama dentro de los productos de Meta.
b) Generadores de imágenes: convierten descripciones de texto en imágenes y también pueden modificar imágenes a partir de una instrucción en texto. Podemos crear imágenes para presentaciones de PowerPoint, afic.es o ilustraciones sin grandes conocimientos de diseño.
- Midjourney: crea imágenes a partir de descripciones textuales. Es decir, le decimos lo que queremos ver y ella lo dibuja. Es capaz de generar imágenes muy realistas y artísticas, desde retratos hasta paisajes fantásticos. Son fotos más reales y que parecen menos de IA que otros programas.
- DALL-E: desarrollado por OpenAI, genera imágenes a partir de descripciones en lenguaje natural. Es altamente flexible, lo que permite crear imágenes únicas para diferentes aplicaciones, desde arte digital hasta contenido empresarial.
- Adobe Firefly: permite crear imágenes desde la web y también se integra con las herramientas de Adobe: Photoshop e Illustrator.
- Imagen3 (Google): es el modelo de generación de imágenes de Google incluido dentro de Gemini.
c) Generadores de audio y video: pueden crear video y audio realista (voces o música) a partir de texto. Nos permite crear voces para videos creativos o publicitarios y videos para presentar nuestras ideas.
- Eleven Labs: es la mejor aplicación para generar audio, pues crea voces realistas. Soporta varios idiomas, tiene estilos y tonos de voz (e incluso puede clonar nuestra propia voz).
- Heygen: es la mejor aplicación para video, pues crea avatares realistas que pueden hablar en varios idiomas. Así podemos crear videos sin contar con cámara ni equipo y sin mostrar nuestra cara.
- Runway: es el primer modelo importante de generación de videos por IA y lo hace a través de texto. Su primera versión (gen-1) se lanzó en febrero de 2023, en marzo de 2023 se lanzó gen-2 y en junio de 2024, gen-3.
d) Generadores de código: ayuda a escribir, corregir y optimizar el código en varios lenguajes de programación. Podemos usarlos para mejorar nuestras habilidades de programación (quien las tenga), dominar más rápido lenguajes nuevos, documentar tu código y encontrar errores y resolverlos.
- Github Copillot: fue el primer generador de código importante. Se lanzó en julio de 2021 como beta y se liberó al público en 2023. Está basado en el modelo Codex de OpenAI.
- Tabnine: su diferencia es que puede ejecutarse y analizar el código localmente. Ideal para mantener la privacidad de los proyectos.
- Amazon Q Developer: es parte de Amazon Q, una familia de asistentes de IA de Amazon que están muy integraos con sus servicios de nube AWS.
e) Asistentes de investigación: ayudan a recopilar información, analizarla y organizarla. Pueden generar resúmenes, responder a preguntas complejas y encontrar puntos clave en la información. Son excelentes para proyectos de investigación, tesis o comprender artículos avanzados. Podemos destacar a Perplexity y NotebookLM.
Después de revisar las principales herramientas, algunos consejos para usar bien un chatbot, quizás lo más recurrentemente utilizado. Porque para sacar el máximo potencial no basta con escribir sin más. Para usarlo mejor, es importante la precisión en lo que se consulta. Y estos son algunos consejos:
1) No lo uses como Google: no tiene nada que ver, no sirven palabras sueltas sin más.
2) Ponle en contexto, y ello porque el chatbot tiene tal cantidad de conocimiento que si no le damos un contexto no va a saber qué entregarnos.
3) Coloca al chatbot en un papel determinado (en un rol): es una de las mejores técnicas para obtener resultados precisos.
4) Si es necesario, da un ejemplo al chatbot de cómo esperas la respuesta.
5) También le puedes pedir el formato de la respuesta: párrafos, resúmenes, listas, tablas, etc.
6) Se pueden poner también las reglas de la conversación: con las reglas del juego claras, no nos llevaremos sorpresas.
7) Y ojo, conviene abrir un chat por proyecto. Es una de las cosas más productivas que se pueden hacer con un chatbot, ya que conocerá todo el contexto de tu proyecto (sin mezclar con otras cuestiones).
Todo un mundo el de la IA que ya es una realidad y sobre el que conviene no perder muchos el paso. Porque ha llegado para quedarse (y avanzar a demasiada velocidad).