Material de consulta para aprendizaje y uso de LLM

Material sobre Grandes Modelos de Lenguajes (LLM) realizado en forma colaborativa. Se espera poder emigrar pronto a una asociación propia, haciendo este espacio abierto no solo a la MCD o a la Universidad de Sonora, si no en forma más abierta.

Nombre tentativo: Sociedad de Inteligencia Artificial del Noroeste (SIAN)

Tabla de contenidos

Recursos de aprendizaje
Newsletters y otros recursos para mantenerse actualizado
Frameworks de evaluación y visualización de LLM
Frameworks de building and deploying
Monitoreo de aplicaciones LLM
Frameworks útiles para desarrollo de soluciones basados en LLM
Tips & Tricks

Recursos de aprendizaje

Visual Storytelling: Generative AI exists because of the transformer
Overview of Large Language Models.
DataTalks.Club. Manejan cursos gratuitos de MLOps y LLMOps, además de otros recursos importantes.
DeepLearning.AI short courses. Cursos de menos de dos horas para mantenerse actualizado.
Your Guide to Generative AI Courses. Un learning path the DeepLearning para aprender IA Generativa por medio de sus cursos cortos.
Transformer Puzzles. Rompecabezas para explorar el transformer.
LLM-Training Puzzles.
Transformer Explainer. Explicación visual del modelo transformador. Se puede ver más información de esta herramieta en 🤗 HuggingFace en el siguiente enlace.
The Illustrated Transformer.
Sequence to Sequence (seq2seq) and Attention.

Newsletters y otros recursos para mantenerse actualizado

LLM Papers of the Week. Un pequeño newsletter en donde te puedes suscribir para que te llegue a tu correo los top 5 mejores papers de la semana de LLM.
The AI Index Report. Reporte anual de Standford en donde describen las tendencias del momento y los avances de la AI, incluyendo LLM. Sale cada año desde el 2018.
The Big Bog of GenAI. Documento de Databricks de Inteligencia Artificial Generativa. Incluye un apartado de lenguaje. Para poderlo obtener, era necesario llenar un formulario. Por eso, se sube como material dentro del repositorio.
Hugging Face Artificial Analysis LLM Performance Leaderboard.
Hugging Face Open LLM Leaderboard.
Hugging Face Chatbot Arena Leaderboard. En esta plataforma, LLM devs votan cuales son sus modelos favoritos al momento. El procedimiento de ranking es se lleva de una forma sistematizada y puede consultarse en su artículo de presentación, Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference.
An Explorable BERT.
The Definitive Guide to Testing LLM Applications by LangChain.
The Prompt Report: A Systematic Survey of Prompting Techniques.

Frameworks de evaluación y visualización de LLM

RAGAS. Framework de evaluación open source. Sus ideas de evaluación son simples pero efectivas y creativas. Al día de hoy, 12 de mayo del 2024, cuentan con 9 métricas. Las tres originales se pueden leer en extenso en el paper original donde lo proponen. Su página oficial se encuentra disponible en el siguiente enlace.
LM Studio. Con LM Studio se puede ejecutar LLMs en laptops, completamente offline. Permite utilizar modelos a través de la interfaz de chat in-app o de un servidor local compatible con OpenAI. Descarga cualquier archivo de modelo compatible desde los repositorios de HuggingFace 🤗. Descubrir LLM nuevos y destacados en la página de inicio de la app.
Code Interpreter API. Framework que permite visualizar gráficas que son incluidas en la respuesta generada de un LLM. Es una implementación LangChain del intérprete de código ChatGPT. Usando CodeBoxes como backend para la ejecución de código python sandboxed.
Embedding projector de Tensorflow. Permite realizar reducciones de dimensionalidad para identificar como se están agrupando ideas, frases, palabras, etc. Para realizarlo, se utiliza Tensorboard.
LDAvis. Un framework para hacer gráficas de topic modeling cuando se usa el algoritmo LDA. Hay que tener cuidado de cómo interpretar las gráficas que genera. Para poder entender qué significan, es necesario ir al paper original donde lo proponen. Está para R y Python.
Vector DB Comparison. Vector DB Comparison es una herramienta gratuita y de código abierto de VectorHub para comparar bases de datos vectoriales. Se ha creado para describir los conjuntos de características de diferentes soluciones de bases de datos vectoriales. Cada una de las características descritas ha sido verificada en diversos grados.

Frameworks de building and deploying

DIFY. Algo asi como un MLflow, pero para LLM.
COGNITA.

Monitoreo de aplicaciones LLM

Langfuse. Uso en navegador, pero se puede contenerizar en Docker.
Langsmith. Uso en navegador, pero se puede contenerizar en Docker. Es el sistema de monitoreo de langchaing.
Phoenix. No permite un tracking tan profundo de los logs de la solución LLM como langfuse o langsmith, pero si se pueden almacenar. Tiene un muy bien sistema para hacer EDA de informaciónb vectorial que utiliza el LLM, y trae integrados algunos algoritmos de reducción de la dimensionalidad.

Frameworks útiles para desarrollo de soluciones basados en LLM

LiteLLM. Llama a todas las APIs LLM usando el formato OpenAI. Utiliza Bedrock, Azure, OpenAI, Cohere, Anthropic, Ollama, Sagemaker, HuggingFace, Replicate (más de 100 LLM).
Unstructured. Bibliotecas y API de código abierto para crear canalizaciones de preprocesamiento personalizadas para etiquetado, formación o canalizaciones de aprendizaje automático de producción. Unstructured permite trabajar con datos empresariales existen en formatos difíciles de usar como HTML, PDF, CSV, PNG, PPTX, etc. Unstructured extrae y transforma sin esfuerzo datos complejos para utilizarlos con las principales bases de datos vectoriales y modelos LLM. Aunque esta disponible open source, se puede pagar por uso de su API, y tiene integraciones con algunas nubes. Su página oficial esta disponible en el siguiente enlace.
DSPy. El marco para programar (no prompting) modelos de lenguaje fundacionales.
AutoGen. Un marco de programación desarrollado por Microsoft para la programación IA basada en agentes LLM.
Biblioteca de prompts de Anthropic.
Qwen2-Math. A series of math-specific large language models of our Qwen2 series.

Tips & Tricks

ASCIIFlow. Mejora la documentación de tu código incluyendo diagramas en ASCII del flujo, como en el siguiente ejemplo.
Sphinx. Haz la documentación de tu proyecto de una forma bien estilera en un dos por tres con Sphinx.
Markdown Cheatsheet en GitHub.
Carbon. Cree y comparta bellas imágenes de su código fuente.

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
documentos		documentos
img		img
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Material de consulta para aprendizaje y uso de LLM

Tabla de contenidos

Recursos de aprendizaje

Newsletters y otros recursos para mantenerse actualizado

Frameworks de evaluación y visualización de LLM

Frameworks de building and deploying

Monitoreo de aplicaciones LLM

Frameworks útiles para desarrollo de soluciones basados en LLM

Tips & Tricks

About

Releases

Packages

Contributors 2

License

mcd-unison/llm

Folders and files

Latest commit

History

Repository files navigation

Material de consulta para aprendizaje y uso de LLM

Tabla de contenidos

Recursos de aprendizaje

Newsletters y otros recursos para mantenerse actualizado

Frameworks de evaluación y visualización de LLM

Frameworks de building and deploying

Monitoreo de aplicaciones LLM

Frameworks útiles para desarrollo de soluciones basados en LLM

Tips & Tricks

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Packages