Proyecciones (2)

Continuando con el relato de la experiencia de investigación sobre Lilypad y el intento de hacer una proyección sobre la conveniencia de adoptarlo como plataforma de desarrollo o no, aquí los resultados.

Proyección

Lilypad encaja dentro de la tendencia más amplia para manejar prompt engineering como producto y ciclo de vida completo, lo que incluye:

  • Versionado de prompts y respuestas simultáneamente, no solo del prompt aislado (diferencia con herramientas tipo LangSmith).
  • Facilita la iteración continua mediante métricas cuantitativas.
  • Incluye el código con el que se ejecuta el prompt como un elemento que afecta la respuesta y, por ende, debe formar parte del ciclo de vida.

Lilypad hoy soporta trazado de funciones y anotación, pero puede intuirse que puede extenderse a:

  • Integración nativa con sistemas de evaluación automática (LLM-as-Judge).
  • Comparación A/B entre distintos prompts y modelos.
  • Integración con pipelines de CI/CD para LLM.
  • Plugins para otros frameworks.

Aunque para tener una mayor certeza, se necesitaría una investigación más a fondo, uno podría aventurar las siguientes proyecciones:

Corto plazo (6–12m):

  • Consolidación de la beta pública y lanzamiento de planes Pro/Team.
  • Más integraciones y documentación para la adopción por parte de los desarrolladores.

Mediano plazo (12–24m):

  • Evolución hacia SaaS con dashboards, métricas y alertas analíticas.
  • Integración con evaluaciones automáticas y pipelines de CI/CD para LLMs.

Largo plazo (24+m):

  • Si se logra un ecosistema rico y comunidad activa, Lilypad podría ser:
    • Un estándar para ingeniería de LLMs en Python,
    • Una plataforma fundamental de PromptOps/ModelOps para empresas que despliegan LLMs en producción.

Siguiente

Deja un comentario

Este sitio utiliza Akismet para reducir el spam. Conoce cómo se procesan los datos de tus comentarios.