SAS Certification Leaderboard
Descripción Proyecto integral de automatización que aprovecha los Modelos de Lenguaje Grandes (LLMs) para evaluar exámenes de certificación SAS. Esta iniciativa resultó en la creación de un leaderboard competitivo y el fine-tuning de un modelo Llama 3.3 70B utilizando la tecnología DeepResearch de Claude, cubriendo todos los temas incluidos en el examen de certificación SAS. Tecnologías utilizadas Modelos de Lenguaje Grandes (LLMs) Llama 3.3 70B Claude DeepResearch Hugging Face SAS (Statistical Analysis System) Machine Learning Fine-tuning de modelos Sistemas de evaluación automatizada Características principales Evaluación Automatizada de Exámenes: Sistema basado en LLM para evaluar conocimientos de certificación SAS Leaderboard Competitivo: Sistema de ranking en tiempo real para el rendimiento en exámenes Modelo Fine-tuneado: Modelo personalizado Llama 3.3 70B entrenado en temas SAS completos Integración DeepResearch: Utilizó DeepResearch de Claude para cobertura exhaustiva de temas Cobertura Integral: Incluye todos los temas del examen de certificación SAS Métricas de Rendimiento: Análisis detallado y mecanismos de puntuación Resultados del Proyecto Automatización exitosa del proceso de evaluación de exámenes SAS Creación de un sistema de leaderboard transparente para evaluación competitiva Desarrollo de un modelo especializado fine-tuneado para consultas relacionadas con SAS Base de conocimiento integral que cubre todos los temas de certificación SAS Enlaces Hugging Face Organization