3. Data, Science & AI

24 skills

Found 15241 skills

Total Stars:9.2M

Avg Stars:601

Sort by:Stars Desc Stars Asc Name A-Z Name Z-A

langfuse-prompt-management

mberto10

Manages Langfuse prompts with version control, deployment labels, and comparison for LLM application development.

Langfuse

Prompt versioning

LLM deployment

3. Data, Science & AI

evaluation-infrastructure

mberto10

Builds foundational evaluation infrastructure for AI/ML models, including datasets, graders, harness, and baselines required before optimization.

Datasets

Graders

Baseline

3. Data, Science & AI

langfuse-agent-eval-setup

mberto10

Configures agent evaluation pipelines including flow discovery, quality dimensions, dataset creation, and judge prompts for AI agent testing.

Langfuse

Agent Evaluation

LLM Testing

3. Data, Science & AI

langfuse-trace-analysis

mberto10

Diagnoses root causes in LLM application workflows by combining Langfuse trace data with codebase investigation to resolve failures and improve output quality.

Langfuse

LLM

Trace Analysis

3. Data, Science & AI

langfuse-experiment-runner

mberto10

Runs Langfuse experiments to evaluate LLM performance, compare model and prompt variations, and analyze failures.

Langfuse

LLM Evaluation

Prompt Engineering

3. Data, Science & AI

langfuse-experiment-runner

mberto10

Executes and analyzes LLM evaluation experiments using Langfuse, including prompt testing, dataset evaluation, and LLM-as-judge comparisons.

Langfuse

LLM Evaluation

Experiment Analysis

3. Data, Science & AI

langfuse-score-analytics

mberto10

Analyzes score trends, regressions, and quality metrics distributions over time for performance evaluation and improvement.

Score Analysis

Time Series

Quality Metrics

3. Data, Science & AI

langfuse-data-retrieval

mberto10

Surgically retrieves Langfuse observability data for debugging and analyzing LLM application traces with multiple output modes.

Langfuse

LLM Traces

Observability

3. Data, Science & AI

optimization-target

mberto10

Defines goal, constraints, and adjustable parameters for optimization problems in AI and data science frameworks.

Optimization Framework

Constraints

Decision Variables

3. Data, Science & AI

langfuse-session-analysis

mberto10

Enables session-level analysis in Langfuse to inspect, debug multi-turn conversations, identify errors, and evaluate performance metrics.

Langfuse

Session Analysis

LLM Evaluation

3. Data, Science & AI

ascii-charts

mberto10

Generates ASCII-based data visualizations including charts, graphs, and progress bars for terminal display in Claude Code responses.

ASCII

Terminal

Data Visualization

3. Data, Science & AI

langfuse-instrumentation-setup

mberto10

Configures Langfuse tracing, observability, and scoring for Python-based LLM pipelines to monitor and debug AI model interactions.

Langfuse

Python

LLM

3. Data, Science & AI

analytics

guicheffer

Enables cross-platform event tracking for user interactions and feature usage with analytics providers like Firebase and Adjust.

Firebase

Adjust

Statsig

3. Data, Science & AI

langfuse-dataset-management

mberto10

Manages Langfuse datasets for LLM experiment validation and regression testing, including dataset creation, trace curation, and test set building.

Langfuse

LLM

Regression Testing

3. Data, Science & AI

generate-tts-audio

xiaxianlin

Generates audio files from text segments using MiniMax TTS API with built-in error handling and retry logic.

MiniMax TTS

Text-to-Speech

Error Handling

3. Data, Science & AI

langfuse-dataset-management

mberto10

Manages Langfuse datasets for LLM applications, enabling creation, curation of regression/golden sets, and dataset item inspection.

Langfuse

Datasets

LLM

3. Data, Science & AI

init-serena

sskim91

Initializes Serena MCP for AI-enhanced semantic analysis of code, enabling deeper code structure and meaning interpretation during analysis.

Serena MCP

Semantic Analysis

Code Analysis

3. Data, Science & AI

langfuse-agent-advisor

mberto10

Provides strategic guidance for evaluating, improving AI agents, selecting metrics, building datasets, and setting up iteration loops with Langfuse.

Langfuse

AI Agents

Evaluation Metrics

3. Data, Science & AI

sql-optimization-patterns

sskim91

Optimizes database performance through advanced SQL query tuning, indexing strategies, and EXPLAIN plan analysis.

SQL

Indexing

EXPLAIN

3. Data, Science & AI

langfuse-data-retrieval

mberto10

Retrieves and analyzes Langfuse traces, runs, and metadata for debugging and optimizing LLM application workflows.

Langfuse

Traces

LLM

3. Data, Science & AI

langfuse-score-analytics

mberto10

Analyzes LLM model quality metrics including score trends, regressions, and distributions across releases and environments in Langfuse.

Langfuse

LLM

Model Evaluation

3. Data, Science & AI

database-architect

simplerick0

Specializes in relational database design, schema modeling, normalization, indexing, and migration planning for optimal data integrity and performance.

SQL

Normalization

Indexing

3. Data, Science & AI

optimization-craft

mberto10

Provides a hypothesis-driven methodology for systematically improving AI agent performance through iterative optimization cycles.

AI Agent Optimization

Hypothesis-Driven

Iterative Cycles

3. Data, Science & AI

cursor-agents

simplerick0

Configures and manages Cursor IDE agents for parallel AI-assisted coding, supporting background, cloud, and multi-agent development workflows.

Cursor

AI Agents

Multi-agent

3. Data, Science & AI

PreviousPage 598 of 636 PageNext