3. Data, Science & AI

24 skills

Found 15241 skills

Total Stars:9.2M

Avg Stars:601

Sort by:Stars Desc Stars Asc Name A-Z Name Z-A

hybrid-search-implementation

wshobson

26.3K

Combines vector and keyword search to improve retrieval accuracy in RAG systems and search engines.

RAG

Vector Search

Keyword Search

3. Data, Science & AI

spark-optimization

wshobson

26.3K

Optimizes Apache Spark job performance through partitioning, caching, shuffle tuning, and memory configuration for efficient data processing pipelines.

Apache Spark

Shuffle Optimization

Memory Tuning

3. Data, Science & AI

data-quality-frameworks

wshobson

26.3K

Enables implementation of data quality validation using Great Expectations, dbt tests, and data contracts for robust data pipelines.

Great Expectations

dbt

Data Contracts

3. Data, Science & AI

prompt-engineering-patterns

wshobson

26.3K

Optimizes LLM performance, reliability, and output quality using production-ready prompt engineering patterns.

Prompt Engineering

LLM

Production

3. Data, Science & AI

sql-optimization-patterns

wshobson

26.3K

Optimizes SQL queries and database schemas using indexing and EXPLAIN analysis to enhance performance and resolve slow queries.

SQL

Indexing

EXPLAIN

3. Data, Science & AI

data-storytelling

wshobson

26.3K

Transforms data into compelling narratives using visualization and context for stakeholder presentations and executive reports.

Data Visualization

Business Analytics

3. Data, Science & AI

llm-evaluation

wshobson

26.3K

Enables comprehensive evaluation of LLM applications through automated metrics, human feedback, and benchmarking to measure AI performance and quality.

LLM

Benchmarking

Metrics

3. Data, Science & AI

kpi-dashboard-design

wshobson

26.3K

Guides optimal KPI dashboard design with metric selection, visualization best practices, and real-time monitoring patterns.

KPI Dashboard

Data Visualization

Metric Selection

3. Data, Science & AI

embedding-strategies

wshobson

26.3K

Optimizes embedding models and chunking strategies for semantic search and RAG applications in AI systems.

Embedding Models

RAG

Chunking

3. Data, Science & AI

similarity-search-patterns

wshobson

26.3K

Enables efficient semantic search and nearest neighbor queries through vector database optimization for AI-driven retrieval systems.

Vector Database

Semantic Search

k-NN

3. Data, Science & AI

risk-metrics-calculation

wshobson

26.3K

Calculates portfolio risk metrics including VaR, CVaR, Sharpe ratio, Sortino ratio, and drawdown for risk assessment.

VaR

Sharpe Ratio

Drawdown

3. Data, Science & AI

meeting-insights-analyzer

ComposioHQ

23.8K

Analyzes meeting transcripts and recordings using AI to identify communication patterns and provide actionable feedback for leadership development.

NLP

Behavioral Analytics

Communication Insights

3. Data, Science & AI

langsmith-fetch

ComposioHQ

23.8K

Debugs LangChain and LangGraph agents by fetching and analyzing execution traces from LangSmith Studio for error investigation and performance insights.

LangChain

LangGraph

LangSmith

3. Data, Science & AI

learn-from-pr

dotnet

23.2K

Analyzes completed PRs with agent involvement to extract behavioral lessons, identify patterns, and generate actionable recommendations for improving agent skills and documentation.

Pull Request

AI Agent

Pattern Recognition

3. Data, Science & AI

ai-sdk

vercel

21.3K

Assists developers in building AI features using the Vercel AI SDK, including agents, chatbots, RAG systems, tool calling, and structured output.

RAG

Tool Calling

Structured Output

3. Data, Science & AI

develop-ai-functions-example

vercel

21.3K

Creates and manages example implementations for AI SDK functions to validate provider integrations, demonstrate capabilities, and serve as test fixtures.

AI SDK

Test Fixtures

Provider Support

3. Data, Science & AI

domain-ml

rustfs

20.1K

Enables development of machine learning and AI applications in Rust, supporting model training, inference, and deep learning with Rust libraries.

tch-rs

burn

candle

3. Data, Science & AI

agentic-eval

github

19.4K

Provides techniques for evaluating and refining AI agent outputs through self-critique, rubric-based systems, and iterative improvement pipelines.

LLM-as-judge

Self-Critique

Evaluator-Optimizer

3. Data, Science & AI

mcp-cli

github

19.4K

Command-line interface for interacting with Model Context Protocol (MCP) servers, enabling access to AI tools, APIs, and data sources via terminal commands.

MCP

CLI

LLM

3. Data, Science & AI

gemini

davila7

18.8K

Provides AI-powered code review and plan analysis using Gemini 3 Pro for large context processing (over 200k tokens).

Gemini 3 Pro

Code Review

200k+ Context

3. Data, Science & AI

session-handoff

davila7

18.8K

Creates comprehensive handoff documents for seamless AI agent session transfers, preventing context exhaustion and enabling uninterrupted continuation.

LLM Agents

Context Window

Session Handoff

3. Data, Science & AI

heygen-best-practices

davila7

18.8K

Provides optimal strategies for integrating and utilizing HeyGen's AI avatar video creation API effectively.

HeyGen

AI Avatar

Video API

3. Data, Science & AI

parallel-agents

davila7

18.8K

Orchestrates multiple AI agents with specialized expertise to perform parallel tasks or provide comprehensive analysis from diverse perspectives.

Multi-agent

Orchestration

Parallel

3. Data, Science & AI

database-schema-designer

davila7

18.8K

Designs optimized database schemas for SQL and NoSQL with normalization, indexing, and performance strategies to ensure data integrity and efficiency.

Normalization

Indexing

Database Schema

3. Data, Science & AI

PreviousPage 2 of 636 PageNext