3. Data, Science & AI

24 skills

Found 15241 skills

Total Stars:9.2M

Avg Stars:601

Sort by:Stars Desc Stars Asc Name A-Z Name Z-A

gene-database

davila7

18.0K

Queries NCBI Gene database via E-utilities/Datasets API to retrieve gene info (RefSeqs, GO, locations, phenotypes) for annotation and functional analysis.

NCBI Gene

E-utilities

Gene Ontology

3. Data, Science & AI

pymoo

davila7

18.0K

Provides a multi-objective optimization framework with algorithms like NSGA-II and MOEA/D for engineering design and optimization problems.

NSGA-II

MOEA/D

Pareto fronts

3. Data, Science & AI

nemo-guardrails

davila7

18.0K

Runtime safety framework for LLM applications with jailbreak detection, hallucination prevention, and PII filtering using Colang 2.0 DSL.

LLM Safety

Colang 2.0

Hallucination Detection

3. Data, Science & AI

modal

davila7

18.0K

Deploys and scales machine learning models and compute-intensive Python workloads in the cloud with GPU acceleration and auto-scaling.

GPU

Auto-scaling

3. Data, Science & AI

umap-learn

davila7

18.0K

Provides fast nonlinear dimensionality reduction using UMAP for 2D/3D visualization and clustering preprocessing of high-dimensional data.

UMAP

Dimensionality Reduction

HDBSCAN

3. Data, Science & AI

implementing-llms-litgpt

davila7

18.0K

Enables clean, single-file LLM training and fine-tuning with LitGPT, supporting LoRA/QLoRA for educational and production use.

LitGPT

LLMs

LoRA

3. Data, Science & AI

model-pruning

davila7

18.0K

Reduces LLM size and accelerates inference using pruning techniques like Wanda and SparseGPT, achieving 50% sparsity with minimal accuracy loss.

Pruning

Sparsity

LLM

3. Data, Science & AI

astropy

davila7

18.0K

Comprehensive Python library for astronomical data analysis, handling coordinate transformations, FITS files, and cosmological calculations.

FITS

WCS

Cosmology

3. Data, Science & AI

faiss

davila7

18.0K

Provides efficient similarity search and clustering for dense vectors, supporting billions of vectors with GPU acceleration and multiple index types for high-performance AI applications.

Vector Search

GPU Acceleration

k-NN

3. Data, Science & AI

matchms

davila7

18.0K

Processes mass spectrometry data (mzML/MGF/MSP) with spectral similarity calculations and metadata harmonization for metabolomics research.

mzML

spectral similarity

metabolomics

3. Data, Science & AI

scikit-survival

davila7

18.0K

Comprehensive Python toolkit for survival analysis, including Cox models, Random Survival Forests, and evaluation metrics for time-to-event data.

Survival Analysis

Cox Models

Random Survival Forests

3. Data, Science & AI

senior-computer-vision

davila7

18.0K

Provides advanced computer vision capabilities including object detection, segmentation, and model deployment using PyTorch, OpenCV, and vision transformers for production AI systems.

PyTorch

YOLO

Vision Transformers

3. Data, Science & AI

pytdc

davila7

18.0K

Offers AI-ready drug discovery datasets including ADME, toxicity, and DTI with benchmarks and scaffold splits for therapeutic machine learning.

ADME

DTI

Scaffold Splits

3. Data, Science & AI

reactome-database

davila7

18.0K

Queries Reactome REST API for pathway analysis, gene-pathway mapping, and molecular interaction studies in systems biology research.

Reactome

REST API

Pathway Analysis

3. Data, Science & AI

unsloth

davila7

18.0K

Expert guidance for fast fine-tuning of AI models using Unsloth, achieving 2-5x speedup and 50-80% memory reduction via LoRA/QLoRA optimization.

Unsloth

LoRA

QLoRA

3. Data, Science & AI

ray-data

davila7

18.0K

Scalable data processing for ML workloads, supporting Parquet, CSV, JSON, and images. Integrates with Ray Train, PyTorch, TensorFlow for distributed ETL and preprocessing.

Ray

Distributed

Multi-modal

3. Data, Science & AI

rdkit

davila7

18.0K

Provides molecular data processing including SMILES parsing, descriptor calculation, and substructure search for cheminformatics applications.

SMILES

Substructure Search

Molecular Fingerprints

3. Data, Science & AI

zarr-python

davila7

18.0K

A Python library for efficient storage and processing of large scientific datasets using chunked arrays, with cloud storage integration and compatibility with NumPy, Dask, and Xarray.

Zarr

NumPy

Dask

3. Data, Science & AI

mamba-architecture

davila7

18.0K

Provides a state-space model architecture (Mamba) for efficient sequence processing with O(n) complexity, 5× faster inference, and million-token sequence support without KV cache.

Selective SSM

Mamba

O(n) complexity

3. Data, Science & AI

dnanexus-integration

davila7

18.0K

Enables genomics pipeline development and execution on DNAnexus cloud platform via dxpy SDK for data management and analysis of FASTQ/BAM/VCF formats.

DNAnexus

dxpy

Genomics

3. Data, Science & AI

plotly

davila7

18.0K

Interactive Python library for creating scientific, statistical, and financial visualizations including charts, plots, and dashboards with customizable options.

Plotly

Data Visualization

Interactive Charts

3. Data, Science & AI

get-available-resources

davila7

18.0K

Detects and reports system resources (CPU, GPU, memory) to guide computational strategy for scientific tasks, including recommendations for parallel processing and GPU acceleration.

Resource Profiling

Scientific Computing

GPU Acceleration

3. Data, Science & AI

transformer-lens-interpretability

davila7

18.0K

Guides mechanistic interpretability research using TransformerLens to inspect transformer internals, attention patterns, and activation patching experiments.

TransformerLens

Mechanistic interpretability

Activation patching

3. Data, Science & AI

qutip

davila7

18.0K

Provides quantum simulation and analysis for quantum systems, including states, operators, and dynamics, using QuTiP.

QuTiP

Quantum dynamics

Open quantum systems

3. Data, Science & AI

PreviousPage 8 of 636 PageNext