GWAS Catalog Database

Overview

The GWAS Catalog is a comprehensive repository of published genome-wide association studies maintained by the National Human Genome Research Institute (NHGRI) and the European Bioinformatics Institute (EBI). The catalog contains curated SNP-trait associations from thousands of GWAS publications, including genetic variants, associated traits and diseases, p-values, effect sizes, and full summary statistics for many studies.

When to Use This Skill

This skill should be used when queries involve:

Genetic variant associations: Finding SNPs associated with diseases or traits
SNP lookups: Retrieving information about specific genetic variants (rs IDs)
Trait/disease searches: Discovering genetic associations for phenotypes
Gene associations: Finding variants in or near specific genes
GWAS summary statistics: Accessing complete genome-wide association data
Study metadata: Retrieving publication and cohort information
Population genetics: Exploring ancestry-specific associations
Polygenic risk scores: Identifying variants for risk prediction models
Functional genomics: Understanding variant effects and genomic context
Systematic reviews: Comprehensive literature synthesis of genetic associations

Core Capabilities

1. Understanding GWAS Catalog Data Structure

The GWAS Catalog is organized around four core entities:

Studies: GWAS publications with metadata (PMID, author, cohort details)
Associations: SNP-trait associations with statistical evidence (p ≤ 5×10⁻⁸)
Variants: Genetic markers (SNPs) with genomic coordinates and alleles
Traits: Phenotypes and diseases (mapped to EFO ontology terms)

Loading…

GWAS Catalog Database

Overview

When to Use This Skill

This skill should be used when queries involve:

Genetic variant associations: Finding SNPs associated with diseases or traits
SNP lookups: Retrieving information about specific genetic variants (rs IDs)
Trait/disease searches: Discovering genetic associations for phenotypes
Gene associations: Finding variants in or near specific genes
GWAS summary statistics: Accessing complete genome-wide association data
Study metadata: Retrieving publication and cohort information
Population genetics: Exploring ancestry-specific associations
Polygenic risk scores: Identifying variants for risk prediction models
Functional genomics: Understanding variant effects and genomic context
Systematic reviews: Comprehensive literature synthesis of genetic associations

Core Capabilities

1. Understanding GWAS Catalog Data Structure

The GWAS Catalog is organized around four core entities:

Studies: GWAS publications with metadata (PMID, author, cohort details)
Associations: SNP-trait associations with statistical evidence (p ≤ 5×10⁻⁸)
Variants: Genetic markers (SNPs) with genomic coordinates and alleles
Traits: Phenotypes and diseases (mapped to EFO ontology terms)

gwas-database

GWAS Catalog Database

Overview

When to Use This Skill

Core Capabilities

1. Understanding GWAS Catalog Data Structure

Related Skills

flow

verify

feature-flags

flags

GWAS Catalog Database

Overview

When to Use This Skill

Core Capabilities

1. Understanding GWAS Catalog Data Structure

2. Web Interface Searches

3. REST API Access

4. Query Examples and Patterns

5. Working with Summary Statistics

6. Data Integration and Cross-referencing

Query Workflows

Workflow 1: Exploring Genetic Associations for a Disease

Workflow 2: Investigating a Specific Genetic Variant

Workflow 3: Gene-Centric Association Analysis

Workflow 4: Systematic Review of Genetic Evidence

Workflow 5: Accessing and Analyzing Summary Statistics

Response Formats and Data Fields

Best Practices

Query Strategy

Data Interpretation

Rate Limiting and Ethics

Data Quality Considerations

Python Integration Example

Resources

references/api_reference.md

Training Materials

Important Notes

Data Updates

Citation Requirements

Limitations

Data Access

Additional Resources

Related Skills

flow

verify

feature-flags

flags