Glossary

A comprehensive, searchable index of Retrieval-Augmented Generation terms, definitions, and synonyms to support technical clarity and consistency.

Advanced Concepts

Abstract Meaning Representation (AMR)

Advanced Concepts

Semantic graphs

Causal Inference

Advanced Concepts

Understanding cause-effect

Code Retrieval

Advanced Concepts

Finding relevant code snippets

Counterfactual Reasoning

Advanced Concepts

"What-if" analysis

Distillation

Advanced Concepts

Transferring knowledge to smaller models

Ensemble Methods

Advanced Concepts

Combining multiple models

Model Fusion

Advanced Concepts

Merging embeddings/outputs

Preference Learning

Advanced Concepts

Learning from rankings

Simulation-Based RAG

Advanced Concepts

Virtual environment testing

Structured Data Indexing

Advanced Concepts

Non-text data retrieval

Synthetic Data Generation

Advanced Concepts

Creating training examples

Test-Based Evaluation

Advanced Concepts

Using tests as metrics

Advanced Embedding Techniques

Contextual Embeddings

Advanced Embedding Techniques

Vectors capturing surrounding context

Cross-Lingual Embeddings

Advanced Embedding Techniques

Unified space for multiple languages

Dense Embeddings

Advanced Embedding Techniques

Full-dimensional continuous vectors

Dimensionality Reduction

Advanced Embedding Techniques

Reducing vector dimensions while preserving relationships

Domain-Specific Embeddings

Advanced Embedding Techniques

Models trained on specialized corpora (medical, legal)

Embedding Dimensionality

Advanced Embedding Techniques

Number of dimensions in vector (e.g., 768, 1536)

Instruction-Tuned Embeddings

Advanced Embedding Techniques

Models fine-tuned for specific retrieval tasks

Multi-Vector Embeddings

Advanced Embedding Techniques

Multiple representations per document (title, content, etc.)

Multilingual Embeddings

Advanced Embedding Techniques

Cross-language vector representations

Product Quantization (PQ)

Advanced Embedding Techniques

Compressing vectors by 97% through subvector coding

Quantization

Advanced Embedding Techniques

Reducing precision of vectors (4-bit, 8-bit)

Sparse Embeddings

Advanced Embedding Techniques

/ **Sparse Vectors** - High-dimensional vectors with mostly zeros

SPLADE

SPLADESPLADE

Advanced Embedding Techniques

Sparse Lexical and DensE embedding combining sparse/dense approaches

Vector Compression

Advanced Embedding Techniques

Techniques to reduce storage requirements

Advanced Retrieval & Learning

Continual Learning

Advanced Retrieval & Learning

Lifelong learning systems

Cross-Lingual Transfer

Advanced Retrieval & Learning

Multi-language adaptation

Domain-Specific Fine-Tuning

Advanced Retrieval & Learning

Adapting to specific domains

Few-Shot RAG

Advanced Retrieval & Learning

Learning from minimal examples

Incremental Learning

Advanced Retrieval & Learning

Learning from new data

Knowledge Decay

Advanced Retrieval & Learning

Tracking information relevance over time

Knowledge Refresh

Advanced Retrieval & Learning

Updating stale information

Meta-Learning

Advanced Retrieval & Learning

Learning to learn quickly

Online Learning

Advanced Retrieval & Learning

Real-time model updates

RAFT (Retrieval-Augmented Fine-Tuning)

Advanced Retrieval & Learning

Fine-tuning for RAG

Transfer Learning

Advanced Retrieval & Learning

Knowledge transfer across domains

Zero-Shot RAG

Advanced Retrieval & Learning

No task-specific examples

Advanced Retrieval Methods

ColBERT

Advanced Retrieval Methods

Contextualized Late Interaction over BERT

ColPali

Advanced Retrieval Methods

ColBERT applied to multimodal (vision) content

Conceptual Expansion

Advanced Retrieval Methods

Broadening query scope

Dense Passage Retrieval (DPR)

Advanced Retrieval Methods

Neural dense retrieval approach

HyDE (Hypothetical Document Embeddings)

Advanced Retrieval Methods

LLM-generated synthetic documents

Iterative Retrieval

Advanced Retrieval Methods

Refining retrieval in steps

Multi-Hop Retrieval

Advanced Retrieval Methods

Retrieving across multiple documents

Multi-Query RAG

Advanced Retrieval Methods

Multiple reformulations of single query

Query Expansion

Advanced Retrieval Methods

Enriching query with synonyms and related terms

Query Reformulation

Advanced Retrieval Methods

Rewriting queries for better matching

Query Rewriting

Advanced Retrieval Methods

Transforming queries to improve retrieval

Sub-Query Generation

Advanced Retrieval Methods

Breaking complex queries into parts

Synonym Expansion

Advanced Retrieval Methods

Adding alternative terms

Architectures & Models

BERT

BERTBERT

Architectures & Models

Bidirectional Encoder Representations from Transformers

BM25

BM25BM25

Architectures & Models

Best Matching 25

DPR

DPRDPR

Architectures & Models

Dense Passage Retrieval

HNSW

HNSWHNSW

Architectures & Models

Hierarchical Navigable Small World

HyDE

Architectures & Models

Hypothetical Document Embeddings

IVF

IVFIVF

Architectures & Models

Inverted File

PQ

PQPQ

Architectures & Models

Product Quantization

RAFT

RAFTRAFT

Architectures & Models

Retrieval-Augmented Fine-Tuning

SPLADE

SPLADESPLADE

Architectures & Models

Sparse Lexical and DensE

TF-IDF

TF-IDFTF-IDF

Architectures & Models

Term Frequency-Inverse Document Frequency

Benchmarks & Datasets

BEIR

BEIRBEIR

Benchmarks & Datasets

Diverse information retrieval benchmark

ColBERT Benchmark

Benchmarks & Datasets

Late interaction evaluation

HotpotQA

Benchmarks & Datasets

Multi-hop question answering

MS-MARCO

MS-MARCOMS-MARCO

Benchmarks & Datasets

Large-scale IR benchmark

Natural Questions

Benchmarks & Datasets

Long-form QA benchmark

PubMed QA

Benchmarks & Datasets

Biomedical question answering

TriviaQA

Benchmarks & Datasets

Large-scale QA dataset

XQuAD

Benchmarks & Datasets

Cross-lingual QA benchmark

Compliance & Ethics

Algorithmic Bias

Compliance & Ethics

Systematic discrimination

Bias Detection

Compliance & Ethics

Identifying unfair patterns

CCPA

CCPACCPA

Compliance & Ethics

California Consumer Privacy Act

Explainability

Compliance & Ethics

Understanding model decisions

Fairness Metrics

Compliance & Ethics

Measuring equality

FINRA

FINRAFINRA

Compliance & Ethics

Financial regulatory compliance

GDPR

GDPRGDPR

Compliance & Ethics

General Data Protection Regulation

HIPAA

HIPAAHIPAA

Compliance & Ethics

Health Insurance Portability and Accountability Act

Responsible AI

Compliance & Ethics

Ethical AI principles

SOX

SOXSOX

Compliance & Ethics

Sarbanes-Oxley compliance

Transparency

Compliance & Ethics

Clear system explanation

Context & Token Management

Chunking for Context

Context & Token Management

Dividing content for token limits

Context Preservation

Context & Token Management

Maintaining important information

Context Truncation

Context & Token Management

Cutting text to fit limits

Grounding Context

Context & Token Management

Context supporting response claims

Input Tokens

Context & Token Management

Tokens in query and context

Output Tokens

Context & Token Management

Tokens in generated response

Prompt Caching

Context & Token Management

Reusing previously computed prompts

Sliding Window

Context & Token Management

Fixed-size moving context window

Summarization

Context & Token Management

Condensing text to save tokens

Token Budget

Context & Token Management

Allocated tokens for retrieval and generation

Token Efficiency

Context & Token Management

Maximizing value per token

Token Limit

Context & Token Management

Maximum tokens LLM can process

Core RAG

ANN

ANNANN

Core RAG

Approximate Nearest Neighbor

IR

IRIR

Core RAG

Information Retrieval

LLM

LLMLLM

Core RAG

Large Language Model

NLP

NLPNLP

Core RAG

Natural Language Processing

QA

QAQA

Core RAG

Question Answering

RAG

RAGRAG

Core RAG

Retrieval-Augmented Generation

Data & Context Management

Context Offloading

Data & Context Management

Storing context externally

Conversation History

Data & Context Management

Previous interactions for context

Distributed Retrieval

Data & Context Management

Retrieval from multiple systems

Federated RAG

Data & Context Management

Querying across distributed knowledge sources

Long-Term Memory

Data & Context Management

Persistent user preferences and patterns

RAG with Memory

Data & Context Management

Session and long-term memory integration

Real-Time Updates

Data & Context Management

Dynamic knowledge base updates

Reflective Memory Management

Data & Context Management

Curating important memories

Session Memory

Data & Context Management

Short-term conversation state

Streaming RAG

Data & Context Management

Real-time document and response streaming

Data & Privacy

Access Control

Data & Privacy

RBAC and ABAC

Audit Logging

Data & Privacy

Tracking system actions

Consent Management

Data & Privacy

Recording user permissions

Data Anonymization

Data & Privacy

Removing identifying information

Data Lineage

Data & Privacy

Tracking data origin and transformations

Data Provenance

Data & Privacy

Source and history tracking

Encryption at Rest

Data & Privacy

Data storage encryption

Encryption in Transit

Data & Privacy

Network data encryption

PII Detection

Data & Privacy

Identifying personally identifiable information

PII Redaction

Data & Privacy

Removing sensitive information

Tokenization

Data & Privacy

Replacing sensitive data

Data Structures

B-Tree

Data Structures

Sorted tree structure

Graph

Data Structures

Connected nodes and edges

Hash Table

Data Structures

Key-value storage

Heap

Data Structures

Priority queue structure

Knowledge Graph

Data Structures

Semantic network

Property Graph

Data Structures

Graph with attributes

Queue

Data Structures

First-in-first-out

Skip List

Data Structures

Probabilistic balanced structure

Trie

Data Structures

Prefix tree for strings

Database Features

ACID Compliance

Database Features

Transaction guarantees

Filtering Capabilities

Database Features

Conditional document selection

High Availability

Database Features

Redundancy and failover

Metadata Support

Database Features

Storing non-vector data

Multi-Tenancy

Database Features

Isolated data per tenant

Namespace

Database Features

Data partition within database

Replication

Database Features

Copying data across nodes

Scalability

Database Features

Handling growing data

Sharding

Database Features

Distributing data across partitions

Tenant Isolation

Database Features

Access control per tenant

Document & Data Management

Chunk Overlap

Document & Data Management

Redundant content between consecutive chunks

Chunk Size

Document & Data Management

Number of tokens or characters per segment

Chunking

Document & Data Management

Breaking documents into manageable pieces for embedding

Corpus

Document & Data Management

Complete collection of documents in knowledge base

Document Segmentation

Document & Data Management

Breaking text into logical units

Document Store

Document & Data Management

Repository for original/source documents

Document Versioning

Document & Data Management

Tracking changes and updates to source material

Fixed-Size Chunking

Document & Data Management

Character or token-based uniform segmentation

Metadata Enrichment

Document & Data Management

Adding contextual information (tags, dates, source)

Semantic Chunking

Document & Data Management

Content-aware splitting based on meaning

Smart Chunking

Document & Data Management

/ **Agentic Chunking** - LLM-assisted intelligent document splitting

Text Extraction

Document & Data Management

Pulling readable content from various formats

Text Splitting

Document & Data Management

Dividing content while preserving context

Document Processing

BeautifulSoup

Document Processing

Web scraping

Docling

Document Processing

Document parsing and chunking

Google Gemini OCR

Document Processing

Vision-language model(VLM) OCR

IBM Granite

Document Processing

Open-source vision-language model(VLM) OCR

Mistral OCR

Document Processing

Vision-language model(VLM) OCR

PaddleOCR

Document Processing

Open-source vision-language model(VLM) OCR

pdfplumber

Document Processing

PDF content extraction

PyPDF

Document Processing

PDF text extraction

Selenium

Document Processing

Browser automation

Tesseract

Document Processing

OCR text recognition

Unstructured.io

Document Processing

Document parsing and chunking

Domain Applications

Code Assistant

Domain Applications

API and documentation retrieval

Customer Support

Domain Applications

FAQ and ticket automation

DevOps RAG

Domain Applications

Infrastructure documentation

Enterprise Knowledge Base

Domain Applications

Organizational information system

Financial RAG

Domain Applications

Market data and compliance

Journalism RAG

Domain Applications

Fact-checking and verification

Legal RAG

Domain Applications

Contract and precedent analysis

Medical RAG

Domain Applications

/ **Clinical RAG** - Patient records and guidelines

Real Estate RAG

Domain Applications

Property and regulation information

Research Assistant

Domain Applications

Academic literature integration

Embedding Fundamentals

Cosine Similarity

Embedding Fundamentals

Angle-based similarity metric between vectors

Dot Product

Embedding Fundamentals

Similarity calculation for normalized vectors

Embedding Model

Embedding Fundamentals

Neural network converting text to vectors

Embedding Space

Embedding Fundamentals

Multi-dimensional space where vectors are positioned

Embeddings

Embedding Fundamentals

Numerical vector representations of text capturing semantic meaning

Euclidean Distance

Embedding Fundamentals

Straight-line distance between vectors

Semantic Meaning

Embedding Fundamentals

Contextual understanding of text beyond keywords

Semantic Search

Embedding Fundamentals

Finding documents by meaning rather than keywords

Vector Normalization

Embedding Fundamentals

Scaling vectors to unit length

Vector Representation

Embedding Fundamentals

Numeric array encoding semantic content

Embedding Models

BGE (BAAI General Embedding)

Embedding Models

Open-source high-performance embeddings

CLIP

CLIPCLIP

Embedding Models

Vision-language embedding model

Cohere Embed-v3

Embedding Models

Commercial multilingual embedding model

E5 Embeddings

Embedding Models

Large-scale training datasets embeddings

LLaMA Embeddings

Embedding Models

Embeddings from Meta's LLaMA models

nomic-embed-text

Embedding Models

Open-source efficient embeddings

OpenAI text-embedding-3-large

Embedding Models

3,072-dimensional embedding model

OpenAI text-embedding-3-small

Embedding Models

1,536-dimensional embedding model

Sentence-Transformers

Embedding Models

Framework for semantic textual similarity

Voyage AI Embeddings

Embedding Models

Embeddings from Voyage AI models

Error Analysis

Attribution Error

Error Analysis

Incorrect source citation

Cold Start Problem

Error Analysis

New documents not retrievable

Confabulation

Error Analysis

Confident false information

Context Mismatch

Error Analysis

Retrieved docs not supporting query

Hallucination

Error Analysis

Fabricated information not in context

Knowledge Conflict

Error Analysis

Contradictory information

Prompt Injection

Error Analysis

Adversarial attack via input

Ranking Error

Error Analysis

Relevant docs ranked too low

Retrieval Failure

Error Analysis

Missing relevant documents

Semantic Drift

Error Analysis

Meaning divergence between query and context

Evaluation Tools & Frameworks

AgentOps

Evaluation Tools & Frameworks

Agent behavior tracking

Arize

Evaluation Tools & Frameworks

AI observability platform

DeepEval

Evaluation Tools & Frameworks

LLM evaluation with code

Langfuse

Evaluation Tools & Frameworks

Production monitoring and evaluation

LangSmith

Evaluation Tools & Frameworks

LangChain evaluation platform

Promptfoo

Evaluation Tools & Frameworks

Prompt testing and comparison

Pydantic

Evaluation Tools & Frameworks

Data validation for outputs

RAGAS

RAGASRAGAS

Evaluation Tools & Frameworks

RAG evaluation framework

Foundational Terms

Augmented Prompt

Foundational Terms

Query combined with retrieved context before generation

Context Window

Foundational Terms

Maximum amount of text an LLM can process (tokens)

External Knowledge

Foundational Terms

Information sources outside the LLM's training data

Generation Pipeline

Foundational Terms

LLM component that synthesizes responses from retrieved context

Grounding

Foundational Terms

Anchoring generated responses in retrieved facts to reduce hallucinations

Indexing Pipeline

Foundational Terms

Process of preparing and storing documents for retrieval

Knowledge Base

Foundational Terms

Structured or unstructured collection of documents and data

Retrieval Pipeline

Foundational Terms

System component responsible for fetching relevant documents

Retrieval-Augmented Generation (RAG)

Foundational Terms

Technique combining information retrieval with generative AI for grounded responses

Generation & Response Metrics

Answer Relevancy

Generation & Response Metrics

How well response addresses question

Answer Similarity

Generation & Response Metrics

Semantic similarity to expected answer

BLEU Score

Generation & Response Metrics

N-gram overlap with reference

Citation Accuracy

Generation & Response Metrics

Correctness of source attribution

Coherence

Generation & Response Metrics

Logical flow and readability

Completeness

Generation & Response Metrics

Addressing all query aspects

Exact Match (EM)

Generation & Response Metrics

Predictions matching reference exactly

Factual Correctness

Generation & Response Metrics

Accuracy of claims in response

Faithfulness

Generation & Response Metrics

Response grounded only in retrieved context

ROUGE Score

Generation & Response Metrics

Recall-oriented understudy evaluation

Semantic Similarity

Generation & Response Metrics

Meaning-based comparison

Infrastructure & Deployment

API Gateway

Infrastructure & Deployment

Request routing and management

CDN Integration

Infrastructure & Deployment

Content delivery network

Cloud Deployment

Infrastructure & Deployment

AWS, Azure, GCP

Connection Pooling

Infrastructure & Deployment

Reusing database connections

Containerization

Infrastructure & Deployment

Docker containers

Distributed Systems

Infrastructure & Deployment

Multi-machine setup

Edge Deployment

Infrastructure & Deployment

Placing systems closer to users

Horizontal Scaling

Infrastructure & Deployment

Adding more servers

Kubernetes

Infrastructure & Deployment

Container orchestration

Load Balancing

Infrastructure & Deployment

Distributing requests

Microservices

Infrastructure & Deployment

Independent service components

Self-Hosted

Infrastructure & Deployment

On-premise deployment

Vertical Scaling

Infrastructure & Deployment

Using more powerful servers

Intelligent RAG Patterns

Active RAG

Intelligent RAG Patterns

Iterative query refinement

Adaptive RAG

Intelligent RAG Patterns

Dynamic strategy selection based on query type

Agentic RAG

Intelligent RAG Patterns

Autonomous agent-driven retrieval decisions

Branched RAG

Intelligent RAG Patterns

Multiple retrieval paths in single query

Corrective RAG (CRAG)

Intelligent RAG Patterns

Post-generation error checking

Memory RAG

Intelligent RAG Patterns

Retaining interaction history

Meta-Learning RAG

Intelligent RAG Patterns

Rapid adaptation with few examples

Multi-Agent RAG

Intelligent RAG Patterns

Coordination between specialized agents

Reflective RAG

Intelligent RAG Patterns

Self-reflective improvement mechanisms

Self-Corrective RAG

Intelligent RAG Patterns

Internal critique and iteration

Self-Grading RAG

Intelligent RAG Patterns

Self-assessment of relevance

Self-RAG

Intelligent RAG Patterns

Model self-evaluates and critiques own outputs

Tool-Based RAG

Intelligent RAG Patterns

RAG using external tools/APIs

Long-Context Handling

Long Document Processing

Long-Context Handling

Extended text handling

Long-Context Models

Long-Context Handling

100K+ token support

Memory Budget

Long-Context Handling

Token allocation strategy

Priority-Based Updates

Long-Context Handling

Updating high-value information

Recency Bias

Long-Context Handling

Preferring recent documents

Salience Scoring

Long-Context Handling

Importance weighting

Selective Memory

Long-Context Handling

Choosing what to retain

Temporal Information

Long-Context Handling

Time-aware retrieval

Machine Learning Concepts

Attention Mechanism

Machine Learning Concepts

Focusing on relevant parts

BERT

BERTBERT

Machine Learning Concepts

Bidirectional Encoder Representations

Encoder-Decoder

Machine Learning Concepts

Two-part model architecture

Fine-Tuning

Machine Learning Concepts

Adapting pre-trained models

GPT

GPTGPT

Machine Learning Concepts

Generative Pre-trained Transformer

Neural Networks

Machine Learning Concepts

Deep learning models

Representation Learning

Machine Learning Concepts

Learning useful features

Self-Attention

Machine Learning Concepts

Elements attending to each other

Transfer Learning

Machine Learning Concepts

Using knowledge from one task for another

Transformer Architecture

Machine Learning Concepts

Attention-based models

Metrics

AUC

AUCAUC

Metrics

Area Under Curve

BLEU

BLEUBLEU

Metrics

BiLingual Evaluation Understudy

EM

EMEM

Metrics

Exact Match

F1

F1F1

Metrics

F1 Score

MAP

MAPMAP

Metrics

Mean Average Precision

MRR

MRRMRR

Metrics

Mean Reciprocal Rank

NDCG

NDCGNDCG

Metrics

Normalized Discounted Cumulative Gain

ROC

ROCROC

Metrics

Receiver Operating Characteristic

ROUGE

ROUGEROUGE

Metrics

Recall-Oriented Understudy for GIST Evaluation

Monitoring & Observability

Datadog

Monitoring & Observability

Infrastructure monitoring

Deepdive

Monitoring & Observability

LLM error analysis

Grafana

Monitoring & Observability

Metrics visualization

Helicone

Monitoring & Observability

Token usage and cost tracking

New Relic

Monitoring & Observability

Application performance

Phoenix

Monitoring & Observability

Observability and evaluation

Prometheus

Monitoring & Observability

Metrics collection

Multimodal RAG

Audio Embedding

Multimodal RAG

Vector representation of audio

Audio Transcription

Multimodal RAG

Speech-to-text

Cross-Modal Retrieval

Multimodal RAG

Text-to-image, image-to-text

Document Image

Multimodal RAG

Scanned PDFs and photos

Image Embeddings

Multimodal RAG

Vector representations of images

Image Retrieval

Multimodal RAG

Finding similar images

Multi-Modal RAG

Multimodal RAG

Handling text, images, video, audio

OCR (Optical Character Recognition)

Multimodal RAG

Text from images

Unified Embedding Space

Multimodal RAG

Single space for multiple modalities

Video Processing

Multimodal RAG

Extracting frames and audio

Vision Encoder

Multimodal RAG

Model for image embeddings

Visual Question Answering (VQA)

Multimodal RAG

QA on images

Optimization Techniques

Batch Processing

Optimization Techniques

Grouping queries for efficiency

Caching

Optimization Techniques

Storing frequent results

Cost Optimization

Optimization Techniques

Minimizing expenses

Early Stopping

Optimization Techniques

Terminating search early

Index Optimization

Optimization Techniques

Improving retrieval speed

Latency Reduction

Optimization Techniques

Speeding up responses

Memcached

Optimization Techniques

Distributed caching

Model Cascading

Optimization Techniques

Using cheaper models first

Prompt Caching

Optimization Techniques

Reusing computed contexts

Query Planning

Optimization Techniques

Optimizing query execution

Redis Caching

Optimization Techniques

In-memory cache layer

Throughput Increase

Optimization Techniques

More queries per second

Token Optimization

Optimization Techniques

Reducing token usage

Orchestration & Framework Libraries

AutoGen

Orchestration & Framework Libraries

Multi-agent conversation framework

CrewAI

Orchestration & Framework Libraries

Agent team orchestration

DSPy

Orchestration & Framework Libraries

Declarative LLM programming

Haystack

Orchestration & Framework Libraries

End-to-end RAG framework

LangChain

Orchestration & Framework Libraries

Comprehensive LLM orchestration framework

LangGraph

Orchestration & Framework Libraries

Stateful workflow graphs

LlamaIndex

Orchestration & Framework Libraries

Document indexing and retrieval framework

OpenAI Swarm

Orchestration & Framework Libraries

Lightweight agent coordination

Semantic Kernel

Orchestration & Framework Libraries

.NET LLM integration

Performance Concepts

Bandwidth

Performance Concepts

Data transfer rate

Big O Notation

Performance Concepts

Complexity classification

Bottleneck

Performance Concepts

Performance limiting factor

Inference Speed

Performance Concepts

Model prediction time

Latency

Performance Concepts

Response time

Memory Footprint

Performance Concepts

Storage requirement

Profiling

Performance Concepts

Performance measurement

Space Complexity

Performance Concepts

Algorithm memory usage

Throughput

Performance Concepts

Operations per unit time

Time Complexity

Performance Concepts

Algorithm speed analysis

Personalization & Memory

Behavioral Tracking

Personalization & Memory

Monitoring user interactions

Demographic Targeting

Personalization & Memory

Segmenting by user attributes

Episodic Memory

Personalization & Memory

Recent interaction memory

Hyper-Personalization

Personalization & Memory

Extreme user customization

Memory Consolidation

Personalization & Memory

Organizing remembered information

Personalization Engine

Personalization & Memory

System for custom ranking

Semantic Memory

Personalization & Memory

Long-term knowledge storage

Session State

Personalization & Memory

Current conversation context

User Profiling

Personalization & Memory

Learning user preferences

User-Specific Embeddings

Personalization & Memory

Custom vector representations

Platforms & Tools

AWS

AWSAWS

Platforms & Tools

Amazon Web Services

Azure

Platforms & Tools

Microsoft Azure

CLI

CLICLI

Platforms & Tools

Command Line Interface

FOSS

FOSSFOSS

Platforms & Tools

Free and Open-Source Software

GCP

GCPGCP

Platforms & Tools

Google Cloud Platform

GUI

GUIGUI

Platforms & Tools

Graphical User Interface

JSON

JSONJSON

Platforms & Tools

JavaScript Object Notation

REST

RESTREST

Platforms & Tools

Representational State Transfer

SDK

SDKSDK

Platforms & Tools

Software Development Kit

Prompting Techniques

A

Prompting Techniques

Comparing prompt variants

Synonyms:B Testing

Chain-of-Thought

Prompting Techniques

Step-by-step reasoning prompts

Context Injection

Prompting Techniques

Including retrieved documents in prompt

Dynamic Prompting

Prompting Techniques

Runtime prompt modification

Few-Shot Prompting

Prompting Techniques

Including examples in prompt

Instruction Engineering

Prompting Techniques

Crafting clear task instructions

Prompt Augmentation

Prompting Techniques

Enhancing prompt with context

Prompt Evaluation

Prompting Techniques

Testing prompt effectiveness

Prompt Optimization

Prompting Techniques

Improving prompt quality

Prompt Template

Prompting Techniques

Reusable prompt structure

Prompt Versioning

Prompting Techniques

Managing prompt variations

System Prompt

Prompting Techniques

Base instructions for LLM behavior

User Prompt

Prompting Techniques

Query or request from user

RAG Variants & Techniques

Advanced RAG

RAG Variants & Techniques

RAG with enhanced retrieval techniques

Basic RAG

RAG Variants & Techniques

Fundamental RAG pattern

Modular RAG

RAG Variants & Techniques

Separate, independently upgradeable components

Monolithic RAG

RAG Variants & Techniques

Integrated single system

Naive RAG

RAG Variants & Techniques

Basic retrieve-then-generate pipeline

Standard RAG

RAG Variants & Techniques

Classical single-stage retrieval approach

Ranking & Re-ranking

Cross-Encoder

Ranking & Re-ranking

Model that scores query-document pairs jointly

Cross-Encoder Reranking

Ranking & Re-ranking

Using BERT-like models to score pairs

Dual-Encoder

Ranking & Re-ranking

Separate encoders for query and document

Learning-to-Rank (LTR)

Ranking & Re-ranking

ML models for optimal ranking

NDCG@K

NDCG@KNDCG@K

Ranking & Re-ranking

Normalized Discounted Cumulative Gain ranking metric

Precision@K

Ranking & Re-ranking

Fraction of top-k results that are relevant

Ranking Functions

Ranking & Re-ranking

Algorithms determining result order

Re-ranking

Ranking & Re-ranking

Reordering retrieved results by relevance

Recall@K

Ranking & Re-ranking

Fraction of all relevant docs in top-k

Relevance Scoring

Ranking & Re-ranking

Assigning confidence to document relevance

Relevance Threshold

Ranking & Re-ranking

Minimum score for document inclusion

Top-K Retrieval

Ranking & Re-ranking

Returning k highest-ranked documents

Ranking Algorithms

BM25

BM25BM25

Ranking Algorithms

Probabilistic ranking function (builds on TF-IDF)

BM25 Parameters

Ranking Algorithms

k1 (term saturation), b (length norm)

Inverse Document Frequency (IDF)

Ranking Algorithms

How rare term is

Length Normalization

Ranking Algorithms

Adjusting for document length

Okapi BM25

Ranking Algorithms

Standard BM25 implementation

Probabilistic Ranking

Ranking Algorithms

Probability-based scoring

Relevance Ranking

Ranking Algorithms

Ordering by relevance

Term Frequency (TF)

Ranking Algorithms

How often term appears

Term Saturation

Ranking Algorithms

Preventing TF dominance

TF-IDF

TF-IDFTF-IDF

Ranking Algorithms

Term Frequency-Inverse Document Frequency

Retrieval Metrics

Contextual Precision

Retrieval Metrics

Are top results ranked in order of relevance?

Contextual Recall

Retrieval Metrics

Does context contain info needed for answer?

F1 Score

Retrieval Metrics

Harmonic mean of precision and recall

F1@K

F1@KF1@K

Retrieval Metrics

F1 score at top-k results

Mean Average Precision (MAP)

Retrieval Metrics

Average precision across queries

Mean Reciprocal Rank (MRR)

Retrieval Metrics

Average rank of first relevant result

MRR@K

MRR@KMRR@K

Retrieval Metrics

MRR considering only top-k results

NDCG@K

NDCG@KNDCG@K

Retrieval Metrics

NDCG@top-k results

Normalized Discounted Cumulative Gain (NDCG)

Retrieval Metrics

Ranking quality metric

Precision

Retrieval Metrics

Fraction of retrieved results that are relevant

Recall

Retrieval Metrics

Fraction of all relevant documents retrieved

Relevance Score

Retrieval Metrics

Numerical measure of document relevance

Similarity Score

Retrieval Metrics

Embedding-based relevance measure

Search Techniques

Full-Text Search

Search Techniques

Searching across all text fields

Hierarchical Retrieval

Search Techniques

Retrieving at different granularity levels

Hybrid Search

Search Techniques

Combining keyword and semantic search

Keyword Search

Search Techniques

Traditional text matching using terms

Late Interaction

Search Techniques

ColBERT-style token-level interactions

Multi-Stage Retrieval

Search Techniques

Sequential retrieval steps with refinement

Neural Search

Search Techniques

Search using deep learning models

Query-Passage Matching

Search Techniques

Scoring document relevance to query

Reciprocal Rank Fusion (RRF)

Search Techniques

Combining ranking lists from multiple retrievers

Semantic Search

Search Techniques

Meaning-based search (vs. keyword)

Sparse-Dense Hybrid

Search Techniques

Combining sparse (BM25) and dense (embeddings) methods

Security Threats

Adversarial Inputs

Security Threats

Crafted attack inputs

Data Poisoning

Security Threats

Corrupting training/knowledge bases

DDoS

Security Threats

Denial-of-service attacks

Jailbreaking

Security Threats

Circumventing safety guardrails

Model Extraction

Security Threats

Stealing model knowledge

Prompt Injection

Security Threats

Malicious input attacks

Rate Limiting

Security Threats

Controlling request volume

Selection & Filtering

Attribute-Based Filtering

Selection & Filtering

Filtering by field values

Candidate Retrieval

Selection & Filtering

Initial broad retrieval stage

Deduplication

Selection & Filtering

Removing duplicate or near-duplicate results

Entity Linking

Selection & Filtering

Connecting mentions to knowledge base entities

Faceted Search

Selection & Filtering

Multi-dimensional filtering

Metadata Filtering

Selection & Filtering

Selecting documents by attributes

Named Entity Recognition (NER)

Selection & Filtering

Identifying entities in text

Query Refinement

Selection & Filtering

Modifying queries for better results

Result Aggregation

Selection & Filtering

Combining results from multiple sources

Specialized Retrieval Approaches

Causal Reasoning

Specialized Retrieval Approaches

Understanding cause-effect relationships

Community Detection

Specialized Retrieval Approaches

Identifying clusters in knowledge graphs

Cross-Document Reasoning

Specialized Retrieval Approaches

Synthesizing info across multiple sources

Entity-Relationship Graph

Specialized Retrieval Approaches

Graph of connected entities

Graph RAG

Specialized Retrieval Approaches

/ **Knowledge-Graph-Aware Retrieval** - Using entity relationships

Knowledge Graph Integration

Specialized Retrieval Approaches

Incorporating structured knowledge

Multi-Hop Reasoning

Specialized Retrieval Approaches

Multi-step logical inference

Semantic Graph Traversal

Specialized Retrieval Approaches

Following relationships for context

Structured Retrieval

Specialized Retrieval Approaches

Retrieving from tables, databases, knowledge graphs

Storage Technologies

Dense Index

Storage Technologies

Index for dense vectors

Distributed Storage

Storage Technologies

Vectors across servers

Graph-Based Index

Storage Technologies

Network structure indexing

Hybrid Index

Storage Technologies

Combined sparse and dense

In-Memory Storage

Storage Technologies

Vectors stored in RAM

Inverted Index

Storage Technologies

Mapping terms to documents

Persistent Storage

Storage Technologies

Vectors on disk

Sparse Index

Storage Technologies

Index for sparse vectors

Tree-Based Index

Storage Technologies

Hierarchical indexing

Vector Index

Storage Technologies

Optimized structure for vector storage

System-Level Metrics

Availability

System-Level Metrics

Uptime and reliability

Cost per Query

System-Level Metrics

Token usage and infrastructure costs

Latency

System-Level Metrics

Time to generate response

Memory Usage

System-Level Metrics

Storage and RAM requirements

Query Latency

System-Level Metrics

Time from query to results

Scalability

System-Level Metrics

Performance as system grows

Throughput

System-Level Metrics

Queries processed per unit time

Token Usage

System-Level Metrics

Number of tokens consumed

Techniques & Patterns

API

APIAPI

Techniques & Patterns

Application Programming Interface

CRAG

CRAGCRAG

Techniques & Patterns

Corrective RAG

ETL

ETLETL

Techniques & Patterns

Extract Transform Load

MCP

MCPMCP

Techniques & Patterns

Model Context Protocol

NER

NERNER

Techniques & Patterns

Named Entity Recognition

OCR

OCROCR

Techniques & Patterns

Optical Character Recognition

RRF

RRFRRF

Techniques & Patterns

Reciprocal Rank Fusion

Self-RAG

Techniques & Patterns

Self-Reflective RAG

VQA

VQAVQA

Techniques & Patterns

Visual Question Answering

Text Processing

Case Normalization

Text Processing

Standardizing letter case

Character Encoding

Text Processing

Text standardization

Language Detection

Text Processing

Identifying text language

Lemmatization

Text Processing

Converting to base form

Stemming

Text Processing

Reducing words to root form

Stop Word Removal

Text Processing

Removing common words

Tokenization

Text Processing

Breaking text into tokens

Whitespace Handling

Text Processing

Cleaning spacing

Use Case Specific

Chatbot

Use Case Specific

Conversational interface

Citation Generation

Use Case Specific

Creating source attributions

Document Search

Use Case Specific

Finding relevant documents

Fact Checking

Use Case Specific

Verifying claims

Q&A System

Use Case Specific

Question answering

Recommendation System

Use Case Specific

Suggesting content

Semantic Search

Use Case Specific

Meaning-based search

Summarization

Use Case Specific

Condensing document content

Vector Database Platforms

Chroma

Vector Database Platforms

Lightweight open-source embedded database

Elasticsearch

Vector Database Platforms

Full-text search with vector support

FAISS

FAISSFAISS

Vector Database Platforms

Facebook's high-performance similarity search library

LanceDB

Vector Database Platforms

Modern vector database with multi-modal support

Milvus

Vector Database Platforms

Enterprise open-source vector database for massive scale

MongoDB Atlas Vector Search

Vector Database Platforms

Vector capabilities in MongoDB

Pinecone

Vector Database Platforms

Managed vector database with hybrid search

PostgreSQL pgvector

Vector Database Platforms

Vector extension for PostgreSQL

Qdrant

Vector Database Platforms

Rust-based high-performance vector database

Supabase

Vector Database Platforms

PostgreSQL with vector support

Vector Database

Vector Database Platforms

Specialized database optimized for storing and querying embeddings

Vector Store

Vector Database Platforms

Alternative term for vector database

Weaviate

Vector Database Platforms

Open-source vector database with GraphQL API