Chunking

Chunking

The process of partitioning unstructured text into smaller, semantically meaningful segments to fit within LLM context windows and optimize retrieval precision. It requires an architectural trade-off between granular retrieval (small chunks reduce noise) and semantic coherence (large chunks preserve context).

Definition

Disambiguation

Not psychological memory grouping or database sharding; specifically refers to text splitting for vectorization.

Visual Metaphor

"Slicing a long loaf of bread into individual slices so they can fit into a toaster."

Key Tools

LangChain (RecursiveCharacterTextSplitter)LlamaIndexSemantic RouterUnstructured.ioNLTKspaCy

Related Connections

Overlap(Component)
Embedding(Prerequisite)
Context Window(Prerequisite)
Vector Database(Component)

Conceptual Overview

Disambiguation

Not psychological memory grouping or database sharding; specifically refers to text splitting for vectorization.

Visual Analog

Slicing a long loaf of bread into individual slices so they can fit into a toaster.

Definition

Conceptual Overview

Disambiguation

Visual Analog

Related Articles