As línguas indígenas se agrupam em várias famílias, isto é, grupos de línguas irmãs que se desenvolveram independentemente durante séculos a partir de uma antiga língua mãe, como se desenvolveram as línguas românicas (Português, Francês, Espanhol, Italiano, Romeno, Catalão, etc.) a partir do Latim. Neste caso, fala-se de parentesco genético entre línguas, o que não deve ser confundido com parentesco genético biológico (entre indivíduos e espécies).
Em alguns casos, as famílias linguísticas mostram uma afinidade entre si que sugere que as suas línguas-mãe, por sua vez, são línguas irmãs, que se desenvolveram de uma língua-mãe mais antiga ainda. Por exemplo, as línguas românicas são aparentadas com as línguas germânicas, as línguas eslavas, as línguas celtas e muitas outras famílias. No Brasil, falamos, nestes casos, em troncos linguísticos, compostos de famílias — como o “tronco indo-europeu” que engloba todas as famílias mencionadas. Em terminologias usadas em outros países, fala-se de uma grande família linguística com várias subfamílias ou “ramificações”.
Também existem diversas línguas isoladas, isto é, línguas para as quais não sabemos de nenhuma língua irmã. Conhecendo melhor estas línguas não-classificadas, é possível demonstrar se elas possuem ligações com famílias linguísticas.
A classificação de línguas é sempre discutível; por exemplo, não é claro que as línguas Aruák tenham menos tempo de divergência do que as línguas Tupi. Uma classificação mais ou menos padrão das línguas indígenas do Brasil é:
- dois troncos linguísticos:
Tupí, com 10 famílias e um total de aprox. 37 línguas (no Brasil), e mais de 40 no total (considerando-se todos os países onde são faladas)
Macro-Gê, com 10 famílias e um total de aprox. 18 línguas;
- quatro famílias grandes (com 10 línguas ou mais):
Aruák, com aprox. 16 línguas (no Brasil, no total em todos os países mais que 36),
Karib, também com aprox. 16 línguas (no Brasil, em todos os países talvez o dobro),
Pano, com aprox. 12 línguas, e
Tucano, com aprox. 11 línguas;
- cinco famílias linguísticas de tamanho médio (com 3 ou mais línguas):
Arawá (7 línguas),
Nadahup (“Maku”) (5 línguas),
Chapacura (5 línguas),
Yanomami (4 línguas),
Nambikwara (3 línguas);
- três famílias linguísticas menores (com só uma ou duas línguas no Brasil):
Mura-Pirahã (2 línguas, só no Brasil),
Katukina (1 língua),
Chiquitano (no Brasil, só uma língua)
Guaikuru (no Brasil, só uma língua), e
Bora (no Brasil, só uma língua);
- sete línguas isoladas ou não-classificadas:
Aikanã, Iránxe, Kanoê, Kwazá, Máku, Trumai e Ticuna.
Existem listas com mais línguas. Isto usualmente é causado pelo fato de que os autores contaram dialetos maiores como se fossem línguas separadas, apesar de haver indícios de que os falantes destes idiomas conseguem se comunicar entre si, cada um usando seu idioma. Nestes casos, nós contamos estas variedades como uma só língua. O essencial é especificar os critérios utilizados.