Dicionário de Rimas Perfeitas

Voltar

Sobre o Dicionário

Por que Dicionário de Rimas Perfeitas?

A rima é um fenômeno fonético que surge da repetição de sons. Dependendo dos sons que são repetidos, as rimas pode ser classificadas em perfeitas ou imperfeitas (uma boa explicação está em Classificação de Rimas). Decidi por esse título para reforçar a característica principal deste dicionário, que é a busca da pronúncia por trás da escrita. Existem ferramentas na rede que prometem encontrar rimas, mas que se baseiam unicamente na semelhança de grafias entre as palavras. Esse método é mais simples, porém não é capaz de encontrar todas as rimas possíveis, e, muitas vezes, aponta rimas onde não existem.

O Dicionário de Rimas Perfeitas procura superar essa deficiência, para disponibilizar uma ferramenta mais completa e correta. Para isso, se esforça para determinar semelhanças entre as pronúncias das palavras, não simplesmente entre suas formas escritas.

Como funciona o Dicionário?

Basta inserir no campo de busca uma palavra para a qual se procura rimas e clicar no botão Procurar. O Dicionário vai apresentar, no campo de resposta, a lista das palavras que rimam com a palavra inserida, caso existam.

O Dicionário considera que a rima é a pronúncia a partir da vogal tônica de uma palavra (ex.: a rima da palavra "praia" é "aia").

A lista de respostas pode ser limitada, selecionando o número mínimo e/ou número máximo de sílabas desejado nas palavras retornadas.

Caso a palavra inserida no campo de busca não exista no banco, o Dicionário procura palavras terminadas com o termo inserido, e caso existam, retorna palavras que rimem.

Como foi feito o Dicionário?

O primeiro passo foi encontrar um banco de palavras abrangente da língua portuguesa, num formato fácil de manipular. O banco que usei como ponto de partida para a versão atual é o arquivo portuguese-brazil.dic, encontrado em github.com/rafaelsc/IntelliJ.Portuguese.Brazil.Dictionary, em março de 2026.

Em seguida, fiz uma limpeza simples no banco, retirando as entradas repetidas e as que obviamente não geram rimas: tipicamente, abreviaturas, símbolos e outros termos compostos apenas por consoantes. Não fiz nenhum esforço extra de curadoria. O banco, depois da limpeza, conta com aproximadamente 970 mil palavras, todas consideradas válidas para os fins deste dicionário.

O terceiro passo foi criar um programa cujo algoritmo analisa a escrita de cada palavra do banco e tenta determinar a sua pronúncia. Para isso, o algoritmo usa como base as regras de acentuação da língua portuguesa, mais uma sequência de testes que tentam mapear a escrita à pronúncia, usando tanto regras documentadas quanto empíricas. Usei o programa para analisar e associar a cada palavra a representação fonética da sua rima, ou seja, a pronúncia a partir da sua vogal tônica.

O banco de palavras aumentado com a pronúncia da rima é usado como base para a pesquisa deste Dicionário.

Quais as limitações do Dicionário?

  1. Limitações da fonte de palavras. O dicionário não pode ser mais completo e correto do que a fonte primária de termos utilizada. Acredito que o banco de palavras que utilizei tenha gerado um dicionário bastante satisfatório, pois inclui termos originados por flexões e conjugações verbais, mas é bem possível que haja outros tão ou mais completos, e que não são do meu conhecimento. A curadoria de um banco de palavras não é tarefa simples, pois a língua possui vocabulário que varia regionalmente, e só esse fato faz com que cada banco seja uma coleção potencialmente incompleta.

    Por outro lado, pode haver palavras não registradas nos dicionários da língua portuguesa. O banco de palavras usado neste dicionário de rimas possui termos técnicos específicos, neologismos, palavras estrangeiras, nomes próprios e grafias alternativas. Não foram corrigidos erros ortográficos, caso existam. Deixo para o usuário a decisão de quais palavras são ou não válidas para o seu fim.
  2. Limitações do algoritmo de determinação da pronúncia. O algoritmo que criei para determinar a pronúncia a partir da escrita usa convenções de pronúncia de português do Brasil, e, possivelmente, com o viés da minha pronúncia regional. Também existem algumas (não muitas, felizmente) ambiguidades na determinação da pronúncia do português, como saber se as vogais “E” e “O” são abertas ou fechadas, e o algoritmo atual não tem como fazer essa diferenciação. Por isso, as palavras "cera" e "fera", por exemplo, aparecem como tendo a mesma rima. Ainda há o caso de palavras estrangeiras, que não foram identificadas como tal, e, provavelmente, têm a pronúncia determinada incorretamente.

    Não descarto, ainda, que o algoritmo apresente falhas, reais ou aparentes, no cálculo do número de sílabas, pois pode haver dificuldade ou ambiguidade na identificação de ditongos e hiatos.

    Além disso, não conheço um conjunto de palavras de teste que possa avaliar a correção do algoritmo com um alto grau de confiança. Os testes que fiz utilizaram palavras usadas em exemplos de livros de gramática, ou pinçadas aleatoriamente da lista. De qualquer maneira, não tenho como fazer um teste exaustivo, e é possível que ainda haja erros no algoritmo.

Comentários? Sugestões? Erros?

Caso queira comentar ou colaborar com sugestões, se notou a falta de alguma palavra ou percebeu uma rima incorreta, pode enviar um email.

Dicionário de Rimas Perfeitas - © 2026 Dossa.com.br - contato@dossa.com.br.