Contador de Frequência de Palavras
Analise texto e conte quantas vezes cada palavra aparece, ordenado por frequência.
O Contador de Frequência de Palavras analisa um bloco de texto e informa quantas vezes cada palavra aparece, classificadas da mais para a menos comum. É uma ferramenta poderosa para escritores, editores, estudantes e analistas de dados que precisam entender a distribuição do vocabulário de um documento ou identificar palavras usadas em excesso.
Cole seu texto e a ferramenta o tokeniza em palavras individuais, normaliza as maiúsculas ("The", "the" e "THE" contam como a mesma palavra) e exibe uma tabela de frequências ordenada por contagem. Palavras de parada comuns podem ser filtradas para focar nas palavras de conteúdo significativo.
A análise de frequência de palavras tem aplicações além da escrita: em linguística fundamenta pontuações de legibilidade, em marketing revela os termos mais usados pelos clientes e em SEO ajuda a identificar a densidade natural de palavras-chave do conteúdo.
Perguntas Frequentes
Implementação de Código
from collections import Counter
import re
STOP_WORDS = {
"a", "an", "the", "and", "or", "but", "in", "on", "at", "to",
"for", "of", "with", "by", "from", "is", "are", "was", "were",
"it", "this", "that", "be", "as", "not", "i", "you", "he", "she",
}
def word_frequency(text: str, stop_words: bool = True, top_n: int = 10) -> list[tuple[str, int]]:
# Lowercase and extract words
words = re.findall(r"[a-z']+", text.lower())
if stop_words:
words = [w for w in words if w not in STOP_WORDS]
counter = Counter(words)
return counter.most_common(top_n)
text = """To be or not to be, that is the question.
Whether tis nobler in the mind to suffer
the slings and arrows of outrageous fortune."""
for word, count in word_frequency(text):
print(f"{word:<20} {count}")Comments & Feedback
Comments are powered by Giscus. Sign in with GitHub to leave a comment.