Contador de Frecuencia de Palabras
Analiza texto y cuenta cuántas veces aparece cada palabra, ordenado por frecuencia.
El contador de frecuencia de palabras analiza un bloque de texto y te dice con qué frecuencia aparece cada palabra, clasificadas de más a menos común. Es una herramienta poderosa para escritores, editores, estudiantes y analistas de datos que necesitan comprender la distribución del vocabulario de un documento o identificar palabras sobreutilizadas.
Pega tu texto y la herramienta lo tokeniza en palabras individuales, normaliza las mayúsculas ("The", "the" y "THE" cuentan como la misma palabra) y muestra una tabla de frecuencias ordenada por recuento. Las palabras vacías comunes se pueden filtrar para centrarse en las palabras de contenido significativo.
El análisis de frecuencia de palabras tiene aplicaciones más allá de la escritura: en lingüística sustenta las puntuaciones de legibilidad, en marketing revela los términos que más usan los clientes y en SEO ayuda a identificar la densidad natural de palabras clave del contenido.
Preguntas Frecuentes
Implementación de Código
from collections import Counter
import re
STOP_WORDS = {
"a", "an", "the", "and", "or", "but", "in", "on", "at", "to",
"for", "of", "with", "by", "from", "is", "are", "was", "were",
"it", "this", "that", "be", "as", "not", "i", "you", "he", "she",
}
def word_frequency(text: str, stop_words: bool = True, top_n: int = 10) -> list[tuple[str, int]]:
# Lowercase and extract words
words = re.findall(r"[a-z']+", text.lower())
if stop_words:
words = [w for w in words if w not in STOP_WORDS]
counter = Counter(words)
return counter.most_common(top_n)
text = """To be or not to be, that is the question.
Whether tis nobler in the mind to suffer
the slings and arrows of outrageous fortune."""
for word, count in word_frequency(text):
print(f"{word:<20} {count}")Comments & Feedback
Comments are powered by Giscus. Sign in with GitHub to leave a comment.