🛠️ToolsShed

Compteur de Fréquence de Mots

Analysez le texte et comptez combien de fois chaque mot apparaît, classé par fréquence.

Le compteur de fréquence des mots analyse un bloc de texte et vous indique combien de fois chaque mot apparaît, classé du plus au moins fréquent. C'est un outil puissant pour les écrivains, les rédacteurs, les étudiants et les analystes de données qui ont besoin de comprendre la distribution du vocabulaire d'un document ou d'identifier les mots surutilisés.

Collez votre texte et l'outil le tokenise en mots individuels, normalise la casse ("The", "the" et "THE" comptent comme le même mot) et affiche un tableau de fréquences trié par comptage. Les mots vides courants peuvent être filtrés pour se concentrer sur les mots de contenu significatifs.

L'analyse de fréquence des mots a des applications au-delà de l'écriture : en linguistique, elle sous-tend les scores de lisibilité, en marketing, elle révèle les termes que les clients utilisent le plus, et en SEO, elle aide à identifier la densité naturelle des mots-clés du contenu.

Questions Fréquentes

Implémentation du Code

from collections import Counter
import re

STOP_WORDS = {
    "a", "an", "the", "and", "or", "but", "in", "on", "at", "to",
    "for", "of", "with", "by", "from", "is", "are", "was", "were",
    "it", "this", "that", "be", "as", "not", "i", "you", "he", "she",
}

def word_frequency(text: str, stop_words: bool = True, top_n: int = 10) -> list[tuple[str, int]]:
    # Lowercase and extract words
    words = re.findall(r"[a-z']+", text.lower())
    if stop_words:
        words = [w for w in words if w not in STOP_WORDS]
    counter = Counter(words)
    return counter.most_common(top_n)

text = """To be or not to be, that is the question.
Whether tis nobler in the mind to suffer
the slings and arrows of outrageous fortune."""

for word, count in word_frequency(text):
    print(f"{word:<20} {count}")

Comments & Feedback

Comments are powered by Giscus. Sign in with GitHub to leave a comment.