🛠️ToolsShed

Wortfrequenz-Zähler

Text analysieren und zählen, wie oft jedes Wort vorkommt, nach Häufigkeit sortiert.

Der Worthäufigkeitszähler analysiert einen Textblock und zeigt, wie oft jedes Wort vorkommt, gerankt vom häufigsten zum seltensten. Dies ist ein leistungsstarkes Werkzeug für Autoren, Redakteure, Studenten und Datenanalysten, die die Vokabelverteilung eines Dokuments verstehen oder übermäßig verwendete Wörter identifizieren müssen.

Fügen Sie Ihren Text ein und das Tool tokenisiert ihn in einzelne Wörter, normalisiert die Groß-/Kleinschreibung ("The", "the" und "THE" zählen als dasselbe Wort) und zeigt eine nach Anzahl sortierte Häufigkeitstabelle an. Häufige Stoppwörter können gefiltert werden, um sich auf die bedeutungsvollen Inhaltswörter zu konzentrieren.

Worthäufigkeitsanalyse hat Anwendungen über das Schreiben hinaus: In der Linguistik bildet sie die Grundlage für Lesbarkeits-Scores, im Marketing zeigt sie, welche Begriffe Kunden am häufigsten verwenden, und im SEO hilft sie, die natürliche Schlüsselwortdichte von Inhalten zu identifizieren.

Häufig gestellte Fragen

Code-Implementierung

from collections import Counter
import re

STOP_WORDS = {
    "a", "an", "the", "and", "or", "but", "in", "on", "at", "to",
    "for", "of", "with", "by", "from", "is", "are", "was", "were",
    "it", "this", "that", "be", "as", "not", "i", "you", "he", "she",
}

def word_frequency(text: str, stop_words: bool = True, top_n: int = 10) -> list[tuple[str, int]]:
    # Lowercase and extract words
    words = re.findall(r"[a-z']+", text.lower())
    if stop_words:
        words = [w for w in words if w not in STOP_WORDS]
    counter = Counter(words)
    return counter.most_common(top_n)

text = """To be or not to be, that is the question.
Whether tis nobler in the mind to suffer
the slings and arrows of outrageous fortune."""

for word, count in word_frequency(text):
    print(f"{word:<20} {count}")

Comments & Feedback

Comments are powered by Giscus. Sign in with GitHub to leave a comment.