Wortfrequenz-Zähler
Text analysieren und zählen, wie oft jedes Wort vorkommt, nach Häufigkeit sortiert.
Der Worthäufigkeitszähler analysiert einen Textblock und zeigt, wie oft jedes Wort vorkommt, gerankt vom häufigsten zum seltensten. Dies ist ein leistungsstarkes Werkzeug für Autoren, Redakteure, Studenten und Datenanalysten, die die Vokabelverteilung eines Dokuments verstehen oder übermäßig verwendete Wörter identifizieren müssen.
Fügen Sie Ihren Text ein und das Tool tokenisiert ihn in einzelne Wörter, normalisiert die Groß-/Kleinschreibung ("The", "the" und "THE" zählen als dasselbe Wort) und zeigt eine nach Anzahl sortierte Häufigkeitstabelle an. Häufige Stoppwörter können gefiltert werden, um sich auf die bedeutungsvollen Inhaltswörter zu konzentrieren.
Worthäufigkeitsanalyse hat Anwendungen über das Schreiben hinaus: In der Linguistik bildet sie die Grundlage für Lesbarkeits-Scores, im Marketing zeigt sie, welche Begriffe Kunden am häufigsten verwenden, und im SEO hilft sie, die natürliche Schlüsselwortdichte von Inhalten zu identifizieren.
Häufig gestellte Fragen
Code-Implementierung
from collections import Counter
import re
STOP_WORDS = {
"a", "an", "the", "and", "or", "but", "in", "on", "at", "to",
"for", "of", "with", "by", "from", "is", "are", "was", "were",
"it", "this", "that", "be", "as", "not", "i", "you", "he", "she",
}
def word_frequency(text: str, stop_words: bool = True, top_n: int = 10) -> list[tuple[str, int]]:
# Lowercase and extract words
words = re.findall(r"[a-z']+", text.lower())
if stop_words:
words = [w for w in words if w not in STOP_WORDS]
counter = Counter(words)
return counter.most_common(top_n)
text = """To be or not to be, that is the question.
Whether tis nobler in the mind to suffer
the slings and arrows of outrageous fortune."""
for word, count in word_frequency(text):
print(f"{word:<20} {count}")Comments & Feedback
Comments are powered by Giscus. Sign in with GitHub to leave a comment.