🛠️ToolsShed

Penghitung Frekuensi Kata

Analisis teks dan hitung seberapa sering setiap kata muncul, diurutkan berdasarkan frekuensi.

Penghitung Frekuensi Kata menganalisis blok teks dan memberi tahu Anda seberapa sering setiap kata muncul, diurutkan dari yang paling sering ke yang paling jarang. Ini adalah alat yang ampuh bagi penulis, editor, mahasiswa, dan analis data yang perlu memahami distribusi kosakata dokumen, mengidentifikasi kata-kata yang terlalu sering digunakan, atau melakukan analisis teks dasar.

Tempel teks Anda dan alat akan memecahnya menjadi kata-kata individual, menormalkan huruf besar/kecil ("The", "the", dan "THE" dihitung sebagai kata yang sama), dan menampilkan tabel frekuensi yang diurutkan berdasarkan jumlah. Kata-kata umum dapat difilter untuk fokus pada kata konten yang bermakna.

Analisis frekuensi kata memiliki aplikasi di luar penulisan: dalam linguistik mendukung skor keterbacaan, dalam pemasaran mengungkapkan istilah yang paling sering digunakan pelanggan, dan dalam SEO membantu mengidentifikasi kepadatan kata kunci alami konten.

Pertanyaan yang Sering Diajukan

Implementasi Kode

from collections import Counter
import re

STOP_WORDS = {
    "a", "an", "the", "and", "or", "but", "in", "on", "at", "to",
    "for", "of", "with", "by", "from", "is", "are", "was", "were",
    "it", "this", "that", "be", "as", "not", "i", "you", "he", "she",
}

def word_frequency(text: str, stop_words: bool = True, top_n: int = 10) -> list[tuple[str, int]]:
    # Lowercase and extract words
    words = re.findall(r"[a-z']+", text.lower())
    if stop_words:
        words = [w for w in words if w not in STOP_WORDS]
    counter = Counter(words)
    return counter.most_common(top_n)

text = """To be or not to be, that is the question.
Whether tis nobler in the mind to suffer
the slings and arrows of outrageous fortune."""

for word, count in word_frequency(text):
    print(f"{word:<20} {count}")

Comments & Feedback

Comments are powered by Giscus. Sign in with GitHub to leave a comment.