Lewati ke konten
🛠️ToolsShed

Pemisah Kalimat

Memisahkan teks menjadi kalimat, paragraf, atau berdasarkan pembatas kustom. Menampilkan jumlah segmen dan statistik panjang.

Tentang alat ini

Pembagi Kalimat (Sentence Splitter) adalah alat praktis untuk memecah teks menjadi segmen logis—kalimat, paragraf, atau potongan yang dipisahkan oleh pemisah khusus. Baik untuk analisis teks dalam penelitian, pemrosesan konten untuk tugas NLP, atau sekadar mengorganisir bagian teks yang panjang, alat ini secara otomatis menghitung setiap segmen dan menghitung statistik panjang, menghemat Anda dari pekerjaan analisis manual yang membosankan.

Cukup tempel teks Anda ke dalam bidang input, pilih metode pemisahan Anda (berdasarkan kalimat, paragraf, atau pemisah khusus), dan klik Bagi. Alat ini langsung menampilkan setiap segmen dalam daftar bernomor bersama dengan hitungan karakter dan kata, sehingga mudah untuk mengidentifikasi pola, membandingkan panjang segmen, atau mengekspor hasil untuk pemrosesan lebih lanjut.

Alat ini sangat berharga bagi penulis yang mengedit dokumen panjang, pengembang yang menyiapkan data pelatihan untuk model teks, pembuat konten yang mengelola struktur artikel, dan siapa saja yang membutuhkan analisis teks cepat tanpa membuka program pemrosesan kata yang berat atau alat basis data.

Pertanyaan yang Sering Diajukan

Implementasi Kode

import re

def split_sentences(text):
    # Split on .!? followed by space+uppercase (basic sentence detection)
    sentences = re.split(r'(?<=[.!?])\s+(?=[A-Z"'])', text.strip())
    return [s.strip() for s in sentences if s.strip()]

def split_paragraphs(text):
    return [p.strip() for p in re.split(r'\n{2,}', text) if p.strip()]

def split_custom(text, delimiter):
    return [p.strip() for p in text.split(delimiter) if p.strip()]

def stats(segments):
    if not segments:
        return {}
    lengths = [len(s) for s in segments]
    return {
        "total": len(segments),
        "avg_length": sum(lengths) // len(lengths),
        "longest": max(lengths),
        "shortest": min(lengths),
    }

text = """Hello world. How are you today? I am doing well!
This is a second group of sentences. They continue here."""

sentences = split_sentences(text)
for i, s in enumerate(sentences, 1):
    print(f"{i}. {s}")
print(stats(sentences))

Comments & Feedback

Comments are powered by Giscus. Sign in with GitHub to leave a comment.