Cümle Bölücü
Metni cümlelere, paragraflara veya özel sınırlayıcıya göre böler. Segment sayısını ve uzunluk istatistiklerini gösterir.
Bu araç hakkında
Cümle Bölücü (Sentence Splitter), metni mantıksal segmentlere—cümleler, paragraflar veya özel sınırlayıcılarla ayrılmış parçalara ayırmak için pratik bir araçtır. İster araştırma için metin analizi, ister NLP görevleri için içerik işleme, ister sadece uzun pasajları organize etme için olsun, bu araç otomatik olarak her segmenti sayar ve uzunluk istatistiklerini hesaplar, sıkıcı manuel analiz işinden sizi kurtarır.
Metninizi giriş alanına yapıştırın, bölme yönteminizi seçin (cümle, paragraf veya özel sınırlayıcı başına) ve Böl düğmesini tıklayın. Araç anında her segmenti numaralandırılmış bir listede, karakter ve kelime sayılarıyla birlikte görüntüler, bu da desenleri tanımlamayı, segment uzunluklarını karşılaştırmayı veya sonuçları daha ileri işlemler için dışa aktarmayı kolaylaştırır.
Bu araç, uzun belgeleri düzenleyen yazarlar, metin modelleri için eğitim verileri hazırlayan geliştiriciler, makale yapısını yöneten içerik oluşturucular ve ağır kelime işlemcileri veya veritabanı araçlarını açmadan hızlı metin analizi gerektiren herkes için değerlidir.
Sıkça Sorulan Sorular
Kod Uygulaması
import re
def split_sentences(text):
# Split on .!? followed by space+uppercase (basic sentence detection)
sentences = re.split(r'(?<=[.!?])\s+(?=[A-Z"'])', text.strip())
return [s.strip() for s in sentences if s.strip()]
def split_paragraphs(text):
return [p.strip() for p in re.split(r'\n{2,}', text) if p.strip()]
def split_custom(text, delimiter):
return [p.strip() for p in text.split(delimiter) if p.strip()]
def stats(segments):
if not segments:
return {}
lengths = [len(s) for s in segments]
return {
"total": len(segments),
"avg_length": sum(lengths) // len(lengths),
"longest": max(lengths),
"shortest": min(lengths),
}
text = """Hello world. How are you today? I am doing well!
This is a second group of sentences. They continue here."""
sentences = split_sentences(text)
for i, s in enumerate(sentences, 1):
print(f"{i}. {s}")
print(stats(sentences))Comments & Feedback
Comments are powered by Giscus. Sign in with GitHub to leave a comment.