Saltar al contenido
🛠️ToolsShed

Divisor de Oraciones

Divide el texto en oraciones, párrafos o por delimitador personalizado. Muestra el recuento de segmentos y estadísticas de longitud.

Acerca de esta herramienta

El Divisor de Oraciones (Sentence Splitter) es una herramienta práctica para dividir texto en segmentos lógicos—oraciones, párrafos o fragmentos separados por delimitadores personalizados. Ya sea para análisis de texto en investigación, procesamiento de contenido para tareas de NLP o simplemente para organizar pasajes largos, esta herramienta cuenta automáticamente cada segmento y calcula estadísticas de longitud, ahorrándote el tedioso trabajo del análisis manual.

Simplemente pega tu texto en el campo de entrada, elige tu método de división (por oración, párrafo o delimitador personalizado) y haz clic en Dividir. La herramienta muestra instantáneamente cada segmento en una lista numerada junto con conteos de caracteres y palabras, facilitando la identificación de patrones, comparación de longitudes de segmentos o exportación de resultados para procesamiento posterior.

Esta herramienta es invaluable para escritores que editan documentos largos, desarrolladores que preparan datos de entrenamiento para modelos de texto, creadores de contenido que administran la estructura de artículos, y cualquiera que necesite análisis rápido de texto sin abrir procesadores de palabras pesados o herramientas de bases de datos.

Preguntas Frecuentes

Implementación de Código

import re

def split_sentences(text):
    # Split on .!? followed by space+uppercase (basic sentence detection)
    sentences = re.split(r'(?<=[.!?])\s+(?=[A-Z"'])', text.strip())
    return [s.strip() for s in sentences if s.strip()]

def split_paragraphs(text):
    return [p.strip() for p in re.split(r'\n{2,}', text) if p.strip()]

def split_custom(text, delimiter):
    return [p.strip() for p in text.split(delimiter) if p.strip()]

def stats(segments):
    if not segments:
        return {}
    lengths = [len(s) for s in segments]
    return {
        "total": len(segments),
        "avg_length": sum(lengths) // len(lengths),
        "longest": max(lengths),
        "shortest": min(lengths),
    }

text = """Hello world. How are you today? I am doing well!
This is a second group of sentences. They continue here."""

sentences = split_sentences(text)
for i, s in enumerate(sentences, 1):
    print(f"{i}. {s}")
print(stats(sentences))

Comments & Feedback

Comments are powered by Giscus. Sign in with GitHub to leave a comment.