Aller au contenu
🛠️ToolsShed

Diviseur de Phrases

Divise le texte en phrases, paragraphes ou par délimiteur personnalisé. Affiche le nombre de segments et les statistiques de longueur.

À propos de cet outil

Le Diviseur de Phrases (Sentence Splitter) est un outil pratique pour diviser le texte en segments logiques—phrases, paragraphes ou fragments séparés par des délimiteurs personnalisés. Que ce soit pour une analyse textuelle en recherche, un traitement de contenu pour des tâches de NLP ou simplement pour organiser de longs passages, cet outil compte automatiquement chaque segment et calcule des statistiques de longueur, vous économisant le travail fastidieux de l'analyse manuelle.

Il vous suffit de coller votre texte dans le champ de saisie, de choisir votre méthode de division (par phrase, paragraphe ou délimiteur personnalisé) et de cliquer sur Diviser. L'outil affiche instantanément chaque segment dans une liste numérotée avec les décomptes de caractères et de mots, ce qui facilite l'identification de modèles, la comparaison des longueurs de segments ou l'exportation des résultats pour un traitement ultérieur.

Cet outil est précieux pour les écrivains éditant des documents longs, les développeurs préparant des données d'entraînement pour des modèles de texte, les créateurs de contenu gérant la structure des articles, et quiconque a besoin d'une analyse textuelle rapide sans ouvrir de lourds traitement de texte ou des outils de base de données.

Questions Fréquentes

Implémentation du Code

import re

def split_sentences(text):
    # Split on .!? followed by space+uppercase (basic sentence detection)
    sentences = re.split(r'(?<=[.!?])\s+(?=[A-Z"'])', text.strip())
    return [s.strip() for s in sentences if s.strip()]

def split_paragraphs(text):
    return [p.strip() for p in re.split(r'\n{2,}', text) if p.strip()]

def split_custom(text, delimiter):
    return [p.strip() for p in text.split(delimiter) if p.strip()]

def stats(segments):
    if not segments:
        return {}
    lengths = [len(s) for s in segments]
    return {
        "total": len(segments),
        "avg_length": sum(lengths) // len(lengths),
        "longest": max(lengths),
        "shortest": min(lengths),
    }

text = """Hello world. How are you today? I am doing well!
This is a second group of sentences. They continue here."""

sentences = split_sentences(text)
for i, s in enumerate(sentences, 1):
    print(f"{i}. {s}")
print(stats(sentences))

Comments & Feedback

Comments are powered by Giscus. Sign in with GitHub to leave a comment.