Question 1

文本清理工具有什么用？

Accepted Answer

文本清理工具可去除文本中不需要的格式问题：多余的空格、重复的空白行、不可打印的控制字符、不一致的换行符，以及可选的特殊字符删除。在将从PDF、电子邮件、网页或文字处理器复制的文本粘贴到代码、数据库或纯文本编辑器之前，非常有用。

Question 2

该工具会删除HTML或Markdown格式吗？

Accepted Answer

文本清理工具只处理纯文本。它会删除控制字符并规范化空白，但不解析或删除HTML标签或Markdown语法。要删除HTML标签，请使用HTML标签删除工具。

Question 3

什么是不可打印或控制字符，为什么它们有害？

Accepted Answer

控制字符是ASCII码0-31的字符（不包括制表符、换行符、回车符等正常空白）。它们包括空字节、响铃字符等不可见字符，可能导致显示问题、解析器中断、数据库记录损坏以及脚本中的意外行为。常见来源包括从终端、PDF提取器和遗留系统复制粘贴。

Question 4

工具会修改原始文本还是创建新副本？

Accepted Answer

工具在输出字段中创建清理后的版本。您的原始输入不会被修改。您可以比较两者，然后根据需要复制清理后的输出。

Question 5

修剪空白和折叠空白有什么区别？

Accepted Answer

修剪是删除每行或整个文本开头和结尾的空格。折叠是将行内多个连续的空格或制表符缩减为单个空格。两种操作结合使用，可以产生适用于任何纯文本场景的规范化文本。

文本清理器

常见问题