从 HTML 提取文本

去掉 HTML 标签并解码实体，得到干净的纯文本。

文本工具在你的浏览器中运行

HTML source

Plain text

如何从 HTML 提取文本？

从 HTML 提取文本会去掉标签、脚本和样式，然后解码实体，只留下可读的文字。Snabbit 会把块级元素转换为换行，使段落保持分隔，整理多余的空白，并返回干净的纯文本。一切都在你的浏览器中运行，所以你粘贴的标记绝不会上传到任何地方。

它会保留链接和加粗标签内部的文字吗？

会。行内标签会被去掉，但其文字内容会保留，所以加粗的词或链接的标签文字会以纯文本形式出现在输出中。

脚本和样式会怎样处理？

脚本和样式块会被完全去掉，包括其内容，所以不会有任何代码或 CSS 泄漏到提取的文本中。

段落会被保留吗？

段落、列表项和标题等块级元素会变成换行，所以结果会保留可读的结构，而不是挤成一长行。